FR2731548A1 - Recherche profondeur d'abord dans un repertoire algebrique pour un encodage rapide de la paroie - Google Patents
Recherche profondeur d'abord dans un repertoire algebrique pour un encodage rapide de la paroie Download PDFInfo
- Publication number
- FR2731548A1 FR2731548A1 FR9602957A FR9602957A FR2731548A1 FR 2731548 A1 FR2731548 A1 FR 2731548A1 FR 9602957 A FR9602957 A FR 9602957A FR 9602957 A FR9602957 A FR 9602957A FR 2731548 A1 FR2731548 A1 FR 2731548A1
- Authority
- FR
- France
- Prior art keywords
- search
- pulse
- level
- zero amplitude
- pulses
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 103
- 230000005236 sound signal Effects 0.000 claims abstract description 28
- 238000010276 construction Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 64
- 230000010267 cellular communication Effects 0.000 claims description 15
- 238000011160 research Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 15
- 238000013461 design Methods 0.000 claims description 14
- 230000001413 cellular effect Effects 0.000 claims description 13
- 230000006854 communication Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 13
- 230000007774 longterm Effects 0.000 claims description 13
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 230000000712 assembly Effects 0.000 claims description 2
- 238000000429 assembly Methods 0.000 claims description 2
- 238000006073 displacement reaction Methods 0.000 claims 1
- 230000002035 prolonged effect Effects 0.000 claims 1
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- 230000002349 favourable effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 19
- 238000011045 prefiltration Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000001143 conditioned effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007103 stamina Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
- G10L2019/0014—Selection criteria for distances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Mobile Radio Communication Systems (AREA)
- Complex Calculations (AREA)
Abstract
Une recherche est effectuée à l'intérieur d'un répertoire afin d'encoder un signal de son. Ce répertoire consiste en un ensemble de vecteurs-codes définissant chacun 40 positions et comprenant N impulsions d'amplitude non nulle assignables à des positions valides prédéterminées. Pour réduire la complexité de la recherche, on exécute une recherche profondeur d'abord employant une structure d'arbre à niveaux ordonnés de 1 à M. Une opération de construction de chemin est réalisée à chaque niveau de carte qu'un chemin candidat du niveau précédent est prolongé en choisissant un nombre prédéterminé de nouvelles impulsions et en sélectionnant des positions valides pour ces nouvelles impulsions conformément à une règle d'ordonnancement d'impulsions et un critère de sélection donnés. Un chemin dont l'origine se situe au premier niveau et qui est prolongé par les opérations de construction de chemin des niveaux subséquents détermine les positions respectives des N impulsions d'amplitude non nulle d'un vecteur-code candidat. L'utilisation d'un vecteur estimatif de vraisemblance de position d'impulsion basé sur le signal de son durant les premiers quelques niveaux permet une élimination initiale d'impulsions pour démarrer la recherche dans des conditions favorables. Un critère de sélection basé sur la maximisation d'un rapport permet d'estimer de choisir le meilleur des vecteurs-codes candidats en compétition.
Description
RECHERCHE PROFONDEUR D'ABORD DANS UN RÉPERTOIRE
ALG BRIOUE POUR UN ENCODAGF RAP TDE DE LA PAROLE
La présente invention concerne une technique améliorée pour encoder numériquement un signal de son, en particulier mais non exclusivement un signal de parole, en vue de transmettre et
synthétiser ce signal de son.
La demande pour des techniques d'encodage numérique de la parole présentant un bon compromis entre la qualité subjective et le débit binaire augmente dans de nombreux domaines tels que la transmission de la parole par satellite, les mobiles terrestres, la radio numérique ou les concentrateurs de voies, l'enregistrement vocal, la réponse vocale et
la téléphonie sans fil.
L'une des meilleures techniques existantes pour réaliser un bon compromis entre la qualité et le débit binaire est la technique de prédiction linéaire a excitation par codes CELP (Code Excited Linear Prediction). Conformément à cette technique, le
signal de parole est échantillonné et traite par sous-
trames successives de L échantillons (c'est-à-dire
SR 11964 CA/DB
vecteurs), o L est un nombre prédéterminé quelconque.
La technique CELP utilise un répertoire.
Un répertoire, dans le contexte de la CELP, est un groupe indexé de séquences longues de L échantillons nommées ci-après vecteurs- codes de dimension L. Le répertoire comporte un index k variant de 1 à M, o M représente la taille du répertoire parfois exprimée en nombre de bits b: M = 2b Un répertoire peut être stocké dans une mémoire physique (c'est-à-dire une table de recherche), ou peut se référer à un mécanisme pour associer l'index à un vecteur-code correspondant (par
exemple une formule).
Afin de synthétiser la parole conformément à la technique CELP, chaque sous-trame d'échantillons de parole est synthétisé en filtrant le vecteur-code approprié du répertoire à l'aide de filtres variant dans le temps pour modéliser les caractéristiques spectrales du signal de parole. Du côté de l'encodeur, la sortie synthétique est calculée pour l'ensemble ou un sous-ensemble des vecteurs-codes du répertoire (recherche dans le répertoire) Le
SR 11964 CA/DB
vecteur-code retenu est celui qui produit la sortie synthétique la plus rapprochée du signal de parole original selon une mesure de distorsion pondérée perceptuellement. Un premier type de répertoires sont ceux nommés répertoires "stochastiques". Un inconvénient de ces répertoires est qu'ils nécessitent souvent une mémoire physique considérable. Ils sont stochastiques, c'est-à-dire aléatoires dans le sens que la correspondance entre l'index et le vecteur-code associé implique des tables de recherche qui sont le résultat de nombres générés aléatoirement ou de techniques statistiques appliquées à des ensembles considérables de segments de parole. La taille des répertoires stochastiques tend à être limitée par la
mémoire et/ou la complexité de la recherche.
Un second type de répertoires sont les répertoires algébriques. En contraste avec les répertoires stochastiques, les répertoires algébriques ne sont pas aléatoires et ne nécessitent pas une mémoire importante. Un répertoire algébrique est un ensemble de vecteurs-codes indexes dans lequel les amplitudes et les positions des impulsions du k- em vecteur-code peuvent être dérivés d'un index k correspondant par une règle ne nécessitant aucune ou
SR 11964 CA/DB
encore une mémoire physique minimale. Ainsi, la taille des répertoires algébriques n'est pas limitée par des considérations de stockage. Les répertoires algébriques peuvent aussi être conçus pour permettre
une recherche efficace.
Un objet de la présente invention est donc de fournir une méthode et un dispositif pour réduire de façon drastique la complexité de la recherche dans un répertoire lors de l'encodage d'un signal de son, ces méthode et dispositif étant applicables à un large
éventail de répertoires.
Plus particulièrement, conformément à la présente invention, il est prévu une méthode pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder un signal de son, dans laquelle: le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; la recherche profondeur d'abord met en oeuvre une structure d'arbre définissant un nombre M de niveaux ordonnés, chaque niveau m étant associé à un nombre prédéterminé N, d'impulsions d'amplitude non
SR 11964 CA/DB
nulle, o N>1 et o la somme des nombres prédéterminés associés aux M niveaux est égale au nombre N d'impulsions d'amplitude non nulle comprises dans les vecteurs-codes, chaque niveau m de la structure d'arbre étant en outre associé à une opération de construction de chemin, à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; cette méthode pour effectuer une recherche profondeur d'abord dans un répertoire comprenant les étapes suivantes: - dans un niveau 1 de la structure d'arbre, l'opération de construction de chemin associée consiste à: choisir un nombre N1 d'impulsions parmi les N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement d'impulsions associée; sélectionner au moins une des positions p valides des N1 impulsions d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin candidat de niveau 1; - dans un niveau m de la structure d'arbre, l'opération de construction de chemin associée définit de façon récursive un chemin candidat de niveau m en prolongeant un chemin candidat
SR 11964 CA/DB
de niveau m-1 à l'aide des sous-étapes suivantes: choisir un nombre Nm d'impulsions parmi les impulsions d'amplitude non nulle n'ayant pas encore été choisies lors de la construction du chemin de niveau m-1 en relation avec la règle d'ordonnancement d'impulsions associée; et sélectionner au moins une des positions p valides des Nô impulsions d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin candidat de niveau m; dans laquelle un chemin candidat de niveau m dont l'origine se trouve au niveau 1 et qui a été prolongé durant les opérations de constxuction de chemin associées aux niveaux subséquents de la structure d'arbre détermine les positions respectives p des N impulsions d'amplitude non nulle d'un vecteur-code et
ainsi définit un vecteur code candidat Ai.
La présente invention concerne également une méthode pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder un signal de son, dans laquelle:
SR 11964 CA/DB
le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; la recherche profondeur d'abord met en oeuvre (a) une division des N impulsions d'amplitude non nulle en un nombre M de sous-ensembles comprenant chacun au moins une impulsion d'amplitude non nulle, et (b) une structure d'arbre incluant des noeuds représentatifs des positions p valides des N impulsions d'amplitude non nulle et définissant une pluralité de niveaux de recherche associés chacun à l'un desdits M sous-ensembles, chaque niveau de recherche étant en outre associé à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; cette méthode pour effectuer une recherche profondeur d'abord dans un répertoire comprenant les étapes suivantes: - dans un premier niveau de recherche de la structure d'arbre, choisir au moins une des N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous- ensemble associé;
SR 11964 DE/DB
sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin à travers les noeuds de la structure d'arbre; - dans chaque niveau de recherche subséquent de la structure d'arbre, choisir au moins une des impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous-ensemble associé; et sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle du sous-ensemble associé en relation avec le critère de sélection associé pour prolonger ledit au moins un chemin à travers les noeuds de la structure d'arbre; dans laquelle chaque chemin défini au premier niveau de recherche et prolongé durant les niveaux de recherche subsélients détermine les positions p respectives des N impulsions d'amplitude non nulle d'un vecteur-code Ak constituant un vecteur-code candidat en vue
d'encoder le signal de son.
SR 11964 CA/DB
La présente invention concerne en outre un dispositif pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder un signal de son, dans lequel: le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur- code; la recherche profondeur d'abord met en oeuvre (a) une division des N impulsions d'amplitude non nulle en un nombre M de sous-ensembles comprenant chacun au moins une impulsion d'amplitude non nulle, et (b) une structure d'arbre incluant des noeuds représentatifs des positions p valides des N impulsions d'amplitude non nulle et définissant une pluralité de niveaux de recherche associés chacun à l'un desdits M sous-ensembles, chaque niveau de recherche étant en outre associé à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; ce dispositif pour effectuer une recherche profondeur d'abord dans un répertoire comprenant: - pour un premier niveau de recherche de la structure d'arbre,
SR 11964 CA/DB
des premiers moyens pour choisir au moins une des N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement
d'impulsions associée pour former le sous-
ensemble associé; des premiers moyens pour sélectionner au moine une des positions p valides de ladite au moins une impulsion d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin à travers les noeuds de la structure d'arbre; - pour chaque niveau de recherche subséquent de la structure d'arbre, des seconds moyens pour choisir au moins une des impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous-ensemble associé; et des seconds moyens pour sélectionner, dans le niveau de recherche subséquent, au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle du sous-ensemble associé en relation avec le critère de sélection associé pour prolonger ledit au moins un chemin à travers les noeuds de la structure d'arbre;
SR 11964 CA/DB
dans lequel chaque chemin défini au premier niveau de recherche et prolongé durant les niveaux de recherche subséquents détermine les positions p respectives des N impulsions d'amplitude non nulle d'un vecteur-code Ak constituant un vecteur-code candidat en vue
d'encoder le signal de son.
Finalement, la présente invention propose un système de communication cellulaire pour couvrir une grande surface géographique divisée en une pluralité de cellules, comprenant: des unités mobiles de transmission/réception; des stations de base cellulaires respectivement situées à l'intérieur des cellules; des moyens pour contrôler la communication entre les.stations de base cellulaires; un sous-système de communication bidirectionnel sans fil entre chaque unité mobile située à l'intérieur d'une cellule et la station de base cellulaire de la même cellule, ce sous-système de communication bidirectionnel sans fil comprenant à l'intérieur de l'unité mobile et à l'intérieur de la station de base cellulaire (a) un transmetteur incluant des moyens pour encoder un signal de parole et des moyens pour transmettre le signal de parole
SR 11964 CA/DB
encodé, et (b) un récepteur incluant des moyens pour recevoir un signal de parole encodé transmis et des moyens pour décoder le signal de parole encodé reçu; dans lequel les moyens pour encoder le signal de parole comprennent un dispositif pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder le signal de parole, dans lequel! le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; la recherche profondeur d'abord met en oeuvre (a) une division des N impulsions
d'amplitude non nulle en un nombre M de sous-
ensembles comprenant chacun au moins une impulsion d'amplitude non nulle, et (b) une structure d'arbre incluant des noeuds représentatifs des positions p valides des N impulsions d'amplitude non nulle et définissant une pluralité de niveaux de recherche associés chacun à l'un des M sous-ensembles, chaque niveau de recherche étant en outre associé à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; ce dispositif pour effectuer une recherche profondeur d'abord dans un répertoire comprenant;
SR 11964 CA/DB
- pour un premier niveau de recherche de la structure d'arbre, des premiers moyens pour choisir au moins une des N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement
d'impulsions associée pour former le sous-
ensemble associé; des premiers moyens pour sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin à travers les noeuds de la structure d'arbre; - pour chaque niveau de recherche subséquent de la structure d'arbre, des seconds moyens pour choisir au moins une des impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous-ensemble associé: et des seconds moyens pour sélectionner, dans le niveau de recherche subséquent, au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle du sous-ensemble associé en relation avec le critère de sélection associé pour prolonger
SR 11964 CA/DB
ledit au moins un chemin à travers les noeuds de la structure d'arbre; dans lequel chaque chemin défini au premier niveau de recherche et prolongé durant les niveaux de recherche subséquents détermine les positions p respectives des N impulsions d'amplitude non nulle d'un vecteur-code A, constituant un vecteur-code candidat en vue
d'encoder le signal de son.
Les objets, avantages et autres caractéristiques de la présente invention deviendront
plus apparent à la lecture de la description non
limitative qui suit de modes de réalisation préférés de celle-ci, donnés à titre d'exemple non limitatif seulement avec référence aux dessins annexes, dans lesquels: La figure 1 est un bloc diagramme schématique d'un mode de réalisation préféré d'un système d'encodage selon la présente invention, comprenant un module estimateur de vraisemblance de position d'impulsion et un module contrôleur d'optimisation;
SR 11964 CA/DB
La figure 2 est un bloc diagramme schématique d'un système de décodage associé au système d'encodage de la figure 1; La figure 3 est une représentation schématique d'une pluralité de boucles imbriquées utilisées par le module contrôleur d'optimisation du système d' encodage de la figure 1 pour calculer les vecteurs-codes optimaux; La figure 4a montre une structure d'arbre permettant d'illustrer par un exemple quelques caractéristiques de la technique de recherche par boucles imbriquées de la figure 3; La figure 4b montre la structure d'arbre de la figure 4a lorsque le traitement aux niveaux inférieurs est conditionné à ce que la performance excède un seuil donné; il s'agit d'une méthode plus rapide d'explorer l'arbre en se concentrant seulement sur les régions les plus prometteuses de cet arbre; La figure 5 illustre comment la technique de recherche profondeur d'abord évolue à travers une structure d'arbre pour quelques combinaisons de positions d'impulsions; l'exemple concerne un répertoire dix-impulsions à vecteurs- codes de 40
SR 11964 CA/DB
positions conçu autour de permutations d'impulsion unique entrelacées; La figure 6 est un organigramme schématique montrant le fonctionnement du module estimateur de vraisemblance de position d'impulsion et du module contrôleur d'optimisation de la figure 1; et La figure 7 est un bloc diagramme schématique illustrant l'infrastructure d'un système
de communication cellulaire typique.
Bien qu'une application de la méthode et du dispositif de recherche profondeur d'abord selon l'invention à un système de communication cellulaire soit divulguée dans le présent mémoire descriptif comme exemple non limitatif, on doit garder à l'esprit que ces méthode et dispositif peuvent être utilisés avec les mêmes avantages dans plusieurs autres types de systèmes de communication requérant l'encodage d'un
signal de son.
Dans un système de communication cellulaire tel que 1 (figure 7), un service de télécommunications est fourni sur une grande surface géographique en divisant cette grande surface en plusieurs cellules plus petites. Chaque cellule a une
SR 11964 CA/DB
station de base cellulaire 2 pour établir des voies de signalisation radio, des voies de transmission audio
et des voies de transmission de données.
Les voies de signalisation radio sont utilisées pour appeler des radiotéléphones mobiles (unités de transmission/réception mobiles) tels que 3 à l'intérieur des limites de la zone couverte (cellule) par la station de base cellulaire, et pour acheminer des appels à d'autres radiotéléphones 3 à l'intérieur ou à l'extérieur de la cellule de la station de base, ou à un autre réseau tel que le
Réseau Téléphonique Public Commuté (RTPC) 4.
Lorsqu'un radiotéléphone 3 a acheminé ou reçu un appel avec succès, une voie de transmission audio ou de données est établie avec la station de base cellulaire 2 correspondant a la cellule dans laquelle le radiotéléphone 3 est situé, et la communication entre la station de base 2 et le radiotéléphone 3 s'effectue sur cette voie de transmission audio ou de données. Le radiotéléphone 3 peut aussi recevoir de l'information de contrôle ou de synchronisation sur la voie de signalisation
pendant qu'un appel est en cours.
SR 11964 CA/DB
Lorsqu'un radiotéléphone 3 quitte une cellule pendant un appel et entre dans une autre cellule, le radiotéléphone transfère l'appel sur une voie de transmission audio ou de données disponible dans la nouvelle cellule. De façon similaire, si aucun appel n'est en cours, un message de contrôle est transmis sur la voie de signalisation de sorte que le radiotéléphone 3 s'enregistre dans la station de base 2 associée à la nouvelle cellule De cette manière, la communication mobile sur une grande surface
géographique est possible.
Le système de communication cellulaire 1 comporte en outre un terminal 5 pour contrôler la communication entre les stations de base cellulaires 2 et le Réseau Téléphonique Public Commuté (RTPC) 4, par exemple pendant une communication entre un radiotéléphone 3 et le RTPC 4, ou entre un radiotéléphone 3 dans une première cellule et un
radiotéléphone 3 dans une seconde cellule.
Bien entendu, un sous-système de communication radio sans fil bidirectionnel est requis pour établir la communication entre chaque radiotéléphone 3 situé dans une cellule et la station
de base cellulaire 2 de cette cellule. Un tel sous-
système de communication radio sans fil bidirectionnel
SR 11964 CA/DB
comporte, de façon typique, dans le radiotéléphone 3 et également dans la station de base cellulaire 2 (a) un transmetteur pour encoder le signal de parole et pour transmettre le signal de parole ainsi encodé à travers une antenne tel que 6 ou 7, et (b) un récepteur pour recevoir un signal de parole encodé transmis à travers la même antenne 6 ou 7 et pour décoder le signal de parole encodé reçu. Comme il est bien connu des personnes versées dans la technique, l'encodage de la parole est nécessaire pour réduire la largeur de bande nécessaire à la transmission de la parole à travers le système de communication radio sans fil bidirectionnel, i.e. entre un radiotéléphone
3 et une station de base 2.
Le but de la présente invention est de fournir une technique numérique efficace pour l'encodage de la parole offrant un bon compromis entre la qualité subjective et le débit binaire, par exemple pour la transmission bidirectionnelle de signaux de parole entre une station de base cellulaire 2 et un radiotéléphone 3 à travers une voie de transmission audio ou de données. La figure 1 est un bloc diagramme schématique d'un système d'encodage numérique de la parole adéquat pour mettre en oeuvre
une telle technique.
SR 11964 CA/DB
Le système d'encodage de la parole de la figure 1 est le même système d'encodage qu'illustré & la figure 1 du brevet américain US-A-5 444 816 auquel un module estimateur de position d'impulsion 112 selon la présente invention a été ajouté. Le brevet US-A-5 444 816 a été délivré le 22 août 1995 pour une invention intitulée "DYNAMIC CODEBOOK FOR EFFICIENT
SPEECH CODING BASED ON ALGEBRAIC CODES".
Le signal de parole analogique d'entrée est échantillonné et traité par blocs. Il doit être mentionné que l'application de la présente invention n'est pas limitée à un signal de parole. L'encodage d'autres types de signaux de son peut aussi être envisagé. Dans l'exemple illustré, le bloc d'entrée S (figure 1) formé d'échantillons de parole S comporte L échantillons consécutifs. Dans la littérature relative au CELP, L est désigné comme étant la longueur de "sous-trame" et est typiquement situé entre 20 et 80. Également, les blocs de L échantillons sont désignés comme des vecteurs de dimension L. Des vecteurs de dimension L variés sont produits au cours de la procédure d'encodage. Une liste de ces vecteurs qui apparaissent aux figures 1
SR 11964 CA/DB
et 2, et aussi une liste des paramètres transmis est donnée ci-après: Liste des principaux vecteurs de dimension L: S Vecteur de parole d'entrée; R' Vecteur résiduel duquel une composante de prédiction à long terme a été retirée; X Vecteur-cible; D Vecteur-cible ayant été filtré à rebours; Aik Vecteur-code d'index k du répertoire algébrique; et Ck Vecteur d'innovation (vecteur-code filtré). Liste des Daramètres transmis: k Index du vecteur-code (entrée du répertoire algébrique); g Gain; STP Paramètres de prédiction à court terme (définissant A(z)); et LTP Paramètres de prédiction à long terme (définissant un gain b et un retard T de
fréquence fondamentale).
PRINCIPE DE DECODAGE:
SR 11964 CA/DB
Nous croyons qu'il est préférable de tout d'abord décrire le dispositif de décodage de la parole de la figure 2 qui illustre les différentes étapes effectuées entre l'entrée numérique (l'entrée du démultiplexeur 205) et la parole échantillonnée à la
sortie du filtre de synthèse 204.
Le démultiplexeur 205 extrait quatre paramètres différente de l'information binaire qu'il reçoit d'une voie numérique d'entrée, à savoir l'index k, le gain g, les paramètres de prédiction à court terme STP, et les paramètres de prédiction à long terme LTP. Le vecteur S de dimension L du signal de parole est synthétisé sur la base de ces quatre
paramètres tel qu'il sera expliqué dans la description
qui suit.
Le dispositif de décodage de la parole de la figure 2 comprend un répertoire dynamique 208 composé d'un générateur de code algébrique 201 et d'un pré-filtre adaptatif 202, un amplificateur 206, un additionneur 207, un module de prédiction à long terme
203, et un filtre de synthèse 204.
Dans une première étape, le générateur de code algébrique 201 produit un vecteur-code Ak en
réponse à l'index k.
SR 11964 CA/DB
Dans une seconde étape, le vecteur-code Ak est traité par le pré-filtre adaptatif 202 lui-même alimenté par les paramètres de prédiction à court terme STP pour produire un vecteur d'innovation de sortie C,. La fonction du pré-filtre adaptatif 202 est de contrôler dynamiquement le contenu fréquentiel du vecteur d'innovation Ck afin d'améliorer la qualité de la parole, c'est-à-dire de réduire la distorsion audible causée par des fréquences qui agacent l'oreille humaine. Des fonctions de transfert typiques F(z) pour le pré-filtre adaptatif 202 sont données ci-après: A(z/y) (z) = ( A(z/y:> :1 IF ( Az) z b t1-b z F,(z) est un pré-filtre dans lequel 0 < y, < y, < 1 sont des constantes. Ce pré-filtre rehausse la région des formants et est très efficace spécialement lorsque le codage est réalisé à un débit
inférieur à 5 kbit/s.
Fh(z) est un pré-filtre de fréquence fondamentale o T est le retard de fréquence fondamentale variant dans le temps et b, est soit
SR 11964 CA/DB
constant ou égal au paramètre (gain b de fréquence fondamentale) de prédiction a long terme quantifié des sous-trames courantes ou précédentes. Fb(z) est très efficace pour rehausser les harmoniques de fréquence fondamentale à tous les débits. Ainsi, F(z) inclut, de façon typique, un pré-filtre Fb(z) parfois combiné àa un pré-filtre F. (z), a savoir: F(z) = Fo(z) Fb(z) D'autres formes de pré-filtres peuvent aussi être
utilisées de manière profitable.
Conformément à la technique CELP, le signal de parole échantillonné de sortie est obtenu en multipliant tout d'abord le vecteur d'innovation Ck en provenance du répertoire 208 par le gain g à l'aide de l'amplificateur 206. L'additionneur 207 somme alors la forme d'onde gCk mise à l'échelle avec la sortie E (la composante de prédiction à long terme du signal d'excitation du filtre de synthèse 204) d'un module de prédiction à long terme 203 alimenté par les
paramètres LTP, placé dans une boucle de contre-
réaction et ayant une fonction de transfert B(z) définie comme suit: B(z) = bz-T
SR 11964 CA/DB
o b et T sont respectivement les gain et retard
définis ci-dessus.
Le module de prédiction 203 est un filtre ayant une fonction de transfert qui dépend des derniers paramètres LTP reçus, c'est-à-dire les paramètres b et T pour ainsi modéliser la périodicité de la fréquence fondamentale de la parole. Il introduit les gain b et retard T appropriés des échantillons. Le signal composite E + gCk constitue le signal d'excitation du filtre de synthèse 204 dont la fonction de transfert est 1/A(z) (A(z) étant défini
dans la description qui suit). Le filtre 204
introduit la forme spectrale correcte conformément aux derniers paramètres STP reçus. Plus particulièrement, le filtre 204 modélise les fréquences de résonance (formants) de la parole. La sortie est le signal de parole échantillonné et synthétisé pouvant être converti en un signal analogique à l'aide d'un filtre antirepliement approprié conformément à une techniquebien connue de l'homme de l'art.
Il existe plusieurs façons de construire un répertoire algébrique 208. Conformément à la présente invention, le répertoire algébrique 208 est
SR 11964 CA/DB
composé de vecteurs-codes ayant N impulsions
d'amplitude non nulle.
Appelons pi et S la position et l'amplitude de la il' impulsion d'amplitude non nulle, respectivement. Nous assumerons que l'amplitude s PI est connue soit parce que la ii- amplitude est fixe ou soit parce qu'il existe une quelconque méthode pour
choisir s préalablement à la recherche du vecteur-
P! code. Appelons "voie i", dénotée Tl l'ensemble des positions. que Pi peut occuper entre 1 et L.
Quelques ensembles typiques de voies sont donnés ci-
après en assumant que L = 40. Le premier exemple est un design introduit dans le brevet précité US-A-5 444 816 et auquel il est référé par "Permutations d'impulsion unique entrelacées" ISPP (Interleaved Single Pulse Permutations). Dans le premier exemple de design, dénoté ISPP(40,5), un ensemble de 40 positions est séparé en 5 voies entrelacées de 40/5 = 8 positions valides chacune. Trois bits sont requis pour spécifier les 8 = 23 positions valides d'une impulsion donnée. Donc, un total de 5x3 = 15 bits de codage sont requis pour spécifier les positions
SR 11964 CA/DB
d'impulsion dans cette structure de répertoire
algébrique particulière.
Design 1: ISPP(40,5)
i Voies (positions valides de la il-
impulsion) 1 Tl = { 1, 6,11,16,21,26,31,36}
2 T2 = { 2, 7,12,17,22,27,32,37}
3 T3 = { 3, 8,13,18,23,28,33,38}
4 T4 = { 4, 9,14,19,24,29,34,39}
T5 = { 5,10,15,20,25,30,35,40}
Cet exemple est complet dans le sens que chacune des 40 positions est reliée à une et à seulement une voie. Il existe plusieurs façons de dériver une structure de répertoire à partir d'un ou plusieurs ISPP's pour rencontrer des exigences particulières en termes de nombre d'impulsions ou de bits de codage. Par exemple, un répertoire à quatre impulsions peut être dérivé à partir du design ISPP(40,5) en ignorant simplement la voie Ts, ou en considérant l'union des voies T4 et T. comme une voie unique. Les exemples 2 et 3 suivants montrent
d'autres façons de compléter les designs ISPP.
SR 11964 CA/DB
Design 2: ISPP(40,10) Voies (positions valides de la ii* impulsion) i T1 = {,11,21,31}
2 T = { 2,12,22,32}
3 T3 = { 3,13,23,33}
9 T = { 9,19,29,39}
T10 = {10,20,30,40}
Design 3: ISPP(48,12) 20. i Voies (positions valides de la ir impulsion)
1 T1 = { 1,13,25,37}
2 T2 = { 2,14,26,38}
3 T3 = { 3,15,27,39}
4 T4 =.{ 4,16,28,40}
s Té = { 5,17,29,41}
À. À À *À..................
11 T1l = {11,23,35,47}
12 T^ = {12,24,36.48}
SR 11964 CA/DB
A noter que dans le design 3, la dernière position d'impulsion des voies Ts à Ta tombe en dehors de la longueur de sous-trame L = 40. Dans un tel cas,
l'impulsion sera simplement ignorée.
Design 4: Somme de deux ISPP(40,1)
i Voies (positions valides de la i-
impulsion) IlS ---- ---- -=,-----,--- ---=, __ _
1 T1 ={1, 2, 3, 4, 5, 6, 7,....39,40}
2 T,={ 1, 2, 3, 4, 5, 6, 7,....,39,40}
Dans le design 4, les voies T1 et T permettent à l'impulsion d'occuper l'une quelconque des 40 positions. A noter que les positions des voies Tl et T2 se superposent. Lorsque plus d'une impulsion occupe la même position leurs amplitudes sont
simplement additionnées ensemble.
Une grande variété de répertoires peuvent
être construits autour du concept des designs ISPP.
PRINCIPE D'ENCODAGE
Le signal de parole échantillonné S est encodé bloc par bloc par]e système d'encodage de la
SR 11964 CA/DB
figure 1, formé de 11 modules numérotés de 102 à 112. La fonction et l'opération de la plupart de ces modules restent inchangées par rapport à la
description du brevet américain précité US-A- 5 444
816. Done, bien que la description qui suit explique
au moins brièvement la fonction et l'opération de chaque module, elle se concentrera sur la matière qui est nouvelle par rapport à la divulgation du brevet
américain précité US-A- 5 444 816.
Pour chaque sous-trame de L échantillons du signal de parole, un ensemble de paramètres de codage par prédiction linéaire LPC, nommés paramètres de prédiction à court terme STP, est produit conformément à une technique antérieure à l'aide d'un module analyseur de spectre LPC 102. Plus spécifiquement, le module analyseur 102 modélise les caractéristiques spectrales de chaque sous-trame S de
L échantillons.
La sous-trame d'entrée S de L échantillons est blanchie par un filtre blanchissant 103 ayant la fonction de transfert suivante basée sur les valeurs courantes des paramètres STP:
SR 11964 CA/DB
M
A(z) = aiz-
i-o o a0 = 1, et z est la variable habituelle de la transformée en "z". Tel qu'illustré à la figure 1, le filtre blanchissant 103 produit un vecteur résiduel R. Un module extracteur de fréquence fondamentale 104 est utilisé pour calculer et quantifier les paramètres LTP, à savoir le retard T et le gain g de prédiction à long terme. L'état initial du module extracteur 104 est aussi initialisé à une valeur FS en provenance d'un module extracteur d'états initiaux 110. Une procédure détaillée pour calculer et quantifier les paramètres LTP est décrite dans ie brevet américain ci-dessus mentionné US-A-5 444 816;
cette procédure est bien connue de l'homme de l'art.
En conséquence, celle-ci ne sera pas décrite davantage
dans la présente divulgation.
Un module de caractérisation des réponses des filtres 105 (figure 1) est alimenté par les paramètres STP et LTP pour calculer une caractéristique des réponses des filtres FRC pour fins
d'utilisation lors des étapes subséquentes.
SR 11964 CA/DB
L'information FRC est formée des trois composantes suivantes o n = 1, 2,
. L. f(n): réponse de F(z) À noter que F(z) inclut, de façon générale, le pré-filtre de fréquence fondamentale. * h(n): réponse de à f(n) A(zy l)..DTD: o y est un facteur perceptuel.
De façon plus générale, h(n) est la réponse impulsionnelle de F(z)W(z)/A(z) qui est une cascade du pré-filtre F(z), du filtre de pondération perceptuelle W(z) et du filtre de synthèse 1/A(z). À noter que F(z) et 1/A(z) sont les mêmes filtres que ceux utilisés dans le
décodeur de la figure 2.
* U(i,j): autocorrélation de Ilh(n) donnée par 1' expression suivante: U(i,j) = h(k-i+1) h(k-j+l) k=1
SR 11964 CA/DB
pour l1i<L et i j L; h(n)O=0 pour n<l Le module de prédiction à long terme 106
est alimenté par le signal d'excitation passé (c'est-
à-dire E + gCk de la sous-trame précédente) pour former la nouvelle composante E utilisant des retard T et
gain b appropriés.
L'état initial du filtre perceptuel 107 est ajusté à la valeur FS en provenance du module extracteur d'états initiaux 110. Le vecteur résiduel R'- R-E calculé par un soustracteur 121 (figure 1) est alors appliqué au filtre perceptuel 107 pour obtenir à la sortie de ce filtre 107 un vecteur-cible X. Tel qu'illustré à la figure 1, les paramètres STP sont appliqués au filtre 107 pour varier sa fonction de transfert en rapport avec ces paramètres. X = R' - P. o P représente la contribution de la prédiction à long terme (LTP) incluant la "sonnerie" des excitations passées. Le critère MSE (Mean Square Error) qui s'applique à l'erreur A peut maintenant être exprimé soue la forme de la matrice suivante: min I112 = minI$/-'52 = minS- [P-gAk r] 11z k k k minIX-gAn 'J2 k
SR 11964 CA/DB
o A = S - S, et /,respectivement S', sont S, respectivement S traités par un filtre de pondération perceptuelle de la forme;
A ( Z)
A(z) A ( z-1) o y=0.8 est une constante perceptuelle, H est une matrice triangulaire inférieure L x L de Toeplitz formée A partir de la réponse h(n) comme suit. Le terme h(O) occupe la diagonale de la matrice et les termes h(1), h(2),..h(L-1) occupent des diagonales
inférieures respectives.
Une étape de filtrage à rebours est effectuée par le filtre 108 de la figure 1. En mettant la dérivée de l'équation ci-dessus égale à zéro par rapport au gain g, nous obtenons le gain optimal suivant:
SR 11964 CA/DB
X(Ai) X (AkH T) r minkifAl2=rin {lll- (X(AkH)9)'} k IlAkHT1Z L'objectif est de trouver l'index k
particulier pour lequel la minimisation est réalisée.
A noter que puisque I1xI2 est une quantité fixe, le même index peut être trouvé en maximisant la quantité suivante: (X(A) r) ( (XII) ArT)2 (DA r)
max k a max --
k |AH if2 Ir lx2 ir2 kRiH2 k 1 k
SR 11964 CA/DB
o D = (XH) et Ckz = IAkH ?112
Dans le filtre à rebours 108, un vecteur-
cible D = (XH) est calculé. Le terme "filtrage à rebours" pour cette opération provient de l'interprétation de (XH) comme le filtrage de X
renversé dans le temps.
La fonction du module contrôleur d'optimisation 109 est d'effectuer une recherche parmi les vecteurs-codes A. disponibles dans le répertoire
algébrique afin de sélectionner le meilleur vecteur-
code pour encoder la sous-trame de L échantillons courante. Le critère de base pour sélectionner le
meilleur vecteur-code parmi un ensemble de vecteurs-
codes ayant chacun N impulsions d'amplitude non nulle est donné sous la forme d'un rapport à maximiser:
SR 11964 CA/DB
Critère de sélection de base: k = max- [Qk(N)] k o (DAk) Qk (N) = [ 2] et o A, a N impulsions d'amplitude non nulle. Le numérateur dans l'équation ci-dessus est le carré de
DA, = ED S
PJPl o D est le vecteur-cible dont une composante de prédiction à long terme a été retirée et Ak est le vecteur-code algébrique ayant N impulsions non nulles d'amplitude S Le dénominateur est un terme d'énergie pouvant être exprimé comme suit:
SR 11964 CA/DB
2 2
Ck = t SlU(P1,Pi) +2. S S U(piP) l=l =l*l P1 P$ o U (Pi, p) est la corrélation associée a deux impulsions d'amplitude unitaire, l'une à la position Pi et l'autre à la position p. Cette matrice est calculée avec l'équation ci-dessus dans le module de caractérisation des réponses des filtres 105 et inclue dans l'ensemble de paramètres désignés FRC dans le
bloc diagramme de la figure 1.
Une méthode rapide pour calculer ce dénominateur consiste à utiliser les N boucles imbriquées de la figure 4 dans laquelle la notation S(i) et SS(i,j) remplace les quantités respectives Is " et "IS S ". Le calcul du dénominateur k2 est le PIt P P) processus qui consomme le plus de temps. Les calculs contribuant à -,2 et qui sont effectués dans chaque boucle de la figure 4 peuvent être exprimés sur des lignes séparées à partir de la boucle la plus à l'extérieur jusqu'à la boucle la plus à l'intérieur comme suit:
SR 11964 CA/DB
ak - s $U(p,pl) +S2 U(p2p2 2) + 2 P Spt U(Pl,p2) +Sp 2U(p3p3) + 2 [Sp SU(pl p3) +S S'U(p 2.P3] pSPU[Pp,) + 2[SM p U(plp) S Upzp).P.l..$ Sp Ulp)]PJ' o Pi est la position de la iIes impulsion d'amplitude
non nulle.
L'équation précédente peut être simplifiée en effectuant un certain pré-calcul a l'aide du module contr6leur d'optimisation 109 pour transformer la matrice U(i,j) fournie par la module de caractérisation des réponses des filtres 105 en une matrice U' (i,j) conformément à la relation suivante: U/(j,k) S S Sk U(j,k) o SX est l'amplitude sélectionnée pour une impulsion individuelle à la position k suite à la quantification de l'estimation d'amplitude correspondante (qui sera décrite ci-après). Le facteur 2 sera ignoré dans le
reste de la discussion afin d'alléger les équations.
SR 11964 CA/DB
Avec la nouvelle matrice U(ij,k), le calcul (voir figure 3) pour chaque boucle de l'algorithme rapide peut être exprimé sur une ligne séparée, de la boucle la plus à l'extérieur l.a boucle la plus à l'intérieur, comme suit: (Y= U (pl,Pl) +U'(p2,p2) + U'(pl,P2) +Ul(p3,p3) +U' (p1,P3) +U(p2P3) I I f +Uy(pI PN) U(PlPi) +U (pPN) +. -+U (P l, P,) Les figures 4a et 4b montrent deux exemples d'une structure d'arbre pour illustrer quelques caractéristiques de la technique de 'recherche par boucles imbriquées" qui vient juste d'être décrite et qui est illustrée à la figure 3, pour bien la comparer avec la présente invention. Les noeuds terminaux au bas de l'arbre de la figure 4a illustrent toutes les combinaisons de positions d'impulsions possibles pour un exemple o le nombre d'impulsions d'amplitude non nulle N = 5, dans lequel chaque impulsion peut assumer une position parmi quatre positions possibles. La technique de "recherche par boucles imbriquées" exhaustive procède
*SR 11964 CA/DB
à travers les noeuds de l'arbre normalement de la gauche vers la droite tel qu'illustré. Un inconvénient de l'approche de la "recherche par boucles imbriquées" est que la complexité de la recherche augmente en fonction du nombre d'impulsions N. Pour être capable de traiter des répertoires ayant un nombre N d'impulsions plus grand, on doit s'organiser pour n'effectuer qu'une recherche partielle du répertoire. La figure 4b illustre le même arbre dans lequel une recherche plus rapide est réalisée en ne s'attardant qu'à la région la plus prometteuse de l'arbre. Plus précisément, le passage aux niveaux inférieurs n'est pas systématique mais plutôt conditionné par le dépassement de seuils donnés
de performance.
Recherche profondeur d'abord Attardons nous maintenant à la technique alternative plus rapide constituant l'objet de la présente invention et réalisée par le module estimateur de vraisemblance de position d'impulsion 112 et le module contrôleur d'optimisation 109 de la figure 1. Les caractéristiques générales de cette technique seront tout d'abord décrites. Par la suite, plusieurs modes de réalisation typiques de cette
technique rapide seront donnés comme exemples.
SR 11964 CA/DB
5.Le but de la recherche est de déterminer le vecteur-code à l'aide du meilleur ensemble de N positions d'impulsions en assumant que les amplitudes des impulsions sont fixes ou encore ont été sélectionnées par un quelconque mécanisme basé sur le signal préalablement à la recherche, comme par exemple celui décrit dans la demande américaine NO 08/383,968 déposée le 6 février 1995. Le critère de sélection de base est la maximisation du rapport Qk ci-haut mentionné. Afin de réduire la complexité de la recherche, les positions des impulsions sont déterminées Nm impulsions à la fois. Plus particulièrement, les N impulsions disponibles sont
divisées (étape 601 de la figure 6) en M sous-
ensembles non vides de N. impulsions, respectivement, de sorte que N1 + l...+ W...+ p = N. Un choix particulier de positions pour les premières J = N1+ N. + N._ impulsions considérées est nommé un chemin de niveau m ou un chemin de longueur J. Le critère de performance pour un chemin de J positions d'impulsions est le rapport Qk(J) lorsque seulement les J impulsions
pertinentes sont considérées.
La recherche démarre avec le sous-ensemble #1 et procède avec les sousensembles subséquents en
SR 11964 CA/DB
accord avec une structure d'arbre de sorte que le
sous-ensemble m fait l'objet d'une recherche au ml&-
niveau de l'arbre.
La fonction de la recherche au niveau 1 est de considérer les N, impulsions du sous-ensemble #1 et leurs positions valides de sorte à déterminer un ou plusieurs chemin(s) candidat(s) de longueur N, qui
sont les trois noeuds du niveau #1.
Le chemin à chaque noeud terminal du niveau m-l est prolongé à la longueur N1+ N,... + N. au niveau m en considérant N. nouvelles impulsions et leurs positions valides. Un ou plusieurs chemin(s) prolongé(s) candidat(s) sont déterminés pour
constituer les noeuds du niveau m.
Le meilleur vecteur-code correspond à celui des chemins de longueur N qui maximise le critère Qk(N) par rapport à tous les noeuds du niveau M. Alors que dans le brevet américain précité US-A-5 444 816 les impulsions (ou voies) sont explorées dans un ordre préétabli (i = 1,2,... N), elles sont considérées en ordres variés dans la présente invention. En fait, elles peuvent être
SR 11964 CA/DB
considérées selon l'ordre jugé le plus prometteur dans les circonstances particulières à n'importe quel moment durant la recherche. A cette fin, un nouvel indice chronologique n (n = 1, 2,.. N) est utilisé et le nombre d'identification ID de la no impulsion considérée dans la recherche est donné par la "fonction d'ordre d'impulsion": i = i(n). Par exemple, à un moment particulier quelconque, le chemin de la recherche, pour un répertoire à cinq impulsions d'amplitude non nulle, peut être réalisé en accord avec la fonction d'ordre d'impulsion suivante: n = 1 2 3 4 5 indice chronologique i = 4 3 1 5 2 impulsion (ou voie) ID Afin d'évaluer intelligemment quel est l'ordre d'impulsion le plus prometteur en tout temps, la présente invention introduit un vecteur "estimatif de vraisemblance de positions d'impulsions" B, qui est basé sur des signaux reliées à la parole. La p'l composante Bp de ce vecteur estimatif B caractérise la probabilité qu'une impulsion occupe la position p (p = 1, 2,.-- L) dans le meilleur vecteur-code que nous recherchons. Ce meilleur vecteur- code est encore inconnu et c'est l'objet de la présente invention de divulguer comment certaines propriétés de ce meilleur
SR 11964 CA/DB
vecteur-code peuvent être déduites des signaux reliée
à la parole.
Le vecteur estimatif B peut être utilisé
comme suit.
Premièrement, le vecteur estimatif B sert de base pour déterminer pour quelle voie i ou j il est plus facile d'évaluer la position d'impulsion. La voie pour laquelle la position d'impulsion est plus facile à évaluer doit être traitée en premier. Cette propriété est souvent utilisée dans la règle d'ordonnancement des impulsions pour choisir les Nm impulsions aux premiers niveaux de la structure d'arbre. En second lieu, pour une voie donnée, le vecteur estimatif B indique la probabilité relative de chaque position valide. Cette propriété est utilisée de façon avantageuse comme critère de sélection dans les quelques premiers niveaux de la structure d'arbre à la place du critère de sélection de base Qk (j) qui, en tout état de cause, dans les quelques premiers niveaux agit sur trop peu d'impulsions pour fournir une performance fiable dans la sélection des positions
valides.
SR 11964 CA/DB
La méthode préférée pour obtenir le vecteur estimatif de vraisemblance de position d'impulsion B des signaux reliés à la parole consiste à calculer la somme du vecteur-cible D normalisé:
(1-1) -D
IDJ IDU et le signal résiduel R' normalisé: R JI'l pour ainsi obtenir le vecteur estimatif de vraisemblance de position d'impulsion B:
B_ (1-_) D +R1
ID NR'II
o D est une constante fixe ayant une valeur typique de 1/2 (D est choisi entre O et 1 dépendant du pourcentage des impulsions d'amplitude non nulle
utilisées dans le code algébrique).
I1 doit être noté que le même vecteur estimatif B est employé dans un contexte différent et pour une fonction différente dans la demande de brevet
SR 11964 CA/DB
américaine No. 08/383,968 déposée le 6 février 1995 pour une invention intitulée "ALGEBRAIC CODEBOOK WITH
SIGNAL-SELECTED PULSE AMPLITUDES FOR FAST CODING OF
SPEECH", qui divulgue une méthode pour sélectionner à priori une combinaison presqu'optimale d'amplitudes d'impulsions. C'est utile dans le contexte d'un design de répertoire algébrique o les amplitudes des impulsions non nulles peuvent assumer une amplitude
parmi q amplitudes de valeurs différentes, o q > 1.
Cette observation confirme que la découverte de bons estimateurs tels que B qui peuvent être déduits du signal lui-même est de grande importance pour coder efficacement la parole. En fait, en plus d'être des estimateurs à la fois pour les positions ou les amplitudes, ils constituent également des estimateurs pour le vecteur-code A, lui- même. Ainsi, toute technique de recherche qui combine à la fois les principes de la demande de brevet américaine No. 08/383,968 et de la présente demande se situe clairement à l'intérieur de la nature et de l'esprit de la présente invention. L'exemple qui suit est une technique combinée typique qui cadre dans l'esprit de la présente invention. Il a été indiqué précédemment dans la présente divulgation que quand au moins deux impulsions appartenant à des voies superposées partagent la même position dans la combinaison, elles sont additionnées. Ce compromis position/amplitude
SR 11964 CA/DB
peut être optimisé à l'aide d'une recherche en treillis. Pour plus de commodité, les constantes et
les variables déjà définies sont listées ci-après.
Liste des constantes Constante Exemple Nom/signification L 40 Longueur de sous-trame (Nombre de positions); N 10 Nombre d'impulsions; 4 Nombre de positions possibles de la voie i; M 5 Nombres de niveaux; N. 2 Nombre d'impulsions associées au mi*e niveau; S, -1 Amplitude à la position P;
Pi 13 Position de la i-
impulsion; et
pifn. 19 Position de la n-
impulsion traitée.
Liste de variables Index Range Usage normal
SR 11964 CA/DB
p 1 - L Position de l'index dans la sous-trame: i 1 - N Index d'impulsion; m 1 - M Index de sous-ensemble; n 1 - N Index d'ordre de traitement; i (n) 1 - N Index de la nos impulsion traitée; pS (.n 1 - L Position de la nia impulsion traitée; Sp {*1} Amplitude a la position p; et Spi,. { 1} Amplitude à la position occupée par la ntè impulsion. Exemples de recherches nrofondeur d'abord Considérons maintenant quelques exemples typiques
de recherches profondeur d'abord.
TECHNIQUE DE RECHERCHE # 1
Répertoire alçébricque
L=40; N=5
ISPP(40,5) (c'est-à-dire: L1=L2=-..L5=8).
SR 11964 CA/DB
Procédure de recherche: Niveau Nombre Chemins Régle Critère de m d' impulsions candidatc d ' o r d o n - sélection N.é nancement d'impulsions
1 1 10 R1,R2 B
2 2 2 R2 Qk(2) 3 2 2 R2 Qk(4) RègleRI Les 10 façons de choisir une première position d'impulsion Pi(,l pendant l'opération de construction de chemins de niveau 1 est de considérer chacune des cinq voies à tour de rôle, et pour chacune des voies choisir à tour de rôle l'une des deux positions qui
maximisent Bp' pour la voie considérée.
La règle R2 définit la fonction d'ordonnancement d'impulsions à etre utilisée pour les quatre impulsions considérées aux niveaux 2 et 3 comme suit. Les quatre indices restants sont redistrïbués sur un cercle et sont renumérotés dans le sens: des aiguilles d'une montre en commençant à la droite de l'impulsion i(l) (c'est-à- dire lc numéro de
SR 11964 CA/DB
l'impulsion au noeud particulier de niveau 1
considéré) -
Tournons nous maintenant à un second cas de la recherche profondeur d'abord que nous appellerons "Technique de recherche #2" et qui illustre clairement
le principe profondeur d'abord.
TECHNIQUE DE RECHERCHE # 2
Répertoire algébri/ue
L=40; N=10
ISPP(40,10) (c'est-à-dire: L=L=..L10=4) Procédure de la recherche: Niveau Nombre Chemins R è g 1 e Critère m d'impulsions candidats d ' or do n - de N. n a n c a m e n tslection d' impulsions
1 2 9 R3 B
2 2 1 R4 Qk(4)
3 2 1 R4 Q)
4 2 1 R4 Q(8)
2 1 R4 Qk(10)
SR 11964 CA/DB
Règle ES On choisit l'impulsion i(1) et on sélectionne sa position conformément au maximum de Bp pour tous les p. Pour i(2), on choisit à tour de rôle chacune des neuf impulsions restantes. Le critêie de sélection pour un i(2) donné consiste à sélectionner
la position pour laquelle Bp est maximisé dans la voie.
RèaeR4-4 À la fin du niveau 1, la fonction entière d'ordonnancement d'impulsions est déterminée en redistribuant sur une cercle les huit indices n restants et en les renumérotant dans le sens de rotation des aiguilles d'une montre en commençant à la
droite de l'impulsion i(2).
La technique de recherche #2 est illustrée aux figures 5 et 6. La figure 5 illustre la structure d'arbre de la technique de recherche profondeur d'abord #2 appliquée à un répertoire à 10 impulsions et à vecteurs-codes de 40 positions conçu autour de
permutations d'impulsion unique entrelacées.
L'organigramme correspondant est illustré à la figure 6. Les L=40 positions sont divisées en 10 voies associées chacune à l'une des N=U10 impulsions
SR 11964 CA/DB
d'amplitude non nulle des vecteurs-codes. Les 10 voies sont entrelacées conformément à N permutations
d'impulsion unique entrelacées.
Le vecteur estimatif de vraisemblance de position d'impulsion B ci- dessus mentionné est calculé. Étape 602 La position p de la valeur absolue maximale du
BP estimé est calculée.
Étame 603 (opérations de construction du départ du chemin au niveau 1) On choisit l'impulsion (i.e., voie) i(l) et on sélectionne sa position valide de manière à ce qu'elle soit conforme a la position trouvée à l'étape 602
(voir 501 dans la figure 5).
Étape 604 (opérations de construction de la fin du chemin au niveau 1)
SR 11964 CA/DB
Pour i(2), on choisit à tour de r8le chacune des 9 impulsions restantes. Le critère de sélection pour un i(2) donné consiste à sélectionner la position qui maximise B. à l'intérieur de la voie dudit i(2) donné. Ainsi, neuf chemins candidats de niveau 1
distincts sont entrepris (voir 502 dans la figure 5).
Chacun des chemins candidats de niveau 1 sont ensuite prolongés au travers des niveaux subséquents de la structure d'arbre pour former 9 vecteurs-codes candidats distincts. De façon évidente, la fonction du niveau 1 est de trouver neuf bonnes paires d'impulsions de départ sur la base du vecteur estimatif B. Pour cette raison, les opérations de construction des chemins de niveau 1 sont dénommées "présélection d'impulsions basée sur le signal" dans
la figure 5.
Etape 605 (Rèale R4) Pour sauver du temps de calcul, l'ordre des impulsions à être utilisé dans les quatre niveaux subséquents est préétabli. Plus particulièrement, la fonction d'ordonnancement des impulsions i(n) pour n = 3, 4,... 10 est déterminée en distribuant les huit indices n restants sur un cercle et en les renumérotant dans le sens de rotation des aiguilles d'une montre en commençant à la droite de i (2)
SR 11964 CA/DB
Utilisant cet ordre, les impulsions i(3) et i(4) sont choisies pour le niveau 2, les impulsions i(5) et i(6) sont déjà choisies pour le niveau 3, et ainsi de suite. taes 606. 607. 608. 609 (Niveaux 2 à 5} Les niveaux 2 à 5 sont conus pour l'efficacité et suivent des procédures identiques. Plus particulièrement, une recherche exhaustive est appliquée à toutes les seize combinaisons des quatre positions des deux impulsions considérées (voir 503 dans la figure 5) conformément au critère de sélection associé Qk(2m), o m - 2, 3, 4, 5 est le numéro
d'identification du niveau.
Puisque seulement un chemin candidat unique résulte de chaque opération de construction de chemin (voir 504 dans la figure 5) associée aux niveaux 2 à (c'est-à-dire un facteur de branchement égal à 1), la complexité de la recherche croit essentiellement linéairement avec le nombre total d'impulsions. Pour cette raison, la recherche effectuée aux niveaux 2 à peut être caractérisée de façon précise en la nommant "recherche profondeur d'abord". Les techniques de recherche arborescentes varient de façon importante en structures, critères et domaines de
SR 11964 CA/DB problèmes. Cependant, dans le domaine de l'intelligence artificielle, il
est habituel de distinguer deux classes étendues de philosophie de recherche, à savoir les "recherches largeur d'abord"
et les "recherches profondeur d'abord".
Les neuf chemins candidats de niveau 1 distincte dont l'origine se situe à l'étape 604 et qui sont prolongés aux niveaux 2 à 5 (c'est-à- dire les étapes 605 à 609) constituent neuf vecteurs-codes
candidats Ak (voir 505 dans la figure 5).
La fonction de l'étape 610 est de comparer les neuf vecteurs-codes candidats Ak et de retenir le meilleur conformément au critère de sélection associé
au dernier niveau, à savoir Qk(10). -
Continuons avec un troisième exemple de la recherche profondeur d'abord dans un répertoire appelée "Technique de recherche #3" afin d'illustrer le cas o plus d'une impulsion peut occuper la même position. TECHNIQUE DE RECHERCHE # 3, 10 impulsions ou moins
SR 11964 CA/DB
RDertoire algébrique
L=40; N = 10
Nombre d'impulsions distinctes < 10 Somme des deux ISPP(40,5) (c'est-à-dire: L1=L2=.. L5=8; L6=L=.L10=8) Procédure de recherche:
= ààààà== = = = ==
Niveau N o m b r e Chemins Règle Critère de m d' impul. ions candidats d ' o r d o n - sélection _^ nancement d'impulsion
1 2 50 R5 B
2 2 2 R6 Qk(4) 3 2 2 R6 Qk(6) 4 2 1 R6 Qk (8) 2 1 R6 Qk (10) RUl RE: Lorsque deux impulsions peuvent occuper la même position, leurs amplitudes respectives s'additionnent pour donner une impulsion d'amplitude double. La règle R5 détermine la façon de sélectionner les deux
SR 11964 CA/DB
premières positions d'impulsions pour produire l'ensemble de chemins candidats de niveau 1. Les (5) *( 10) 50 noeuds des chemine candidats de niveau 1 correspondent a (i) une impulsion d'amplitude double à chacune des positions qui maximise B, dans les cinq voies distinctes, et (ii) toutes les combinaisons de deux positions d'impulsions du groupe de 10 positions d'impulsions sélectionnées en choisissant les deux impulsions qui maximisent B dans chacune des
cinq voies distinctes.
Rèle R6: Similaire à la Règle R4.
Bien que des modes de réalisation préférés de la présente invention aient été décrits en détail dans
la description précédente, ces modes de réalisation
peuvent être modifies à volonté, à l'intérieur de
l'étendue des revendications annexées, sans pour cela
s'éloigner de la nature et de l'esprit de l'invention.
Egalement, l'invention n'est pas limitée au traitement d'un signal de parole; d'autres types de signaux de son, par exemple audio peuvent être traités. De telles modifications, qui retiennent le principe de base, sont bien entendu comprises dans la présente invention.
SR 11964 CA/DB
Claims (29)
1. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder un signal de son, dans laquelle: le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; ladite recherche profondeur d'abord met en oeuvre une structure d'arbre définissant un nombre M de niveaux ordonnés, chaque niveau m étant associé à un nombre prédéterminé N= d'impulsions d'amplitude non nulle, o N.>l et o la somme desdits nombres prédéterminés associés aux M niveaux est égale au nombre N d'impulsions d'amplitude non nulle comprises dans lesdits vecteurs-codes, chaque niveau m de la structure d'arbre étant en outre associé à une opération de construction de chemin, à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; ladite méthode pour effectuer une recherche profondeur d'abord dans un répertoire comprenant les étapes suivantes: - dans un niveau 1 de la structure d'arbre, l'opération de construction de chemin associée consiste à;
SR 11964 CA/DB
choisir un nombre N1 d'impulsions parmi les N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement d'impulsions associée; sélectionner au moins une des positions p valides desdites N1 impulsions d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin candidat de niveau 1; - dans un niveau m de la structure d'arbre, l'opération de construction de chemin associée définit de façon récursive un chemin candidat de niveau m en prolongeant un chemin candidat de niveau m-1 à l'aide des sous-étapes suivantes; choisir un nombre N, d'impulsions parmi les impulsions d'amplitude non nulle n'ayant pas encore été choisies lors de la construction du chemin de niveau m-1 en relation avec la règle d'ordonnancement d'impulsions associée; et sélectionner au moins une des positions p valides desdites NM impulsions d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin candidat de niveau m; dans laquelle un chemin candidat de niveau m donL l'origine se trouve au niveau 1 et qui a été prolongé durant les opérations de construction de chemin associées aux niveaux
SR 11964 CA/DB
subséquents de la structure d'arbre détermine les positions respectives p des N impulsions d'amplitude non nulle d'un vecteur-code et
ainsi définit un vecteur code candidat Ai.
2. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder un signal de son, dans laquelle: le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; ladite recherche profondeur d'abord met en oeuvre (a) une division des N impulsions d'amplitude non nulle en un nombre M de sous-ensembles comprenant chacun au moins une impulsion d'amplitude non nulle, et (b) une structure d'arbre incluant des noeuds représentatifs des positions p valides des N impulsions d'amplitude non nulle et définissant une pluralité de niveaux de recherche associés chacun à l'un desdits M sous-ensembles, chaque niveau de recherche étant en outre associé à une règle d'ordonnancement d'impulsions donnée et a un critère de sélection donné; ladite méthode pour effectuer une recherche profondeur d'abord dans un répertoire comprenant les étapes suivantes: - dans un premier niveau de recherche de la structure d'arbre,
SR 11964 CA/DB
choisir au moins une des N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement d'impulsions associée pour former le sousensemble associé; sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin à travers les noeuds de la structure d'arbre; - dans chaque niveau de recherche subséquent de la structure d'arbre, choisir au moins une des impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous-ensemble associé; et sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle du sous- ensemble associé en relation avec le critère de sélection associé pour prolonger ledit au moins un chemin à travers les noeuds de la structure d'arbre; dans laquelle chaque chemin défini au premier niveau de recherche et prolongé durant les niveaux de recherche subséquents détermine les positions p respectives des N impulsions d'amplitude non nulle d'un vecteur-code Ak
SR 11964 CA/DB
constituant un vecteur-code candidat en vue
d'encoder le signal de son.
3. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 2, caractérisée en ce que ledit au moins un chemin comprend plusieurs chemins, en ce que les niveaux de recherche de la structure d'arbre incluent un dernier niveau de recherche, et en ce que ladite méthode comporte, dans le dernier niveau de recherche de la structure d'arbre, une étape de sélection, en relation avec le critère de sélection associé, de l'un des vecteurs- codes candidats A, définis par lesdits chemins en vue d'encoder le signal
de son.
4. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 2, caractérisé en ce qu'elle comprend en outreuneétape qui consiste à dériver les positions p valides prédéterminées des N impulsions d'amplitude non nulle conformément à au moins un design
de permutations d'impulsion uniaue entrelacées.
5. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 2, caractérisée en ce que, dans chaque niveau de recherche subséquent de la structure d'arbre, l'étape de sélection comporte les étapes suivantes:
SR 11964 CA/DB
-2731548
calculer un rapport mathématique donné pour chaque chemin défini par la ou les positions d'impulsions p sélectionnées dans le ou les niveaux de recherche précédents et prolongé par chaque position
p valide de ladite au moins une impulsion du sous-
ensemble associé audit niveau de recherche subséquent; et retenir le chemin prolongé, défini par les positions d'impulsions p qui maximise ledit rapport donné. 6. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 2, caractérisée en ce que, au premier niveau de recherche de la structure d'arbre, les étapes qui consistent à choisir au moins une des impulsions d'amplitude non nulle et à sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle sont effectuées en: calculant un vecteur estimatif de vraisemblance de position d'impulsion en relation avec le signal de son; et sélectionnant ladite au moins une impulsion d'amplitude non nulle du sous- ensemble associé et ladite au moine une position p valide de celle-ci en relation avec le vecteur estimatif de
vraisemblance de position d'impulsion.
SR 11964 CA/DB
7. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 6, caractérisée en ce que l'étape de calcul du vecteur estimatif de vraisemblance de position d'impulsion comprend les étapes suivantes: traiter le signal de son pour produire un signal-cible X, un signal-cible D ayant été filtré à rebours, et un signal résiduel R' duquel une composante de prédiction à long terme a été retiree; calculer le vecteur estimatif de vraisemblance de position d'impulsion B en réponse a au moins l'un des signal-cible X, signal-cible D et
signal résiduel R'.
8. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 7, caractérisée en ce que l'étape de calcul du vecteur estimatif de vraisemblance de position d'impulsion B en réponse à au moins l'un des signal-cible X, signal-cible D et signal résiduel R' comporte une étape de sommation du signal-cible D dans la forme normalisée suivante: D (1-fs; IDI et du signal résiduel R' dans la forme normalisée suivante:
SR 11964 CA/DB
R' pour ainsi obtenir un vecteur estimatif de vraisemblance de position d'impulsion B de la forme suivante; À=I, IR e l
o 5 est une constante fixe.
9. Méthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 8, caractérisée en ce que 0 est une constante fixe ayant une valeur située entre
O et 1.
10. Mfthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 9, caractérisée en ce que
est une constante fixe ayant une valeur égale à 1/2.
il. Efthode pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 2, caractérisée en ce que lesdites N impulsions d'amplitude non nulle ont des indices respectifs, et en ce que, dans chaque niveau subséquent de recherche de la structure d'arbre,
SR 11964 CA/DB
l'étape qui consiste à choisir au moins une desdites impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée, comprend une étape qui consiste à distribuer les indices des impulsions n'ayant pas encore été choisies sur un cercle et une étape qui consiste à choisir ladite au moins une impulsion d'amplitude non nulle conformément à une séquence des indices formée par déplacement sur le cercle dans le sens des aiguilles d'une montre et commençant à la droite de la dernière impulsion d'amplitude non nulle sélectionnée dans le niveau de
recherche précédent de la structure d'arbre.
12. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder un signal de son, dans lequel: le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; ladite recherche profondeur d'abord met en oeuvre (a) une division des N impulsions d'amplitude non nulle en un nombre M de sous-ensembles comprenant chacun au moins une impulsion d'amplitude non nulle, et (b) une structure d'arbre incluant des noeuds représentatifs des positions p valides des N impulsions d'amplitude non nulle et définissant une pluralité de niveaux de recherche associés chacun à
SR 11964 CA/DB
l'un desdits M sous-ensembles, chaque niveau de recherche étant en outre associé à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; ledit dispositif pour effectuer une recherche profondeur d'abord dans un répertoire comprenant: - pour un premier niveau de recherche de la structure d'arbre, des premiers moyens pour choisir au moins une des N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement
d'impulsions associée pour former le sous-
ensemble associé; des premiers moyens pour sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin à travers les noeuds de la structure d'arbre; - pour chaque niveau de recherche subséquent de la structure d'arbre, des seconds moyens pour choisir au moins une des impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous-ensemble associé; et des seconds moyens pour sélectionner, dans ledit niveau de recherche subséquent, au moins une des positions p valides de ladite au
SR 11964 CA/DB
moins une impulsion d'amplitude non nulle du sous-ensemble associé en relation avec le critère de sélection associé pour prolonger ledit au moins un chemin à travers les noeuds de la structure d'arbre; dans lequel chaque chemin défini au premier niveau de recherche et prolongé durant les niveaux de recherche subséquents détermine les positions p respectives des N impulsions d'amplitude non nulle d'un vecteur-code Ak constituant un vecteur-code candidat en vue
d'encoder le signal de son.
13. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 12, caractérisé en ce que ledit au moins un chemin comprend plusieurs chemins, en ce que les niveaux de recherche de la structure d'arbre incluent un dernier niveau de recherche, et en ce que ledit dispositif comporte des moyens pour sélectionner, dans le dernier niveau de recherche de la structure d'arbre et en relation avec le critère de sélection associé, l'un des vecteurs-codes candidats Ak définis par lesdits chemins en vue d'encoder le
signal de son.
14. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 12, caractérisé en ce qu'il comprend en outre des moyens pour dériver les positions p valides
SR 11964 CA/DB
prédéterminées des N impulsions d'amplitude non nulle conformément à au moins un design de permutations
d'impulsion unique entrelacées.
15. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 12, caractérisé en ce que les seconds moyens de sélection comprennent: des moyens pour calculer un rapport mathématique donné pour chaque chemin défini par la ou les positions d'impulsions p sélectionnées dans le ou les niveaux de recherche précédents et prolongé par chaque position p valide de ladite au moins une impulsion du sous-ensemble associé audit niveau de recherche subséquent; et des moyens pour retenir le chemin prolongé, défini par les positions d'impulsions p qui
maximisent ledit rapport donné.
16. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 12, caractérisé en ce que les premiers moyens pour choisir et les premiers moyens pour sélectionner comportent: des moyens pour calculer un vecteur estimatif de vraisemblance de position d'impulsion en relation avec le signal de son; et des moyens pour sélectionner ladite au
moins une impulsion d'amplitude non nulle du sous-
ensemble associé et ladite au moins une position p
SR 11964 CA/DB
valide de celle-ci en relation avec le vecteur
estimatif de vraisemblance de position d'impulsion.
17. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 16, caractérisé en ce que lesdits moyens pour calculer le vecteur estimatif de vraisemblance de position d'impulsion comprennent: des moyens pour traiter le signal de son pour produire un signal-cible X, un signal-cible D ayant été filtré à rebours, et un signal résiduel R' duquel une composante de prédiction à long terme a été retirée; et des moyens pour calculer le vecteur estimatif de vraisemblance de position d'impulsion B
en réponse à au moins l'un des signal-cible X, signal-
cible D et signal résiduel R'.
18. D'ispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 17, caractérisé en ce que les moyens pour calculer le vecteur estimatif de vraisemblance de position d'impulsion B en réponse à au moins l'un des signal-cible X, signal-cible D et signal résiduel R' comportent des moyens pour sommer le signal-cible D dans la forme normalisée suivante: D
< 1 -13) 11 D
SR 11964 CA/DB I]D'
SR 11964 CA/DB
et le signal r6siduel R' dans la forme normalisée suivante: R' pour ainsi obtenir un vecteur estimatif de vraisemblance de position d'impulsion B de la forme suivante: D 0R1
IDI IR 1'
o 5 est une constante fixe.
19. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 18, caractérisé en ce que 0 est une constante fixe ayant une valeur située entre
0 et 1.
20. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 19, caractérisé en ce que
est une constante fixe ayant une valeur égale à 1/2.
21. Dispositif pour effectuer une recherche profondeur d'abord dans un répertoire suivant la revendication 12, caractérisé en ce que lesdites N impulsions d'amplitude non nulle ont des
SR 11964 CA/DB
indices respectifs, et en ce que lesdits seconds moyens pour choisir comprennent: des moyens pour distribuer les indices des impulsions n'ayant pas encore été choisies sur un cercle; et des moyens pour choisir ladite au moins une impulsion d'amplitude non nulle conformément à une séquence des indices formée par déplacement sur le cercle dans le sens des aiguilles d'une montre et commençant à la droite de la dernière impulsion d'amplitude non nulle sélectionnée dans le niveau de
recherche précédent de la structure d'arbre.
22. Système de communication cellulaire pour couvrir une grande surface géographique divisée en une pluralité de cellules, comprenant: des unitées mobiles de transmission/réception; des stations de base cellulaires respectivement situées à l'intérieur desdites cellules; des moyens pour contrôler la communication entre les stations de base cellulaires; un sous-système de communication bidirectionnel sans fil entre chaque unité mobile située à l'intérieur d'une cellule et la station de base cellulaire de la même cellule, ledit sous-système de communication bidirectionnel sans fil comprenant à l'intérieur de l'unité mobile et à l'intérieur de la
SR 11964 CA/DB
station de base cellulaire (a) un transmetteur incluant des moyens pour encoder un signal de parole et des moyens pour transmettre le signal de parole encodé, et (b) un récepteur incluant des moyens pour recevoir un signal de parole encodé transmis et des moyens pour décoder le signal de parole encodé reçu; dans lequel lesdits moyens pour encoder le signal de parole comprennent un dispositif pour effectuer une recherche profondeur d'abord dans un répertoire en vue d'encoder le signal de parole, dans lequel;: le répertoire comprend un ensemble de vecteurs-codes Ak définissant chacun plusieurs positions p différentes et comprenant N impulsions d'amplitude non nulle assignables chacune à des positions p valides prédéterminées du vecteur-code; ladite recherche profondeur d'abord met en oeuvre (a) une division des N impulsions
d'amplitude non nulle en un nombre M de sous-
ensembles comprenant chacun au moins une impulsion d'amplitude non nulle, et (b) une structure d'arbre incluant des noeuds représentatifs des positions p valides des N impulsions d'amplitude non nulle et définissant une pluralité de niveaux de recherche associés chacun à l'un desdits M sous-ensembles, chaque niveau de recherche étant en outre associé à une règle d'ordonnancement d'impulsions donnée et à un critère de sélection donné; ledit dispositif pour effectuer une recherche profondeur d'abord dans un répertoire comprenant:
SR 11964 CA/DB
- pour un premier niveau de recherche de la structure d'arbre, des premiers moyens pour choisir au moins une des N impulsions d'amplitude non nulle en relation avec la règle d'ordonnancement
d'impulsions associée pour former le sous-
ensemble associé; des premiers moyens pour sélectionner au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle en relation avec le critère de sélection associé pour définir au moins un chemin à travers les noeuds de la structure d'arbre; - pour chaque niveau de recherche subsequent de la structure d'arbre, des seconds moyens pour choisir au moins une des impulsions d'amplitude non nulle n'ayant pas encore été choisies en relation avec la règle d'ordonnancement d'impulsions associée pour former le sous-ensemble associé; et des seconds moyens pour sélectionner, dans ledit niveau de recherche subséquent, au moins une des positions p valides de ladite au moins une impulsion d'amplitude non nulle du sous-ensemble associé en relation avec le critère de sélection associé pour prolonger ledit au moins un chemin à travers les noeuds de la structure d'arbre;
SR 11964 CA/DB
dans lequel chaque chemin défini au premier niveau de recherche et prolongé durant les niveaux de recherche subséquents détermine les positions p respectives des N impulsions d'amplitude non nulle d'un vecteur-code A. constituant -un vecteur-code candidat en vue
d'encoder le signal de son.
23.: Système de communication cellulaire suivant la revendication 22, caractérisé en ce que ledit au moins un chemin comprend plusieurs chemins, en ce que les niveaux de recherche de la structure d'arbre incluent un dernier niveau de recherche, et en ce que ledit dispositif pour effectuer une recherche profondeur d'abord dans un répertoire comporte des moyens pour sélectionner, dans le dernier niveau de recherche de la structure d'arbre et en relation avec le critère de sélection associé, l'un des vecteurs-codes candidats Ak définis par
lesdits chemins en vue d'encoder le signal de son.
24. Sstème de communication cellulaire suivant la revendication 22, caractérisé en ce qu'il comprend en outre des moyens pour dériver les positions p valides prédéterminées des N impulsions d'amplitude non nulle conformément à au moins un design
de permutations d'impulsion unique entrelacées.
SR 11964 CA/DB
25. Système de communication cellulaire suivant la revendication 22, caractérise en ce que les seconds moyens de sélection comprennent: des moyens pour calculer un rapport mathématique donné pour chaque chemin défini par la ou les positions d'impulsions p sélectionnées dans le ou les niveaux de recherche précédents et prolongé par chaque position p valide de ladite au moins une impulsion du sous- ensemble associé audit niveau de recherche subséquent; et des moyens pour retenir le chemin prolongé, défini par les positions d'impulsions p qui
maximisent ledit rapport donné.
26. Système de communication cellulaire suivant la revendication 22, caractérisé en ce que les premiers moyens pour choisir et les premiers moyens pour sélectionner comportent: des moyens pour calculer un vecteur estimatif de vraisemblance de position d'impulsion en relation avec le signal de son; et des moyens pour sélectionner ladite au
moins une impulsion d'amplitude non nulle du sous-
ensemble associé et ladite au moins une position p valide de celle-ci en relation avec le vecteur
estimatif de vraisemblance de position d'impulsion.
27. Système de communication cellulaire suivant la revendication 26, caractérisé en ce que lesdits moyens pour calculer le vecteur
SR 11964 CA/DB
estimatif de vraisemblance de position d'impulsion comprennent: des moyens pour traiter le signal de son pour produire un signal-cible X, un signal-cible D ayant été filtré à rebours, et un signal résiduel R' duquel une composante de prédiction à long terme a été retirée; et des moyens pour calculer le vecteur estimatif de vraisemblance de position d'impulsion B
en réponse à au moins l'un des signal-cible X, signal-
cible D et signal résiduel R'.
28. système de communication cellulaire suivant la revendication 27, caractérisé en ce que les moyens pour calculer le vecteur estimatif de vraisemblance de position d'impulsion B en réponse à au moins l'un des signal-cible X, signal-cible D et signal résiduel R' comportent des moyens pour sommer le signal-cible D dans la forme normalisée suivante: D
(1 -D)^V
et le signal résiduel R' dans la forme normalisée suivante: RI i R t
SR 11964 CA/DB
pour ainsi obtenir un vecteur estimatif de vraisemblance de position d'impulsion B de la forme suivante:
B=(1-3D) +D R'
IlDIl I 'N
o P est une constante fixe.
29. Système de communication cellulaire suivant la revendication 28, caractérisé en ce que f est une constante fixe ayant une valeur
située entre O et 1.
30. Système de communication cellulaire suivant la revendication 29, caractérisé en ce que 5 est une constante fixe ayant une valeur égale
a 1/2.
31. Système de communication cellulaire suivant la revendication 22, caractérisé en ce que lesdites N impulsions d'amplitude non nulle ont des indices respectifs, et en ce que lesdits seconds moyens pour choisir comprennent: des moyens pour distribuer les indices des impulsions n'ayant pas encore été choisies sur un cercle; et des moyens pour choisir ladite au moins une impulsion d'amplitude non nulle conformément a une séquence des indices formée par déplacement sur le
SR 11964 CA/DB
cercle dans le sens des aiguilles d'une montre et commençant à la droite de la dernière impulsion d'amplitude non nulle sélectionnée dans le niveau de
recherche précédent de la structure d'arbre.
SR 11964 CA/DB
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US40178595A | 1995-03-10 | 1995-03-10 | |
US08/509,525 US5701392A (en) | 1990-02-23 | 1995-07-31 | Depth-first algebraic-codebook search for fast coding of speech |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2731548A1 true FR2731548A1 (fr) | 1996-09-13 |
FR2731548B1 FR2731548B1 (fr) | 1998-11-06 |
Family
ID=27017596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR9602957A Expired - Lifetime FR2731548B1 (fr) | 1995-03-10 | 1996-03-08 | Recherche profondeur d'abord dans un repertoire algebrique pour un encodage rapide de la paroie |
Country Status (24)
Country | Link |
---|---|
US (1) | US5701392A (fr) |
EP (1) | EP0813736B1 (fr) |
JP (1) | JP3160852B2 (fr) |
KR (1) | KR100299408B1 (fr) |
CN (1) | CN1114900C (fr) |
AR (1) | AR001189A1 (fr) |
AT (1) | ATE193392T1 (fr) |
AU (1) | AU707307B2 (fr) |
BR (1) | BR9607144A (fr) |
CA (1) | CA2213740C (fr) |
DE (1) | DE19609170B4 (fr) |
DK (1) | DK0813736T3 (fr) |
ES (1) | ES2112808B1 (fr) |
FR (1) | FR2731548B1 (fr) |
GB (1) | GB2299001B (fr) |
HK (1) | HK1001846A1 (fr) |
IN (1) | IN187842B (fr) |
IT (1) | IT1285305B1 (fr) |
MX (1) | MX9706885A (fr) |
MY (1) | MY119252A (fr) |
PT (1) | PT813736E (fr) |
RU (1) | RU2175454C2 (fr) |
SE (1) | SE520554C2 (fr) |
WO (1) | WO1996028810A1 (fr) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
JP3273455B2 (ja) * | 1994-10-07 | 2002-04-08 | 日本電信電話株式会社 | ベクトル量子化方法及びその復号化器 |
ATE192259T1 (de) * | 1995-11-09 | 2000-05-15 | Nokia Mobile Phones Ltd | Verfahren zur synthetisierung eines sprachsignalblocks in einem celp-kodierer |
DE19641619C1 (de) * | 1996-10-09 | 1997-06-26 | Nokia Mobile Phones Ltd | Verfahren zur Synthese eines Rahmens eines Sprachsignals |
EP1071081B1 (fr) * | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Procédé de production d'une table de codes de quantification vectorielle |
US6161086A (en) * | 1997-07-29 | 2000-12-12 | Texas Instruments Incorporated | Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search |
EP1746583B1 (fr) * | 1997-10-22 | 2008-09-17 | Matsushita Electric Industrial Co., Ltd. | Codeur de son et décodeur de son |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
JP3199020B2 (ja) * | 1998-02-27 | 2001-08-13 | 日本電気株式会社 | 音声音楽信号の符号化装置および復号装置 |
JP3180762B2 (ja) * | 1998-05-11 | 2001-06-25 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US6556966B1 (en) | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
JP3824810B2 (ja) * | 1998-09-01 | 2006-09-20 | 富士通株式会社 | 音声符号化方法、音声符号化装置、及び音声復号装置 |
CA2252170A1 (fr) | 1998-10-27 | 2000-04-27 | Bruno Bessette | Methode et dispositif pour le codage de haute qualite de la parole fonctionnant sur une bande large et de signaux audio |
US6295520B1 (en) | 1999-03-15 | 2001-09-25 | Tritech Microelectronics Ltd. | Multi-pulse synthesis simplification in analysis-by-synthesis coders |
WO2001020595A1 (fr) * | 1999-09-14 | 2001-03-22 | Fujitsu Limited | Codeur/decodeur vocal |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6738733B1 (en) * | 1999-09-30 | 2004-05-18 | Stmicroelectronics Asia Pacific Pte Ltd. | G.723.1 audio encoder |
CA2290037A1 (fr) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Dispositif amplificateur a lissage du gain et methode pour codecs de signaux audio et de parole a large bande |
KR100576024B1 (ko) * | 2000-04-12 | 2006-05-02 | 삼성전자주식회사 | 에이켈프 음성 압축기의 코드북 검색 장치 및 방법 |
CA2327041A1 (fr) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | Methode d'indexage de positions et de signes d'impulsions dans des guides de codification algebriques permettant le codage efficace de signaux a large bande |
US7206739B2 (en) * | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
US6766289B2 (en) * | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
CA2388439A1 (fr) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | Methode et dispositif de dissimulation d'effacement de cadres dans des codecs de la parole a prevision lineaire |
CA2392640A1 (fr) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | Methode et dispositif de signalisation attenuation-rafale de reseau intelligent efficace et exploitation maximale a demi-debit dans le codage de la parole a large bande a debit binaire variable pour systemes amrc sans fil |
KR100463559B1 (ko) * | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100463418B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치 |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (fr) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | Procede et dispositif pour le codage ou le decodage de signaux audio large bande |
US20050256702A1 (en) * | 2004-05-13 | 2005-11-17 | Ittiam Systems (P) Ltd. | Algebraic codebook search implementation on processors with multiple data paths |
SG123639A1 (en) | 2004-12-31 | 2006-07-26 | St Microelectronics Asia | A system and method for supporting dual speech codecs |
US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
KR100813260B1 (ko) * | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 코드북 탐색 방법 및 장치 |
JP5159318B2 (ja) * | 2005-12-09 | 2013-03-06 | パナソニック株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US20070150266A1 (en) * | 2005-12-22 | 2007-06-28 | Quanta Computer Inc. | Search system and method thereof for searching code-vector of speech signal in speech encoder |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
US20080147385A1 (en) * | 2006-12-15 | 2008-06-19 | Nokia Corporation | Memory-efficient method for high-quality codebook based voice conversion |
ES2404408T3 (es) * | 2007-03-02 | 2013-05-27 | Panasonic Corporation | Dispositivo de codificación y método de codificación |
CN100530357C (zh) * | 2007-07-11 | 2009-08-19 | 华为技术有限公司 | 固定码书搜索方法及搜索器 |
RU2458413C2 (ru) * | 2007-07-27 | 2012-08-10 | Панасоник Корпорэйшн | Устройство кодирования аудио и способ кодирования аудио |
BRPI0814129A2 (pt) * | 2007-07-27 | 2015-02-03 | Panasonic Corp | Dispositivo de codificação de áudio e método de codificação de áudio |
US8566106B2 (en) * | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
CN101931414B (zh) * | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US9123334B2 (en) | 2009-12-14 | 2015-09-01 | Panasonic Intellectual Property Management Co., Ltd. | Vector quantization of algebraic codebook with high-pass characteristic for polarity selection |
CN103250206B (zh) * | 2010-10-07 | 2015-07-15 | 弗朗霍夫应用科学研究促进协会 | 用于比特流域中的编码音频帧的强度估计的装置及方法 |
CN102623012B (zh) * | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
US11256696B2 (en) * | 2018-10-15 | 2022-02-22 | Ocient Holdings LLC | Data set compression within a database system |
CN110247714B (zh) * | 2019-05-16 | 2021-06-04 | 天津大学 | 集伪装与加密于一体的仿生隐蔽水声通信编码方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2199215A (en) * | 1986-12-23 | 1988-06-29 | British Telecomm | A stochastic coder |
WO1991013432A1 (fr) * | 1990-02-23 | 1991-09-05 | Universite De Sherbrooke | Manuel de codage dynamique pour une articulation efficace, avec codage base sur des codes algebriques |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
CA1164569A (fr) * | 1981-03-17 | 1984-03-27 | Katsunobu Fushikida | Systeme pour determiner les poles et les zeros |
WO1983003917A1 (fr) * | 1982-04-29 | 1983-11-10 | Massachusetts Institute Of Technology | Codeur et synthetiseur vocal |
US4625286A (en) * | 1982-05-03 | 1986-11-25 | Texas Instruments Incorporated | Time encoding of LPC roots |
US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
JPS5922165A (ja) * | 1982-07-28 | 1984-02-04 | Nippon Telegr & Teleph Corp <Ntt> | アドレス制御回路 |
DE3276651D1 (en) * | 1982-11-26 | 1987-07-30 | Ibm | Speech signal coding method and apparatus |
US4764963A (en) * | 1983-04-12 | 1988-08-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech pattern compression arrangement utilizing speech event identification |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
DE3335358A1 (de) * | 1983-09-29 | 1985-04-11 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung |
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
CA1236922A (fr) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Methode et appareil de codage de signaux numerique |
CA1223365A (fr) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Methode et appareil de codage de paroles |
US4724535A (en) * | 1984-04-17 | 1988-02-09 | Nec Corporation | Low bit-rate pattern coding with recursive orthogonal decision of parameters |
US4680797A (en) * | 1984-06-26 | 1987-07-14 | The United States Of America As Represented By The Secretary Of The Air Force | Secure digital speech communication |
US4742550A (en) * | 1984-09-17 | 1988-05-03 | Motorola, Inc. | 4800 BPS interoperable relp system |
CA1252568A (fr) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Codeur et decodeur de signaux a faible debit binaire pouvant reduire la vitesse de transmission de l'information |
US4858115A (en) * | 1985-07-31 | 1989-08-15 | Unisys Corporation | Loop control mechanism for scientific processor |
IT1184023B (it) * | 1985-12-17 | 1987-10-22 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4873723A (en) * | 1986-09-18 | 1989-10-10 | Nec Corporation | Method and apparatus for multi-pulse speech coding |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
CA1337217C (fr) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Codage vocal |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
CA1321646C (fr) * | 1988-05-20 | 1993-08-24 | Eisuke Hanada | Systeme de communication vocale codee a codes de synthese de composantes a faible amplitude |
US5008965A (en) * | 1988-07-11 | 1991-04-23 | Kinetic Concepts, Inc. | Fluidized bead bed |
JPH04504208A (ja) * | 1989-04-04 | 1992-07-30 | ジエネラブス・テクノロジーズ・インコーポレイテツド | 組換えトリコサンチンおよびコード配列 |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5097508A (en) * | 1989-08-31 | 1992-03-17 | Codex Corporation | Digital speech coder having improved long term lag parameter determination |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
US5667340A (en) * | 1995-09-05 | 1997-09-16 | Sandoz Ltd. | Cementitious composition for underwater use and a method for placing the composition underwater |
-
1995
- 1995-07-31 US US08/509,525 patent/US5701392A/en not_active Expired - Lifetime
-
1996
- 1996-03-05 MX MX9706885A patent/MX9706885A/es unknown
- 1996-03-05 BR BR9607144A patent/BR9607144A/pt not_active IP Right Cessation
- 1996-03-05 JP JP52713096A patent/JP3160852B2/ja not_active Expired - Lifetime
- 1996-03-05 AT AT96903854T patent/ATE193392T1/de active
- 1996-03-05 CN CN96193196A patent/CN1114900C/zh not_active Expired - Lifetime
- 1996-03-05 CA CA002213740A patent/CA2213740C/fr not_active Expired - Lifetime
- 1996-03-05 AU AU47811/96A patent/AU707307B2/en not_active Expired
- 1996-03-05 EP EP96903854A patent/EP0813736B1/fr not_active Expired - Lifetime
- 1996-03-05 DK DK96903854T patent/DK0813736T3/da active
- 1996-03-05 RU RU97116484/09A patent/RU2175454C2/ru active
- 1996-03-05 WO PCT/CA1996/000135 patent/WO1996028810A1/fr active IP Right Grant
- 1996-03-05 PT PT96903854T patent/PT813736E/pt unknown
- 1996-03-05 KR KR1019970706298A patent/KR100299408B1/ko not_active IP Right Cessation
- 1996-03-07 MY MYPI96000844A patent/MY119252A/en unknown
- 1996-03-08 SE SE9600918A patent/SE520554C2/sv not_active IP Right Cessation
- 1996-03-08 IT IT96TO000174A patent/IT1285305B1/it active IP Right Grant
- 1996-03-08 AR AR33568996A patent/AR001189A1/es unknown
- 1996-03-08 FR FR9602957A patent/FR2731548B1/fr not_active Expired - Lifetime
- 1996-03-08 IN IN422CA1996 patent/IN187842B/en unknown
- 1996-03-09 DE DE19609170A patent/DE19609170B4/de not_active Expired - Lifetime
- 1996-03-11 GB GB9605123A patent/GB2299001B/en not_active Expired - Lifetime
- 1996-09-19 ES ES09650035A patent/ES2112808B1/es not_active Expired - Fee Related
-
1998
- 1998-02-04 HK HK98100818A patent/HK1001846A1/xx not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2199215A (en) * | 1986-12-23 | 1988-06-29 | British Telecomm | A stochastic coder |
WO1991013432A1 (fr) * | 1990-02-23 | 1991-09-05 | Universite De Sherbrooke | Manuel de codage dynamique pour une articulation efficace, avec codage base sur des codes algebriques |
Non-Patent Citations (1)
Title |
---|
KODRATOFF Y, BARES M: "Base terminologique de l'intelligence artificielle", 27 May 1991, TECHNIQUE ET DOCUMENTATION - LAVOISIER, PARIS, XP002046534 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2731548A1 (fr) | Recherche profondeur d'abord dans un repertoire algebrique pour un encodage rapide de la paroie | |
FR2730336A1 (fr) | Repertoire algebrique a amplitudes d'impulsions selectionnees en fonction du signal de parole pour un encodage rapide | |
EP0749626B1 (fr) | Procede de codage de parole a prediction lineaire et excitation par codes algebriques | |
EP0608174B1 (fr) | Systeme de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués | |
EP0782128B1 (fr) | Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application | |
CA2512179C (fr) | Procede de codage et de decodage audio a debit variable | |
MXPA03004513A (es) | Metodo y dispositivo para vincular posiciones y signos de pulso de vinculacion en libros de codigos algebraicos para codificacion eficiente de senales de banda ancha. | |
FR2929466A1 (fr) | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique | |
FR2596936A1 (fr) | Systeme de transmission d'un signal vocal | |
EP1692687B1 (fr) | Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques | |
EP2979266B1 (fr) | Mixage partiel optimisé de flux audio codés selon un codage par sous-bandes | |
EP0428445A1 (fr) | Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit | |
FR2762464A1 (fr) | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" | |
EP2652735B1 (fr) | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique | |
FR2880724A1 (fr) | Procede et dispositif de codage optimise entre deux modeles de prediction a long terme | |
KR100743534B1 (ko) | 디지털 정보를 전송하는 전송장치 및 전송방법 | |
FR2702590A1 (fr) | Dispositif de codage et de décodage numériques de la parole, procédé d'exploration d'un dictionnaire pseudo-logarithmique de délais LTP, et procédé d'analyse LTP. | |
WO2014154989A1 (fr) | Mixage optimisé de flux audio codés selon un codage par sous-bandes | |
FR2960335A1 (fr) | Codage avec mise en forme du bruit dans un codeur hierarchique | |
Foodeei et al. | Low-delay CELP and tree coders: comparison and performance improvements. | |
EP0796490B1 (fr) | Methode et dispositif de prediction de signal pour un codeur de parole | |
FR2980620A1 (fr) | Traitement d'amelioration de la qualite des signaux audiofrequences decodes | |
FR2709387A1 (fr) | Système de communication radio. | |
FR2791166A1 (fr) | Procedes de codage, de decodage et de transcodage | |
FR2737360A1 (fr) | Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 20 |