FR2475264A1 - Procede et systeme de transmission d'un signal de parole avec codage a prediction - Google Patents
Procede et systeme de transmission d'un signal de parole avec codage a prediction Download PDFInfo
- Publication number
- FR2475264A1 FR2475264A1 FR8020155A FR8020155A FR2475264A1 FR 2475264 A1 FR2475264 A1 FR 2475264A1 FR 8020155 A FR8020155 A FR 8020155A FR 8020155 A FR8020155 A FR 8020155A FR 2475264 A1 FR2475264 A1 FR 2475264A1
- Authority
- FR
- France
- Prior art keywords
- signal
- formant
- speech
- difference
- parameter signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 10
- 238000001228 spectrum Methods 0.000 claims abstract description 33
- 230000003044 adaptive effect Effects 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000011002 quantification Methods 0.000 claims abstract description 8
- 238000013139 quantization Methods 0.000 claims description 62
- 230000005284 excitation Effects 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 150000001768 cations Chemical class 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims description 2
- 230000008054 signal transmission Effects 0.000 claims 7
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 230000003595 spectral effect Effects 0.000 abstract description 3
- 230000015654 memory Effects 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- MFYSYFVPBJMHGN-UHFFFAOYSA-N Cortisone Natural products O=C1CCC2(C)C3C(=O)CC(C)(C(CC4)(O)C(=O)CO)C4C3CCC2=C1 MFYSYFVPBJMHGN-UHFFFAOYSA-N 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- CBGUOGMQLZIXBE-XGQKBEPLSA-N clobetasol propionate Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@H](C)[C@@](C(=O)CCl)(OC(=O)CC)[C@@]1(C)C[C@@H]2O CBGUOGMQLZIXBE-XGQKBEPLSA-N 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 229940069205 cormax Drugs 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- WUBBRNOQWQTFEX-UHFFFAOYSA-N 4-aminosalicylic acid Chemical group NC1=CC=C(C(O)=O)C(O)=C1 WUBBRNOQWQTFEX-UHFFFAOYSA-N 0.000 description 1
- 208000019300 CLIPPERS Diseases 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 101100007970 Mus musculus Ctdspl gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
- H04B14/046—Systems or methods for reducing noise or bandwidth
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/04—Differential modulation with several bits, e.g. differential pulse code modulation [DPCM]
- H03M3/042—Differential modulation with several bits, e.g. differential pulse code modulation [DPCM] with adaptable step size, e.g. adaptive differential pulse code modulation [ADPCM]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
L'INVENTION CONCERNE LA TRANSMISSION DE LA PAROLE. UN SYSTEME DE TRAITEMENT DE SIGNAL DE PAROLE A PREDICTION COMPREND UN FILTRE ADAPTATIF 120, BRANCHE DANS UN RESEAU DE REACTION 137 CONNECTE AU QUANTIFICATEUR 111. LE FILTRE ADAPTATIF COMBINE LE SIGNAL D'ERREUR DE QUANTIFICATION, LES SIGNAUX DE PARAMETRE DEPREDICTION LIES AUX FORMANTS ET LE SIGNAL DE DIFFERENCE POUR CONCENTRER LE BRUIT DE QUANTIFICATION DANS LES PICS SPECTRAUX QUI CORRESPONDENT AUX FORMANTS DU SPECTRE DE LA PAROLE, GRACE A QUOI LE BRUIT DE QUANTIFICATION EST MASQUE PAR LES FORMANTS. APPLICATION A LA TELEPHONIE.
Description
La présente invention concerne la transmission
numérique des signaux de parole et elle porte plus parti-
culièrement sur des configurations de traitement de signal de parole à prédiction qui sont conçues de façon à réduire les effets de bruit. Le codage des signaux pour la transmission sur
des voies numériques dans les systèmes de transmission te'é-
phoniques ouaiGres néceEtt généralement l'échantillonnage d'un signal d'entrée, la quantification des échantillons, et la génération d'un code numérique pour chaque signal quantifié. Les signaux de parole sont fortement corrélés et ils comprennent donc une partie qui peut être prédite à partir de ses valeurs passées. Si un émetteur à codage numérique et un récepteur décodeur comprennent tous deux un dispositif qui élabore la partie prédite du signal de parole fortement corrélé, il suffit de coder et de transmettre la partie non prédite du signal de parole. De ce fait, le codage par prédiction d'un signal de parole conduit à une utilisation efficace des voies numériques,
sans dégradation du signal.
Le codage de signaux de parole par prédiction, tel qu'il est décrit dans les brevets U.S. 3 502 986 et 3 631 520, fait intervenir la génération de paramètres de prédiction à partir d'une suite d'échantillons de signal de parole et la formation d'une valeur prédite de
chaque échantillon de signal de parole à partir des para-
mètres générés et des échantillons de signal de parole précédents. La différence entre chaque échantillon et
sa valeur prédite est quantifiée, codée sous forme numé-
rique et émise vers un récepteur dans lequel le signal de différence est décodé et combiné avec la valeur prédite correspondante formée dans le récepteur. De cette manière, seule la partie du signal qui ne peut pas être prédite à partir du signal déjà codé est quantifiée et transmise, ce qui permet de réaliser une économie sur la capacité de
la voie. L'économie se traduit par la cadence de bit ré-
duite qui est nécessaire pour transmettre uniquement la par-
tie non prédite du signal de parole redondant, en comparai-
son de la cadence de bit très supérieure qui serait néces-
saire pour transmettre le signal de parole codé directement.
On quantifie généralement des échantillons de
signal en engendrant sélectivement un signal qui corres-
pond au niveau d'un ensemble de niveaux d'amplitude spé-
cifiés qui est le plus proche de l'amplitude de l'échan-
tillon de signal. Cependant, l'erreur produite par la
quantification produit une distorsion du signal transmis.
Comme il est décrit dans le brevet U.S. 2 927 962, on peut réduire le bruit produit par la quantification en formant un signal d'erreur correspondant à la différence entre les échantillons quantifiés et non quantifiés et en modifiant les échantillons de signal d'une manière prédéterminée en
se basant sur le signal d'erreur. Bien que les configura-
tions de modification n'affectent pas la puissance totale de bruit de quantification, elles permettent de concentrer la puissance de bruit dans une partie spécifiée du spectre
du signal dans laquelle ses effets sont les plus faibles.
Une configuration de filtre à réaction utilisant ce prin-
cipe en codage de signal de télévision, pour placer le
bruit de quantification dans la gamme de fréquence supé-
rieure de la bande du signal,,est décrite dans l'article intitulé "Synthesis of Optimal Filters for a Feedback Quantization System," par E. G. Kimme et F.F. Kuo, IEEE Transactions on Circuit Theory, septembre 1963, pages
405-413.
Les configurations de réduction d'erreur de quan-
tification mentionnées précédemment, qui concentrent géné-
ralement la puissance d'erreur dans des parties fixes du spectre de fréquence pour réduire au minimum la puissance
efficace d'erreur, ne conduisent pas à une réduction op-
timale du bruit pour les configurations de codage de signal de parole. L'absence de réduction optimale du bruit résulte de la nature du spectre du signal de parole qui comprend plusieurs parties de fréquences de formants variant au
cours du temps, qui correspondent à des parties de l'enve-
loppe spectrale à court terme dans laquelle l'énergie de parole est concentrée, et des parties inter-formants. Dans les régions sonores de la parole, les parties de formants
sont directement liées aux résonances dans l'organe vocal.
La puissance du signal de paroLe est donc concentrée dans
ces parties de formants, tandis que les régions inter-
formants contiennent notablement moins de puissance de
signal de parole. De ce fait, la concentration de la puis-
sance'd'erreur de quantification dans une partie fixe du spectre de fréquence ne tient pas compte de la relation entre le spectre de bruit de quantification et le spectre de parole changeant, si bien que des effets de bruit
appréciables demeurent.
L'invention porte sur une configuration de codage de signal de parole dans laquelle on engendre des signaux de paramètre de prédiction liés aux formants, à partir
d'une analyse du signal de parole sur des intervalles sé-
lectionnés. On forme un signal représentatif de la diffé-
rence entre le signal de parole et sa valeur prédite, à partir de la partie présente et de la partie précédente
du signal de parole et des signaux de paramètre de prédic-
tion engendrés. On modifie le signal de différence pour définir sélectivement le bruit. On quantifie le signal de différence modifié et on produit un signal d'erreur de quantification correspondant à la différence entre le
signal de différence modifié quantifié et non quantifié.
La modification du signal de différence comprend la combi-
naison du signal d'erreur de quantification, des signaux de paramètre de prédiction liés aux formants et du signal de différence pour concentrer l'erreur de quantification dans les parties de formants du spectre de signal de parole,
grâce à quoi le bruit de quantification transmis est mas-
qué par les formants du signal de parole.
Conformément à un aspect de l'invention, le signal d'erreur quantifié est modifié en fonction des signaux de paramètre de prédiction liés aux formants, afin de produire un signal d'erreur pondéré de formant. Le signal d'erreur pondéré de formant est combiné avec le signal de différence pour concentrer l'erreur de quantification dans les parties de formantsdu spectre de signal de parole afin
que le rapport du signal de parole au bruit de quantifi-
cation soit maintenu au-dessus d'un niveau prédéterminé
sur la totalité du spectre du signal de parole.
Selon un autre aspect de l'invention, on forme un ensemble de signaux de paramètre de filtre à partir des signaux de paramètre de prédiction liés aux formants ak et on produit un signal d'erreur pondéré de formant à partir des signaux de paramètre de filtre et du signal
d'erreur. On soustrait le signal d'erreur pondéré de for-
mant du signal de différence pour concentrer l'erreur de quantification dans les parties de formantsdu spectre du
signal de parole.
Selon un autre aspect encore de l'invention, on forme l'ensemble de signaux de paramètre de filtre fk à partir de l'ensemble de signaux de paramètre de prédiction de formant ak conformément à la relation prédéterminée: p+l p .. k 1-(i+ az_
-fkz = (1 + zl k-
k=1 k=1 dans laquelle z-1 représente un retard d'un intervalle
d'échantillon et p représente le nombre de signaux de para-
mètre de prédiction. On modifie le signal d'erreur par les signaux de paramètre de filtre f fixés pour former le k signal d'erreur pondéré de formant p+i wn = fken-k k=1 qui est soustrait du signal de différence, le terme en
désignant la valeur présente du signal d'erreur de quanti-
fication. On supprime la redondance due à la structure de
formants du signal de parole en soustrayant la valeur pré-
dite du signal de parole présent, obtenue à partir des signaux de paramètre de prédiction liés au formant, de la valeur réelle du signal de parole présent. Cependant, la
redondance liée à la hauteur demeure dans le signal de diffé-
rence résultant, comme le décrit le brevet U.S. 3 740 476.
Selon un autre aspect encore de l'invention, on forme un ensemble de signaux de paramètre de prédiction liés à la hauteur, à partir de l'analyse du signal de parole pour chaque intervalle sélectionné. On combine le signal quan- tifié avec les signaux de paramètre de prédiction liés à
la hauteur pour produire l'échantillon de signal de diffé-
rence prédit. On applique le signal de différence prédit aux moyens de modification de différence pour réduire la
redondance liée à la hauteur dans le signal quantifié.
L'invention sera mieux comprise à la lecture de
la description qui va suivre d'un exemple de réalisation
et en se référant aux dessins annexés sur lesquels:
La figure 1 est un schéma synoptique d'un cir-
cuit de codage de signal de parole par prédiction corres-
pondant à l'invention;
La figure 2 est un schéma synotpique d'un cir-
cuit de décodage de signal de parole par prédiction qui est utilisé en association avec le circuit de la figure 1
La figure 3 est un schéma synoptique du calcula-
teur de prédiction de la figure 1; La figure 4 est un schéma synoptique détaillé du générateur de coefficients de filtre et circuit de mémoire de la figure 1; La figure 5 est un schéma synoptique détaillé des prédicteurs de formants des figures 1 et 2 La figure 6 est un schéma synoptique détaillé du filtre de pondération de la figure 1; La figure 7 est un schéma synoptique détaillé des prédicteurs de périodicité vocale des figures 1 et 2 La figure 8 représente des signaux qui illustrent le fonctionnement du circuit calculateur de prédiction de la figure 3; La figure 9 est un graphique qui illustre les caractéristiques de réduction de bruit de quantification du circuit codeur de la figure 1; et La figure 10 représente des signaux obtenus dans
le circuit de la figure 1..
2475264-
On voit sur la figure 1 un codeur de signal de
parole à prédiction correspondant à l'invention. Un signal.
de parole s (t) qui provient de la source de signal de
parole 101 est appliqué au circuit de filtrage et d'échantIn-
lonnage 103 dans lequel il est soumis à un filtrage passe- bas, modifié par une configuration de préaccentuation haute
fréquence et est échantillonné à une cadence prédéterminée.
Le circuit 103 peut comprendre un filtre passe-bas avec
une fréquence de coupure de 4 kHz, un réseau de préaccen-
tuation avec une pente de 6 dB par octave commençant à
700 Hz, et un échantillonneur ayant une cadence d'échan-
tillonnage CL1 de 8 kHz. Les échantillons de signal succes-
sifs provenant du circuit de filtrage et d'échantillonnage 103 sont appliqués au convertisseur analogique-numérique 105 qui produit pour chaque échantillon de signal un code
numérique s convenant à l'utilisation dans le codeur.
n Les échantillons codés successifs s n provenant du convertisseur 105 sont appliqués directement sur une entrée du calculateur de paramètres de prédiction 135 et ils sont appliqués par le circuit de retard d'échantillon 106 à l'entrée de signal du prédicteur de formants 107 et à l'entrée positive du réseau soustracteur 109. Le circuit
de retard 106 peut être constitué par un registre à déca-
lage ou toute autre configuration de retard bien connue.
Le prédicteur 107 réagit aux échantillons de code retardés
s et à l'ensemble fixé de signaux de prédiction A = a1,a2,...
ak.....ap, provenant du calculateur 135,en engendrant un code de valeur de prédiction p sn-kak (1) k=1 pour chaque échantillon, en désignant par ak le coefficient de paramètre de prédiction linéaire de rang k et par p
l'ordre du prédicteur. On sait que le prédicteur 107 pré-
dit la valeur présente de chaque échantillon de signal sn sur la base de la somme pondérée d'un certain nombre de
valeurs d'échantillons antérieures conformément à l'ex-
pression (1). La prédiction est basée sur l'enveloppe spectra-
le à court terme du signal de parole et les signaux de paramètre de prédiction a1, a2.....ap sont liés à la structure de formants de la fonction de transmission de
l'organe vocal.
La figure 5 représente un filtre transversal
de type bien connu qu'on peut utiliser en tant que prédic-
teur de formants 107. Le prédicteur de la figure 5 peut être caractérisé de la manière suivante, avec la notation de la transformation en z: p Ps(Z) = akz-k (2) k k k=1
en désignant par z-1 un retard d'un intervalle d'échantil-
lon et par ai, a2,.....ak9.... ap les p coefficients du prédicteur. Sur la figure 5, p est égal à 10. Le registre à décalage 503 est un registre à décalage à 10 étages qu'on fait fonctionner à la cadence d'échantillonnage CL1 de
8 kHz et qui reçoit 1es échantillons successifs sn à par-
tir du circuit de retard 106, par la ligne 501. Le signal de sortie du premier étage du registre à décalage, sur la ligne 504-1, est appliqué sur une entrée du multiplicateur 505-1. De façon similaire, les signaux de sortie des étages restants du registre à décalage, sur les lignes 504- 2 à 504-10, sont appliqués aux multiplicateurs respectifs 505-2 à 505-10. Les signaux de coefficient de prédiction linéaire A=A1, A2,..., A1O qui proviennent du calculateur 135 sont appliqués aux multiplicateurs 505-1 à 505-10 par la ligne 510. Chaque multiplicateur forme le produit snkak et les produits sont sommés deux à la fois dans les additionneurs 507-2 à 507-10, de façon à obtenir sur la ligne de sortie 512 un signal représentatif de la somme des produits,
conformément à l'équation (1).
Le signal prédit provenant de la ligne 512 est appliqué sur l'entrée négative du réseau soustracteur 109 dans lequel il est soustrait de l'échantillon codé présent sn. Le signal de différence résultant: dn = sn - sn-kk (3) k=1 correspond au signal de parole, avec suppression de sa
redondance due aux formants. La suppression de la redon-
dance due aux formants est illustrée sur la figure 10, sur laquelle le signal 1001 représente une partie d'un signal de parole provenant de la source 101 et comportant à la
fois une redondance de formants et une redondance de pé-
riode de hauteur. Le signal 1003 correspond au signal de différence de l'équation (3) dans lequel la composante de formant prédite est supprimée du signal de parole, tandis
que la redondance liée à la période de hauteur demeure.
Le signal de différence dn provenant du réseau soustracteur 109 est appliqué au circuit modificateur 137 qui comporte le prédicteur de périodicité vocale 128 qui est conçu de façon à supprimer la redondance de période de hauteur qui demeure dans le signal de différence, et le
filtre de pondération 120 qui est conçu de façon à redis-
tribuer le bruit de quantification dans le signal de diffé-
rence afin de réduire sa perception. Le.signal de sortie du circuit modificateur 137, qn' est appliqué à l'entrée
du quantificateur 111 qui, comme il est bien connu, sélec-
tionne un niveau parmi un ensemble de niveaux d'amplitude
prédéterminés, en fonction de la valeur de chaque échan-
tillon de signal de différence présent sur son entrée.
Dans le quantificateur 111, la taille de pas, c'est-à-
dire la différence entre les niveaux d'amplitudes du quan-
tificateur, est déterminée par les caractéristiques statis-
tiques du signal de différence modifié et est engendrée
dans le calculateur de paramètres de prédiction 135.
Le signal de sortie du quantificateur 111, qn' est appliqué au réseau soustracteur-113, ainsi qu'à l'additionneur 131 par l'intermédiaire du codeur numérique 112. L'additionneur 131 et le prédicteur de périodicité
vocale 128 forment un code de valeur prédite d'n pour cha-
n que échantillon de signal de différence d, à partir d'un ensemble de codes de différence antérieurs, de signaux de sortie de quantificateur et de signaux de paramètre de prédicteur B = bl, b2, b3, ainsi que d'un code m qui est représentatif de la période de hauteur du segment de signal de parole courant. L'additionneur 131 forme la somme du signal qn et du signal de différence prédit, cette somme
étant appliquée au prédicteur 128. Le prédicteur 128 en-
gendre une valeur prédite du signal de différence présent, conformément à la relation: d' = bd' + b2dnm + b3dnm (4a) n i n-m+l 2 n-m 3 n-m-i n Le prédicteur 128 est caractérisé par la fonction suivante, avec la notation de la transformation en z: Pb-m+ +bz -m-! P = b + + b2z-m + b3zm-1 (4b) d i 2 3
dans laquelle z représente un retard de m échantillons.
bl, b2 et b3 sont les signaux de coefficient de prédiction qui sont déterminés en minimisant la valeur quadratique
moyenne de l'erreur de prédiction entre le signal de diffé-
rence dn et sa valeur prédite.
Les signaux m et b1, b2 et b3 sont engendrés dans le caleultateur 135,pour chaque intervalle de signal de
parole. Le code de valeur prédite pour le signal de diffé-
rence présent est soustrait du signal de différence pré-
sent dn dans le réseau soustracteur 126, de façon que la redondance liée à la période de hauteur soit extraite du
signal de-différence. Le signal 1005 sur la figure 10 re-
présente le signal de différence après extraction de la redondance liée à la période de hauteur, dans le réseau soustracteur 126. Contrairement au signal de parole 1001 et au signal de différence 1003, le signal 1005 est par nature analogue à du bruit, ce qui indique la suppression de la redondance liée aux formants comme de la redondance
liée à la période de hauteur.
La figure 7 représente de façon plus détaillée le prédicteur 128. Sur la figure 7, le registre à décalage 703 comprend 120 étages qui enregistrent les échantillons successifs reçus à partir de l'additionneur 131. Les 120 étages représentent une durée de 15 ms qui correspond au plus long intervalle de hauteur prévu. Le signal de sortie de chaque étage du registre à décalage est appliqué au circuit sélecteur 705 qui transmet sélectivement les signaux
2475264-
de sortie correspondant à trois étages consécutifs du registre à décalage, sous l'action du code m lié à la
période de hauteur qui provient du calculateur 135, confor-
mément aux équations (4a) et (4b). Le signal de sortie de l'étage sélectionné d'extrême-gauche du registre à décala-
ge est appliqué au multiplicateur 706-1. De façon simi-
laire, les signaux de sortie des étages sélectionnés adja-
cents du registre à décalage sont appliqués aux multipli-
cateurs respectifs 706-2 et 706-3. Les signaux de para-
mètre de prédiction b1, b2 et b3 sont appliqués aux mul-
tiplicateurs 706-1, 706-2 et 706-3 à partir du calcula-
teur 135, par la ligne 711. Les codes de produit prove-
nant des multiplicateurs 706-1, 706-2 et 706-3 sont sommés dans les additionneurs 707-2 et 707-3, grâce à quoi le
code de valeur prédite pour le signal de différence pré-
sent apparaît sur la ligne 712.
Le calculateur de paramètres de prédiction 735
engendre les signaux de paramètre de prédiction nécessai-
res pour le prédicteur de formants 107 et le prédicteur de périodicité vocale 128, ainsi que la taille de pas et d'autres signaux utilisés dans le codeur. On sait que les signaux de parole ne sont pas stationnaires. Cependant, les caractéristiques de la parole qui varient au cours du temps changent relativement lentement, si bien qu'il suffit d'adapter les signaux de paramètre de prédiction au signal
changeant toutes les 10 ms pour une cadence d'échantillon-
nage de 8 kHz. Ainsi, le calculateur de paramètres de pré-
diction 135 reçoit les échantillons de parole sn au cours de chaque intervalle de temps de 10 ms et il fournit des signaux de paramètre de prédiction pour chaque intervalle
de temps de 10 mspour tenir compte des conditions chan-
geantes du signal.
La figure 3 représente une configuration de trai-
tement qu'on peut utiliser pour le calculateur 135. En consi-
dérant la figure 3, on note que le processeur 309 reçoit l'information de signal enregistrée provenant de la mémoire
d'échantillons320 et il reçoit une information de programme----
enregistrée de façon permanente qui provient des mémoires 1l mortes 303 et 305 par le contrôleur 307. Sous l'effet des
signaux reçus et de l'information de programme, le proces-
seur 309 engendre un ensemble de coefficients de prédic-
tion linéaire liés aux formants A = a1, a2,....a10; un ensemble de signaux de coefficient de prédiction linéaire liés à la hauteur B = b1, b2, b3; un ensemble de signaux de coefficient de corrélation partielle liés aux formants r1, r29....R10; et un signal de valeur efficace 2R, un
signal lié à la période de hauteur m et un signal de tail-
le de pas à destinés à être utilisés dans d'autres parties
du codeur de la figure 1. Les signaux de sortie du proces-
seur 309 sont enregistrés dans des mémoires de sortie 331
à 336, comme il est représenté sur la figure 3. Le proces-
seur 309 peut être constitué par le Macro Arithmetic Processor System 100, de la firme CSP Inc., ou il peut être constitué par d'autres configurations de processeur
bien connues.
Le contrôleur 307 de la figure 3 est conçu de façon à fractionner chaque intervalle de temps de 10 ms
du signal de parole en une suite de trois périodes prédé-
terminées, chacune d'elles étant consacrée à un mode de fonctionnement particulier. Les modes de fonctionnement sont représentés sur la figure 8. Les impulsions d'horloge
CL2 provenant de l'horloge 140 de la figure 1 sont espa-
cées de 10 ms et elles déterminent les intervalles de temps de 10 ms. Sur la figure 8, une impulsion d'horloge CL2 apparaît à l'instant t1, c'est-àdire au début d'un intervalle de temps de 10 ms. Cette impulsion d'horloge CL2 place le contrôleur 307 dans son mode d'entrée de données, comme le montre le signal 805. Pendant le mode d'entrée de données, le contrôleur 307 est connecté au processeur 309 et à la mémoire d'échantillons de parole 320. Sous l'effet des signaux de commande qui proviennent du contrôleur 307, les 80 codes d'échantillon sn qui ont été insérés dans la mémoire d'échantillons 320 pendant l'intervalle de temps de 10 ms précédent sont transférés vers la mémoire de données 316 par l'interface d'entrée/ sortie 318. Comme le montre le signal 805, le mode d'entrée
de données se termine à l'instant t2, lorsque 80 codes -
d'échantillon provenant de la mémoire 320 ont été appli-
qués à des adresses prédéterminées dans la mémoire de données 316. Pendant que les 80 échantillons enregistrés sont transférés vers la mémoire de données 316, les échan- tillons de l'intervalle de temps présent sont insérés dans la mémoire 320, sous la commande des impulsions
d'horloge CL1.
Juste après l'instant t2, le contrôleur 307 est placé dans son mode de paramètres de prédiction de formants comme le montre le signal 807. Pendant le mode de paramètres de prédiction de formants, la mémoire de programme de paramètres de prédiction 303 est connectée
au processeur central 312 par l'intermédiaire du contrô-
leur 307, du circuit d'interface de contrôleur 310 et du
bus 340. Sous l'effet des instructions qui sont enregis-
trées de façon permanente dans la mémoire morte 303, le processeur 309 engendre les signaux de coefficient de corrélation partielle de formantsrm = ri, r2...., r10 et les signaux de coefficient de prédiction linéaire de
formants A = a1,...a10. Les signaux A et rm sont transfé-
rés respectivement vers les mémoires 331 et 333. La liste en langage Fortran des instructions enregistrées dans la mémoire morte 303 pour produire les signaux de prédicteur
de formants figure à l'annexe 1.
On sait qu'on engendre les signaux de paramètre en formant la matrice de covariance P, dont les termes sont: Pij 1 sn-isn-j' i=1,2,....,10,j= 1,2,. .,10 (5) n=1 et les facteurs de corrélation de parole: ci = Snsn i i= 1,2,
.,10 (6) n=1 On calcule ensuite les facteurs g1 à g10, conformément à la relation: r1013 T [ c21 (7) i0J 0ci0 dans laquelle T désigne la matrice triangulaire inférieure obtenue par la décomposition triangulaire de [Pijl = T T (8) On calcule ensuite les coefficients de corrélation partiel- le rm conformément à la relation: gm; rm kon 1/2 (9) o - gi dans laquelle: co Sn..DTD: CO = 'Z S2
n=l -
correspond à l'énergie du signal de parole dans l'inter-
valle de temps de 10 ms. On calcule les signaux de para-
mètre de prédiction linéaire de formants A = a1, a2.....
a1O à partir des signaux de paramètre de corrélation par-
tielle rm, conformément à la formule récursive: ai(m) = ai(m-1) + rmam i(m-1) ao(o) = 1 i=1,2,...,m=1,2,...,10 (10) Les signaux de paramètre de corrélation partielle rm et les signaux de paramètre de prédiction linéaire ai qui sont engendrés dans le processeur 309 au cours du mode de paramètres de prédiction de formants sont transférés de la mémoire de données 316 vers les mémoires 331 et 333 pour être utilisés au cours de l'intervalle de temps de ms suivant. Les signaux A sont également transférés vers le générateur de coefficients de filtre et mémoire 122. Au cours du mode de paramètres de prédiction de
formants, le contrôleur 307 compte les impulsions d'hor-
loge CL1 qui proviennent de l'horloge 140 pour déterminer
l'instant d'achèvement de ee mode.
A l'instant t3, après le transfert des signaux de paramètre de prédiction linéaire et de corrélation partielle vers les mémoires 331 et 333, le contrôleur 337 est placé dans son mode de paramètres de prédiction de hauteur, comme il apparait sur le signal 809. Entre les instants t3 et t4, le contrôleur 307 connecte la
mémoire de programme de prédiction de hauteur 305 au pro-
cesseur central 312 par l'interface de contrôleur 310 et
le bus 340. Les codes d'instruction contenus dans la mé-
moire morte 305, dont la liste en langage Fortran figure à l'annexe 2, forment les signaux de paramètre de hauteur b1, b2 et b3, ainsi que le signal m lié à la hauteur, qui sont destinés à être utilisés dans le prédicteur de périodicité vocale 128 de la figure 1. Conformément à la liste en langage Fortran de l'annexe 2, le processeur 309 calcule au cours du mode de prédiction de hauteur les corrélations entre les signaux de différence dn et.dn_1
sur un intervalle fixé, de la manière indiquée par l'équa-
tion (11): nddn-i n= 80 =41, 42...., 120 (11)
=7 - 80 8
2 d27 d2n-i n=1 n=1 pour déterminer l'indice de temps i pour lequel "i est
maximal. L'instant auquel Si est maximal (m) est trans-
féré à partir de la mémoire de données 316 sous la commande
du contrôleur 307.
Le processeur 309 calcule également les paramè- tres de prédiction de hauteur b1, b2, et b3 en se basant sur le principe
qui consiste à minimiser l'expression: Z (dn-bld-m+l-b2dn-m-b3dn-m-1)2 (12) n=1 Le facteur 2R pour l'écrêteur 124 est calculé conformément à la relation: R =1(dn-bldn- m±b2dn m-b3dn-m-1) 2 (13) J. n ln-m+2 nm 3 n-i n=1 Le facteur de taille de pas À est également calculé, pour être utilisé dans le quantificateur 111, selon la relation:
A = 1,224R (14)
pour un quantificateur à trois niveaux, de la manière dé- crite dans l'article intitulé "Quantizing for Minimum Distortion," par Joel Max, paru dans la revue IRE Transactions on Information Theory, Vol. IT-6, pages 7-121,
mars 1960. A l'instant t4, les termes 2R et sont trans-
férés dans les mémoires 334 et 336. Pendant l'intervalle de temps de 10 ms qui sépare les instants t1 et t5, les signaux de sortie des mémoires 331 à 336 correspondent aux valeurs de signal s obtenues dans l'intervalle de temps de 10 ms précédent l'instant t1. A l'instant t5, les signaux de paramètre placés dans ces mémoires entre les
instants t1 et t4 sont appliqués sur les sorties des mémoi-
res, sous l'effet d'un signal de commande provenant du contrôleur 307. Pendant l'intervalle de temps suivant, les signaux de paramètre caiculés entre les instants t1 et t5 commandent le codeur de la figure 1. Du fait que les échantillons de signal qui proviennent du convertisseur analogique-numérique 105 sont retardés d'une durée de 10 ms dans le circuit de retard 106, les signaux de paramètre provenant du calculateur 135 correspondent aux échantillons de signal sn qui sont traités dans les prédicteurs 107 et
128 et le quantificateur 111.
* Le signal de sortie du codeur numérique 112, pro-
venant du quantificateur 111, consiste en une suite de codes numériques qn qui sont représentatifs de la composante non prédite du signal de parole, c'est-à-dire le signal de parole duquel on a fait disparaître la redondance liée aux
formants et à la hauteur. Du fait que les niveaux d'ampli-
tude prédéterminés qu'on emploie dans le quantificateur 111 ne sont pas égaux aux valeurs des échantillons qn qui sont appliqués à ce quantificateur, une distorsion ou un bruit de quantification correspondant à en = qn - qn (15) est également présent dans le signal q qui provient du n codeur numérique 112. La distorsion est ensuite transmise par la voie de communication 150 et elle apparaît dans le signal de parole reconstitué (t) en sortie du circuit
décodeur de la figure 2.
Le bruit de quantification présent dans le
signal transmis peut être réduit par une prédiction effi-
cace. Cependant, cette réduction n'assure pas une faible valeur de la distorsion perçue dans le signal de parole
reconstitué, du fait que la distorsion dépend de la rela-
tion entre le spectre du bruit de quantification et le spectre'de la parole. Le spectre du signal de parole est caractérisé par des régions de formants qui varient au cours du temps, c'est-à-dire des régions dans lesquelles la puissance du signal de parole est concentrée, et par des régions inter-formants dans lesquelles la puissance de signal est relativement faible. La ligne 901 de la figure 9 illustre un spectre caractéristique pour une partie d'un signal de parole. Cependant, la fréquence du
bruit de quantification en est généralement répartie uni-
formément, de la manière qui est représentée par la ligne 903. L'examen des lignes 901 et 903 de la figure 9
montre clairement que le bruit de quantification corres-
pondant à la ligne 903 est plus faible que la puissance de signal de parole dans des régions de formants, mais est prédominant dans les régions inter-formants dans lesquelles le niveau du signal de parole est faible. Plus précisément, le bruit de quantification de la ligne 903 dépasse le signal de parole dans la région inter-formants entre les pics de formants des fréquences fa et fb' En outre, alors que le
rapport entre le signal de parole et le bruit de quantifi-
cation est relativement élevé pour les formants, il est beaucoup plus faible dans les positions inter-formants du
spectre de parole.
On sait qu'on peut modifier le spectre du bruit de
quantification par un filtrage, avec la restriction consis-
tant en ce que le bruit de quantification moyen demeure constant. Les configurations de filtrage de l'art antérieur emploient des caractéristiques qui sont conçues de façon à décaler le bruit de quantification vers les parties de fréquence supérieure du spectre de fréquence, ou de façon à réduire au minimum la valeur efficace du bruit. Cependant, ces configurations de filtrage sont invariantes dans le temps et elles sont donc incapables de réduire le bruit perçu dans un signal de parole dans lequel les formants
se décalent au cours du temps.
Conformément à l'invention, on introduit un fil-
tre à réaction adaptatif dont les caractéristiques sont commandées par les signaux de paramètre de prédiction liés aux formants. Le filtre adaptatif concentre le bruit de quantification dans les parties de formantsdu spectre de parole d'une manière qui varie au cours du temps afin que le bruit de quantification soit toujours masqué par les formants changeants du signal de parole. La ligne 905
représente le spectre de bruit de quantification redistri-
bué désiré. Comme le montre le signal 905, la puissance de bruit de quantification est concentrée dans les parties de formants du spectre de signal de parole représenté par
la ligne 901, si bien que la puissance de bruit de quanti-
fication est réduite dans les régions inter-formants dans lesquelles le bruit perçu est élevé. Ainsi, le rapport entre le signal de parole et l'erreur de quantification
est maintenu au-dessus d'une valeur acceptable prédéter-
minée sur la totalité du spectre de signal de parole. De cette manière, on réduit la distorsion perçue qui est due
au bruit d'erreur de quantification.
Sur la figure 1, la configuration de masquage du bruit de quantification comprend un filtre à pondération
adaptatif 120 qui modifie le signal d'erreur de quantifi-
cation en produit dans le réseau soustracteur 113, confor-
mément aux signaux de paramètre qui proviennent du géné-
rateur de coefficients 122. Ces signaux de paramètre sont produits à partir des signaux de paramètre de prédiction de
formants A=al, a2,....ap qui sont engendrés dans le calcu-
lateur 135. La distorsion qui est due à la quantification
dans le circuit de la figure 1 est l'erreur de quantifica-
tion e de l'équation (15), modifiée par les fonctions de n transfert du prédicteur de formants 107 et du filtre à réaction 120, comme l'indique l'expression (16):
E (1-F) (16)
(i-P S) Dans cette expression E représente la transformée de Fourier à court terme du signal d'erreur en; F représente la transformée de Fourier à court terme de la fonction de transfert du filtre de pondération 120 et P représente la s transformée de Fourier à court terme de la fonction de
transfert du prédicteur de formants 107. Ainsi, le spec-
tre de puissance de bruit de quantification du signal de
sortie du codeur peut être remodelé conformément à l'équa-
tion (16). On a constaté que la fonction suivante, en notation de la transformation en z: 1-F 1+z-1 1 1_-z__-1
1-P 2 + ( 1_-P) ( 2 (17)
_ (17)
T 2 '1P'2
S s réalise le filtrage du bruit de quantification qui est nécessaire pour obtenir la distribution de spectre de
bruit correspondant à la ligne 905.
L'équation (17) peut être réduite à: F = 1 (1 + z-1)Ps (18)
Du fait que la fonction de transfert du prédicteur de-
formants 107, avec la notation de la transformation en-z, est: Ps akzk (19) k=l la fonction de transfert du filtre de l'équation (18) devient: il 10 F = j fkz-k = 1 (akz-k + akzk) (20) k=l k=l A partir de l'équation (20), on détermine les valeurs suivantes pour les signaux de paramètre destinés à commander le filtre de pondération 120 f --a1
1 2 1
f k (ak+ a k) pour k = 2, 3,.-....................,10.(21) et f - 1 a10 il 2 0 Comme le montre l'examen de l'équation (21), - les signaux de paramètre de filtre de pondération f1 à
fil sont directement liés aux signaux de paramètre de pré-
diction de formants a1.....aIO' Du fait que les signaux
de paramètre de prédiction de formants a1,..... alo chan-
gent sous l'effet du signal de parole variant au cours du temps, les signaux de paramètre de filtre de pondération fi à fil sont modifiés de façon que le spectre de bruit de quantification qui correspond à la ligne 905 suive les caractéristiques de formants changeantes du spectre de signal de parole correspondant à la ligne 901. De cette manière, le spectre du bruit de quantification dans le signal q est toujours masqué par la partie de fréquences n de formants du signal de parole et on maintient un rapport
minimal entre le signal de parole et le bruit de quantifi-
cation sur la totalité du spectre de parole.
Le générateur de coefficients de filtre et mémoi-
re 122 est représenté en détail sur la figure 4. En consi-
dérant la figure 4, on voit que le signal de paramètre a est appliqué directement au circuit diviseur par deux 422-1 qui peut être constitué par un circuit à registre à décalage conçu de façon à effectuer un décalage d'un rang vers la droite. On sait que le fait de décaler un code binaire d'un rang vers la droite divise effectivement le code par un facteur égal à deux. Le signal de sortie du circuit diviseur par deux 422- 1 est le signal de paramètre de filtre f. Les signaux de paramètre a1 et- a2 sont sommés dans le circuit additionneur 420-2 et le signal résultant
est divisé par deux dans le circuit 422-2. De façon simi-
laire, l'additionneur 420-3 fait la somme des paramètres
a2 et a3 de façon que le signal de sortie du circuit divi-
seur par deux 422-3 soit le signal de paramètre de filtre f De façon similaire, les signaux de paramètre de filtre 3'. f4 à fg sont produits par un dispositif similaire qui
n'est pas représenté sur la figure 4. Le signal de paramè-
tre de filtre f10 est obtenu à partir du circuit diviseur
par deux 422-10 qui reçoit son signal d'entrée de l'addi-
tionneur 420-10. Le signal de paramètre a10 est divisé par deux dans le circuit 422-11 pour produire le signal de
paramètre de filtre fil.
Les signaux de paramètre de filtre f1 à fil
sont engendrés conformément à l'équation (21) dans le cir-
cuit-de la figure 4 et ils sont transférés vers là section d'entrée de la mémoire 430 pendant l'intervalle de temps
de 10 ms qui précède l'utilisation de ces signaux de para-
mètre de filtre dans le filtre de pondération 120. Au début de l'intervalle de 10 ms suivant, sous l'effet du signal d'horloge CL2 qui provient de l'horloge 140, les signaux de paramètre de filtre présents dans la section
d'entrée de la mémoire 430 sont transférés vers sa sec-
tion de sortie. De cette manière, les signaux de paramètre
de filtre sont affectés à chaque ensemble de 80 échantil-
lons dans les filtres 120, au cours de l'intervalle de
temps de 10 ms approprié.
Les signaux de coefficient de filtre f à f11 1 i qui proviennent du circuit de générateur et de mémoire
122 sont appliqués au filtre 120 par la ligne 123. Le cir-
cuit de filtre de pondération- 120 est représenté en détail sur la figure 6. En considérant la figure 6, on voit que les échantillons-de signal d'erreur én qui proviennent du soustracteur 113 sont appliqués séquentiellement par la
ligne 123 au registre à décalage à 11 étages 603. Les si-
gnaux en sont décalés séquentiellement vers la droite par les impulsions d'horloge CL1 qui proviennent de l'horloge , de manière classique. Les signaux de paramètre de
filtre f 1à fàl sont appliqués par la ligne 610 aux mul-
tiplicateurs respectifs 605-1 à 605-11. Les signaux d'er-
reur en, enl....en_11 sont appliqués aux multiplicateurs 605-1 à 605-11 à partir des étages du registre à décalage
603, par les lignes respectives 604-1 à 604-11. Le multi-
plicateur 605-1 forme un code de prédiction fl en' De façon similaire, le multiplicateur 605-11 forme le code de
produit fil e n-11' Les signaux de sortie des multiplica-
teurs 605-1 à 605-11 sont sommés successivement dans les additionneurs 607-2 à 607-11, grâce à quoi le signal d'erreur pondéré de formants: Wn = fkenk (22) (22) k=l
apparaît sur la ligne 612.
Le signal d'erreur pondéré de formantswn est
appliqué au soustracteur 126 par le circuit écrêteur 124.
Dans le circuit écreteur 124, le signal codé w est compa-
ré au signal de valeur efficace 2R qui provient de la mémoire 337 du calculateur 135. Lorsque la valeur présente du signal d'erreur pondéré remplit la condition: IwI < 2R (23)
le signal w est transmis directement au soustracteur 126.
Cependant, lorsque la condition: IwI > 2R (24) est remplie, le signal 2R est transmis au soustracteur 126 si le signal w est positif. Le signal 2R est transmis au soustracteur 126 si w est négatif. De cette manière, le signal de réaction que le filtre de pondération d'erreur 120 applique au soustracteur 126 est limité au double de
la valeur efficace du signal de différence dn.
Le signal de sortie du soustracteur 126 corres-
pond aux composantes non prédites du signal de parole modifiées par le signal d'erreur de quantification filtré
2475264-
avec réaction. Le signal de sortie résultant du codeur numérique 112, qn, est représentatif de la composante
quantifiée non prédite du signal de parole ayant un spec-
tre de bruit de quantification modifié. Le signal q. est appliqué au circuit multiplexeur et modulateur 115, en compagnie des signaux de paramètre de hauteur b et m, des signaux de paramètre de corrélation partielle rm et du signal de taille de pas à. Le circuit 115 forme un signal modulé de façon appropriée qui est transmis par la voie de communication 150 vers le circuit décodeur de la
figure 2.
Le circuit décodeur qui est représenté sur la figure 2 reçoit l'information transmise par le canal de communication 150 et il forme une image du signal de parole s(t) que la source 101 a appliqué à l'origine au
circuit codeur de la figure 1. Sur la figure 2, le cir-
cuit démodulateur et démultiplexeur 201 réagit à l'infor-
mation provenant de la voie de communication 150 en appli-
quant au décodeur numérique 203 le signal non prédit quan-
tifié qn et le signal de taille de pas A. De façon clas-
sique, le décodeur 203 effectue une mise à l'échelle du signal qn par le signal de taille de pas Cet le signal quantifié et mis à l'échelle est appliqué sur une entrée du circuit additionneur 205. L'autre signal d'entrée du
circuit additionneur 205 provient du prédicteur de pério-
dicité vocale 217.
Les signaux de paramètre liés à la hauteur B =
b1, b2, b3, qui proviennent du démultiplexeur et démodu-
lateur 201, pour chaque intervalle de temps de 10 ms, sont enregistrés dans la mémoire de coefficients de hauteur
213 et sont appliqués à partir de cette mémoire au prédic-
teur 217. Le prédicteur 217 est identique au prédicteur 128 de la figure 1 qui est représenté en détail sur la figure 7. Sous l'effet de la séquence de codes de signal
provenant de l'additionneur 205 et des signaux de paramè-
tre de prédiction b1, b2, b3 et m provenant de la mémoire 213, le prédicteur 217 forme la composante prédite liée à
la hauteur du signal de parole et il applique cette compo-
sante à l'additionneur 205. Le signal de sortie de l'addi-
tionneur 205 représente le signal d'excitation et il
comprend la composante non prédite et la composante pré-
dite liée à la hauteur du signal de parole. Le signal d'excitation qui provient de l'additionneur 205 est alors appliqué sur une entrée de l'additionneur 207 dont l'autre
signal d'entrée provient du prédicteur de formants 219.
Selon une caractéristique avantageuse, la formation de l'excitation employant le prédicteur de périodicité de ^
parole 217 ne nécessite pas la détection des segments sono-
res et sourds du signal de parole ou l'utilisation d'une source de bruit pour l'excitation correspondant aux sons sourds.
Les signaux de paramètre de corrélation partiel-
le liés aux formants rm de chaque intervalle de temps de msprovenant du démultiplexeur 201,sont transférés vers le convertisseur de coefficients et mémoire 215. Le convertisseur 215 convertit les signaux de paramètre de
corrélation partielle rm en signaux de paramètre de pré-
diction linéaire A = a1, a2.a10. Le convertisseur de coefficients 215 peut être constitué par un processeur tel que celui qui est utilisé dans le calculateur 135 de
la figure 1, ou par toute autre configuration de micro-
processeur de type classique.-Le convertisseur 215 forme les signaux de paramètre de prédiction linéaire de formants
a1, a2,... a10 à partir des signaux de paramètre de corré-
lation partielle rm, conformément à la formulation récur-
sive de l'équation (10). Les signaux rm sont transmis au
récepteur de la figure 2 du fait que ceci améliore la sta-
bilité, comme il est bien connu.
Le prédicteur de formants 219 est identique au prédicteur 107 de la figure 1 qui est représenté en détail sur la figure 5. Sous l'effet de la séquence des signaux d'excitation provenant de l'additionneur 207 et des signaux
de paramètre de prédiction de formants a1, a2,....a10 pro-
venant du convertisseur 215, le prédicteur de formants en-
gendre la composante de formants prédite du signal de
parole. Le signal de sortie. de l'additionneur 207 corres-
pond alors à la séquence de codes de signal image n. Le signal de sortie de l'additionneur 207 est appliqué au
filtre 209 qui-consiste en un réseau de désaccentuation qui.
exerce une action complémentaire de celle du réseau de pré-
accentuation appartenant au filtre 103, et en un filtre passe-bas qui correspond aux configurations de filtre du
filtre 103 de la figure 1. Le convertisseur numérique-analo-
gique 211 convertit la séquence d'échantillons de signal
provenant du filtre 209 en un signal analogique image 9(t).
On vient de décrire l'invention en considérant
un exemple de réalisation. Il va de soi que de nombreuses -
modifications peuvent être apportées au mode de réalisa-
tibn décrit et représenté, sans sortir du cadre de l'in-
vention. Par exemple, l'entrée du prédicteur de formants de la figure 1 peut être connectée au codeur numérique 112 au lieu d'être connectée au circuit de retard-106. De cette manière, la valeur prédite du signal de parole est formée à partir du signal quantifié codé qn au lieu de
l'être à partir de l'échantillon de signal de parole s.
2475264-
ANNEXE 1
C+++++ GENERATION DES PARAMETRES DE COEFFICIENT DE
PREDICTION LINEAIRE
SUBROUTINE LPCPAR
COMMON/BLKSIG/S(81),X(90),D(200),V(80),E(91),Y(90)
COMMON/BLKPAR/R(lO),A(lO),B(3),M COMMON/BLKSCR/P(10, O10),T(10,lO),C(tO), Q(10),W(10) C+++++ X(l)......X(90) SONT LES ECHANTILLONS DE PAROLE
C+++++ X(1)......X(10) SONT LES ECHANTILLONS PROVENANT
DE L'INTERVALLE PRECEDENT.
C+++++ X(11)... X(90) SONT LES ECHANTILLONS PROVENANT
DE L'INTERVALLE COURANT.
C+++++ CALCUL DE L'ENERGIE DES ECHANTILLONS DE PAROLE
C+++++ ENERGIE = PX
CALL INPROD(X(ll),X(11),80,PX)
C+++++ GENERATION DES COEFFICIENTS DE CORRELATION DE
PAROLE C(1)....C(10)
DO 1 I = 1,10
1 CALL INPROD (X(ll),X(ll-I),80,C(I))
C+++++ GENERATION DES CORRELATIONS PARTIELLES ET DES
COEFFICIENTS DE PREDICTEUR
EE-PX
DO 100 I = 1,10
C+++++ GENERATION DES ELEMENTS DE MATRICE DE COVARIANCE
- P(I,J)
DO 20 J = 1,10
XX = 0.0
IF (I.EQ. 1.AND. I. EQ.J) XX = PX
IF (I.EQ. 1.AND. J.GT. 1) XX = C(J-1)
IF (I.GT. 1) XX = P(I-1,J-1)
P(I,J) = XX + X(ll-I)*X(ll-J) - X(91-I)*X(91-J)
C+++++ CONVERSION EN MATRICE TRIANGULAIRE T AVEC P = T*T
(TRANSPOSEE)
DO 40 J = 1,I
SM = P(J,I)
K= 1
3 IF (K.EQ. J) GO TO 4
SM = SM - T(I,K)*T(J,K)
K = K + 1
GO TO 3
4 IF (I.EQ. J) W(J) = 1/SQRT(SM)
IF (I.NE.J) T(I,J) = SM*W(J)
CONTINUE
C+++++ GENERATION DE LA CORRELATION PARTIELLE R(I)
SM = C(I)
IF (I.EQ.1) GO TO 5
DO 50 J = 2,I
SM = SM - T(I,J-1)*Q(J-1)
Q(I) = SM*W(I)
IF (I.EQ. 1) GO TO 80
EE = EE - Q(I-1)XQ(I-1)
R(I) = -Q(I)/SQRT(EE)
C+++++ GENERATION DES COEFFICIENTS DE PREDICTEUR
A(1).... A(I)
A(I) = R(I)
IF (I.EQ. 1) GO TO 100
K = 1
6 IF (K.GT. I/2) GO TO 100
TI = A(K)
TJ = A(I-K)
A(K) = TI + R(I)*TJ
A(I-K) = TJ + R(I)*TI
K = K + 1
GO TO 6
CONTINUE
C+++++ GENERATION DU PREMIER SIGNAL DE DIFFERENCE
DO 110 N = 11,90
D(N) = X(N)
L =N - 1
DO 10 I = 1,10
D(N) = D(N) + A(I)*X(L)
L = L - 1
CONTINUE
RETURN
END
SUBROUTINE INPROD (X,Y,N,PX)
Gan (I)X*(I)X + Xd = Xa T I1 = I I oc O'0 = Xd
(N)X (N)À NOIONSWIG
LZ. i99zSCZ
ANNEXE 2
C++++++ GENERATION DES PARAMETRES DE PREDICTEUR DE
HAUTEUR
SUBROUTINE PCHPAR
* COMMON/BLKSIG/S(81),X(90),D(200),V(80),E(91),Y(90)
COMMON/BLKPAR/R(lO),A(lO),B(3),M COMMON/BLKSCR/P(10,lO),T(lO,lO),C(lO), Q(10),W(10)
C+++++ CALCUL DE L'ENERGIE DU PREMIER SIGNAL DE DIFFE-
RENCE DANS L'INTERVALLE COURANT
C+++++ ENERGIE = PDO
CALL INPROD(D(121),D(121),80,PDO)
C+++++ CALCUL DE L'ENERGIE DU PREMIER SIGNAL DEDIFFE-
RENCE PASSE
C+++++ ENERGIE= PD1 -
CALL INPROD(D(81),D(81),80,PD1)
C+++++ DETERMINATION DE L'EMPLACEMENT DU PIC DE CORRE-
LATION
CORMAX = -1.1
CORP = 1.1
CORT = 0,0
DO 100 I = 41,120
C+++++ GENERATION DE LA CORRELATION POUR LE RETARD I
C+++++ CORRELATION = CORL
CALL INPROD (D(121),D(121-I),80,P2)
PD1 = PD1 + (D(121+I) + D(201-I))*(D(121-I) - D(201-I))
CORL = p2/SQRT(PD1*PDO)
C+++++ SAUT A 10 SI ON N'EST PAS A UN PIC DE CORRELA-
TION
IF(CORT.LT. CORL.OR. CORT.LT. CORP) GO TO 10
C+++++ DETERMINATION DU PIC CORRECT PAR INTERPOLATION
CORM = CORT + O.125*((CORP - CORL)**2)/(2*CORT - CORP -CORL)
IF(CORM. LT. CORMAX) GO TO 10
CORMAX = CORM
M = I-1
OORP=CORT
OORT=O CORL
CONTINUE
GENERATION DES COEFFICIENTS B POUR LA PREDICTION
DE HAUTEUR
GNs (I)x*(I)X + Xd = Xd N'T = I I oI 0'0 = Xd
(N)X' (M)I NOISMSWIG
( Xd'Nis'2iX)GOUdNI INILnOUgnf NIfl,, (I)X*(I)X + Xd = Xd N'TI= I I oa 0'0 = Xd (N)X' (M)X NOIS:WIGa (Xd' N'.'X) GOHdNI SIIMLOUfnS aNM: NUflLT1I
- (w-N)a*(E)a -
Unod iaHaa d SDNaIIIGa (gH +
Z-:)/(Z0.(ZU
(T-W-N)OE*(E)S
(T+N-N)C.*()9 - (M)G = (N)A 011I
00'ITZ = N OTI oc HngLnVH Vq sa IVNDIS na HOI:VwINUD (C)G - (T)a - Tg = (eq - úg)*9'0 = () (e) g (sa + a)*s'o = (T)g r -**:g- I)/( Z. - oú0 + TOD) = S (Z- l)/(o - TO-) = z (u + F**TU +:I* - T) + (C +:o)*(:u - T))= Tg Gd/úSD = ú cid/D = To Gd/13- 10 (úD'O9' (w-OZT)u' (TUl)a)cIO'dHî I VO (sD'oú'(w-T:)c'(: T)a)aou:cii TIVD (ID'O9'(w-gTI)a'(TT)a)uOadiNI IqVO Gd/lGd = T ( ad'08' (w-ZI) a' (w-oZT)a)aoacai TIVO (lad'oú'(w-îzz)a'(w-îZ) a)aoacI TIVo T T - t9zçztz
Claims (14)
1. Système de transmission de signal de parole à prédiction comprenant un dispositif (135) qui analyse
un signal de parole dans des intervalles de temps sélec-
tionnés pour engendrer un ensemble de signaux de paramètre de prédiction liés aux formants pour chaque intervalle des circuits (107, 109) qui réagissent conjointement au signal de parole et aux signaux de paramètre de prédiction liés aux formants en produisant un signal représentatif de
la différence entre le signal de parole et sa valeur pré-
dite; un circuit de modification (137) destiné à modifier
le signal représentatif de la différence; un quantifica-
teur (111) qui réagit au signal de différence modifié en engendrant un signal quantifié; et un circuit soustracteur
(113) qui forme un signal d'erreur de quantification cor-
respondant à la différence entre le signal de différence modifié quantifié et non quantifié; caractérisé en ce que le circuit de modification (137) réagit conjointement aux signaux de paramètre de prédiction liés aux formants, au
signal d'erreur de quantification et au signal de diffé-
rence en concentrant l'erreur de quantification dans les parties de formants du spectre du signal de parole, grâce
à quoi l'erreur de quantification est masquée par les for-
mants du signal de parole.
2. Système de transmission de signal de parole à prédiction selon la revendication 1, caractérisé en ce que le circuit de modification (137) comprend des moyens (120, 122, 124) qui réagissent conjointement aux signaux de paramètre de prédiction liés aux formants et au signal d'erreur de quantification en formant un signal d'erreur pondéré de formants, et des moyens (126) qui combinent le
signal d'erreur pondéré de formantsavec le signal de diffé-
rence pour concentrer l'erreur de quantification dans les parties de formants du spectre du signal de parole, afin de maintenir le rapport entre le signal de parole et l'erreur de quantification au-dessus d'un niveau prédéterminé, sur
la totalité du spectre du signal de parole.
3. Système de transmission de signal de parole
à prédiction selon la revendication 2, caractérisé en ce-
que les moyens de formation de signal d'erreur pondéré de formantscomprennent des moyens (122) qui réagissent aux signaux de paramètre de prédiction liés aux formants en engendrant un ensemble de signaux de paramètre de filtre adaptatif, et des moyens (120) qui réagissent conjointement aux signaux de paramètre de filtre adaptatif et au-signal d'erreur de quantification pour former le signal d'erreur de quantification pondéré de formants; et les moyens de combinaison (126) soustraient le signal d'erreur pondéré
de formants du signal de différence.
4. Système de transmission de signal de parole à prédiction selon la revendication 3, caractérisé en ce
que les moyens (122) qui engendrent des signaux de para-
mètre de filtre adaptatif sont conçus de façon à former
un ensemble de signaux de paramètre de filtre fi, f2,....
fp, fp+1, conformément à la relation prédéterminée p+l P p+1 p1' _ I fkz =.. (1+z1) 3 a k=i k=1 dans laquelle z représente un terme de retard, ak est le signal de paramètre de prédiction lié aux formants de rang k
et p est le nombre de signaux de paramètre de prédiction.
5. Système de transmission de signal de parole à prédiction selon la revendication 4, caractérisé en ce que les moyens (120) de formation de signal d'erreur de quantification pondéré de formants comprennent un circuit à filtre transversal qui est conçu de façon à former un signal d'erreur de quantification pondéré de formants p+l Wn L fken-k k=1 dans lequel wn est la valeur présente du signal d'erreur de
quantification pondéré de formants et e est la valeur pré-
n
sente du signal d'erreur de-quantification.
6. Système de transmission de signal de parole'
à prédiction selon l'une quelconque des revendications 2
à 5, caractérisé en ce que le dispositif d'analyse (135) est également conçu de façon à engendrer un ensemble de signaux de paramètre de prédiction liés à la hauteur b1, b2, b3 et un signal lié à la période de hauteur, m, et les
moyens de modification (137) comprennent en outre un pré-
dicteur de périodicité vocale (128) qui réagit au signal quantifié, aux signaux de paramètre de prédiction liés à la hauteur bi, b2 et b3 et au signal lié à la période de hauteur, m, en formant un signal: d- b di_ + b dl + b d' + n =ln m+1 2 n-m 3 n-m-i n correspondant à la valeur prédite du signal de différence,
dans lequel d' est la valeur présente du signal de diffé-
n rence prédit et q est le signal quantifié, et les moyens
de combinaison (126) sont également conçus de façon à sous-
traire du signal de différence la valeur prédite de ce signal de différence afin de réduire la redondance liée
à la hauteur dans le signal de différence modifié.
7. Système de transmission de signal de parole à prédiction selon la revendication 6, comprenant en outre
des moyens (203, 205, 217) qui réagissent au signal quan-
tifié en produisant un signal d'excitation et des moyens (215, 219, 207) qui réagissent conjointement au signal d'excitation et aux signaux de paramètre de prédiction liés aux formants en formant une image du signal de parole,
caractérisé en ce que les moyens produisant un signal-
d'excitation (215, 219, 207) comprennent un prédicteur de périodicité vocale (217)qui réagit au signal quantifié, aux signaux de paramètre de prédiction liés à la hauteur et au signal lié à la période de hauteur en formant un signal correspondant à la valeur prédite du signal de différence, et des moyens (205) qui combinent la valeur
prédite du signal de différence avec le signal quantifié.
8. Procédé de traitement d'un signal de parole comprenant les opérations qui consistent à analyser le signal de parole dans des intervalles sélectionnés pour
2475264;
engendrer un ensemble de signaux de paramètre de prédiction liés aux formants pour chaque intervalle; à produire un signal représentatif de la différence entre le signal de parole présent et sa valeur prédite, à partir du signal de parole et des signaux de paramètre de prédiction liés aux formants; à modifier le signal de différence; à quantifier le signal de différence modifié; et à former un signal d'erreur de quantification correspondant à la différence entre les signaux de différence modifiés quantifiés et non quantifiés; caractérisé en ce que la modification du signal de différence comprend l'opération qui consiste à combiner les signaux de paramètre de prédiction liés aux formants,
le signal d'erreur de quantification et le signal de diffé-
rence, pour concentrer l'erreur de quantification dans les parties de formantsdu spectre du signal de parole afin
que l'erreur de quantification soit masquée par les for-
mants du signal de parole.
9. Procédé de traitement d'un signal de parole
selon la revendication 8, caractérisé en ce que la modifi-
cation du signal de différence comprend l'opération consis-
tant à former un signal d'erreur de quantification pondéré
de formants, à partir des signaux de paramètre de prédic-
tion liés-aux formants et du signal d'erreur de quantifi-
cation, et à combiner le signal d'erreur pondéré de for-
mants avec le signal de différence pour concentrer l'erreur de quantification dans les parties de formants du spectre du signal de parole afin de maintenir le rapport entre le signal de parole et l'erreur de quantification au-dessus d'un niveau prédéterminé sur la totalité du spectre du
signal de parole.
10. Procédé de traitement d'un signal de parole-
selon la revendication 9, caractérisé en ce que la formation du signal d'erreur pondéré de formants comprend l'opération consistant à engendrer un ensemble de signaux de paramètre de filtre adaptatif à partir des signaux de paramètre de prédiction liés aux formants, et à pondérer les signaux d'erreur de quantification avec les signaux de paramètre de filtre adaptatifs; et l'opération consistant à combiner
2-475264
le signal de différence avec le signal d'erreur pondéré de formants comprend l'opération consistant à soustraire
le signal d'erreur pondéré de formants du signal de diffé-
rence.
11. Procédé de traitement d'un signal de parole
selon la revendication 10, caractérisé en ce que l'opéra-
tion consistant à engendrer les signaux de paramètre de
filtre adaptatif comprend l'opération qui consiste à for-
mer un ensemble de signaux de paramètre de filtre f1,f2.
fp, fp+, conformément à la relation p+i P X f -k 1 (i+z1) > akz k=1 k=1 dans laquelle z 1 représente un retard déterminé, ak est le signal de paramètre de prédiction lié aux formants de
rang k et p est le nombre de signaux de paramètre de pré-
diction liés aux formants.
12. Procédé de traitement d'un signal de parole--
selon la revendication 11, caractérisé en ce que l'opéra-
tion de formation du signal d'erreur de quantification pondéré de formants comprend l'opération qui consiste à filtrer le signal d'erreur de quantification conformément à la relation p+i n fken-k k=l dans laquelle wn est la valeur présente du signal d'erreur de quantification pondéré de formantset en est la valeur
présente du signal d'erreur de quantification.
13. Procédé de traitement d'un signal de parole
selon l'une quelconque des revendications 9 à 12, caracté-
risé en ce que l'analyse du signal de parole comprend en outre l'opération qui consiste à former un ensemble de signaux de paramètre de prédiction liés à la hauteur b1, b2, b3 et un signal lié à la période de hauteur, m, pour chaque intervalle, la modification du signal de différence comprend l'opération qui consiste à produire un signal correspondant à la valeur prédite du signal de différence,
conformément à la relation: -
dl'=b d' + bdn' + bdl n _lnm+l 2 n-m 3 n-m-l n dans laquelle dl est la valeur présente du signal de diffé- n rence prédit et qn est le signal quantifié, et la valeur prédite du signal de différence est combinée avec le signal de différence et avec le signal d'erreur pondéré de formants pour réduire la redondance lié à la hauteur dans le signal
de différence modifié.
14. Procédé de traitement d'un signal de parole
selon la revendication 13, comprenant en outre les opéra-
tions qui consistent à produire un signal d'excitation sous l'effet du signal quantifié et à former une image du signal de parole en combinant le signal d'excitation avec les signaux de paramètre de prédiction liés aux formants, caractérisé en ce que l'opération consistant à produire une excitation comprend les opérations consistant à former un signal correspondant à la valeur prédite du signal de différence, à partir de la partie précédente du signal quantifié, des signaux de paramètre de prédiction liés à la hauteur b1, b2, b3 et du signal lié à la période de hauteur, m, et à combiner le signal quantifié présent
avec la valeur prédite du signal de différence.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US05/894,329 US4133976A (en) | 1978-04-07 | 1978-04-07 | Predictive speech signal coding with reduced noise effects |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2475264A1 true FR2475264A1 (fr) | 1981-08-07 |
FR2475264B1 FR2475264B1 (fr) | 1986-08-01 |
Family
ID=25402929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR8020155A Expired FR2475264B1 (fr) | 1978-04-07 | 1980-09-17 | Procede et systeme de transmission d'un signal de parole avec codage a prediction |
Country Status (8)
Country | Link |
---|---|
US (1) | US4133976A (fr) |
EP (1) | EP0012766A1 (fr) |
JP (1) | JPS5912186B2 (fr) |
CA (1) | CA1119724A (fr) |
DE (1) | DE2945414C2 (fr) |
FR (1) | FR2475264B1 (fr) |
GB (1) | GB2036515B (fr) |
WO (1) | WO1979000901A1 (fr) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1123955A (fr) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Appareil d'analyse et de synthese de la parole |
NL180895C (nl) * | 1978-11-30 | 1987-05-04 | Philips Nv | Analoog-digitaal-omzetter. |
USRE32124E (en) * | 1980-04-08 | 1986-04-22 | At&T Bell Laboratories | Predictive signal coding with partitioned quantization |
US4354057A (en) * | 1980-04-08 | 1982-10-12 | Bell Telephone Laboratories, Incorporated | Predictive signal coding with partitioned quantization |
US4509150A (en) * | 1980-12-31 | 1985-04-02 | Mobil Oil Corporation | Linear prediction coding for compressing of seismic data |
US4381428A (en) * | 1981-05-11 | 1983-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Adaptive quantizer for acoustic binary information transmission |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
USRE32580E (en) * | 1981-12-01 | 1988-01-19 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech coder |
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
NL8302985A (nl) * | 1983-08-26 | 1985-03-18 | Philips Nv | Multipulse excitatie lineair predictieve spraakcodeerder. |
JPS60116000A (ja) * | 1983-11-28 | 1985-06-22 | ケイディディ株式会社 | 音声符号化装置 |
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4675863A (en) * | 1985-03-20 | 1987-06-23 | International Mobile Machines Corp. | Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels |
FR2579356B1 (fr) * | 1985-03-22 | 1987-05-07 | Cit Alcatel | Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4628529A (en) * | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
USRE34247E (en) * | 1985-12-26 | 1993-05-11 | At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4827517A (en) * | 1985-12-26 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech processor using arbitrary excitation coding |
US4726037A (en) * | 1986-03-26 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4862168A (en) * | 1987-03-19 | 1989-08-29 | Beard Terry D | Audio digital/analog encoding and decoding |
US4933675A (en) * | 1987-03-19 | 1990-06-12 | Beard Terry D | Audio digital/analog encoding and decoding |
FR2624675B1 (fr) * | 1987-12-15 | 1990-05-11 | Charbonnier Alain | Dispositif et procede de traitement d'un signal de base echantillonne, en particulier representatif de sons |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
ATE145775T1 (de) * | 1988-02-29 | 1996-12-15 | Sony Corp | Verfahren und einrichtung zur digitalsignalverarbeitung |
US4882585A (en) * | 1988-03-17 | 1989-11-21 | Beard Terry D | Method and apparatus for high resolution analog-digital-analog transformations |
JPH0797753B2 (ja) * | 1989-01-24 | 1995-10-18 | 日本ビクター株式会社 | 符号化出力データ量の制御方式 |
JPH02309820A (ja) * | 1989-05-25 | 1990-12-25 | Sony Corp | デイジタル信号処理装置 |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
US5195168A (en) * | 1991-03-15 | 1993-03-16 | Codex Corporation | Speech coder and method having spectral interpolation and fast codebook search |
US5546383A (en) * | 1993-09-30 | 1996-08-13 | Cooley; David M. | Modularly clustered radiotelephone system |
US5602959A (en) * | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
DE19729494C2 (de) | 1997-07-10 | 1999-11-04 | Grundig Ag | Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte |
US6047035A (en) * | 1998-06-15 | 2000-04-04 | Dspc Israel Ltd. | Method and device for quantizing the input to soft decoders |
US6360239B1 (en) * | 1999-01-13 | 2002-03-19 | Creative Technology Ltd. | Noise-shaped coefficient rounding for FIR filters |
DE10026872A1 (de) | 2000-04-28 | 2001-10-31 | Deutsche Telekom Ag | Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector) |
EP1279164A1 (fr) * | 2000-04-28 | 2003-01-29 | Deutsche Telekom AG | Procede de calcul d'une decision d'activite vocale (detecteur d'activite vocale) |
US20060116874A1 (en) * | 2003-10-24 | 2006-06-01 | Jonas Samuelsson | Noise-dependent postfiltering |
DE102005039621A1 (de) * | 2005-08-19 | 2007-03-01 | Micronas Gmbh | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System |
CN101051464A (zh) * | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
EP3079151A1 (fr) | 2015-04-09 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codeur audio et procédé de codage d'un signal audio |
US10308447B2 (en) * | 2016-08-12 | 2019-06-04 | Sierra Pacific Industries | Stick placer assembly |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2927962A (en) * | 1954-04-26 | 1960-03-08 | Bell Telephone Labor Inc | Transmission systems employing quantization |
US3502986A (en) * | 1967-12-14 | 1970-03-24 | Bell Telephone Labor Inc | Adaptive prediction for redundancy removal in data transmission systems |
US3631520A (en) * | 1968-08-19 | 1971-12-28 | Bell Telephone Labor Inc | Predictive coding of speech signals |
US3740476A (en) * | 1971-07-09 | 1973-06-19 | Bell Telephone Labor Inc | Speech signal pitch detector using prediction error data |
-
1978
- 1978-04-07 US US05/894,329 patent/US4133976A/en not_active Expired - Lifetime
-
1979
- 1979-03-28 GB GB7944218A patent/GB2036515B/en not_active Expired
- 1979-03-28 JP JP54500642A patent/JPS5912186B2/ja not_active Expired
- 1979-03-28 WO PCT/US1979/000197 patent/WO1979000901A1/fr unknown
- 1979-03-28 DE DE2945414A patent/DE2945414C2/de not_active Expired
- 1979-03-29 CA CA000324451A patent/CA1119724A/fr not_active Expired
- 1979-11-08 EP EP79900392A patent/EP0012766A1/fr not_active Withdrawn
-
1980
- 1980-09-17 FR FR8020155A patent/FR2475264B1/fr not_active Expired
Also Published As
Publication number | Publication date |
---|---|
JPS55500402A (fr) | 1980-07-10 |
FR2475264B1 (fr) | 1986-08-01 |
WO1979000901A1 (fr) | 1979-11-15 |
GB2036515A (en) | 1980-06-25 |
EP0012766A1 (fr) | 1980-07-09 |
US4133976A (en) | 1979-01-09 |
CA1119724A (fr) | 1982-03-09 |
GB2036515B (en) | 1982-08-18 |
DE2945414C2 (de) | 1985-09-05 |
JPS5912186B2 (ja) | 1984-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2475264A1 (fr) | Procede et systeme de transmission d'un signal de parole avec codage a prediction | |
US7031912B2 (en) | Speech coding apparatus capable of implementing acceptable in-channel transmission of non-speech signals | |
US4301329A (en) | Speech analysis and synthesis apparatus | |
US4811396A (en) | Speech coding system | |
US5359696A (en) | Digital speech coder having improved sub-sample resolution long-term predictor | |
EP0501421B1 (fr) | Système de codage de parole | |
FR2596936A1 (fr) | Systeme de transmission d'un signal vocal | |
US4726037A (en) | Predictive communication system filtering arrangement | |
US5884251A (en) | Voice coding and decoding method and device therefor | |
EP0450064B1 (fr) | Codeur de parole numerique a predicteur a long terme ameliore a resolution au niveau sous-echantillon | |
EP0428445B1 (fr) | Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit | |
US4354057A (en) | Predictive signal coding with partitioned quantization | |
EP0415675A2 (fr) | Codage utilisant une excitation stochastique soumise à des limitations | |
EP0396121B1 (fr) | Système pour le codage de signaux audio à large bande | |
US5113448A (en) | Speech coding/decoding system with reduced quantization noise | |
USRE32124E (en) | Predictive signal coding with partitioned quantization | |
US5504832A (en) | Reduction of phase information in coding of speech | |
US6535847B1 (en) | Audio signal processing | |
CA1321025C (fr) | Systeme de codage-decodage de signaux vocaux | |
CA2124713C (fr) | Interpolateur a long terme | |
EP0709981B1 (fr) | Codage de signaux en sous-bandes avec codage prédictif basé sur la hauteur du ton dans chaque sous-bande | |
US4908863A (en) | Multi-pulse coding system | |
CA2246901C (fr) | Methode pour ameliorer la performance d'un vocodeur | |
FR2481024A1 (fr) | Circuit predicteur adaptatif utilisant un filtre en treillis et dispositif de codage ou de decodage mic differentiel correspondant | |
EP0520462B1 (fr) | Codeurs de parole basés sur des méthodes d'analyse par synthèse |