FR2596936A1 - Systeme de transmission d'un signal vocal - Google Patents

Systeme de transmission d'un signal vocal Download PDF

Info

Publication number
FR2596936A1
FR2596936A1 FR8704637A FR8704637A FR2596936A1 FR 2596936 A1 FR2596936 A1 FR 2596936A1 FR 8704637 A FR8704637 A FR 8704637A FR 8704637 A FR8704637 A FR 8704637A FR 2596936 A1 FR2596936 A1 FR 2596936A1
Authority
FR
France
Prior art keywords
signal
voice signal
low frequency
frequency voice
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8704637A
Other languages
English (en)
Other versions
FR2596936B1 (fr
Inventor
Yohtaro Yatsuzuka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Publication of FR2596936A1 publication Critical patent/FR2596936A1/fr
Application granted granted Critical
Publication of FR2596936B1 publication Critical patent/FR2596936B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

UN SIGNAL VOCAL D'ENTREE ARRIVANT EN 1 SUR UN FILTRE ANALOGIQUE 2 EST DIVISE EN UN SIGNAL VOCAL BASSE FREQUENCE ET UN SIGNAL VOCAL HAUTE FREQUENCE PAR DES FILTRES 40 ET 41; UN SIGNAL RESIDUEL PREDICTIONNEL DU SIGNAL VOCAL BASSE FREQUENCE EST TRANSMIS APRES AVOIR ETE CODE DANS UN CODEUR DE FORME D'ONDE 43 AFIN DE DIMINUER, AUTANT QUE POSSIBLE, LA DETERIORATION DE LA QUALITE DU SIGNAL, ET DES RENSEIGNEMENTS INDICATIFS D'UN SPECTRE HAUTE FREQUENCE A TEMPS COURT DU SIGNAL VOCAL HAUTE FREQUENCE SONT EXTRAITS DE CE DERNIER A L'AIDE DE FILTRES 46, 56, 59 ET TRANSMIS APRES CODAGE.

Description

La présente invention concerne un système de transmission de signal vocal
et plus particulièrement un système de transmission de signal vocal qui présente une utilité particulière lorsqu'il est employé dans un système de communication exigeant une grande efficacité d'utilisation du trajet de transmission, ou encore dans un système de communication qui est sujet à de sévères
limitations concernant la bande de fréquence de transmission et la puissance de transmission utilisées.
Jusqu'à présent, du MIC b 64 kb/s ou du MICA (MIC adapté) à 32 kb/s a été utilisé comme trajet de transmission de base pour la transmission numérique de signaux vocaux. Dans ce cas, un codage des signaux vocaux à une cadence faible de 4,8 à 9,6 kb/s sans apporter une 15 détérioration appréciable de leur qualité améliorerait de manière marquée l'efficacité d'utilisation du trajet de transmission de base et diminuerait fortement les coûts de communication. Pour une construction économique des systèmes 20 qui sont sévèrement limités en termes de bande de fréquence de transmission, d'énergie de transmission et d'autres caractéristiques de transmission tels que, par exemple les systèmes de communication numérique par satellites utilisés en mer, les systèmes de communication 25 par satellites utilisés dans la navigation aérienne, les systèmes de communication numériques par satellites utilisés dans les communications et les affaires, et dans les systèmes de communication numérique mobile par radio pour automobiles, il existe une demande pour des systèmes 30 de codage de signaux vocaux qui assurent une qualité excellente du signal vocal codé à une cadence de codage d'environ 4,8 à 8,6 kb/s et qui n'est pas susceptible d'être influencée par des erreurs apparaissant sur le trajet de transmission. La matérialisation d'un tel système de codage de signal vocal lui permettra également de réduire la capacité de stockage nécessaire non seulement dans les domaines techniques mentionnés cidessus mais également dans le cas o des signaux vocaux sont emmagasinés sous forme codée. Jusqu'à présent, on a proposé un système de codage particulier appelé ci-après système "RELP" en tant qu'exemple de système de codage qui utilise une cadence de codage de 4,8 h 9,6 kb/s. La caractéristique principale du RELP est que, en entrant un système vocal d'entrée dans un filtre inversé présentant 10 une caractéristique inverse de la caractéristique de corrélation de la valeur d'amplitude du signal vocal d'entrée, on obtient un signal résiduel présentant une enveloppe de spectre h temps court aplatie et, qu'ensuite, la composante basse fréquence du signal résiduel est transmise après avoir été codée sous une forme d'onde à l'aide d'une modulation de type MIC Modulation par Impulsion et Codage) ou du type MDA (Modulation à Delta Adapté). Du côté de la réception, un signal résiduel haute fréquence est régénéré par un procédé de reproduction non linéaire tel que pour un redressement et par un procédé de maintien de spectre agissant sur le principe du pliage de spectre, sur la base du signal résiduel basse fréquence obtenu par décodage de la forme d'onde. Les signaux résiduels de basse et de haute 25 fréquence sont ajoutés entre eux pour rétablir le signal résiduel. Le signal résiduel est appliqué en tant que signal d'excitation à un filtre de synthèse de spectre à
temps court, en reproduisant ainsi un signal vocal qui présente une enveloppe de spectre semblable à celle du 30 signal vocal d'origine.
En d'autres termes, le système RELP matérialise la réduction de la cadence de codage en extrayant la composante basse fréquence du signal résiduel et en la
transmettant sous la forme d'un code de forme d'onde.
A ce sujet, pour augmenter la qualité du signal vocal synthétisé dans le système RELP, il est important de connaître la façon dont sont correctement reproduites, du côté de la synthèse, les composantes haute fréquence retenant la structure des harmoniques. Toutefois, dans la technique antérieure qui rétrécit la bande su signal résiduel basse fréquence pour diminuer la cadence de codage comme décrit plus haut, la bande des composantes haute fréquence à reproduire s'élargit du côté de la synthèse, et une reproduction correcte de ces composantes haute fréquence devient difficile, en imposant une limitation sur l'accroissement de la qualité du signal vocal. Comme cela est décrit plus haut en détail, le 15 défaut du système RELP connu peut être attribué à la disposition de base qui permet d'obtenir un signal résiduel d'un signal vocal par l'intermédiaire d'un filtrage inversé, qui extrait de ce dernier un signal résiduel basse fréquence, et qui le transmet après codage 20 dans une forme d'onde par l'intermédiaire d'une modulation de type MIC adapté (MICA) ou d'une modulation de
type delta adapté (MDA).
En vue des inconvénients notés ci-dessus de la technique antérieure, la présente invention a pour objet 25 de créer un système de transmission avec lequel il est possible d'obtenir un signal vocal synthétisé d'excellente qualité même si l'on utilise une faible cadence de codage. Le système de transmission conforme à la pré30 sente invention est ainsi caractérisé en ce qu'un signal vocal d'entrée est divisé au préalable en signaux résiduels de basse et haute fréquence, le signal résiduel de basse fréquence étant transmis sous la forme d'un code de forme d'onde avec la fidélité la plus élevée possible et 35 la détérioration de qualité la plus faible possible par l'utilisation du système de Codage Prédictionnel Adapté (CPA) ou du système de Codage Excité à Impulsions Multiples (CEIM), alors que l'information sur le spectre haute fréquence de temps court est extraite du signal résiduel haute fréquence et est transmise sous la forme d'une information pouvant être utilisée dans la reproduction du
signal vocal du côté de la réception.
Diverses autres caractéristiques de l'invention
ressortent d'ailleurs de la description détaillée qui 10 suit.
Une forme de réalisation de l'objet de l'invention est représentée à titre d'exemple non limitatif au dessin annexé en comparaison avec la technique antérieure.
Les figures 1A, lB et 2 sont des schémas synoptiques d'un exemple de système connu de type RELP.
La figture 3 est un schéma synoptique d'une forme
de réalisation de la présente invention.
La figure 4A est un schéma synoptique montrant 20 un exemple particulier d'un codeur de forme d'onde
utilisé dans la forme de réalisation de la figure 3.
La figure 4B est un schéma synoptique d'un
exemple de décodeur de forme d'onde permettant de reproduire un signal transmis conformément à la présente 25 invention.
La figure 5 est un schéma explicatif du principe
de la présente invention.
La figure 6 est un schéma synoptique montrant des
moyens de formation d'ondes d'harmoniques supérieures 30 pour produire un signal reçu et transmis selon la présente invention.
Les figures 7A, 7B, 7C et 7D sont des diagrammes explicatifs du fonctionnement des moyens de formation
d'ondes de la figure 6.
Les figures 8, 9 et 10 sont des schémas synoptiques d'exemples particuliers d'un filtre de synthèse à pas de haute fréquence, un filtre de synthèse haute fréquence à temps court et un filtre de formation de spectre haute fréquence qui sont utilisés dans la reproduction d'un signal reçu et transmis en accord avec la
présente invention.
Les figures 11 et 12 sont des schémas synoptiques de moyens permettant d'améliorer les caractéris10 tiques reproduites du signal transmis conformément à la
présente invention.
Les figures 13A et 13B sont des diagrammes caractéristiques explicatifs du fonctionnement des moyens
illustrés aux figures 11 et 12.
De manière h bien montrer les différences entre la technique antérieure et la présente invention, on décrit tout d'abord un exemple d'une telle technique
antérieure en se référant à la figure 1A.
Un signal vocal d'entrée de type analogique 20 appliqué h une borne d'entrée 1 présente une bande de fréquence limitée par un filtre analogique 2 à 0,3 3,4 kHz, par exemple et est transformé par un convertisseur A/N 3 pour donner un signal vocal numérique 4 échantillonné à par exemple 8 kHz. Un filtre inversé 6 25 permet d'éliminer la corrélation de l'amplitude des échantillons du signal vocal numérique 4 de manière aplatir l'enveloppe de son spectre. Le coefficient de filtrage établi dans le filtre inversé 6 est obtenu en analysant, dans un analyseur de spectre à temps court 5, 30 l'enveloppe du spectre à temps court du signal vocal numérique 4, par exemple pour chaque trame de 20 mspar l'intermédiaire d'un procédé d'auto-corrélation ou d'un procédé analogue. Le coefficient de filtrage est codé par un codeur de coefficient 7 de type LPC pour chaque trame 35 et appliqué au filtre inversé 6 par l'intermédiaire d'un \:: décodeur de coefficient 8 de type LPC, et il est transmis en même temps au cÈté de la réception, comme décrit plus loin. Un signal 35 est formé à partir du filtre inversé 6, et ce signal, qui présente un spectre aplati, est appelé signal résiduel. De manière à ne transmettre que la composante basse fréquence du signal résiduel 35, le signal résiduel basse fréquence est extrait au moyen d'un filtre passe bas 9 dont la bande passante s'étend, par exemple, de O à 1000 Hz. La cadence d'échantillonnage du 10 signal est transformée par un convertisseur de cadence d'échantillonnage 10 en accord avec la bande du signal de 8 kHz à 2 kHz, dans cet exemplaire. Le signal d'une telle faible cadence d'échantillonnage est codé en forme d'onde par un codeur de forme d'onde 11. Comme mentionné plus 15 haut, on utilise, pour ce codage de forme d'onde, une modulation à MIC adapté (MICA) ou une modulation à delta
adaptée (MDA).
En outre, de manière à permettre un réglage du niveau dans la reproduction des composantes haute fré20 quence du signal résiduel du côté de la réception, le côté de la réception détecte le rapport de puissance entre le signal résiduel 35 et le signal résiduel basse fréquence au moyen d'un comparateur de puissance 12 et il le code à l'aide d'un codeur 13. Les signaux de sortie du 25 codeur de forme d'onde 11, du codeur 13 et du codeur de coefficient 7 sont appliqués à un multiplexeur 15 dans lequel ils sont multiplexés en même temps qu'un signal de synchronisation de trame provenant d'un générateur de signal de synchronisation de trame 14 à la cadence de codage requis. Le signal de sortie multiplexé est amené sur le trajet de transmission par l'intermédiaire d'une
borne de sortie 16.
On décrit maintenant, en référence à la figure lB, le fonctionnement du côté de la réception. 35 Le signal provenant du trajet de transmission est appliqué par l'intermédiaire d'une borne 17 à un démultiplexeur 18 par lequel il est séparé pour donner le signal résiduel basse fréquence codé en forme d'onde, l'information de rapport de puissance et l'information de coefficient de filtrage de chaque trame en synchronisme avec le signal de synchronisation de trame qui est détecté par un détecteur 19. Le signal résiduel basse fréquence qui est décodé par un décodeur de forme d'onde 10 20 est transformé en un signal de cadence d'échantillonnage à 8 kHz par l'intermédiaire d'une interpolation d'échantillonnage effectuée par un convertisseur de cadence d'échantillonnage 21. Le signal ainsi obtenu a une bande de fréquence limitée par un filtre passe-bas 22 15 en reproduisant le signal résiduel basse fréquence. Un générateur d'ondes d'harmoniques supérieures 23 génère des ondes d'harmoniques supérieures par l'intermédiaire d'un circuit non linéaire ou d'un procédé de maintien de spectre sur la base du signal résiduel basse fréquence. 20 Les ondes d'harmoniques supérieures sont appliquées à un filtre passe-haut 24 présentant, par exemple, une bande passante de 1 à 4,0 kHz et dans lequel elles sont transformées en un signal résiduel haute fréquence. Un dispositif de réglage de niveau 25 sert à régler le niveau du 25 signal résiduel haute fréquence de telle manière que sa relation par rapport au niveau du signal résiduel basse fréquence puisse être telle qu'indiqué par l'information de rapport de puissance qui est fourni par un décodeur 26. Après une telle opération, les signaux résiduels haute et basse fréquence sont ajoutés l'un à l'autre à l'aide d'un additionneur 27 pour former un signal résiduel d'une bande à 4 kHz qui est appliqué, en tant que signal d'excitation 36, à un filtre de synthèse de spectre 29 pour le spectre à temps court. Etant donné que 35 le coefficient de filtrage, obtenu à l'aide d'un décodeur de coefficient 28 de type LPC, est réglé dans le filtre de synthèse 29, on donne au signal d'excitation 36 une certaine caractéristique de fréquence produisant un signal vocal numérique 39. Le signal 39 est appliqué à 5 un convertisseur N/A 30 et à un filtre analogique 31 de sorte qu'il est fourni à une borne 32 en tant que signal
vocal analogique à bande limitée.
Le système RELP décrit ci-dessus présente en lui-même des défauts pour la transmission de signaux à une cadence de codage faible et pour l'amélioration de la qualité des signaux vocaux décodés. Un tel défaut est
maintenant décrit ci-dessous en détail.
Selon le système RELP indiqué plus haut, la disposition de base pour le signal résiduel basse fréquence qui est codé pour donner une forme d'onde est celle indiquée à la figure 2. Ainsi, des moyens de conversion de cadence d'échantillonnage et des moyens de codage/décodage sont montés entre le filtre inversé 6 et le filtre de synthèse 29, et un bruit de quantification N(z) créé par les 20 moyens de codage est ajouté au signal résiduel basse fréquence. Le filtre inversé 6 comprend un dispositif prédictionnel ou 'prédicteur" 33 à temps court et un soustracteur 34, tandis que le filtre de synthèse 29 comprend un dispositif prédictionnel ou "prédicteur" à 25 temps court 37 présentant les mêmes caractéristiques que celles du dispositif prédictionnel 33 et un additionneur 38. Si on suppose maintenant que la fonction de transfert du dispositif prédictionnel 37, exprimée par la conversion en Z, et que le signal résiduel basse fréquence, sont respectivement représentées par P(z) et S(z), alors le signal résiduel basse fréquence reproduit R(z) peut être exprimé de la façon suivante: R(z) = --(z) - p(z) + S(z)......... (1) Comme cela est visible de la relation (1) ci-dessus, le signal résiduel basse fréquence reproduit R(z) se trouve mélangé à une composante de brut de quantification N(z) ayant traversé le filtre de synthèse 29. En outre, en supposant que la composante de bruit de quantification N(z) présente un spectre plat, on produit la même enveloppe de spectre que celle du signal vocal, ce qui a pour résultat une détérioration importante de la qualité tonale subjective du système résiduel basse fréquence. Ceci constitue le même phénomène que celui qui a souvent été signalé dans le codage de forme d'onde par un système de codage prédictionnel adapté ci- après appelé "système CPA". Pour cette raison, il est usuel dans le codage de forme d'onde par le système usuel de type RELP 15 de diminuer l'apparition du bruit de quantification N(z) du fait de l'utilisation de trois bits de quantification ou davantage, et de rétrécir la bande du signal résiduel
basse fréquence afin de réduire la cadence de codage.
Par exemple, selon un système RELP de type connu 20 à 9,6 kb/s le signal résiduel basse fréquence présente
une bande de 1 kHz et est échantillonné à une cadence de 2 kHz, et un échantillon est quantifié avec quatre bits.
Le nombre de bits nécessaire pour une telle opération est égal à huit kbits et les 1,6 kbits restants sont utilisés 25 pour la transmission d'autres informations. Dans un système de type RELP à 7,2 kb/s le signal résiduel basse fréquence présente une bande de 0,8 kHz et il est échantillonné à 1,6 kHz, et un échantillon est quantifié avec trois bits. Le nombre de bits nécessaire pour une telle opération est de 4,8 kbits et les 3,4 kbits restants sont prévus pour la transmission d'autres informations. En outre, dans un système de type RELP à 4,8 kb/s, la bande du signal basse fréquence ne peut pas être obtenue en dessous de 800 kHz au vu des caractéristiques de distri35 bution de la fréquence fondamentale du signal vocal, et la limite inférieure de la fréquence d'échantillonnage ne peut pas être moindre que 1,6 kHz. Du fait de cela, la quantification à trois bits est impossible et la qualité
du système vocal synthétisé n'est pas bonne.
Il résulte des constatations ci-dessus que la disposition de la technique antérieure présente les
défauts mentionnés plus haut.
On décrit maintenant en se référant à la figure 3 une forme de réalisation de la présente invention. 10 La description ci-après est faite en supposant que la bande
du signal vocal analogique est de 4 kHz.
La bande du signal vocal analogique provenant de la borne d'entrée 1 est soumise à une limitation par l'intermédiaire du filtre analogique 2, et le signal vocal analogique est ensuite transformé par le convertisseur A/N 3 pour donner le signal numérique 4 échantillonné à une cadence de 8 kHz. Le signal numérique 4 est divisé en signaux vocaux basse et haute fréquence par l'intermédiaire de filtres passe-bas et passe-haut 40 et, 20 respectivement 41. La cadence d'échantillonnage du signal vocal basse fréquence est transformée par un convertisseur de cadence d'échantillonnage 42 depuis la cadence d'échantillonnage de 8 kHz jusqu'A une cadence d'échantillonnage deux fois plus élevée que la bande de fré25 quence de ce signal, en étant ensuite codé de manière correcte par un codeur de forme d'onde 43 pour donner des codes de forme d'onde appropriés. Par ailleurs, le spectre du signal vocal haute fréquence est analysé par un analyseur de spectre à temps court 45. L'information 30 de coefficient obtenue à la suite de l'analyse est codée par un codeur de coefficient 47 de type LPC. En outre, les puissances de sortie des filtres passe-bas et passe-haut 40 et 41 sont comparés à l'aide d'un convertisseur de puissance 48 et le résultat de cette compa35 raison est codé, par un codeur 49, comme étant l'un des paramètres de la reproduction du signal vocal haute fréquence du côté de la synthèse. Les signaux de sortie du codeur de forme d'onde 43, du codeur de coefficient 47 de type LPC et du codeur 49 décrit plus haut, sont multiplexés par un multiplexeur 44, en même temps que le signal de synchronisation de trame provenant du générateur de signal de synchronisation de trame 14,-et le signal de sortie multiplexé est amené sur le trajet de transmission par la borne 16. Il y a lieu de noter que 10 les fréquences de coupure des filtres passe-haut et passe-bas 40 et 41 seront décrites plus loin en liaison
avec les caractéristiques du codeur de forme d'onde 43.
On décrit maintenant le fonctionnement du côté
de la réception et du côté de la synthèse.
Le signal provenant du trajet de transmission est appliqué, par l'intermédiaire de la borne 17, à un démultiplexeur 50 dans lequel il est séparé pour donner le signal de synchronisation de trame, le signal vocal basse fréquence codé, l'information de coefficient codée 20 et l'information de rapport de puissance codée. Le signal vocal basse fréquence codé est décodé par un décodeur de forme d'onde 51, une interpolation en est faite par un convertisseur de cadence d'échantillonnage 52 à la cadence d'échantillonnage de 8 kHz, puis il est amené 25 passer à travers un filtre passe-bas 53, de sorte qu'il
est reproduit en tant que signal vocal basse fréquence.
Le signal vocal haute fréquence est, par ailleurs, reproduit de la manière suivante: Un signal d'excitation ou un signal résiduel d'un filtre de synthèse de spectre 30 basse fréquence du décodeur de forme d'onde 51 décrit
plus loin est prélevé à une borne 54 pour être introduit dans un générateur d'ondes d'harmoniques supérieures 55.
En tant que moyen de formation d'ondes d'harmoniques supérieures, on peut utiliser de nombreux procédés connus 35 tels qu'un procédé à redressement, un procédé à pliage de spectre et un procédé à impulsions de polarité. On indiquera toutefois plus loin des moyens de formation d'ondes d'harmoniques supérieures et qui seront efficaces pour améliorer la valeur d'évaluation subjective. Un signal d'onde d'harmoniquessupérieurE 69 est formé par le générateur d'ondes d'harmoniques supérieures 55 est obtenu à partir du signal vocal basse fréquence, et sa structure harmonique et ses caractéristiques de fréquence ne peuvent pas être considérées comme reflétant correc10 tement celles du signal vocal d'origine. Le signal d'onde d'harmonique supérieure 69 est, par conséquent, ensuite soumis à un traitement ultérieur. le signal est amené à un filtre de synthèse de pas à haute fréquence 56 dans lequel une structure spectrale suivant la période du pas 15 du signal vocal basse fréquence est reproduite, puis une enveloppe de spectre haute fréquence à temps court est reproduite par un filtre de synthèse haute fréquence à temps court 46. La période du pas et le coefficient de filtrage du filtre de synthèse de pas à haute fréquence 56 sont obtenus en prélevant d'une borne 57 la période de pas et le coefficient de filtrage d'un filtre de synthèse de pas à basse fréquence du décodeur de forme d'onde 51 et en les pondérant, selon les besoins, en considération de la cadence d'échantillonnage du signal vocal basse 25 fréquence et de la cadence d'échantillonnage du signal d'onde d'harmonique supérieure. Par exemple, lorsque les cadences d'échantillonnage du signal vocal basse fréquence et du signal d'onde d'harmoniques sont respectivement égales à 2 et 8 kHz, une période de pas quatre fois plus 30 longue que celle prélevée au décodeur de forme d'ondes 51 est alors réglée,et le coefficient de filtrage est
utilisé tel quel ou en tant que valeur pondérée.
coefficient de filtrage du filtre de synthèse haute fréquence à temps court 46 est transmis du c8té de la transmission et décodé par le décodeur de coefficient 58 de type LPC. Il y a lieu de noter que le paramètre du filtre de synthèse de pas à haute fréquence 56 peut également être détecté du côté de la transmission et ensuite transmis, à partir de là, vers le côté de récep5 tion lorsque la capacité des bits de transmission est
suffisamment importante.
La sortie 63 du filtre de synthèse de spectre haute fréquence à temps court 46 est en outre appliquée à un filtre de mise en forme de spectre haute fréquence 59, 10 dans lequel ce spectre est mis en forme pour que la qualité du signal vocal haute fréquence à reproduire soit aussi proche que possible de la qualité subjective du signal vocal haute fréquence d'origine. En tant que coefficient de filtrage, on peut utiliser, dans ce cas, 15 une valeur qui est pondérée sur les coefficients de filtrage utilisés pour le filtre de synthèse de pas
haute fréquence 56 et le filtre de synthèse haute fréquence à temps court 46.
Du fait de ce qui précède, le signal d'ondes d'harmoniquessupérieure 69 créé par le générateur d'ondes d'harmoniques supérieures 55 est mis en forme en lui donnant la structure de pas et la structure de spectre du signal vocal haute fréquence d'origine, de sorte que l'évaluation subjective du signal vocal haute fréquence reproduit peut être fortement améliorée. Notamment dans le cas de l'emploi d'un procédé de pliage de spectre pour les moyens de formation d'ondes d'harmoniques supérieures, il est possible de fortement réduire un bruit à fréquence unique pouvant être attribué à la période de 30 pliage et appelé bruit total, ce bruit ayant posé un
problème particulier dans le passé.
Le signal vocal haute fréquence ainsi reproduit est réglé, par un dispositif de réglage de niveau 61, dans son rapport de puissance au signal vocal basse fréquence sur la base de l'information de sortie d'un décodeur 60. Le signal vocal haute fréquence est ensuite appliqué à un additionneur 62 dans lequel il est ajouté au signal vocal basse fréquence pour former le signal vocal numérique 39 présentant une bande de 4 kHz. Le signal vocal numérique est fourni au convertisseur N/A 30 et au filtre analogique 31, et il sort constitué par la
borne 32.
On décrit maintenant des exemples de dispositions du codeur de forme d'onde 43 et du décodeur de o10 forme d'onde 51 pouvant être utilisé dans la présente forme de réalisation, en même temps que la relation entre la bande du signal vocal basse fréquence et la cadence de codage. Les figures 4A et 4B illustrent des exemples de 15 dispositions du codeur de forme d'onde 43 et du décodeur de forme d'onde 51. Ces exemples utilisent le système APC et sont décrits dans la demande de brevet japonais
publiée sous le N 116000/85.
Le fonctionnement du codeur de forme d'onde 43 20 représenté à la figure 4A va tout d'abord être décrit.
Le signal numérique d'entré Sj est appliqué, par l'intermédiaire d'une borne d'entrée 70 du codeur, à un analyseur de spectre 71 de type LPC dans lequel il est soumis à une analyse de spectre à temps court (analyse de 25 type LPC) pour chaque trame. Le paramètre LPC résultant est codé par un codeur de paramètre LPC 72, après quoi il est transmis par l'intermédiaire d'un multiplexeur 98
vers le c8té de la transmission.
En outre, la sortie du codeur de paramètre LPC 30 72 est décodée par un décodeur de paramètre LPC 73 afin d'obtenir un coefficient prédictionnel. Le coefficient prédictionnel est pondéré à différentes valeurs pour les prises respectives d'un filtre numérique formant un dispositif prédictionnel à temps court 74 fournissant à 35 nouveau un coefficient prédictionnel. On suppose maintenant que la fonction de transfert convertie en Z du dispositif prédictionnel à temps court 74 est comme suit: N P(z) =i a Z-1 li= ou a. i 1 i Dans ce qui précède, N est le nombre de prises, ai est un coefficient prédictionnel d'une prise de rang n, i est un coefficient prédictionnel obtenu par 10 décodage du résultat de l'analyse LPC, et P est une constante fixe représentant la valeur pondérée et à une valeur dans l'intervalle 0 < P< 1. Le coefficient prédictionnel ai est utilisé pour un filtre de mise en forme du bruit 87 ainsi que pour un dispositif prédictionnel à temps court (spectre) pour un décodage local. Le signal de sortie prédictionnel du dispositif prédictionnel à temps court 74 qui utilise le coefficient prédictionnel ai(o i = 1 à N) est soustrait, par un soustracteur 75, du signal d'entrée de manière à obtenir 20 un signal résiduel de spectre à temps court. Le signal résiduel n'a, dans ce cas, aucune corrélation dans un temps court autre que la période de pas. Sur la base de ce signal, un codeur de paramètre de pas 77, relié par l'intermédiaire d'un analyseur de pas 76 au soustracteur 25 75 mentionné plus haut, permet d'obtenir une corrélation entre le signal vocal et une période de pas Np, en calculant un coefficient prédictionnel pour un dispositif prédictionnel à temps long (spectre) 79. Ce dispositif prédictionnel à temps long (spectre)79 calcule une valeur prédictionnelle en utilisant la période de pas, le coefficient prédictionnel et le signal de sortie du soustracteur 75, en utilisant le fait que le signal vocal estrépété selon sensiblement la même forme d'onde correspondant à la période de pas. En soustrayant une 35 valeur prédictionnelle de temps court et une valeur :;: f :: : v: :; : V: : f : - 5 :' : f. À::., :::: A: i:
0,:: 0:: X 10
: u , : : D: Of; g :::: f::0 A: D:: t V- 15 : : 0 0 0 f -a:: : .
- ^^LX: A.::: |
::: f T 0 20 \ , , , . f - R D f : f
;0;00 25
-: 0-: 0
d'': :: f : :: V - X: :: X 35 0: :- f: : L:::::;: Du:
prédictionnelle de temps long ci-dessus, du signal d'entrée, le signal résiduel au niveau du bruit de sortie d'un soustracteur 80 peut être "blanchi' de manière sensiblement idéale. La période de pas et le coefficient prédictionnel codé par le codeur de paramètre de pas 77 sont transmis par l'intermédiaire du multiplexeur 98 vers le côté de la réception.
A partir du signal ainsi "blanchi" de sortie du soustracteur 80, le signal de sortie du filtre de mise en forme de bruit 87 est soustrait à l'aide d'un soustracteur 88 dont la sortie est quantifiée pour donner le signal résiduel final et codé au moyen d'un quantificateur adapté 84. Le quantificateur adapté 84 présente, comme dimension d'opération de base, une dimension d'opération de quantification qui fournit une valeur optimale, c'est-à-dire qui diminue le produit de quantification lorsque la variance du signal final est un. En conséquence, lorsque la variance du signal résiduel final n'est pas un, la caractéristique de quantification sera détériorée. C'est un calculateur quadratique de valeur efficace 81 qui compense cette détérioration. En multipliant la dimension de l'opération de base par la valeur efficace calculée dans le calculateur quadratique de valeur efficace 81, on peut obtenir une opération de quantification optimale vis-à-vis de la valeur efficace du signal, et on peut également contrôler le signal résiduel final en se référant à la valeur efficace du signal pour que la variance devienne un. Il est souhaitable, pour augmenter la qualité du signal, de préparer plusieurs types de dimensions d'opérations de base, en tenant compte de la nature de la distribution d'amplitude du signal résiduel final tel que par une distribution de type gausienne ou laplacienne. Cependant, le signal résiduel final à la sortie du soustracteur 88 ne présente pas de distribution idéale car il est produit en soustrayant du signal "blanchi" le signal de sortie du filtre de mise en forme de bruit 87 qui présente une certaine caractéristique de coupure de fréquence. Une
série d'opérations de traitement décrites ci-dessous est 5 ainsi nécessaire pour obtenir une dimension d'opération de quantification optimale.
On suppose maintenant que la dimension de l'opération de quantification est remise à jour pour
chaque sous-trame.
La valeur efficace du signal résiduel est obtenue par le calculateur quadratique de valeur efficace 81 pour chaque sous-trame, et elle est, en outre, appliquée à un codeur de valeur efficace 82et à un indicateur de valeur efficace 83 permettant d'obtenir une 15 valeur efficace quantifiée. Le niveau de sortie du codeur de valeur efficace 82 est, à ce moment, considéré comme étant un niveau de référence et il est emmagasiné dans le codeur 82 en même temps que les niveaux adjacents. On détermine, tout d'abord, la dimension de l'opération du 20 dispositif de quantification adapté 84 en utilisant, en tant que valeur efficace de référence, une valeur efficace quantifiée correspondant au niveau de référence. La sortie du filtre de mise en forme de bruit 87 est ensuite soustraite du signal résiduel à l'aide du soustracteur 88, et le signal de soustraction sortant du soustracteur 88 est quantifié pour donner le signal résiduel final et il est codé. En outre, le signal codé est amené à un dispositif de déquantification adapté 85 pour obtenir un signal résiduel final quantifié à partir duquel le 30 signal résiduel final non quantifié est soustrait à l'aide d'un soustracteur 86 pour obtenir un bruit quantifié. Le bruit quantifié ainsi obtenu est appliqué au filtre de mise en forme de bruit 87. En même temps, le signal résiduel final quantifié est amené à un addition35 neur 90 dans lequel il est ajouté au signal de sortie d'un dispositif prédictionnel à temps long (spectre) 89 en vue d'un décodage local. Le signal de sortie ajouté est en outre additionné, à l'aide d'un additionneur 91, au signal de sortie provenant du dispositif prédictionnel 5 à temps court (spectre) 93 en vue d'un décodage local. Un sigpal d'entrée décodé localement Sj est ainsi appliqué à une borne de signal décodé localement 92. La différence entre le signal d'entrée décodé localement et le signal d'entrée est obtenu sous la forme d'un signal d'erreur à 10 l'aide d'un soustracteur 97. La puissance du signal d'erreur est calculée dans un détecteur de puissance d'erreur minimum 96 sur la sous-trame. Pour chacune des dimensions de l'ensemble des dimensions d'opérations de base, on a préparé une série d'opérations semblables à 15 celles décrites ci-dessus, la puissance du signal d'erreur correspondant à chacune d'entre elles étant calculée par le détecteur de puissance d'erreur minimale 86 et stockée dans ce détecteur. On obtient, en outre, des dimensions d'opération respectives pour l'ensemble 20 d'un nombre déterminé h l'avance de niveaux efficaces à proximité du niveau efficace de référence, et ceux-ci sont amenés dans le dispositif de quantification adapté 84. Comme cela est le cas avec la dimension de l'opération de base, on effectue les opérations de traitement 25 mentionnées ci-dessus, grâce auxquelles on calcule et on stocke la puissance du signal d'erreur pour chaque niveau efficace. Celle parmi les combinaisons d'une valeur de référence déterminée à l'avance des valeurs efficaces voisines et des dimensions d'opération de base préparées 30 qui assurent le minimum de puissance du signal d'erreur obtenu en correspondance avec toutes les combinaisons mentionnées plus haut, est considérée comme représentant des paramètres de quantification optimum qui sont codés par un codeur de dimension d'opération 94 et ensuite transmis par l'intermédiaire du multiplexeur 98 vers le c8té de réception. Pour la dimension de l'opération de base, un mot de codage correspondant est produit par le codeur de dimension d'opération 94 et, par l'intermédiaire du multiplexeur 98, il est transmis vers le côté de la réception. On décrit maintenant le fonctionnement du côté de la réception en se référant à la figure 4B. Le signe reçu par l'intermédiaire de la borne d'entrée 100 d'un décodeur est séparé par un démultiplexeur 101 pour donner 10 un signal relatif au signal résiduel final, un signal relatif à la valeur moyenne, un signal relatif à la dimension de l'opération de base et un signal relatif au paramètre de pas. La valeur moyenne est décodée par un décodeur de valeur moyenne 103. Cette valeur ainsi que la 15 dimension de l'opération de base obtenue par un décodeur de dimension d'opération 102 sont amendes à un dispositif de déquantification 104. Sur cette base, le signal Ij relatif au signal résiduel final reçu est décodé par le dispositif de déquantification 104 pour obtenir un signal 20 résiduel final quantifiéEj. Par ailleurs, le coefficient prédictionnel obtenu par l'intermédiaire d'un décodeur de paramètre LPC 107 est amené à un dispositif prédictionnel à temps court 110. Le signal relatif au paramètre de pas est appliqué à un décodeur de paramètre de pas 106 permettant d'obtenir la période du pas et le coefficient prédictionnel, et ces valeurs sont amenées à un dispositif prédictionnel à temps long 108. Le signal de sortie du dispositif prédictionnel à temps long 108 est ajouté, à l'aide d'un additionneur 105 au signal de sortie du 30 dispositif de déquantification 104, et ce signal est appliqué au dispositif prédictionnel à temps long 108. Le signal de sortie de l'additionneur 105 est ajouté au signal de sortie prédictionnel provenant du dispositif prédictionnel à temps court 110 au moyen d'un 35
15 20
30
additionneur 109, en fournissant ainsi un signal de bande vocale décodé Sj.
Il y a lieu de noter que le signal résiduel
final Ej ou le signal de sortie de l'additionneur 105 est appliqué à une borne 54 en tant que signal de formation haute fréquence. Le signal de sortie du décodeur du paramètre de pas 106 est appliqué à une borne 57.
La disposition de base du signal vocal basse fréquence de la forme de réalisation de la fig. 3 utilisant le système de type APC décrit cidessus pour la transmission du signal vocal basse fréquence est d'un type illustré à la fig. 5. On ne décrit ainsi que le cas o l'on utilise des dispositifs prédictionnels à temps court. La référence 100 indique un dispositif prédictionnel à temps court du côté de la transmission et la référence 101 est un dispositif prédictionnel à temps court du c8té de la réception. Dans ce cas, si l'on représente la fonction de transfert du dispositif prédictionnel 101, la fonction de transfert du filtre de mise en forme du bruit 87 dans le codeur de forme d'onde 83, le signal vocal basse fréquence et le bruit quantifié, respectivement par P(z), F(z), S(z) et N(z), le signal vocal basse fréquence reproduit R(z) peut s'exprimer comme suit: Cl - F(z)) N(z) + S(z)............. (2) R(z) = 1 - P(z)
Dans la relation 2, à condition que F(z) = P/z/') et en rendant la valeur de S'inférieure à un, l'influence du bruit de quantification peut être fortement diminuée par rapport au cas de la relation 1 mentionné plus haut.
Dans une simulation réelle, on pourrait obtenir un signal vocal reproduit de bonne qualité bien qu'une quantification à un bit ait été effectuée par le dispositif de quantification adapté 84.
La capacité de transmission du signal basse fréquence par la quantification à un bit apportera les
avantages suivants au système de type RELP.
Dans un système de transmission de 4,8 kb/s, la 5 bande du signal vocal basse fréquence est de 1 kHz et est échantillonnée à une cadence de 2 kHz, des bits de transmission de 2kb/s sont attribués pour la transmission du signal, alors que des bits de transmission de 2,8 kb/s sont attribués pour la transmission des autres informa10 tions, ce qui permet une très bonne qualité de la transmission du signal vocal. La cadence de transmission de
4,8 kb/s sera la limite inférieure pour obtenir une qualité élevé pour la transmission du signal vocal.
Dans un système de transmission à 7,2 ou 9,6 15 kb/s, on peut agrandir la bande du signal vocal basse fréquence. Par exemple, dans le système de transmission à 7,2 kb/s, si des bits de transmission de 4 kb/s sont attribués à la transmission du signal vocal basse fréquence et que des bits de transmission de 3,2 kb/s sont 20 attribués à la transmission des autres informations, la bande du signal vocal basse fréquence peut être étendue à 2 kHz. Ceci signifie que la bande du signal vocal haute fréquence à reproduire du côté de la réception est
réduite à 2 kHz et, en conséquence, la qualité du signal 25 vocal à reproduire peut être améliorée de manière significative.
Dans le système de transmission à 9,6 kb/s, des bits de transmission d'environ 7 kb/s sont attribués à la transmission du signal vocal basse fréquence, la bande du 30 signal vocal basse fréquence est dans ce cas de 3,5 kHz, et la bande du signal vocal haute fréquence à reproduire du côté de la réception est inférieure à 1 kHz. En conséquence, même si les moyens de reproduction du signal vocal haute fréquence ne présentent pas un rendement très 35 élevé, on peut toutefois obtenir un signal vocal d'une
extrêmement bonne qualité.
Pour les raisons données plus haut, les fréquences de coupure du filtre passe-bas 40 et du filtre passe-haut 41 sont déterminées en relation à la cadence de codage. On décrit maintenant en détail les moyens de formation d'ondes d'harmoniques supérieures. Dans cette réalisation, on peut utiliser les moyens de formation d'ondes d'harmoniques supérieures de type habituel comme décrit précédemment, mais on présente ci-après des moyens
appropriés pour encore augmenter la qualité du signal.
La figure 6 illustre un exemple de la disposition pour obtenir une telle amélioration de la qualité du 15 signal, et les figures 7A à 7D montrent des formes d'ondes se produisant au niveau de certaines parties de la disposition. Dans l'exemple représenté, le signal d'entrée est un signal vocal basse fréquence échantillonné à 2 kHz comme illustré à la figure 7A. Le disposi20 tif de maintien de spectre 103 effectue une interpolation des valeurs d'échantillonnage nulles entre des échantillons du signal représenté à la figure 7A, en obtenant un signal échantillonné à 8 kHz comme illustré à la figure 7B. Considéré sur l'axe des fréquences, ce signal pré25 sente une bande de signal vocal basse fréquence qui est
plié de manière répétée, ce qui provoque du bruit tonal.
Pour empêcher cela, l'exemple conforme à la présente invention ajoute, par l'intermédiaire d'un additionneur 108, la forme d'onde de la figure 7B avec un "pseudo bruit" qui est produit par un générateur de bruit 105. Il est également possible de remplacer les valeurs d'échantillonnage nulles par des pseudo bruits en utilisant divers autres moyens. Etant donné que le niveau du pseudo bruit doit être proportionnel au niveau du signal 35 d'entrée, le niveau du bruit est commandé par un calculateur de puissance 104. A la figure 7C, le signal d'entrée est indiqué en traits pleins et le pseudo bruit ajouté est indiqué en traits interrompus. Un écrèteur de centrage 106 écrète le centre du signal de la figure 7C et l'amène à un niveau Lt indiqué par des lignes en traits mixtes. La raison de cela est que des échantillons de faible valeur provoquent de manière utile des bruits
haute fréquence.
Le niveau d'écrètage Lt est également mis sous 10 le contrôle du calculateur de puissance 105 car il a besoin de varier de manière adaptée avec le niveau du signal d'entrée. A la suite d'une telle opération, le signal d'ondes d'harmoniques supérieures disponible à la sortie de l'écrèteur de centrage 106 est comme illustré 15 la figure 7D. Ce signal est un signal qui retient la structure de l'onde harmonique mais ne possède pas le bruit tonal particulier à la technique de maintien de spectre, et ce signal a un spectre plat. Un filtre passe bande 107 est employé pour extraire une bande requise. 20 Le signal d'onde d'harmonique supérieure ainsi obtenu est synthétisé pour donner une source de signal vocal d'entraînement haute fréquence en utilisant l'information de pas et l'information de spectre, comme indiqué précédemment, et son spectre est en outre mis en 25 forme, de sorte que l'on peut former un signal vocal
haute fréquence de bonne qualité.
Les figures 8 à 10 illustrent respectivement, à titre d'exemple, les dispositions du filtre de synthèse haute fréquence 56, du filtre de synthèse haute fréquence 30 à temps court 46 et du filtre de mise en forme de spectre haute fréquence 59, qui sont utilisés dans la forme de réalisation de la figure 3. Il y a lieu de noter à ce sujet que les dispositifs prédictionnels 115 et 117 de la figure 10 utilisent les coefficients des dispositifs 35
prédictionnels 111 à 113 correspondants des figures 8 et 9, ou encore leur valeur pondérée de manière appropriée.
On a indiqué plus haut que la forme de réalisation illustrée h la figure 3 permet la reproduction d'un signal vocal plus conforme au signal vocal d'origine. Toutefois, le sens auditif humain (l'oreille) n'évalue pas la qualité d'un signal vocal uniquement en terme de
fidélité de sa forme d'onde. Parfois, la valeur d'évaluation subjective du signal vocal est diminuée du fait 10 de la propriété du bruit qui y est inclus.
Il est proposé ci-après des moyens efficaces pour améliorer la valeur d'évaluation subjective en altérant, d'une certaine manière, la fidélité de la forme d'onde. Ces moyens sont efficaces pour tous les systèmes 15 de transmission de signaux vocaux tels que le système connu de type RELP, ainsi que le système connu de type
APC, etc, quelque soit la forme de réalisation représentée à la fig. 3.
Dans le cas du codage de forme d'onde comme dans 20 le système de type APC, le bruit inclus dans le signal vocal reproduit est le bruit de quantification N(z) qui présente un spectre relativement plat en fonction de la fréquence. Dans le cas de la reproduction d'ondes d'harmoniques supérieures, comme dans le système de type RELP, 25 le bruit présente un spectre entièrement différent de celui du signal vocal. Une telle différence dans la nature du spectre entre le signal vocal et le bruit
affecte sérieusement la valeur d'évaluation subjective.
En vue de ce qui précède, la présente invention insiste 30 sur la nature du signal vocal et donne au bruit une nature semblable à celle du signal vocal en fournissant
ainsi une meilleure évaluation à l'oreille (sens auditif).
La figure 11 illustre un exemple d'une disposi35 tion pour obtenir ce qui précède, et cette disposition comprend un filtre de mise en forme de postbruits 118 et un dispositif de réglage de niveau 119. Dans la forme de réalisation de la figure 1, ces éléments sont reliés entre le filtre de synthèse 29 et le convertisseur N/A 30, pour le traitement du signal vocal. Le filtre de mise en forme de postbruits 118 est de réalisation identique au filtre de synthèse 29 et utilise, en tant que coefficient, une valeur pondérée du coefficient du filtre de
synthèse 29.
Dans la forme de réalisation représentée à la figure 3, le filtre de mise en forme de postbruits 118 et le dispositif de réglage de niveau 119 sont reliées à la sortie du décodeur de forme d'onde 51. Le filtre de mise en forme de postbruits 118 se compose d'un filtre de synthèse de pas 120 et d'un filtre de synthèse de spectre à temps court 123, comme on le voit à la figure 12. Un dispositif prédictionnel à temps long 122 et un dispositif prédictionnel à temps court 125 prévus dans ces filtres sont de réalisation identique au dispositif 20 prédictionnel à temps long 108 et au dispositif prédictionnel à temps court 110 dont il a été question précédemment en liaison avec la figure 4B, et leur coefficient sont des valeurs pondérées des coefficients
de ces derniers.
On suppose que les fonctions de transfert des dispositifs prédictionnels à temps long et à temps court 122 et respectivement 125 peuvent être représentées dans la région de conversion en Z respectivement par PPNL(z) et PPNS(z), celles-ci peuvent alors s'exprimer comme 30 suit: -NP
PPNL(Z) = L.C.Z-NP
N.(3)
N.......... (3)
PPNS(Z) = i i' -1S i=1 i3' S*'35 O L et S sont des coefficients utilisables pour une mise en forme, C est le coefficient du dispositif prédictionnel à temps long 122, Np est le nombre de prises (correspondant à la période des pas) du dispositif prédictionnel à temps long 122, Ai est le coefficient de la prise de rang i du dispositif prédictionnel h temps court 125, et N est le nombre de prises du dispositif prédictionnel à temps court 125. Dans les relations 3, si les coefficients ' L et S sont chacun réglés à l'unité, alors les fonctions de transfert des dispositifs prédictionnels à temps long et à temps court 73 et, respectivement, 74 de la figure 4 deviendront égaux l'un à l'autre. En conséquence, bien que cela ne soit pas représenté à la figure 12, les coefficients des disposi15 tifs prédictionnels 122 et 125 sont fournis à partir des dispositifs prédictionnels 108 et 110 du décodeur de forme d'onde 51, et leurs coefficients sont utilisés après avoir été pondérés par L et S' Les valeurs de <Let S sont choisies h l'intérieur des intervalles 0< 20 'L et K 1 sur la base de l'évaluation subjective. De manière expérimentale, on a obtenu de bons résultats pour
les valeurs de l'intervalle comprises entre 0,4 et 0,2.
Du fait du fonctionnement d'un tel filtre de mise en forme de postbruits 118 présentant le signal d'entrée 25 illustré à la figure 13A, la caractéristique du signal vocal est encore améliorée, tandis que l'on donne au bruit représenté à la figure 13A une caractéristique analogue à celle du signal vocal, comme cela est illustré
à la figure 13B.
Le dispositif de réglage de niveau 119 de la figure 11 est prévu pour régler, à une valeur égale, la puissance d'entrée et la puissance du signal du filtre de mise en forme de postbruits 118 car le niveau du signal y varie. Comme cela est décrit ci-dessus en détail, conformément à la présente invention, le signal vocal basse fréquence est transmis en tant que forme d'onde correcte par l'utilisation du système de type APC, et le signal vocal haute fréquence est transmis en tant que coefficient prédictionnel d'un spectre à temps court. Du c8té de la réception, le signal vocal basse fréquence correcte est décodé et l'enveloppe du spectre ainsi que la structure du pas sont reconstitués pour les ondes d'harmoniques supérieures reproduites, à la suite de quoi on peut produire un signal vocal haute fréquence de très bonne qualité et la qualité du signal vocal peut être fortement améliorée. Plus particulièrement, l'applicabilité du système de type APC de quantification à un bit 15 pour la transmission du signal vocal basse fréquence permet d'obtenir une transmission de signal vocal de bonne qualité dans le cas d'une cadence de codage de 4,8 kb/s ainsi que la réduction de la bande du signal vocal haute fréquence dans le cas d'une cadence de codage de 7,2 à 9,6 kb/s, ce qui assure une qualité accrue pour le
signal vocal.
En outre, la présente invention donne des moyens pour former une onde d'harmoniques supérieures de bonne
qualité ainsi que des moyens pour augmenter la valeur 25 d'évaluation subjective d'un signal vocal.

Claims (3)

REVENDICATIONS
1. Système de transmission d'un signal vocal, caractérisé en ce qu'un signal vocal d'entrée est divisé en un signal vocal basse fréquence et un signal vocal 5 haute fréquence, un signal résiduel prédictionnel du signal vocal basse fréquence est transmis après avoir été codé dans un codeur de forme d'onde afin de diminuer autant que possible la détérioration de la qualité de ce signal, et des renseignements indicatifs d'un spectre 10 haute fréquence à temps court du signal vocal haute fréquence sont extraits de ce dernier et transmis après codage.
2. Système de transmission d'un signal vocal selon la revendication 1, caractérisé en ce que le codeur 15 de forme d'onde comprend un dispositif de quantification adapté permettant d'obtenir un signal vocal basse fréquence codé à transmettre, un dispositif prédictionnel à temps court permettant d'obtenir une valeur prédictionnelle à temps court h partir du signal vocal basse 20 fréquence, un dispositif prédictionnel à temps long permettant d'obtenir une valeur prédictionnelle à temps long à partir du signal vocal basse fréquence, de premiers moyens soustractifs permettant de soustraire la valeur prédictionnelle de temps court et la valeur prédictionnelle de temps long du système vocal basse fréquence afin d'obtenir un signe résiduel, un dispositif de déquantification permettant de déquantifier le signal vocal basse fréquence codé afin d'obtenir un signal résiduel final quantifié, de seconds moyens soustractifs 30 permettant de soustraire le signal résiduel final quantifié d'un signal d'entrée du dispositif de quantification adapté afin d'obtenir un bruit quantifié, un filtre de mise en forme de bruit permettant d'obtenir un bruit mis en forme, et un troisième moyen soustractif permettant de soustraire le bruit mis en forme du signal résiduel afin d'obtenir un signal résiduel final devant être utilisé en tant que signal d'entrée du dispositif de quantification adapté.
3. Système de transmission d'un signal vocal selon la revendication 1, caractérisé en ce que les informations indicatives du signal vocal haute fréquence sont des informations de coefficient et des informations de rapport de puissance, ces informations de coefficient étant obtenues à partir du signal vocal haute fréquence 10 par un analyseur de spectre à temps court et codé par un codeur de coefficient de type LPC, les informations de rapport de puissance étant obtenues par comparaison, dans un comparateur, du signal vocal haute fréquence avec le
signal vocal basse fréquence et étant codées par l'inter15 médiaire d'un codeur.
FR8704637A 1986-04-04 1987-04-02 Systeme de transmission d'un signal vocal Expired - Fee Related FR2596936B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61076788A JPS62234435A (ja) 1986-04-04 1986-04-04 符号化音声の復号化方式

Publications (2)

Publication Number Publication Date
FR2596936A1 true FR2596936A1 (fr) 1987-10-09
FR2596936B1 FR2596936B1 (fr) 1993-12-24

Family

ID=13615354

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8704637A Expired - Fee Related FR2596936B1 (fr) 1986-04-04 1987-04-02 Systeme de transmission d'un signal vocal

Country Status (5)

Country Link
US (1) US4757517A (fr)
JP (1) JPS62234435A (fr)
DE (1) DE3710664A1 (fr)
FR (1) FR2596936B1 (fr)
GB (1) GB2188820B (fr)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4933883A (en) * 1985-12-04 1990-06-12 International Business Machines Corporation Probability adaptation for arithmetic coders
EP0280827B1 (fr) * 1987-03-05 1993-01-27 International Business Machines Corporation Procédé de détermination de la fréquence fondamentale et codeur de la parole utilisant ledit procédé
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
GB2229342A (en) * 1989-03-15 1990-09-19 Marconi Gec Ltd Data reduction of digitised speech signals
EP0401452B1 (fr) * 1989-06-07 1994-03-23 International Business Machines Corporation Codeur de la parole à faible débit et à faible retard
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
DE4203436A1 (de) * 1991-02-06 1992-08-13 Koenig Florian Datenreduzierte sprachkommunikation
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5802109A (en) * 1996-03-28 1998-09-01 Nec Corporation Speech encoding communication system
DE19643900C1 (de) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Nachfiltern von Hörsignalen, speziell von Sprachsignalen
FR2761848B1 (fr) * 1997-04-04 2004-09-17 Parrot Sa Dispositif de commande vocale pour radiotelephone, notamment pour utilisation dans un vehicule automobile
EP1168734A1 (fr) * 2000-06-26 2002-01-02 BRITISH TELECOMMUNICATIONS public limited company Procédé pour réduir la distorsion d'une transmission de voix par un réseau de données
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
WO2004097796A1 (fr) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. Dispositif et procede de codage audio et dispositif et procede de decodage audio
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
EP1513137A1 (fr) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Système de traitement de la parole à excitation à impulsions multiples
US7949518B2 (en) * 2004-04-28 2011-05-24 Panasonic Corporation Hierarchy encoding apparatus and hierarchy encoding method
WO2005112001A1 (fr) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. Dispositif de codage, dispositif de décodage et méthode pour cela
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
JP4551817B2 (ja) * 2005-05-20 2010-09-29 Okiセミコンダクタ株式会社 ノイズレベル推定方法及びその装置
JP4556866B2 (ja) * 2005-12-27 2010-10-06 日本ビクター株式会社 高能率符号化プログラム及び高能率符号化装置
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
EP2830061A1 (fr) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil et procédé permettant de coder et de décoder un signal audio codé au moyen de mise en forme de bruit/ patch temporel
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
CN112885363A (zh) * 2019-11-29 2021-06-01 北京三星通信技术研究有限公司 语音发送方法和装置以及语音接收方法和装置、电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0002998A1 (fr) * 1977-12-23 1979-07-11 International Business Machines Corporation Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé
GB2113055A (en) * 1981-12-15 1983-07-27 Kokusai Denshin Denwa Co Ltd A voice encoding and decoding device
GB2150377A (en) * 1983-11-28 1985-06-26 Kokusai Denshin Denwa Co Ltd Speech coding system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3914554A (en) * 1973-05-18 1975-10-21 Bell Telephone Labor Inc Communication system employing spectrum folding
US4048443A (en) * 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
JPS594718B2 (ja) * 1981-05-06 1984-01-31 日本電信電話株式会社 音声符号化方式
US4498173A (en) * 1982-06-17 1985-02-05 At&T Bell Laboratories Technique for digital split-channel transmission using interpolative coders and decoders
DE3235804A1 (de) * 1982-09-28 1984-03-29 Robert Bosch Gmbh, 7000 Stuttgart Verfahren und schaltungsanordnung zur bandbreitenreduzierten sprachuebertragung
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0002998A1 (fr) * 1977-12-23 1979-07-11 International Business Machines Corporation Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé
GB2113055A (en) * 1981-12-15 1983-07-27 Kokusai Denshin Denwa Co Ltd A voice encoding and decoding device
GB2150377A (en) * 1983-11-28 1985-06-26 Kokusai Denshin Denwa Co Ltd Speech coding system

Also Published As

Publication number Publication date
FR2596936B1 (fr) 1993-12-24
DE3710664A1 (de) 1987-10-15
GB2188820B (en) 1989-11-29
GB2188820A (en) 1987-10-07
US4757517A (en) 1988-07-12
GB8707741D0 (en) 1987-05-07
JPS62234435A (ja) 1987-10-14
DE3710664C2 (fr) 1988-09-15

Similar Documents

Publication Publication Date Title
FR2596936A1 (fr) Systeme de transmission d&#39;un signal vocal
EP2002428B1 (fr) Procede de discrimination et d&#39;attenuation fiabilisees des echos d&#39;un signal numerique dans un decodeur et dispositif correspondant
EP1905010B1 (fr) Codage/décodage audio hiérarchique
EP2374126B1 (fr) Régénération d&#39;un signal vocal à large bande
FR2639459A1 (fr) Procede de traitement du signal et appareil de formation de donnees issues d&#39;une source sonore
EP1125283B1 (fr) Procede de quantification des parametres d&#39;un codeur de parole
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
EP1875465A1 (fr) Procede d&#39;adaptation pour une interoperabilite entre modeles de correlation a cout terme de signaux numeriques
EP1429316B1 (fr) Procédé et système de correction multi-références des déformations spectrales de la voix introduites par un réseau de communication
EP1275109B2 (fr) Méthode et dispositif d&#39;enrichissement spectral
EP0989544A1 (fr) Dispositif et procédé de filtrage d&#39;un signal de parole, récepteur et système de communications téléphonique
EP2171713B1 (fr) Codage de signaux audionumériques
EP1383109A1 (fr) Procédé et dispositif d&#39;encodage de la parole à bande élargie
EP1192619B1 (fr) Codage et decodage audio par interpolation
EP1192621B1 (fr) Codage audio avec composants harmoniques
EP1192618B1 (fr) Codage audio avec liftrage adaptif
WO2001003121A1 (fr) Codage et decodage audio avec composants harmoniques et phase minimale
FR2741744A1 (fr) Procede et dispositif d&#39;evaluation de l&#39;energie du signal de parole par sous bande pour vocodeur bas debits
EP1383111A2 (fr) Procédé et dispositif d&#39;encodage de la parole à bande élargie
WO2001003116A1 (fr) Procedes et dispositifs d&#39;analyse et de synthese audio
EP1192620A1 (fr) Codage et decodage audio incluant des composantes non harmoniques du signal
FR2773653A1 (fr) Dispositifs de codage/decodage de donnees, et supports d&#39;enregistrement memorisant un programme de codage/decodage de donnees au moyen d&#39;un filtre de ponderation frequentielle
EP1383112A2 (fr) Procédé et dispositif d&#39;encodage de la parole à bande élargie, permettant en particulier une amélioration de la qualité des trames de parole voisée
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes
FR2980620A1 (fr) Traitement d&#39;amelioration de la qualite des signaux audiofrequences decodes

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20051230