FR2653557A1 - Appareil et procede pour le traitement de la parole. - Google Patents

Appareil et procede pour le traitement de la parole. Download PDF

Info

Publication number
FR2653557A1
FR2653557A1 FR9012962A FR9012962A FR2653557A1 FR 2653557 A1 FR2653557 A1 FR 2653557A1 FR 9012962 A FR9012962 A FR 9012962A FR 9012962 A FR9012962 A FR 9012962A FR 2653557 A1 FR2653557 A1 FR 2653557A1
Authority
FR
France
Prior art keywords
speech
compressibility
transfer function
frequency
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9012962A
Other languages
English (en)
Other versions
FR2653557B1 (fr
Inventor
Tamura Junichi
Sakurai Atsushi
Kosaka Tetsuo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of FR2653557A1 publication Critical patent/FR2653557A1/fr
Application granted granted Critical
Publication of FR2653557B1 publication Critical patent/FR2653557B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention concerne un appareil et un procédé de traitement de la parole. L'appareil comporte un analyseur destiné à analyser une parole d'entrée, un circuit de compression destiné à comprimer une information de parole obtenue par analyse de la parole conformément à une fonction de transfert non linéaire, un circuit destiné à faire correspondre une compressibilité, en tant que coefficient de fonction de transfert du circuit de compression, à chacun des phonèmes ou à chacune des trames constituant la parole, et une mémoire destinée à stocker l'information de parole. Domaine d'application: synthétisation de la parole.

Description

L'invention concerne un procédé et un appareil pour le traitement de la
parole, et plus particulièrement un procédé et un appareil pour le traitement de la parole
qui peuvent synthétiser une parole par une parole synthé-
tisée de haute qualité et qui peuvent synthétiser une
parole en changeant la qualité de la voix.
La figure 2 des dessins annexés décrits ci-
après montre une construction de base d'un appareil de synthétisation de la parole. En général, un modèle de production de la parole comporte: une section à source de sons qui est constituée d'un générateur 2 d'impulsions et d'un générateur 3 de bruit; et un filtre 4 de synthèse qui exprime les caractéristiques de résonance d'un trajet vocal représentatives d'une particularité d'un phonème. Une mémoire 1 de paramètres de synthèse destinée à envoyer des paramètres à la section à source de sons et au filtre de synthèse est réalisée comme montré sur la figure 3. Une parole est analysée sur la base d'une longueur de fenêtre d'analyse d'environ quelques millisecondes à des dixièmes de millisecondes. Le résultat de l'analyse obtenue pour un intervalle de temps allant du commencement de l'analyse d'une certaine fenêtre d'analyse jusqu'au commencement de l'analyse de la fenêtre d'analyse suivante est stocké dans la mémoire 1 de paramètres d'analyse en tant que données d'une trame. Les paramètres de synthèse comprennent: des paramètres de la source de sons représentatifs de la hauteur d'un son et d'un état voisé/non voisé; et des coefficients du filtre de synthèse. A la suite de la synthèse, les paramètres de synthèse ci-dessus portant sur une trame sont délivrés en sortie à un intervalle de temps arbitraire (habituellement à un intervalle de temps prédéterminé; un intervalle de temps arbitraire lorsque l'intervalle entre les fenêtres d'analyse est modifié), afin que l'on obtienne une parole synthétisée. Des procédés d'analyse de parole tels que les procédés "PARCOR", "LPC", "LSP", par formantes, par cepstre et autres sont connus de
façon classique.
Parmi les procédés d'analyse/synthèse ci-
dessus, on considère à présent que le procédé LSP et le procédé par cepstre ont les qualités de synthèse les meilleures. Conformément au procédé LSP, bien que la relation de correspondance entre l'enveloppe spectrale et le paramètre d'articulation soit bonne, les paramètres sont basés sur le modèle de pôles entiers d'une manière similaire à ceux utilisés dans le procédé PARCOR. Par conséquent, si le procédé LSP est utilisé pour une synthèse de règle ou analogue, on considère qu'un léger problème apparaît. Par ailleurs, dans le procédé par cepstre, un cepstre, qui est défini par les coefficients de Fourier d'un spectre logarithmique, est utilisé pour un coefficient de filtre de synthèse. Conformément à la méthode par cepstre, si l'on obtient un cepstre en utilisant une information d'enveloppe d'un spectre logarithmique, la qualité de la parole synthétisée est très élevée. De plus, à la différence d'un procédé par prédiction linéaire, étant donné que le procédé par cepstre est du type à zéro pôle dans lequel les ordres du dénominateur et du numérateur
d'une fonction de transfert sont les mêmes, les caractéris-
tiques d'interpolation sont bonnes et un tel cepstre peut également convenir en tant que paramètre de synthèse d'un
synthétiseur de règle.
Cependant, dans le cepstre ordinaire, il est nécessaire d'établir l'ordre d'analyse à un ordre élevé
pour délivrer une parole synthétisée de haute qualité.
Cependant, si l'ordre d'analyse est relevé, la capacité de la mémoire de paramètre augmente, de sorte que ceci n'est pas avantageux. Par conséquent, si les paramètres à une fréquence élevée sont atténués conformément à la résolution de la fréquence du sens auditif d'un être humain (la résolution est haute à une fréquence basse et basse à une fréquence élevée) et si les paramètres extraits sont utilisés, la mémoire peut être utilisée efficacement. Le processus d'atténuation des paramètres conformément & la résolution de fréquence du sens auditif de l'être humain est exécuté par une conversion de fréquence dans le cepstre ordinaire par l'utilisation d'une échelle de mel. Le coefficient de cepstre de mel obtenu par conversion de fréquence du coefficient de cepstre en utilisant l'échelle de mel est défini par le coefficient de Fourier du spectre
logarithmique dans une mémoire de fréquences non linéaires.
L'échelle de mel est une échelle de fréquences non linéaires représentative de la résolution de fréquence du sens auditif de l'être humain qui a été estimée par Stevens. En général, l'échelle qui était approximativement exprimée par les caractéristiques de phase d'un filtre
passe-tout est utilisée.
Une fonction de transfert du filtre passe-tout est exprimée par Z1 =(Z1-a) / (l- az-1) I ai < 1...(1) et ses caractéristiques de phase sont comme suit: n = nf + 2tg({a.sinn/(l - a.cosn)}... (2)
rv -
z = eJs2, z = ein f = 2rfT, n = 2rfT o a, f et T désignent une fréquence angulaire normalisée,
une fréquence et une période d'échantillonnage, respective-
ment. Lorsque la fréquence d'échantillonnage est établie à kHz, il est possible d'obtenir par conversion la fréquence qui est sensiblement proche de l'échelle de mel
en établissant a = 0,35.
La figure 4 montre un organigramme pour l'extraction d'un paramètre de cepstre de mel. La figure 5 montre un état dans lequel le spectre a été soumis à une conversion par utilisation de l'échelle mel. La figure 5A montre un spectre logarithmique après achèvement de la transformation de Fourier. La figure 5B montre une enveloppe spectrale qui passe par les crêtes d'un spectre lissé et d'un spectre logarithmique. La figure 5C est un diagramme montrant le cas o l'enveloppe spectrale de la figure 5B a été convertie en fréquence non linéaire par utilisation de l'équation (1) dans laquelle a = 0,35 et la résolution de fréquences d'un son bas a été relevée. Etant donné que l'échelle n sur chacune des figures 5B et 5C a été établie à des intervalles réguliers, la courbe de l'enveloppe spectrale est élargie à une basse fréquence et est comprimée à une haute fréquence. Jusqu'à présent, la valeur d'a était fixée du côté du synthétiseur et les paramètres de la source sonore et les coefficients du filtre de synthèse montrés sur la figure 3 étaient envoyés
depuis la mémoire 1 de paramètres de synthèse.
Conformément au procédé dans lequel une approximation en fréquence mel était effectuée, bien que les paramètres puissent être comprimés de façon efficace, étant donné que la gamme des hautes fréquences dans la bande de fréquence est comprimée, on considère qu'un tel procédé est désavantageux pour synthétiser une voix féminine ayant pour particularité d'être dans une bande de fréquence élevée. Par ailleurs, même pour une voix grave telle qu'une voix masculine, dans le cas o un élément de parole tel que "cha", "chu", "cho", "hya", "hyu" ou "hyo" ayant pour particularité d'être une parole dans une bande de fréquence relativement élevée, était synthétisé ou autre, il existe une tendance à la détérioration de la
clarté d'une partie consonante.
L'invention a pour objet un appareil de traitement de la parole pouvant améliorer la clarté d'une partie consonante et pouvant synthétiser une parole de
haute qualité.
Un autre objet de l'invention est de fournir un appareil de traitement de la parole pouvant modifier le ton
d'une parole par simple conversion d'une compressibilité.
Pour comprimer chacun des phonèmes constituant une parole par la valeur optimale, l'invention comporte des moyens destinés à extraire une valeur dans laquelle une compressibilité, en tant que coefficient d'une fonction de transfert non linéaire lorsqu'une information de parole est
comprimée, a été amenée à correspondre à chaque phonème.
Pour comprimer par la valeur optimale chacun des phonèmes constituant une parole, l'invention utilise un
procédé d'extraction d'une valeur dans lequel une compres-
sibilité, en tant que coefficient d'une fonction de transfert non linéaire lorsqu'une information de parole est
comprimée, a été amenée à correspondre à chaque phonème.
Pour changer le ton d'une parole, l'invention
comporte des moyens destinés à convertir une compres-
sibilité à la suite d'une analyse et d'une synthétisation
de la parole, à la compressibilité après la conversion.
Pour changer le ton d'une parole, l'invention utilise un procédé pour convertir une compressibilité à la suite d'une analyse et d'une synthétisation de la parole, à
la compressibilité après la conversion.
L'invention sera décrite plus en détail en regard des dessins annexés à titre d'exemples nullement limitatifs et sur lesquels: la figure lA est un schéma d'un agencement d'un appareil de synthétisation de la parole constituant une forme principale de réalisation de l'invention; la figure lB est un diagramme montrant une structure de données dans une mémoire de paramètres de synthèse de la figure 1A; la figure lC est un schéma montrant la construction d'un système constituant une forme de réalisation principale de l'invention; la figure 1D est un diagramme montrant la structure d'une table pour se référer à l'ordre d'un coefficient de cepstre par la valeur de ai; la figure 1E est un diagramme montrant le cas o 0 a été inséré dans des données lors d'une interpolation de la partie entre les trames ayant des ordres différents sur la figure lB; la figure 1F est un diagramme spectral d'un son original et d'une parole synthétisée dans le cas o la valeur de a est différente à la suite d'une analyse et d'une synthèse; la figure 2 est un schéma fonctionnel d'un appareil classique de synthétisation de la parole; la figure 3 est un diagramme montrant une structure de données dans une mémoire classique de paramètres de synthèse;
la figure 4 est un organigramme pour l'extrac-
tion et l'analyse d'un paramètre de synthèse à exécuter dans une conversion de fréquence non linéaire; la figure 5A est un graphique d'un spectre logarithmique de la figure 4; la figure 5B est un graphique d'une enveloppe spectrale obtenue par une méthode par cepstre améliorée sur la figure 4; la figure 5C est un graphique montrant le résultat obtenu dans le cas o une conversion de fréquence non linéaire a été effectuée sur l'enveloppe spectrale de la figure 5B; la figure 6 est un diagramme montrant un exemple dans lequel l'ordre d'un paramètre de synthèse pour un phonème et la valeur de a ont été établis de façon à correspondre en ordre pour améliorer la clarté de la partie consonante; la figure 7A est un diagramme d'une table pour la conversion de la valeur de a par une hauteur; la figure 7B est un diagramme d'une table destinée à convertir la valeur de a par un terme de puissance;
la figure 8 montre une équation de la modula-
tion de a pour changer la qualité de la voix d'une parole; la figure 9 est un diagramme d'une forme d'onde de a montrant l'état de la modulation; la figure 10A est un organigramme principal montrant le déroulement d'une analyse de la parole; la figure 0lB est un organigramme montrant l'analyse d'une parole et l'extraction des coefficients d'un filtre de synthèse sur la figure 10A; la figure 10C est un organigramme portant sur l'extraction d'une enveloppe spectrale d'une forme d'onde d'entrée de parole de la figure lOB; la figure 10D est un organigramme montrant l'extraction de coefficients de filtre de synthèse d'une parole de la figure lOB; la figure 11A est un organigramme montrant la synthèse d'une parole dans le cas o existe une table de conversion d'ordre; la figure llB est un organigramme portant sur une section de commande de transfert de paramètres de synthèse; la figure 11C est un organigramme montrant le déroulement des opérations d'un synthétiseur de la parole; et les figures 12A et 12B représentent un schéma d'un agencement d'un filtre d'approximation spectrale
logarithmique de mel.
Les figures 1A à iF représentent une première forme de réalisation de l'invention. La figure 1A est un
schéma fonctionnel simplifié d'un appareil de synthétisa-
tion de la parole; la figure lB est un diagramme montrant une structure de données dans une mémoire de paramètres de synthèse; et la figure 1C est un schéma fonctionnel de l'appareil entier de synthétisation de la parole. Le déroulement des opérations sera décrit en détail en regard des organigrammes des figures lOA à 11C. Dans le schéma fonctionnel représenté sur la figure lC, une forme d'onde de la parole est appliquée en entrée à partir d'un microphone 200. Seule la composante à basse fréquence est autorisée à passer par un filtre passe-bas 201. Un signal analogique d'entrée est converti en un signal numérique par un convertisseur analogique/numérique 202. Le signal numérique est transmis par l'intermédiaire d'une interface 203 pour exécuter la transmission et la réception avec une unité centrale de traitement 205 afin de commander le fonctionnement de l'ensemble de l'appareil conformément à des programmes stockés dans une mémoire 204; d'une interface 206 destinée à exécuter l'émission et la réception avec un visuel 207, un clavier 208 et l'unité centrale de traitement 205; d'un convertisseur numérique/analogique 209 destiné à convertir le signal numérique provenant de l'unité centrale de traitement 205 en un signal analogique; d'un filtre passe-bas 210 destiné à ne permettre le passage que de la composante à basse
fréquence; et d'un amplificateur 211. Ainsi, un haut-
parleur 212 délivre une forme d'onde de la parole.
D'une manière similaire à celle utilisée dans l'appareil classique de synthétisation de la parole montré sur la figure 2, l'appareil de synthétisation de la figure 1A est conçu de manière que la forme d'onde de la parole qui est appliquée en entrée à partir du microphone 200 soit analysée par l'unité centrale de traitement 205, et que les données résultant de l'analyse soient transférées trame par trame, à un intervalle de période de trame prédéterminé,
d'une mémoire 100 de paramètres de synthèse à un synthé-
tiseur 105 de la parole sous l'action d'un dispositif 101 de commande de transfert des paramètres de synthèse. Le déroulement des opérations effectuées pour analyser une parole est montré dans l'organigramme des figures lOA à 10D
et sera expliqué en détail. La figure lOA est un organi-
gramme principal montrant le processus d'analyse de la parole. La figure lOB est un organigramme montrant le processus de l'opération d'analyse d'une parole et de l'opération d'extraction des coefficients d'un filtre de synthèse. La figure 10C est un organigramme montrant le processus de l'opération d'extraction d'une enveloppe spectrale d'une forme d'onde d'entrée de la parole. La figure 10D est un organigramme montrant le processus de l'opération d'extraction des coefficients de filtre de synthèse d'une parole. Pour la forme d'onde de parole d'entrée, la forme d'onde obtenue sur un intervalle de temps allant d'un instant o l'analyse d'une certaine fenêtre d'analyse a commencé jusqu'à ce que l'analyse de la fenêtre d'analyse suivante ait commencé, est établie comme étant une trame. La forme d'onde de la parole d'entrée est analysée et synthétisée ci-après sur la base d'une unité de trame. Dans l'organigramme montré sur les figures lOA à 10D, le nombre de trame i est d'abord établi à 0 (étape SI). Puis le nombre de trames est mis à jour (étape S2). Les données d'une trame sont appliquées en entrée à l'unité centrale de traitement 205 (étape S3), unité qui analyse la forme d'onde d'entrée de la parole et qui extrait les coefficients de filtre de synthèse (étape
S4). Pour analyser la parole et pour extraire les coeffi-
cients de filtre de synthèse, une enveloppe spectrale de la forme d'onde d'entrée de la parole est extraite (étape S8) et les coefficients de filtre de synthèse sont extraits (étape S9). Un sous-programme d'extraction de l'enveloppe
spectrale est montré dans l'organigramme de la figure 10C.
Premièrement, une certaine fenêtre spéciale est formée pour la forme d'onde de parole d'entrée en ce qui concerne les données d'une longueur de trame sous la forme d'un signal d'une longueur finie (étape S1O). Puis la forme d'onde de parole d'entrée est soumise à une transformation de Fourier (étape Sll), un logarithme est calculé (étape S12) et la valeur du logarithme est stockée en tant que spectre logarithmique X(a) dans une mémoire tampon de stockage faisant partie de la mémoire 204 (étape S13). Puis une transformation de Fourier inverse est exécutée (étape S14) et la valeur résultante est établie à un coefficient de cepstre C(n). Pour lisser le coefficient de cepstre en C(n), ce coefficient est coupé à une certaine fenêtre spéciale (relevage) (étape S15). Le numéro de trame i sur la figure 10C est établi à 0 (étape S16). Le résultat obtenu par l'exécution de la transformation de Fourier est établi à un spectre lissé Si(f) (étape S17). Le spectre Si(f) est soustrait de X(f) retenu dans le tampon de stockage et la valeur négative est supprimée. Le résultat
est établi à un spectre résiduel Ei(f) (S18).
Ei(f) = (1 + b)Ei(f) est calculé en ce qui concerne un coefficient d'accélération approprié b (étape S19). En outre, pour obtenir un spectre lissé Si(f) de Ei(f), la transformation inverse de Fourier (étape S20), le relevage (étape S21) et la transformation de Fourier (étape S22) i+1 sont exécutés. Si(f) + S'(f) est établi à Si+ (n) (étape S23). i est remplacé par i+l (étape S24). Les processus des étapes S18 à S24 sont répétés jusqu'à ce que i soit égal à 4 (étape S25). Lorsque i est égal à 4 (S24), la valeur de i+l ^ S (f) est établie à une enveloppe spectrale S(f). Il est
approprié d'établir i à une valeur de 3 à 5. Le sous-
programme d'extraction des coefficients de filtre de l1
synthèse est montré dans l'organigramme de la figure 10D.
^ L'enveloppe spectrale S(n) obtenue dans l'organigramme de la figure lOC est convertie en une fréquence de uel en tant que caractéristiques de fréquence du sens auditif. La caractéristique de phase du filtre passetout, qui exprime approximativement la fréquence mel, est montrée dans l'équation (2). Une fonction inverse de la caractéristique de phase est montrée dans l'équation suivante (3). Une conversion de fréquence non linéaire est exécutée par
l'équation (3) (étape S27).
n = n - 2tg-1{o - sinn/(l + a.cosn)}...(3) Une information d'étiquette (symbole de phonème correspondant à la forme d'onde) est préalablement additionnée aux données de formes d'ondes et la valeur de a
est déterminée sur la base de l'information d'étiquette.
L'enveloppe spectrale après la conversion de fréquence non linéaire est obtenue et est soumise à la transformation de Fourier inverse (étape S28), afin que l'on obtienne un coefficient de cepstre Ca(m). Des coefficients de filtre bi(m) (i: numéro de trame, m: ordre) sont obtenus par l'équation suivante (4) en utilisant le coefficient de
cepstre Ca(m) (étape 529).
bi(m) = Ca(m) + B(Ca(m-l) - b(m+1))...(4) Les coefficients de filtre bi(m) obtenus sont stockés dans la mémoire 100 de paramètres de synthèse à l'intérieur de la mémoire 204 (étape S5). La figure lB montre une structure de la mémoire 100 de paramètres de synthèse. Les paramètres de synthèse d'une trame du nombre
de trames i comprennent la valeur d'un rapport de conver-
sion de fréquence ai en plus de données de discrimination U/Vi (voisé/non voisé), une information concernant un rythme tel qu'une hauteur et analogue, et des coefficients de filtre bi(m) représentatifs d'un phénomène. La valeur du rapport de conversion de fréquence ai est la valeur optimale qui a été établie en correspondance à chaque phonème par l'unité centrale de traitement 205 à la suite d'une analyse de la forme d'onde d'entrée de parole. ai est défini comme étant un coefficient a de la fonction de transfert du filtre passe-tout, montrée dans l'équation (1) (i est un nombre de trame). Lorsque la valeur de a est faible, la compressibilité est également faible. Lorsque a est grand, la compressibilité est également grande. Par exemple, a - 0,35 dans le cas d'une analyse de la parole produite par une voix masculine, analyse effectuée à la fréquence d'échantillonnage de 10 kHz. Même dans le cas de la même période d'échantillonnage, en particulier dans le cas de la parole d'une voix féminine, si la valeur de a est établie de façon à être une valeur légèrement faible et que l'ordre du coefficient de cepstre est augmenté, un son vocal ayant une clarté élevée, analogue à une voix féminine, est obtenu. L'ordre du coefficient de cepstre correspondant à la valeur de a est prédéterminé par la table montrée sur la figure 1D qui a été formée de façon préliminaire. Le dispositif 101 de commande de transfert de paramètres de synthèse transfère les données uniquement en ce qui concerne l'ordre au synthétiseur 105 de parole, à partir de la mémoire 100 de paramètre de synthèse en référence à la table montrée sur la figure ID. A ce moment, si les données d'interpolation, dans lesquelles la présente trame et la trame suivante ont été interpolées sur une base d'unité d'échantillonnage, sont envoyées, une autre parole de bonne qualité peut être obtenue. Les figures 11A à llC montrent un organigramme indiquant le déroulement des opérations pour synthétiser une parole. Il existe un cas dans lequel la mémoire 204 contient une table 106 de conversion destinée à effectuer la compressibilité de fréquence ai en correspondance avec l'ordre du coefficient de cepstre à la suite d'une synthèse d'une parole, et un cas dans lequel la mémoire 204 ne contient pas une telle table de conversion. La figure 11A est un organigramme montrant le déroulement de l'opération de synthèse d'une parole dans le cas o la mémoire 204 possède la table 106
de conversion. Premièrement, la valeur de la compres-
sibilité de fréquence a des données d'une trame est extraite de la mémoire 100 de paramètres de synthèse à l'intérieur de la mémoire 204 par l'unité centrale de traitement 205 (étape S31). Un ordre P du coefficient de cepstre correspondant à a est extrait de la table 106 de référence d'ordre par l'unité centrale de traitement 205 (étape S32). Une donnée bi(P) des coefficients de filtre uniquement de l'ordre P est extraite de la mémoire 100 de paramètres de synthèse par l'unité centrale de traitement 205 et 0 est inséré dans les parties restantes des données
de trame de la quantité du Qième ordre (30ième ordre-
Pième ordre = Qième ordre) (étape S33). Les données de trame formées sont stockées dans un Tampon (Nouveau) dans
la mémoire 204 (étape S34).
La figure llB est un organigramme montrant le déroulement de l'opération de synthèse de la parole dans le cas o la mémoire 204 ne possède pas la table 106 de
référence d'ordre.
La figure llB montre le processus dans lequel le dispositif 101 de commande de transfert de paramètres de synthèse transfère les données au synthétiseur 105 de parole tout en interpolant les données. Premièrement, la donnée de la trame de départ est introduite en tant que donnée de trame présente dans un Tampon (ancien) en provenance de la mémoire 100 de paramètres de synthèse se trouvant dans la mémoire 204 (étape S35). Ensuite, la donnée de trame du nombre de trames suivant est stockée dans un Tampon (Nouveau) en provenance de la mémoire 100 de paramètres de synthèse (étape S36). La valeur obtenue par division de la différence entre le Tampon (Nouveau) et le Tampon (ancien) par le nombre n d'échantillons à interpoler est placée en Tampon (différence) (étape S37). La valeur obtenue par l'addition de Tampon (différence) au Tampon de donnée de trame présente (ancien) est établie au Tampon de donnée de trame présente (ancien) (étape S38). Dans cet état, l'appareil attend (étape S40) jusqu'à ce qu'une
demande de transfert soit délivrée en sortie du synthé-
tiseur 105 de parole (étape S39). Si la demande de transfert a été générée, le Tampon de donnée de trame présente (ancien) est transféré au filtre 104 de synthèse
(étape S41). Une vérification est effectuée pour déter-
miner si le Tampon de donnée de trame présente (ancien) est égal au Tampon de donnée de trame suivante (Nouveau) ou non (étape S42). S'ils diffèrent, on revient au sous-programme de traitement et les processus des étapes S38 à S42 sont
répétés jusqu'à ce que Tampon (ancien) = Tampon (Nouveau).
S'il est déterminé à l'étape S42 que Tampon (ancien) = Tam-
pon (Nouveau), le Tampon (Nouveau) est remplacé en tant que
tampon de donnée de trame présente (ancien) (étape S43).
Une vérification est effectuée pour déterminer si le transfert de la totalité des données de trame dans la mémoire 100 de paramètres de synthèse est achevé ou non
(étape S44). Si la réponse est NON, on revient au sous-
programme de traitement et les processus des étapes S36 à S44 sont répétés jusqu'à ce que le transfert des données soit achevé. La figure 11C est un organigramme montrant le déroulement des opérations effectuées dans le synthétiseur
de parole.
Si un paramètre de synthèse a été appliqué en entrée à partir du dispositif 101 de commande de transfert de paramètres de synthèse au synthétiseur 105 de la parole (étape S45), la donnée U/V est envoyée au générateur 102 d'impulsions (étape S46). La donnée Hauteur est envoyée à un commutateur U/V 107 (étape S47). Les coefficients de filtre et la valeur de a sont envoyés à un filtre 104 de synthèse (étape S48). Dans le filtre 104 de synthèse, on procède au calcul d'un filtre de synthèse (étape S49). Même après le calcul du filtre de synthèse, l'appareil attend (étape S52) jusqu'à ce qu'une impulsion de synchronisation de sortie d'échantillon soit délivrée par une horloge 104 (étape S51). Si l'impulsion de synchronisation de sortie d'échantillon a été générée (étape S51), le résultat du calcul du filtre de synthèse est délivré au convertisseur numérique/analogique 209 (étape S52). Une demande de transfert est envoyée au dispositif 101 de transfert de
paramètres de synthèse (étape S53).
Les figures 12A et 12B montrent un mode de réalisation d'un filtre MLSA. Une fonction de transfert du v filtre de synthèse 104 est exprimée par H(Z) de la manière suivante: \v -IV H(Z) = exp (b(0)/2).R4(F(Z))...(3) F(Z) = Z-1 (b(l)+b(2)Z-1+b(3)Z-2+...+b(30)Z-29... (4) o R4 désigne une fonction exponentielle qui est exprimée par une approximation quartique de Padé. Autrement dit, le filtre de synthèse est du type dans lequel l'équation (1) a été substituée à l'équation (4) et l'équation (4) a été substituée à l'équation (3). En changeant le rapport a de conversion de fréquence et l'ordre P des coefficients qui sont donnés au filtre dans la construction de filtre montrée dans les équations (1), (3) et (4), on comprime la parole d'entrée selon la compressibilité de fréquence
optimale. On peut synthétiser une parole par les coeffi-
cients de filtre produits au rapport d'expansion de
fréquence correspondant à chaque trame. Dans la forme de réalisation, la conversion de fréquence a été effectuée
par l'utilisation d'un filtre
passe-tout primaire comme montré dans l'équation (1).
Cependant, si un filtre de synthèse comprenant un filtre passe-tout d'ordre multiple est utilisé, la fréquence peut être comprimée ou expansée en ce qui concerne une partie
arbitraire de l'enveloppe spectrale obtenue.
Dans la première forme de réalisation, on a synthétisé une parole de haute qualité en effectuant la compressibilité de fréquence a à la suite d'une analyse et en faisant correspondre l'ordre P des coefficients de
filtre à a et P à la suite d'une synthèse.
Dans la seconde forme de réalisation, après que le paramètre de synthèse, qui a été analysé par l'établissement de la valeur de la compressibilité de fréquence a à une valeur constante, a été converti par le dispositif 101 de commande de transfert de paramètres de synthèse, le paramètre de synthèse converti est transféré au synthétiseur 105 de parole, afin que la qualité du son (tonalité de la voix) soit modifiée et que la parole puisse être synthétisée. La figure 1F montre un état d'un spectre (inclus dans une trame) dans le cas o la valeur de a a été modifiée. La valeur de a à la suite d'une analyse a été établie à aa = 0,35 et la valeur de a à la suite d'une synthèse a été établie à as = 0,15, 0,35 et 0,45. Si la parole était synthétisée par l'exécution d'une conversion telle que as < aa, on obtiendrait une voix grave ayant des composantes de basse fréquence pondérées. Si as > aa, on obtient une voix aiguë ayant des composantes de haute
fréquence pondérées.
Les procédés suivants peuvent être utilisés en
tant que procédés de conversion de la valeur de a.
1. Un procédé dans lequel une table de conversion pour changer la valeur de a est établie au préalable, et la valeur de a, après la fin de la conversion qui a été obtenue en référence à la table de conversion,
est utilisée à la suite d'une synthèse.
2. Un procédé dans lequel, après que la valeur de a a été modifiée par une équation fonctionnelle linéaire
ou non linéaire, la valeur modifiée de a est utilisée.
La valeur de a à la suite d'une analyse et la valeur de a à la suite d'une synthèse sont établies de façon à être égales et sont amenées à correspondre, ou bien la valeur après sa conversion en une valeur différente est
amenée à correspondre. Il existe divers procédés correspon-
dants. Dans la forme de réalisation décrite, ces valeurs ont été amenées à correspondre sur une base d'unité de trame. Cependant, elles peuvent également être amenées à correspondre sur la base d'une unité d'un phonème, d'une
syllabe ou d'une parole.
Pour améliorer la clarté à la suite d'une synthèse, par exemple dans le cas de /k/j/a/, il est très souhaitable d'améliorer la clarté de la partie consonante /k/ de "kja". Par conséquent, pour améliorer la clarté à la suite d'une analyse de la partie /k/, a est diminué et P est augmenté. Par exemple, on procède à l'analyse en posant a = 0,21 et Pu 30ème ordre et le paramètre est stocké dans la mémoire 100 de paramètres de synthèse. Si la valeur de a est augmentée progressivement pour la partie /j/ et
a = 0,35 et P = 16ème ordre pour la partie /a/, l'inter-
polation de trames est également exécutée en douceur. La figure 6 montre des variations de la valeur du rapport de conversion de fréquence a de chaque trame et de l'ordre des
coefficients qui sont donnés au filtre de synthèse.
Si le premier procédé de modification de la valeur de a par l'utilisation de la table de conversion est mis en oeuvre en tant que procédé lorsque a à la suite d'une analyse et a à la suite d'une synthèse sont modifiés, comme montré sur la figure 7A, en désignant la valeur de a en correspondance à la valeur de la Hauteur qui est donnée au synthétiseur, un son dans lequel les composantes à basse fréquence sont renforcées, à une fréquence de hauteur élevée, est obtenu et un son dans lequel des composantes à haute fréquence sont renforcées, à une fréquence de faible hauteur, est dérivé. Comme montré sur la figure 7B, en établissant une correspondance à b(O), un son dans lequel les composantes de basse fréquence sont renforcées dans le cas d'une voix forte et un son dans lequel les composantes à haute fréquence sont renforcées dans le cas d'une petite voix, peuvent être synthétisés et la parole synthétisée
peut être émise.
Par ailleurs, dans le cas d'une variation de la
valeur de a par la fonction selon le second procédé ci-
dessus, par exemple, la valeur de a à la suite d'une analyse (a = 0,35 et P = 16ème ordre de toutes les trames pour simplifier l'explication) peut être établie à la valeur qui était modulée à une période prédéterminée à la
suite d'une synthèse. En utilisant des moyens d'introduc-
tion d'une période de modulation et d'une fréquence de modulation (par exemple 0,35 0,1) dans le dispositif 101 de commande de transfert de paramètres de synthèse sur la figure 1A, on module la distribution spectrale de la voix d'entrée d'une manière dépendant du temps et une parole différente de la parole d'entrée peut être produite en sortie. La figure 8 montre l'équation de la modulation de a
et la figure 9 montre un état de la modulation de a.
L'un quelconque des procédés de modulation de a basés sur l'amplitude, la fréquence et la phase peut être utilisé. En ce qui concerne le procédé de modulation, la valeur de l'information d'amplitude d'une parole (dans la forme de réalisation, b(0): coefficients de filtre du
terme de 0ème ordre) peut également être amenée à cor-
respondre à la valeur de a. Par exemple, la valeur de b(0) du filtre de synthèse peut également être modifiée en posant bn(O) = (a - 0,35 + 1). b0(0) (b0(0); ancien b(0) Bn(0); nouveau b(0)) en utilisant la valeur de a montrée
sur la figure 9.
En ce qui concerne la hauteur, il est possible d'établir une correspondance telle que Hauteurn = (a - 0,35 + 1). Hauteur0 (Hauteur0: ancien; Hauteurn: nouveau). Par contre, la valeur de a peut également être modifiée par l'utilisation du terme de puissance et de la
valeur de la hauteur.
Conformément à l'invention, le mode de réalisation ci-dessus permet d'obtenir les avantages suivants. En utilisant les moyens d'établissement de la compressibilité en tant que coefficient d'une fonction de transfert non linéaire lorsqu'une information de parole est comprimée à la valeur correspondant à chacun des phonèmes constituant une parole, on comprime les phonèmes de la valeur optimale, respectivement. Par conséquent, la clarté
de la partie consonante est améliorée et on peut syn-
thétiser une parole de haute qualité.
En utilisant le procédé dans lequel la compressibilité, en tant que coefficient de la fonction de transfert non linéaire lorsqu'une information de parole est comprimée, est établie à la valeur correspondant à chacun des phonèmes constituant une parole, on comprime les phonèmes de la valeur optimale, respectivement. Ainsi, la clarté de la partie consonante est améliorée et on peut
synthétiser une parole de haute qualité.
En utilisant les moyens destinés à convertir la compressibilité à la suite d'une analyse de la parole et
les moyens destinés à synthétiser une parole par l'utilisa-
tion de la compressibilité convertie, on peut modifier le ton vocal d'une parole par simple conversion de la compressibilité. En utilisant le procédé de conversion de la compressibilité à la suite d'une analyse de la parole et le procédé de synthétisation d'une parole par l'utilisation de la compressibilité convertie, on peut changer le ton vocal
d'une parole par simple conversion de la compressibilité.
Il va de soi que de nombreuses modifications peuvent être apportées à l'appareil décrit et représenté
sans sortir du cadre de l'invention.

Claims (20)

REVENDICATIONS
1. Appareil de traitement de la parole, caractérisé en ce qu'il comporte des moyens d'analyse (104, 205, 206) destinés à analyser une parole d'entrée, des moyens de compression destinés à comprimer une information de parole obtenue par analyse de la parole conformément à une fonction de transfert non linéaire, des moyens destinés à faire correspondre une compressibilité, en tant que coefficient de fonction de transfert des moyens de compression, à chacun des phonèmes ou à chacune des trames constituant la parole, et un moyen à mémoire (100) destiné
à stocker l'information de parole.
2. Appareil selon la revendication 1, carac-
térisé en ce que la fonction de transfert non linéaire est exprimée par Z= = (z-1 - a)/(l - aZ-1)
lorsque la compressibilité est établie à ae.
3. Appareil selon la revendication 2, carac-
térisé en ce que la fonction de transfert non linéaire permet d'obtenir un axe de fréquence qui est proche d'une résolution de fréquence du sens auditif d'un être humain
par ajustement de la compressibilité.
4. Appareil selon la revendication 1, carac-
térisé en ce que la fonction de transfert non linéaire
permet d'obtenir un axe de fréquence proche d'une résolu-
tion de fréquence du sens auditif d'un être humain par
ajustement de la compressibilité.
5. Procédé de traitement de la parole, caractérisé en ce qu'une parole d'entrée est analysée pour que l'on obtienne une information de parole et une compressibilité, en tant que coefficient d'une fonction de transfert non linéaire lorsque l'information de parole est
comprimée, est amenée à correspondre à chacun des phéno-
mènes ou à chacune des trames constituant la parole, afin
que l'information de parole soit comprimée et stockée.
6. Procédé selon la revendication 5, caracté-
risé en ce que la fonction de transfert non linéaire est exprimée par z-1 = (z-1 - a)/(1 - az-1)
lorsque la compressibilité est établie à a.
7. Procédé selon la revendication 6, caracté-
risé en ce que la fonction de transfert non linéaire permet d'obtenir un axe de fréquence qui est proche d'une résolution de fréquence du sens auditif d'un être humain
par ajustement de la compressibilité.
8. Procédé selon la revendication 5, caracté-
risé en ce que les moyens de synthèse utilisent un filtre (104) d'approximation de spectre logarithmique qui est constitué par l'utilisation d'un filtre passe-tout primaire
en tant qu'élément à retard.
9. Appareil de traitement de la parole, caractérisé en ce qu'il comporte des moyens (200, 201, 202, 203) destinés à lire une information de parole, des moyens
de conversion (106) destinés à convertir une compres-
sibilité dans l'information de parole, et des moyens de
synthèse (104) destinés à synthétiser une parole conformé-
ment à une fonction de transfert non linéaire à ladite compressibilité.
10. Appareil selon la revendication 9, caractérisé en ce que la fonction de transfert non linéaire est exprimée par Z-1 = (z-1 - x)/(1 - z-1)
lorsque la compressibilité est établie à a.
11. Appareil selon la revendication 10, caractérisé en ce que la fonction de transfert non linéaire permet d'obtenir un axe de fréquence qui est proche d'une résolution de fréquence du sens auditif d'un être humain
par ajustement de la compressibilité.
12. Appareil selon la revendication 9, caractérisé en ce qu'une table (106) ou une équation fonctionnelle peut également être utilisée pour une conversion de la compressibilité.
13. Appareil selon la revendication 9, caractérisé en ce que la fonction de transfert non linéaire permet d'obtenir un axe de fréquence qui est proche d'une résolution de fréquence du sens auditif d'un être humain
par ajustement de la compressibilité.
14. Appareil selon la revendication 9, caractérisé en ce que les moyens de synthèse utilisent un filtre (104) d'approximation de spectre logarithmique qui est constitué par l'utilisation d'un filtre passe-tout
primaire en tant qu'élément à retard.
15. Procédé de traitement de la parole, caractérisé en ce qu'une information de parole est lue, une compressibilité dans l'information de parole est convertie, et une parole est synthétisée conformément à une fonction
de transfert non linéaire à ladite compressibilité.
16. Procédé selon la revendication 15, caractérisé en ce que la fonction de transfert non linéaire est exprimée par z- = (Z1 - a)/(l1 - az-1)
lorsque la compressibilité est établie à a.
17. Procédé selon la revendication 16, caractérisé en ce que la fonction de transfert non linéaire permet d'obtenir un axe de fréquence qui est proche d'une résolution de fréquence du sens auditif d'un être humain
par ajustement de la compressibilité.
18. Procédé selon la revendication 15, caractérisé en ce qu'une table (106) ou une équation fonctionnelle peut également être utilisée pour une
conversion de la compressibilité.
19. Procédé selon la revendication 15, caractérisé en ce que la fonction de transfert non linéaire permet d'obtenir un axe de fréquence qui est proche d'une résolution de fréquence du sens auditif d'un être humain par ajustement de la compressibilité.
20. Procédé selon la revendication 15, caractérisé en ce que les moyens de synthétisation utilisent un filtre (104) d'approximation de spectre logarithmique qui est réalisé par l'utilisation d'un filtre
passe-tout primaire en tant qu'élément à retard.
FR909012962A 1989-10-20 1990-10-19 Appareil et procede pour le traitement de la parole. Expired - Fee Related FR2653557B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1274638A JPH03136100A (ja) 1989-10-20 1989-10-20 音声処理方法及び装置

Publications (2)

Publication Number Publication Date
FR2653557A1 true FR2653557A1 (fr) 1991-04-26
FR2653557B1 FR2653557B1 (fr) 1993-04-23

Family

ID=17544493

Family Applications (1)

Application Number Title Priority Date Filing Date
FR909012962A Expired - Fee Related FR2653557B1 (fr) 1989-10-20 1990-10-19 Appareil et procede pour le traitement de la parole.

Country Status (5)

Country Link
US (1) US5715363A (fr)
JP (1) JPH03136100A (fr)
DE (1) DE4033350B4 (fr)
FR (1) FR2653557B1 (fr)
GB (1) GB2237485B (fr)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19616103A1 (de) * 1996-04-23 1997-10-30 Philips Patentverwaltung Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal
US5998725A (en) * 1996-07-23 1999-12-07 Yamaha Corporation Musical sound synthesizer and storage medium therefor
DE19860133C2 (de) * 1998-12-17 2001-11-22 Cortologic Ag Verfahren und Vorrichtung zur Sprachkompression
FR2796193B1 (fr) * 1999-07-05 2001-10-05 Matra Nortel Communications Procede et dispositif de codage audio
GB2373005B (en) * 2001-03-10 2005-01-12 Roger Wilde Ltd Fire rated glass flooring
JP4603727B2 (ja) * 2001-06-15 2010-12-22 セコム株式会社 音響信号分析方法及び装置
JP4256189B2 (ja) * 2003-03-28 2009-04-22 株式会社ケンウッド 音声信号圧縮装置、音声信号圧縮方法及びプログラム
JP4110573B2 (ja) * 2003-09-16 2008-07-02 横河電機株式会社 パルスパターン発生装置
US7860256B1 (en) * 2004-04-09 2010-12-28 Apple Inc. Artificial-reverberation generating device
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
JP4699117B2 (ja) * 2005-07-11 2011-06-08 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0388104A2 (fr) * 1989-03-13 1990-09-19 Canon Kabushiki Kaisha Procédé pour l'analyse et la synthèse de la parole

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3681530A (en) * 1970-06-15 1972-08-01 Gte Sylvania Inc Method and apparatus for signal bandwidth compression utilizing the fourier transform of the logarithm of the frequency spectrum magnitude
US4260229A (en) * 1978-01-23 1981-04-07 Bloomstein Richard W Creating visual images of lip movements
US4304965A (en) * 1979-05-29 1981-12-08 Texas Instruments Incorporated Data converter for a speech synthesizer
EP0076234B1 (fr) * 1981-09-24 1985-09-04 GRETAG Aktiengesellschaft Procédé et dispositif pour traitement digital de la parole réduisant la redondance
CA1243779A (fr) * 1985-03-20 1988-10-25 Tetsu Taguchi Systeme de traitement de la parole
US4922539A (en) * 1985-06-10 1990-05-01 Texas Instruments Incorporated Method of encoding speech signals involving the extraction of speech formant candidates in real time
GB2207027B (en) * 1987-07-15 1992-01-08 Matsushita Electric Works Ltd Voice encoding and composing system
US4882754A (en) * 1987-08-25 1989-11-21 Digideck, Inc. Data compression system and method with buffer control

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0388104A2 (fr) * 1989-03-13 1990-09-19 Canon Kabushiki Kaisha Procédé pour l'analyse et la synthèse de la parole

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ELECTRONICS AND COMMUNICATIONS IN JAPAN. vol. 69, no. 10, 1 Octobre 1986, NEW YORK US pages 957 - 964; KITAMURA: 'Speech analysis synthesis system and quality of synthesized speech using Mel-Cepstrum' *
ELECTRONICS AND COMMUNICATIONS IN JAPAN. vol. 70, no. 5, 1 Mai 1987, NEW YORK US pages 16 - 25; KOHATA ET AL: 'Vector quantization of speech signals using principal component analysis' *
INTERNATIONAL CONFERENCE ON ACOUSTICS SPEECH AND SIGNAL PROCESSING vol. 1, 14 Avril 1983, BOSTON MASSACHUSIETS pages 93 - 96; IMAI: 'Cepstral analysis synthesis on the Mel frequency scale' *

Also Published As

Publication number Publication date
US5715363A (en) 1998-02-03
JPH03136100A (ja) 1991-06-10
DE4033350A1 (de) 1991-04-25
DE4033350B4 (de) 2004-04-08
FR2653557B1 (fr) 1993-04-23
GB2237485A (en) 1991-05-01
GB9022674D0 (en) 1990-11-28
GB2237485B (en) 1994-07-06

Similar Documents

Publication Publication Date Title
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
KR930005226B1 (ko) 코드북 벡터 발생방법 및 장치
EP0782128B1 (fr) Procédé d&#39;analyse par prédiction linéaire d&#39;un signal audiofréquence, et procédés de codage et de décodage d&#39;un signal audiofréquence en comportant application
EP1593116B1 (fr) Procédé pour le traitement numérique différencié de la voix et de la musique, le filtrage de bruit, la création d&#39;effets spéciaux et dispositif pour la mise en oeuvre dudit procédé
FR2653557A1 (fr) Appareil et procede pour le traitement de la parole.
JP2003122400A (ja) 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正
US5295224A (en) Linear prediction speech coding with high-frequency preemphasis
JPS62261238A (ja) ボコーダ装置
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
EP0865029B1 (fr) Interpolation de formes d&#39;onde par décomposition en bruit et en signaux périodiques
JPH1063297A (ja) 音声符号化方法および装置
Robinson Speech analysis
US6535847B1 (en) Audio signal processing
EP0573358B1 (fr) Procédé et dispositif de synthèse vocale à vitesse variable
EP1192619B1 (fr) Codage et decodage audio par interpolation
JPH0738116B2 (ja) マルチパルス符号化装置
EP1192618B1 (fr) Codage audio avec liftrage adaptif
EP1192621B1 (fr) Codage audio avec composants harmoniques
WO1991017541A1 (fr) Procede et dispositif de codage bas debit de la parole
US5899974A (en) Compressing speech into a digital format
EP1194923B1 (fr) Procedes et dispositifs d&#39;analyse et de synthese audio
JP3271966B2 (ja) 符号化装置及び符号化方法
WO2001003119A1 (fr) Codage et decodage audio incluant des composantes non harmoniques du signal
FR2751776A1 (fr) Procede d&#39;extraction de la frequence fondamentale d&#39;un signal de parole
JPH11184499A (ja) 音声符号化方法および音声符号化方法

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20070629