EP0543719A1 - Method and arrangement for voiced-unvoiced decision applied in a very low rate vocoder - Google Patents

Method and arrangement for voiced-unvoiced decision applied in a very low rate vocoder Download PDF

Info

Publication number
EP0543719A1
EP0543719A1 EP92403087A EP92403087A EP0543719A1 EP 0543719 A1 EP0543719 A1 EP 0543719A1 EP 92403087 A EP92403087 A EP 92403087A EP 92403087 A EP92403087 A EP 92403087A EP 0543719 A1 EP0543719 A1 EP 0543719A1
Authority
EP
European Patent Office
Prior art keywords
frame
calculating
score
states
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP92403087A
Other languages
German (de)
French (fr)
Inventor
Pierre-André Thomson-CSF Laurent
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of EP0543719A1 publication Critical patent/EP0543719A1/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Definitions

  • the present invention relates to a voicing decision method and device for a very low bit rate vocoder.
  • the speech signal is segmented into frames of constant durations from 10 to 30 milliseconds so as to determine within them the periodicity still designated by "Pitch" "in Anglo-Saxon language, of the speech signal.
  • These frames are arbitrarily positioned in the speech signal and only one voicing value is provided for each frame.
  • the frames are grouped in blocks of 2, 6 or 8 frames for example and so that the bit rate allocated to voicing is reduced, all possible voicing combinations are generally not authorized. It is generally considered in fact improbable that there may exist one or two isolated voiced frames in the middle of a packet of unvoiced frames, or vice versa.
  • the object of the invention is to overcome the aforementioned drawbacks.
  • the subject of the invention is a voicing decision method for a very low bit rate vocoder according to which the speech signal is sampled and segmented into frames of constant duration, characterized in that it consists in considering the evolution of the speech signal on a determined number K of successive frames by assigning to each current frame n a score for each of the possible states of evolution of the speech signal as a function of the correlation rates of samples distributed in each frame, to be determined in each current frame state of evolution of the speech signal which has the maximum score to go up from this state to the most probable state of the frame nK passing successively through the states of maximum score of each previous frame.
  • the method according to the invention which is represented diagrammatically by blocks 1 to 5 in FIG. 1 performs a voicing decision on speech signal ranges of duration multiple of the "pitch". This duration is calculated between two predetermined extreme values, which are a minimum value to take into account sufficient signal and a maximum value to both limit the computational load and take into account the speed of natural variation of the characteristics of speech.
  • the treatment begins with the calculation of three parameters which are a long-term correlation rate note R M , a correlation rate at order 1 note R1 and a rate of transition to 0 note T ppz . These calculations are shown in blocks 1, 2 and 3 in Figure 1.
  • the long-term correlation rate R M is calculated according to the expression in which M represents a value of "pitch" in number of samples, S n and S nm are amplitudes of signal samples, N denotes the number of samples analyzed, K is a constant and ⁇ represents a fraction of M This calculation makes it possible to provide the true value of the "pitch" when the correlation rate which is obtained has a maximum value.
  • R M is equal to 1, while it is practically zero for a random sound (unvoiced).
  • K1 avoids divisions by zero and provides a very low value of R M in speech silences where the power is very low.
  • R1 The correlation rate at order 1, R1 is calculated according to the expression in which S n and S n-1 represent as before the amplitudes of N samples and K2 is a constant.
  • R1 For a voiced sound, R1 is very close to 1 and it approaches -1 for an unvoiced sound.
  • K2 makes it possible to give to R1 a value practically zero during the rests.
  • T ppz provides the ratio between the number of sign changes of each sample S n , and N / 2 this rate varies between a value almost zero for a voiced sound and a value close to 1 for a sound not seen.
  • the processing continues, as shown by block 4 in FIG. 1 by a normalization of the parameters R N , R1 and T ppz determined previously.
  • This normalization has the effect of fixing the values of the parameters R N , R1 and T ppz between the two values 0 and 1, the value 0 corresponding to the perfectly unvoiced sound and the value 1 corresponding to the perfectly voiced sound.
  • the normalized values obtained are then weighted by weighting coefficients ⁇ 1, ⁇ 2 and ⁇ 3 to form a quantity Z defined by the relation
  • Z takes the value 1 for perfectly voiced sounds and the value 0 for perfectly unvoiced sounds.
  • the voicing decision which is represented by block 5 in FIG. 1 takes place on a criterion of decision by maximum likelihood, by considering the possible evolution of the speech signal over several successive frames, by assigning in each new frame a score to each of the possible states of evolution depending on the value of the number z obtained from the relation (4).
  • the NNV state is preceded by the NNN state
  • the NVV state is preceded by the NNV state
  • the VVV state is preceded either by the NVV state or by the VVV state
  • the NNN state is preceded either by the NNN state itself or by the VNN state
  • the VNN state is preceded by the VVN state
  • the VVN state is preceded by the VVV state.
  • Each of the possible arrival states in the frame is assigned a score.
  • the score retained is the largest possible among those obtained by adding or subtracting, according to the signs indicated on the arrows representing the transitions between states in FIG. 3, the value of z calculated by the relation (4 ) previous to which it is optionally subtracted a predetermined threshold value Z0 between 0 and 1.
  • the corresponding ending states are also prohibited.
  • the method stores the arrival scores which are then used as starting scores for the next frame and the table of the previous states is also stored.
  • the final decision takes place on all the frames with a certain delay, that is to say that the voicing decision at the time of arrival of the frame n will be that of the frame nK in the manner represented by the flowchart. of FIG. 4.
  • ni 0, 1, ..., K-1
  • the method goes back to this one and continues in a similar way until frame n- 5 along the solid bold lines in FIG. 4.
  • the state to which the method thus goes back is the state VVN which corresponds to the n-5 frame not seen in state 5.
  • the method is only valid if the constraint of three successive frames of the same voicing state are respected, which is not always the case if the process stops at the previous stage.
  • the frame n-5 corresponds to state 5
  • the frame n-4 can in this case only be in state 4, the only state which it is possible to achieve from FIG. 3 in starting from state 5, the ascent in the states during the next frame must necessarily lead to state 5 in frame n-4.
  • the rest of the processing then consists, for all the possible states in frame n, of eliminating the states (here states 0, 3, 4 and 5) from which it is not possible to go back to state 5, in the frame n-4 by positioning their scores at infinity.
  • state 1 is of course not eliminated, because it is from it that the ascent was started in the states and state 2 is preserved because the process can go back from it to the state 5 in the frame n-4 (bold dashed lines).
  • FIG. 5 A device for implementing the method according to the invention is shown in FIG. 5.
  • This device comprises represented respectively inside closed dotted lines a device 6 for calculating the parameter Z, a device 7 for normalization, a device 8 for final decision.
  • the device for calculating the parameter Z comprises a device 9 for calculating long-term autocorrelation of the value R M , a device 10 for correlation to the order 1 of the coefficient R1 and a device 11 for calculating the zero crossing rate T ppz .
  • the calculation devices 9, 10 and 11 each receive simultaneously on a first input the signal samples S n and carry out the calculations corresponding to the preceding relations (1), (2) and (3) inside a window d analysis provided by a device 12 which determines an analysis duration for each frame n as a function of the value of the "pitch" M.
  • the multiplier circuits 13, 14, 15 are coupled to the output of the calculation devices 9, 10 and 11 to apply the weighting coefficients ⁇ 1, ⁇ 2 and ⁇ 3 to the correlation rates R M and R1 + 1 2 and at the zero crossing rate-T ppz .
  • the results of the calculations carried out by the multiplier circuits 13, 14, 15 are applied to the inputs of a summing circuit 16 providing on its output k value Z.
  • the value Z of the relation (3) is applied to the input of the normalization block 7.
  • the normalization block 7 comprises a register 17 for storing the maximum number Z.
  • the output of the register 17 is coupled to a first input of a comparator circuit 18, the second input of which receives the value Z supplied by the computing device 6.
  • the input of the register 17 is connected to the output of a multiplexer circuit 19 controlled by the output of the comparator circuit 18 to apply to the input of the register 17 either the value Z as it is, or the result of the calculation provided by a multiplier circuit 20 having a first operand input connected to the output of the register 17 and a second operand entry to which the coefficient 1- ⁇ of the relation (5) described above is applied.
  • a divider circuit 21 is coupled by a first operand input at the output of the register 17 and by a second operand input at the output of the device 6 to calculate the quantity "z" equal to Z / Z MAX .
  • the quantity "z” is applied to the input of the final decision device 8 which includes a device 22 for calculating the scores, feedback of the states and elimination of the prohibited states coupled to a memory 23 of the starting scores SDi, at a memory 24 of the arrival scores SAi and a memory 25 of the previous states.
  • the score calculation device 22 receives on the other hand, on a second input the threshold value Z une, on a third input the number of frames n and provides on an output the voicing decisions for each of the frames nK.

Abstract

The method consists in considering the development of the speech signal over a given number K of successive frames, by assigning to each current frame n a score for each of the possible states of development of the speech signal, as a function of the correlation coefficients of samples distributed in each frame (1, 2, 3), in determining (5) within each current frame the state of development of the speech signal having the maximum score, in order to recover from this state the most probable state of the frame n-K, by successively passing through the maximum-score states of each preceding frame. Application: low bit rate vocoders. <IMAGE>

Description

La présente invention concerne un procédé et un dispositif de décision de voisement pour vocodeur à très faible débit.The present invention relates to a voicing decision method and device for a very low bit rate vocoder.

Dans les vocodeurs à très faible débit de 1200 bits/seconde et moins, le signal de parole est segmente en trames de durées constantes de 10 à 30 millisecondes de façon à déterminer à l'intérieur de celles-ci la périodicité encore designée par "Pitch" dans le langage anglo-saxon, du signal de parole. Ces trames sont positionnées arbitrairement dans le signal de parole et une seule valeur de voisement est fournie pour chaque trame. Comme les trames sont regroupées en blocs de 2, 6 ou 8 trames par exemple et pour que le débit alloue au voisement soit réduit, toutes les combinaisons de voisement possibles ne sont généralement pas autorisées. Il est généralement considéré en effet comme improbable qu'il puisse exister une ou deux trames voisées isolées au milieu d'un paquet de trames non voisées, ou l'inverse. Ceci conduit dans les réalisations habituelles à mettre en oeuvre un processus de décision de voisement qui fonctionne en deux passes, une première passe suivant laquelle une première décision de voisement locale est prise au niveau de chaque trame, celle-ci résultant de l'examen des valeurs de différents paramètres du signal de parole et une deuxième passe pour corriger les décisions prises lors de la première passe et supprimer dans les parties voisées les petits paquets de trames non voisées et vice versa. Naturellement le fonctionnement des dispositifs correspondants repose sur une grande part d'heuristique (basée sur des expérimentations, des apprentissages, etc...) qui est la plupart du temps satisfaisant dans des conditions peu sévères mais qui se dégrade très rapidement des lors que le signal de parole est perturbe par exemple par du bruit.In vocoders with very low bit rate of 1200 bits / second and less, the speech signal is segmented into frames of constant durations from 10 to 30 milliseconds so as to determine within them the periodicity still designated by "Pitch" "in Anglo-Saxon language, of the speech signal. These frames are arbitrarily positioned in the speech signal and only one voicing value is provided for each frame. As the frames are grouped in blocks of 2, 6 or 8 frames for example and so that the bit rate allocated to voicing is reduced, all possible voicing combinations are generally not authorized. It is generally considered in fact improbable that there may exist one or two isolated voiced frames in the middle of a packet of unvoiced frames, or vice versa. This leads in the usual embodiments to implementing a voicing decision process which operates in two passes, a first pass according to which a first local voicing decision is taken at the level of each frame, the latter resulting from the examination of the values of different parameters of the speech signal and a second pass to correct the decisions made during the first pass and delete in the voiced parts the small packets of unvoiced frames and vice versa. Naturally, the operation of the corresponding devices is based on a large part of heuristics (based on experiments, learning, etc.) which is most of the time satisfactory under mild conditions but which degrades very quickly as soon as the speech signal is disturbed for example by noise.

Le but de l'invention est de pallier les inconvénients précités.The object of the invention is to overcome the aforementioned drawbacks.

A cet effet, l'invention a pour objet un procédé de décision de voisement pour vocodeur à très faible débit suivant lequel le signal de parole est échantillonné et segmente en trames de durée constante caractérisé en ce qu'il consiste à considérer l'évolution du signal de parole sur un nombre K déterminé de trames successives en affectant à chaque trame courante n un score à chacun des états possibles d'évolution du signal de parole en fonction des taux de corrélation d'échantillons répartis dans chaque trame, à déterminer dans chaque trame courante l'état d'évolution du signal de parole qui a le score maximal pour remonter à partir de cet état à l'état le plus probable de la trame n-K en passant successivement par les états de score maximal de chaque trame précédente.To this end, the subject of the invention is a voicing decision method for a very low bit rate vocoder according to which the speech signal is sampled and segmented into frames of constant duration, characterized in that it consists in considering the evolution of the speech signal on a determined number K of successive frames by assigning to each current frame n a score for each of the possible states of evolution of the speech signal as a function of the correlation rates of samples distributed in each frame, to be determined in each current frame state of evolution of the speech signal which has the maximum score to go up from this state to the most probable state of the frame nK passing successively through the states of maximum score of each previous frame.

D'autres caractéristiques et avantages de l'invention apparaîtront ci-après à l'aide de la description qui suit faite en regard des dessins annexes qui représentent :

  • La figure 1 les différentes étapes du procédé selon l'invention mises sous la forme d'un organigramme.
  • La figure 2 un diagramme d'états pour montrer le mécanisme des transitions mises en oeuvre dans le procédé selon l'invention permettant d'effectuer des décisions de voisement avec un maximum de vraisemblance.
  • La figure 3 un exemple de fonctionnement du mécanisme d'état représenté à la figure 2 sur cinq trames successives.
  • La figure 4 un graphe montrant comment une décision de voisement peut être prise en compte par un cheminement des états sur cinq trames successives.
  • La figure 5 un mode de réalisation d'un dispositif pour la mise en oeuvre du procédé selon l'invention.
Other characteristics and advantages of the invention will appear below with the aid of the description which follows given with reference to the annexed drawings which represent:
  • Figure 1 the different steps of the method according to the invention put in the form of a flowchart.
  • FIG. 2 a state diagram to show the mechanism of the transitions implemented in the method according to the invention making it possible to make voicing decisions with maximum likelihood.
  • Figure 3 an example of operation of the state mechanism shown in Figure 2 on five successive frames.
  • FIG. 4 is a graph showing how a voicing decision can be taken into account by a routing of the states over five successive frames.
  • Figure 5 an embodiment of a device for implementing the method according to the invention.

Le procédé selon l'invention qui est représenté schématiquement par les blocs 1 à 5 sur la figure 1 effectue une décision de voisement sur des plages de signal de parole de durée multiple du "pitch". Cette durée est calculée entre deux valeurs extrêmes predéterminées, qui sont une valeur minimale pour prendre en compte suffisamment de signal et une valeur maximale pour à la fois limiter la charge de calcul et tenir compte de la vitesse de variation naturelle des caractéristiques de la parole. Le traitement commence par le calcul de trois paramètres qui sont un taux de corrélation à long terme note RM, un taux de corrélation à l'ordre 1 note R₁ et un taux de passage à 0 note Tppz. Ces calculs sont figurés sur les blocs 1, 2 et 3 de la figure 1.The method according to the invention which is represented diagrammatically by blocks 1 to 5 in FIG. 1 performs a voicing decision on speech signal ranges of duration multiple of the "pitch". This duration is calculated between two predetermined extreme values, which are a minimum value to take into account sufficient signal and a maximum value to both limit the computational load and take into account the speed of natural variation of the characteristics of speech. The treatment begins with the calculation of three parameters which are a long-term correlation rate note R M , a correlation rate at order 1 note R₁ and a rate of transition to 0 note T ppz . These calculations are shown in blocks 1, 2 and 3 in Figure 1.

Le taux de corrélation à long terme RM est calculé suivant l'expression

Figure imgb0001

dans laquelle M représenté une valeur de "pitch" en nombre d'échantillons, Sn et Sn-m sont des amplitudes d'échantillons de signal, N désigne le nombre d'échantillons analyses, K est une constante et Δ représente une fraction de M. Ce calcul permet de fournir la vraie valeur du "pitch" lorsque le taux de corrélation qui est obtenu présente une valeur maximale. Pour un son parfaitement voisé, RM est égal à 1, tandis qu'il est pratiquement nul pour un son aléatoire (non voisé). La constante K₁ évite les divisions par zéro et fournit une valeur très faible de RM dans les silences de parole où la puissance est très faible.The long-term correlation rate R M is calculated according to the expression
Figure imgb0001

in which M represents a value of "pitch" in number of samples, S n and S nm are amplitudes of signal samples, N denotes the number of samples analyzed, K is a constant and Δ represents a fraction of M This calculation makes it possible to provide the true value of the "pitch" when the correlation rate which is obtained has a maximum value. For a perfectly voiced sound, R M is equal to 1, while it is practically zero for a random sound (unvoiced). The constant K₁ avoids divisions by zero and provides a very low value of R M in speech silences where the power is very low.

Le taux de corrélation à l'ordre 1, R₁ est calculé suivant l'expression

Figure imgb0002

dans laquelle Sn et Sn-1 représentent comme précédemment les amplitudes de N échantillons et K₂ est une constante.The correlation rate at order 1, R₁ is calculated according to the expression
Figure imgb0002

in which S n and S n-1 represent as before the amplitudes of N samples and K₂ is a constant.

Pour un son voisé, R₁ est très voisin de 1 et il se rapproche de -1 pour un son non voisé. La constante K₂ permet de donner à R₁ une valeur pratiquement nulle durant les silences.For a voiced sound, R₁ is very close to 1 and it approaches -1 for an unvoiced sound. The constant K₂ makes it possible to give to R₁ a value practically zero during the rests.

Le taux de passage par zéro, Tppz fournit le rapport entre le nombre de changements de signe de chaque échantillon Sn, et N/2 ce taux évolue entre une valeur presque nulle pour un son voisé et une valeur proche de 1 pour un son non voisé.The rate of passage through zero, T ppz provides the ratio between the number of sign changes of each sample S n , and N / 2 this rate varies between a value almost zero for a voiced sound and a value close to 1 for a sound not seen.

Le traitement continue, de la façon figurée par le bloc 4 sur la figure 1 par une normalisation des paramètres RN, R₁ et Tppz déterminés précédemment. Cette normalisation a pour effet de fixer les valeurs des paramètres RN, R₁ et Tppz entre les deux valeurs 0 et 1, la valeur 0 correspondant au son parfaitement non voisé et la valeur 1 correspondant au son parfaitement voisé. Les valeurs normalisées obtenues sont ensuite pondérées par des coefficients pondérateurs α₁, α₂ et α₃ pour former une quantité Z définie par la relation

Figure imgb0003
The processing continues, as shown by block 4 in FIG. 1 by a normalization of the parameters R N , R₁ and T ppz determined previously. This normalization has the effect of fixing the values of the parameters R N , R₁ and T ppz between the two values 0 and 1, the value 0 corresponding to the perfectly unvoiced sound and the value 1 corresponding to the perfectly voiced sound. The normalized values obtained are then weighted by weighting coefficients α₁, α₂ and α₃ to form a quantity Z defined by the relation
Figure imgb0003

En prenant soin de choisir les valeurs des coefficients pondérateurs telle que la relation α₁ + α₂ + α₃ = 1 soit vérifiée, Z prend alors la valeur 1 pour les sons parfaitement voisés et la valeur 0 pour les sons parfaitement non voisés. Les paramètres α₁, α₂ et α₃ peuvent par exemple être déterminés comme suit α₁ = 0,45, α₂ = 0,35 et α₃ = 0,2 mais leurs valeurs optimales ne peuvent être réellement trouvées que par un ajustement expérimental des valeurs des coefficients α₁ en fonction notamment des filtrages sur les échantillons de signal Sn.Taking care to choose the values of the weighting coefficients such that the relation α₁ + α₂ + α₃ = 1 is verified, Z then takes the value 1 for perfectly voiced sounds and the value 0 for perfectly unvoiced sounds. The parameters α₁, α₂ and α₃ can for example be determined as follows α₁ = 0.45, α₂ = 0.35 and α₃ = 0.2 but their optimal values can only be really found by an experimental adjustment of the values of the coefficients α₁ as a function in particular of the filterings on the signal samples S n .

L'adaptation à un niveau variable de bruit ambiant a lieu en constatant qu'ajouter du bruit aux signaux voisés a pour conséquence de diminuer les taux de corrélation RM et R₁ et augmenter le taux de passage à zéro Tppz, c'est-à-dire, de diminuer globalement la valeur maximale ZMAX possible pour Z à un instant donne. Pour cela une mise à jour d'une estimée de ZMAX est réalisée et la quantité relative "z" = Z/Z MAX

Figure imgb0004

sert alors d'indicateur brut de voisement compte tenu du bruit.The adaptation to a variable level of ambient noise takes place by noting that adding noise to the voiced signals has the consequence of reducing the correlation rates R M and R₁ and increasing the rate of passage to zero T ppz , that is to say that is, to globally decrease the maximum value Z MAX possible for Z at a given time. For this, an update of an estimate of Z MAX is carried out and the relative quantity "z" = Z / Z MAX
Figure imgb0004

then serves as a rough indicator of voicing given the noise.

La quantité ZMAX peut être estimé à chaque nouvelle valeur de Z en mettant à jour ZMAX par chaque nouvelle valeur de Z, si Z est supérieure à la valeur ZMAX ou si la nouvelle valeur de Z est inférieure à ZMAX, en calculant la quantité ZMAX suivant la relation Z MAX = (1-ε) Z MAX

Figure imgb0005

dont la décroissance est définie par une constante de temps qui est fonction de ε pour suivre l'évolution du bruit, cette constante de temps étant d'autant plus élevée que ε est petit.The quantity Z MAX can be estimated at each new value of Z by updating Z MAX with each new value of Z, if Z is greater than the value Z MAX or if the new value of Z is less than Z MAX , by calculating the quantity Z MAX according to the relation Z MAX = (1-ε) Z MAX
Figure imgb0005

whose decrease is defined by a time constant which is a function of ε to follow the evolution of the noise, this time constant being all the higher as ε is small.

La décision de voisement qui est figurée par le bloc 5 sur la figure 1 a lieu sur un critère de décision par maximum de vraisemblance, en considérant l'évolution possible du signal de parole sur plusieurs trames successives, en affectant dans chaque nouvelle trame un score à chacun des états possibles d'évolution dépendant de la valeur du nombre z obtenue de la relation (4).The voicing decision which is represented by block 5 in FIG. 1 takes place on a criterion of decision by maximum likelihood, by considering the possible evolution of the speech signal over several successive frames, by assigning in each new frame a score to each of the possible states of evolution depending on the value of the number z obtained from the relation (4).

Pour rendre compte d'un état de voisement sur une durée minimale, par exemple de trois trames consécutives, cela conduit à considérer une logique combinatoire à 6 états possibles de voisement, tels que définis dans le tableau de la figure 2, dans lequel "V" signifie "voisé " et "N" signifie "non voisé", et le graphe des transitions de la figure 3 représentant les transitions entre états possibles pour parvenir à la trame courante n à partir des états possibles de la trame précédente n-1. Il est à noter sur la figure 3 que chaque état d'une trame n est précédé d'un ou de deux états dans la trame n-1 précédente. Ainsi dans la trame n l'état NNV est précédé de l'état NNN, l'état NVV est précédé de l'état NNV, l'état VVV est précédé soit de l'état NVV soit de l'état VVV, l'état NNN est précédé soit de l'état NNN lui-même soit de l'état VNN, l'état VNN est précédé de l'état VVN et l'état VVN est précédé de l'état VVV.To account for a voicing state over a minimum duration, for example of three consecutive frames, this leads to consider a combinational logic with 6 possible voicing states, as defined in the table in FIG. 2, in which "V "means" voiced "and" N "means" unvoiced ", and the graph of the transitions in FIG. 3 representing the transitions between possible states to reach the current frame n from the possible states of the previous frame n-1. It should be noted in FIG. 3 that each state of a frame n is preceded by one or two states in the previous frame n-1. Thus in frame n the NNV state is preceded by the NNN state, the NVV state is preceded by the NNV state, the VVV state is preceded either by the NVV state or by the VVV state, the NNN state is preceded either by the NNN state itself or by the VNN state, the VNN state is preceded by the VVN state and the VVN state is preceded by the VVV state.

Naturellement, ce type de mécanisme peut très bien être adapté à des durées différentes d'où dépendront dans chaque cas le nombre d'états à considérer.Naturally, this type of mechanism can very well be adapted to different durations from which the number of states to be considered will depend in each case.

A chacun des états d'arrivée possibles à la trame n est affecté un score. Pour chacun d'eux, le score retenu est le plus grand possible parmi ceux obtenus en additionnant ou en soustrayant, suivant les signes indiqués sur les flèches représentant les transitions entre états sur la figure 3, la valeur de z calculée par la relation (4) précédente à laquelle il est éventuellement retranchée une valeur de seuil prédéterminée Z₀ comprise entre 0 et 1. Pour tenir compte du fait que certains états de départ deviennent interdits du fait que leur valeur de score devient infinie, les états d'arrivée correspondant sont également interdits.Each of the possible arrival states in the frame is assigned a score. For each of them, the score retained is the largest possible among those obtained by adding or subtracting, according to the signs indicated on the arrows representing the transitions between states in FIG. 3, the value of z calculated by the relation (4 ) previous to which it is optionally subtracted a predetermined threshold value Z₀ between 0 and 1. To take into account the fact that certain starting states become prohibited because their score value becomes infinite, the corresponding ending states are also prohibited.

Par exemple, le score SA₂ de l'état d'arrivée 2 (VVV) sur la figure 3 est déterminé par l'une des relations :
   - SA₂ = MAX ((SD₁ +Z-Z₀); SD₂+(Z-Z₀)
si les états de départ SD₁ et SD₂ sont tous deux autorisés.
   - SA₂ = SD₁ + (Z-Z₀) si l'état de départ 2 est interdit.
   - SA₂ = SD₂ + (Z-Z₀) si l'état de départ 1 est interdit
où SA₂ = - Infini si les états de départ 1 et 2 sont tous les deux interdits. Dans ce dernier cas l'état 2 est interdit comme état de départ à la trame suivante.
For example, the score SA₂ of the arrival state 2 (VVV) in FIG. 3 is determined by one of the relationships:
- SA₂ = MAX ((SD₁ + Z-Z₀); SD₂ + (Z-Z₀)
if the starting states SD₁ and SD₂ are both authorized.
- SA₂ = SD₁ + (Z-Z₀) if the start state 2 is prohibited.
- SA₂ = SD₂ + (Z-Z₀) if starting state 1 is prohibited
where SA₂ = - Infinite if the starting states 1 and 2 are both prohibited. In the latter case, state 2 is prohibited as the starting state for the next frame.

Naturellement à chaque nouvelle trame le procédé mémorise les scores d'arrivée qui servent ensuite de scores de départ pour la trame suivante et le tableau des états précédents est également mémorisé.Naturally with each new frame the method stores the arrival scores which are then used as starting scores for the next frame and the table of the previous states is also stored.

La décision finale a lieu sur toutes les trames avec un certain retard c'est-à-dire que la décision de voisement à l'instant d'arrivée de la trame n sera celle de la trame n-K de la façon représentée par l'organigramme de la figure 4. Le procédé consiste à rechercher parmi les six états d'arrivée celui dont le score est le plus élevé, puis il remonte K moins une fois de suite de l'état auquel il est parvenu à la trame n-i (i = 0, 1, ..., K-1) à l'état précédent qui est mémorisé pour cette trame. Dans l'exemple de la figure 4 qui représenté une situation avec un retard de cinq trames, à la trame n l'état 1 est supposé avoir le meilleur score. Du fait que cet état a, suivant le diagramme des transitions de la figure 3, comme état précédent l'état 0 à la trame n-1, le procédé remonte à celui-ci et continue de façon similaire jusqu'à la trame n-5 suivant les traits gras continus de la figure 4. L'état auquel le procédé remonte ainsi est l'état VVN qui correspond à la trame n-5 non voisée de l'état 5. Cependant le procédé ne vaut que si la contrainte de trois trames successives de même état de voisement est respectée ce qui n'est pas toujours le cas si le procédé s'arrête au stade précédent. En effet étant donné que la trame n-5 correspond à l'état 5, la trame n-4 ne peut être dans ce cas que dans l'état 4, seul état auquel il est possible de parvenir d'après la figure 3 en partant de l'état 5, la remontée dans les états lors de la prochaine trame devant aboutir obligatoirement à l'état 5 dans la trame n-4. La suite du traitement consiste alors pour tous les états possibles à la trame n à éliminer les états (ici les états 0, 3, 4 et 5) à partir desquels il n'est pas possible de remonter à l'état 5, dans la trame n-4 en positionnant leurs scores à l'infini. Dans l'exemple de la figure 4 l'état 1 n'est bien entendu par éliminé, car c'est à partir de lui qu'à été amorcée la remontée dans les états et l'état 2 est conserve car le procédé peut remonter à partir de lui à l'état 5 dans la trame n-4 (traits gras tiretés).The final decision takes place on all the frames with a certain delay, that is to say that the voicing decision at the time of arrival of the frame n will be that of the frame nK in the manner represented by the flowchart. of FIG. 4. The method consists in searching among the six arrival states for the one with the highest score, then it goes back K less once in a row from the state it reached the frame ni (i = 0, 1, ..., K-1) in the previous state which is memorized for this frame. In the example of FIG. 4 which represents a situation with a delay of five frames, at frame n state 1 is assumed to have the best score. Because this state has, according to the diagram of the transitions of FIG. 3, as state preceding the state 0 at frame n-1, the method goes back to this one and continues in a similar way until frame n- 5 along the solid bold lines in FIG. 4. The state to which the method thus goes back is the state VVN which corresponds to the n-5 frame not seen in state 5. However, the method is only valid if the constraint of three successive frames of the same voicing state are respected, which is not always the case if the process stops at the previous stage. In fact, since the frame n-5 corresponds to state 5, the frame n-4 can in this case only be in state 4, the only state which it is possible to achieve from FIG. 3 in starting from state 5, the ascent in the states during the next frame must necessarily lead to state 5 in frame n-4. The rest of the processing then consists, for all the possible states in frame n, of eliminating the states (here states 0, 3, 4 and 5) from which it is not possible to go back to state 5, in the frame n-4 by positioning their scores at infinity. In the example of figure 4 state 1 is of course not eliminated, because it is from it that the ascent was started in the states and state 2 is preserved because the process can go back from it to the state 5 in the frame n-4 (bold dashed lines).

Si dans un autre exemple, la remontée initiale aurait conduit à l'état 3 (trames n-5), sachant que l'état 3 ne peut être suivi que des états 0 ou 3 (trame n-4), tous les états dans la trame n qui ne remontent pas aux états 0 ou 3 dans la trame n-4 auraient été éliminés. Ce procédé d'élimination d'états a entre autres avantages celui de fournir en sortie un train de valeurs de voisement satisfaisant systématiquement la contrainte (absence d'îlot de voisement/non voisement isoles). Si côté réception, cette contrainte n'est pas vérifiée, cela signifie qu'il y a eu une erreur de transmission ce qui permet de prendre des mesures curatives par exemple, en positionnant à "voisé" l'indicateur de voisement dans la zone incriminée.If in another example, the initial ascent would have led to state 3 (frames n-5), knowing that state 3 can only be followed by states 0 or 3 (frame n-4), all the states in frame n which does not go back to states 0 or 3 in frame n-4 would have been eliminated. This method of eliminating states has, among other advantages, that of outputting a stream of voicing values systematically satisfying the constraint (absence of voicing island / non-voicing isolated). If on the reception side, this constraint is not verified, this means that there was a transmission error which allows curative measures to be taken, for example, by positioning the voicing indicator in the incriminated area at "voiced" .

Un dispositif pour la mise en oeuvre du procédé selon l'invention est représenté à la figure 5. Ce dispositif comporte représentés respectivement à l'intérieur de lignes fermées en pointillés un dispositif 6 de calcul du paramètre Z, un dispositif 7 de normalisation, un dispositif 8 de décision finale. Le dispositif de calcul du paramètre Z comporte un dispositif 9 de calcul d'autocorrélation à long terme de la valeur RM, un dispositif 10 de corrélation à l'ordre 1 du coefficient R₁ et un dispositif 11 de calcul de taux de passage à zéro Tppz. Les dispositifs de calcul 9, 10 et 11 reçoivent simultanément chacun sur une première entrée les échantillons de signal Sn et effectuent les calculs correspondant aux relations (1), (2) et (3) précédentes à l'intérieur d'une fenêtre d'analyse fourni par un dispositif 12 qui détermine une durée d'analyse pour chaque trame n en fonction de la valeur du "pitch" M. Les circuits multiplieurs 13, 14, 15 sont couplés à la sortie des dispositifs de calcul 9, 10 et 11 pour appliquer les coefficients de pondération α₁, α₂ et α₃ aux taux de corrélation RM et R₁ + 1 2

Figure imgb0006
et au taux de passage à zéro-Tppz. Les résultats des calculs effectués par les circuits multiplieurs 13, 14, 15 sont appliqués sur les entrées d'un circuit sommateur 16 fournissant sur sa sortie k valeur Z. La valeur Z de la relation (3) est appliquée à l'entrée du bloc de normalisation 7. Le bloc de normalisation 7 comporte un registre 17 de mémorisation du nombre Z maximum. La sortie du registre 17 est couplée à une première entrée d'un circuit comparateur 18 dont la deuxième entrée reçoit la valeur Z fournie par le dispositif de calcul 6. L'entrée du registre 17 est reliée à la sortie d'un circuit multiplexeur 19 commandé par la sortie du circuit comparateur 18 pour appliquer à l'entrée du registre 17 soit la valeur Z telle quelle, soit le résultat du calcul fourni par un circuit multiplieur 20 possédant une première entrée d'opérande reliée à la sortie du registre 17 et une deuxième entrée d'opérande sur laquelle est appliquée le coefficient 1-ε de la relation (5) décrite précédemment. Un circuit diviseur 21 est couplé par une première entrée d'opérande à la sortie du registre 17 et par une deuxième entrée d'opérande à la sortie du dispositif 6 pour calculer la quantité "z" égale à Z/ZMAX. La quantité "z" est appliquée à l'entrée du dispositif de décision finale 8 qui comporte un dispositif de calcul 22 des scores, de remontées des états et d'éliminations des états interdits couplé à une mémoire 23 des scores de départ SDi, à une mémoire 24 des scores d'arrivée SAi et à une mémoire 25 des états précédents. Le dispositif de calcul des scores 22 reçoit d'autre part, sur une deuxième entrée la valeur de seuil Z₀, sur une troisième entrée le numéro de trames n et fournit sur une sortie les décisions de voisement pour chacune des trames n-K.A device for implementing the method according to the invention is shown in FIG. 5. This device comprises represented respectively inside closed dotted lines a device 6 for calculating the parameter Z, a device 7 for normalization, a device 8 for final decision. The device for calculating the parameter Z comprises a device 9 for calculating long-term autocorrelation of the value R M , a device 10 for correlation to the order 1 of the coefficient R₁ and a device 11 for calculating the zero crossing rate T ppz . The calculation devices 9, 10 and 11 each receive simultaneously on a first input the signal samples S n and carry out the calculations corresponding to the preceding relations (1), (2) and (3) inside a window d analysis provided by a device 12 which determines an analysis duration for each frame n as a function of the value of the "pitch" M. The multiplier circuits 13, 14, 15 are coupled to the output of the calculation devices 9, 10 and 11 to apply the weighting coefficients α₁, α₂ and α₃ to the correlation rates R M and R₁ + 1 2
Figure imgb0006
and at the zero crossing rate-T ppz . The results of the calculations carried out by the multiplier circuits 13, 14, 15 are applied to the inputs of a summing circuit 16 providing on its output k value Z. The value Z of the relation (3) is applied to the input of the normalization block 7. The normalization block 7 comprises a register 17 for storing the maximum number Z. The output of the register 17 is coupled to a first input of a comparator circuit 18, the second input of which receives the value Z supplied by the computing device 6. The input of the register 17 is connected to the output of a multiplexer circuit 19 controlled by the output of the comparator circuit 18 to apply to the input of the register 17 either the value Z as it is, or the result of the calculation provided by a multiplier circuit 20 having a first operand input connected to the output of the register 17 and a second operand entry to which the coefficient 1-ε of the relation (5) described above is applied. A divider circuit 21 is coupled by a first operand input at the output of the register 17 and by a second operand input at the output of the device 6 to calculate the quantity "z" equal to Z / Z MAX . The quantity "z" is applied to the input of the final decision device 8 which includes a device 22 for calculating the scores, feedback of the states and elimination of the prohibited states coupled to a memory 23 of the starting scores SDi, at a memory 24 of the arrival scores SAi and a memory 25 of the previous states. The score calculation device 22 receives on the other hand, on a second input the threshold value Z une, on a third input the number of frames n and provides on an output the voicing decisions for each of the frames nK.

Naturellement, la mise en oeuvre du procédé selon l'invention qui vient d'être décrite n'est pas unique et il va de soi que d'autres modes de réalisation mettant en oeuvre des microprocesseurs de traitement du signal notamment sont tout aussi envisageables, leur programmation étant à la portée de l'homme de métier.Naturally, the implementation of the method according to the invention which has just been described is not unique and it goes without saying that other embodiments using microprocessors for signal processing in particular are just as possible, their programming being within the reach of the skilled person.

Claims (10)

Procédé de décision de voisement pour vocodeur à très faible débit suivant lequel le signal de parole est échantillonné et segmenté en trames de durée constante caractérisé en ce qu'il consiste à considérer l'évolution du signal de parole sur un nombre K déterminé de trames successives en affectant à chaque trame courante n un score à chacun des états possibles d'évolution du signal de parole en fonction des taux de corrélation d'échantillons répartis dans chaque trame (1, 2, 3), à déterminer (5) dans chaque trame courante l'état d'évolution du signal de parole qui a le score maximal pour remonter à partir de cet état à l'état le plus probable de la trame n-K en passant successivement par les états de score maximal de chaque trame précédente.Voting decision method for a very low bit rate vocoder according to which the speech signal is sampled and segmented into frames of constant duration, characterized in that it consists in considering the evolution of the speech signal over a determined number K of successive frames by assigning to each current frame n a score for each of the possible states of evolution of the speech signal as a function of the correlation rates of samples distributed in each frame (1, 2, 3), to be determined (5) in each frame current the state of evolution of the speech signal which has the maximum score to go up from this state to the most probable state of the frame nK passing successively through the states of maximum score of each previous frame. Procédé selon la revendication 1 caractérisé en ce qu'il consiste à calculer (1) un taux de corrélation RM à long terme pour un intervalle M égal à la valeur du "pitch" du signal de parole.Method according to Claim 1, characterized in that it consists in calculating (1) a long-term correlation rate R M for an interval M equal to the value of the pitch of the speech signal. Procédé selon les revendications 1 et 2 caractérisé en ce qu'il consiste à calculer (2) un taux de corrélation à l'ordre 1 pour déterminer la nature voisé ou non du son correspondant aux échantillons corrélés.Method according to claims 1 and 2 characterized in that it consists in calculating (2) a correlation rate at order 1 to determine the voiced or unvoiced nature of the sound corresponding to the correlated samples. Procédé selon l'une quelconque des revendications 1 à 3 caractérisé en ce qu'il consiste à déterminer (3) le taux de passages à zéro du signal de parole.Method according to any one of Claims 1 to 3, characterized in that it consists in determining (3) the rate of zero crossings of the speech signal. Procédé selon l'une quelconque des revendications 2 à 4 caractérisé en ce qu'il consiste (4) à effectuer une sommation pondérée du taux de corrélation à long terme, du taux de corrélation à l'ordre 1 et du taux de passage à zéro pour obtenir un incrément de score "z" et calculer à partir des scores possibles de chaque trame précédant une trame courante, les scores des états possibles d'arrivée.Method according to any one of Claims 2 to 4, characterized in that it consists in (4) performing a weighted summation of the long-term correlation rate, of the order 1 correlation rate and of the zero crossing rate to obtain a score increment "z" and calculate from the possible scores of each frame preceding a current frame, the scores of the possible states of arrival. Procédé selon la revendication 5 caractérisé en ce qu'il consiste à donner des valeurs de score infini aux états interdits.Method according to claim 5, characterized in that it consists in giving infinite score values to the prohibited states. Procédé selon l'une quelconque des revendications 5 et 6 caractérisé en ce que la valeur d'incrément est égale à la somme pondérée du taux de corrélation à long terme, du taux de corrélation à l'ordre 1 et du taux de passage à zéro diminuée d'une valeur de seuil prédéterminée Z₀.Method according to either of Claims 5 and 6, characterized in that the increment value is equal to the weighted sum of the long-term correlation rate, of the correlation rate at order 1 and the zero crossing rate minus a predetermined threshold value Z₀. Dispositif pour la mise en oeuvre du procédé selon l'une quelconque des revendications 1 à 7 caractérisé en ce qu'il comprend un dispositif (6) de calcul de valeur d'incrément de score, couplé à un dispositif de décision finale (8) comportant un dispositif de calcul des scores, de remontée des états et d'élimination des états interdits par l'intermédiaire d'un dispositif de normalisation (7).Device for implementing the method according to any one of Claims 1 to 7, characterized in that it comprises a device (6) for calculating the score increment value, coupled to a final decision device (8) comprising a device for calculating the scores, feedback of the states and elimination of the prohibited states by means of a standardization device (7). Dispositif selon la revendication 8 caractérisé en ce que le dispositif (6) de calcul de valeur d'incrément de score comporte un dispositif de calcul de corrélation à long terme (9), un dispositif de calcul de corrélation à l'ordre 1 (10) et un dispositif (11) de calcul de taux de passage à zéro, couplés à un circuit sommateur (16).Device according to Claim 8, characterized in that the device (6) for calculating the score increment value comprises a device for calculating the long-term correlation (9), a device for calculating the correlation at order 1 (10 ) and a device (11) for calculating the zero crossing rate, coupled to a summing circuit (16). Dispositif selon la revendication 9 caractérisé en ce que le dispositif (6) de calcul de valeur de score est formé par un processeur de traitement du signal.Device according to Claim 9, characterized in that the device (6) for calculating the score value is formed by a signal processing processor.
EP92403087A 1991-11-22 1992-11-17 Method and arrangement for voiced-unvoiced decision applied in a very low rate vocoder Withdrawn EP0543719A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9114411A FR2684226B1 (en) 1991-11-22 1991-11-22 ROUTE DECISION METHOD AND DEVICE FOR VERY LOW FLOW VOCODER.
FR9114411 1991-11-22

Publications (1)

Publication Number Publication Date
EP0543719A1 true EP0543719A1 (en) 1993-05-26

Family

ID=9419216

Family Applications (1)

Application Number Title Priority Date Filing Date
EP92403087A Withdrawn EP0543719A1 (en) 1991-11-22 1992-11-17 Method and arrangement for voiced-unvoiced decision applied in a very low rate vocoder

Country Status (3)

Country Link
EP (1) EP0543719A1 (en)
CA (1) CA2083469A1 (en)
FR (1) FR2684226B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002047068A2 (en) * 2000-12-08 2002-06-13 Qualcomm Incorporated Method and apparatus for robust speech classification
CN106128480A (en) * 2016-06-21 2016-11-16 安徽师范大学 A kind of method that noisy speech is carried out voice activity detection

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2316682A1 (en) * 1975-06-18 1977-01-28 Nippon Telegraph & Telephone PROCEDURE FOR JUDGING THE VOISEE AND DEVOISEE CONDITIONS OF A CONVERSATION SIGNAL
US4589131A (en) * 1981-09-24 1986-05-13 Gretag Aktiengesellschaft Voiced/unvoiced decision using sequential decisions

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2316682A1 (en) * 1975-06-18 1977-01-28 Nippon Telegraph & Telephone PROCEDURE FOR JUDGING THE VOISEE AND DEVOISEE CONDITIONS OF A CONVERSATION SIGNAL
US4589131A (en) * 1981-09-24 1986-05-13 Gretag Aktiengesellschaft Voiced/unvoiced decision using sequential decisions

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EUROSPEECH 89, EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY vol. 2, Septembre 1989, PARIS FRANCE pages 264 - 267 EL-SHEIKH T. ;EL-GHONEMY M. ;MANSOUR O. 'Toward a phoneme based word recognition system' *
IEEE TRANSACTIONS ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING. vol. 28, no. 4, Août 1980, NEW YORK US pages 398 - 407 CHONG K. ; HYEONG H. 'Voiced Unvoiced Silence discrimination of speech by delta modulation' *
IEEE TRANSACTIONS ON AUDIO AND ELECTROACOUSTICS. vol. 21, no. 3, Juin 1973, NEW YORK US pages 154 - 160 MARKEL '* Application of a digital inverse filter for automatic formant and Fo Analysis' *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002047068A2 (en) * 2000-12-08 2002-06-13 Qualcomm Incorporated Method and apparatus for robust speech classification
WO2002047068A3 (en) * 2000-12-08 2002-08-22 Qualcomm Inc Method and apparatus for robust speech classification
CN100350453C (en) * 2000-12-08 2007-11-21 高通股份有限公司 Method and apparatus for robust speech classification
KR100895589B1 (en) * 2000-12-08 2009-05-06 퀄컴 인코포레이티드 Method and apparatus for robust speech classification
KR100908219B1 (en) * 2000-12-08 2009-07-20 퀄컴 인코포레이티드 Method and apparatus for robust speech classification
CN106128480A (en) * 2016-06-21 2016-11-16 安徽师范大学 A kind of method that noisy speech is carried out voice activity detection

Also Published As

Publication number Publication date
FR2684226A1 (en) 1993-05-28
FR2684226B1 (en) 1993-12-24
CA2083469A1 (en) 1993-05-23

Similar Documents

Publication Publication Date Title
EP0806760B1 (en) Method and device for filtering a speech signal by equalisation, implemented by a statistical signal model
EP1016072B1 (en) Method and apparatus for suppressing noise in a digital speech signal
EP0127718B1 (en) Process for activity detection in a voice transmission system
EP0768770B1 (en) Method and arrangement for the creation of comfort noise in a digital transmission system
FR2520913A1 (en) METHOD AND APPARATUS FOR RECOGNIZING KEYWORDS IN WORDS
FR2520912A1 (en) CONTINUOUS SPEECH RECOGNITION METHOD AND APPARATUS
FR2520911A1 (en) ANALYSIS METHOD AND APPARATUS FOR SPEECH RECOGNITION
EP0867856A1 (en) Method and apparatus for vocal activity detection
EP0490740A1 (en) Method and apparatus for pitch period determination of the speech signal in very low bitrate vocoders
EP3078027B1 (en) Voice detection method
WO2003048711A2 (en) Speech detection system in an audio signal in noisy surrounding
EP1267325A1 (en) Process for voice activity detection in a signal, and speech signal coder comprising a device for carrying out the process
EP0685833B1 (en) Method for speech coding using linear prediction
WO2008047051A2 (en) Attenuation of overvoicing, in particular for generating an excitation at a decoder, in the absence of information
FR2768544A1 (en) Voice activity detection system
EP0543719A1 (en) Method and arrangement for voiced-unvoiced decision applied in a very low rate vocoder
EP0052041B1 (en) Method and device for pitch period determination
EP1021805B1 (en) Method and apparatus for conditioning a digital speech signal
EP3627510A1 (en) Filtering of an audio signal acquired by a voice recognition system
EP0573358B1 (en) Variable speed voice synthesizer method and apparatus
EP2589045B1 (en) Adaptive linear predictive coding/decoding
EP0469997B1 (en) Coding method and speech coder using linear prediction analysis
EP0734013B1 (en) Determination of an excitation vector in a CELP coder
EP0347307A2 (en) Coding method and linear prediction speech coder
EP0596785A1 (en) Method for the discrimination of speech in presence of ambient noise and low bit-rate vocoder to implement the method

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE ES GB IT

17P Request for examination filed

Effective date: 19931005

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: THOMSON-CSF

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 19950601