FR2684226A1 - Procede et dispositif de decision de voisement pour vocodeur a tres faible debit. - Google Patents

Procede et dispositif de decision de voisement pour vocodeur a tres faible debit. Download PDF

Info

Publication number
FR2684226A1
FR2684226A1 FR9114411A FR9114411A FR2684226A1 FR 2684226 A1 FR2684226 A1 FR 2684226A1 FR 9114411 A FR9114411 A FR 9114411A FR 9114411 A FR9114411 A FR 9114411A FR 2684226 A1 FR2684226 A1 FR 2684226A1
Authority
FR
France
Prior art keywords
frame
state
score
states
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9114411A
Other languages
English (en)
Other versions
FR2684226B1 (fr
Inventor
Laurent Pierre-Andre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Priority to FR9114411A priority Critical patent/FR2684226B1/fr
Priority to EP92403087A priority patent/EP0543719A1/fr
Priority to CA002083469A priority patent/CA2083469A1/fr
Publication of FR2684226A1 publication Critical patent/FR2684226A1/fr
Application granted granted Critical
Publication of FR2684226B1 publication Critical patent/FR2684226B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Le procédé consiste à considérer l'évolution du signal de parole sur un nombre K déterminé de trames successives en affectant à chaque trame courante n un score à chacun des états possibles d'évolution du signal de parole en fonction des taux de corrélation d'échantillons répartis dans chaque trame (1, 2, 3), à déterminer (5) dans chaque trame courante l'état d'évolution du signal de parole qui a le score maximal pour remonter à partir de cet état à l'état le plus probable de la trame n-K en passant successivement par les états de score maximal de chaque trame précédente. Application: Vocodeurs à faibles débits.

Description

Procédé et dispositif de décision de voisement pour vocodeur à très faible
débit La présente invention concerne un procédé et un dispositif de décision de voisement pour vocodeur à très faible débit. Dans les vocodeurs à très faible débit de 1200 bits/seconde et moins, le signal de parole est segmenté en trames de durées constantes de 10 à 30 millisecondes de façon à déterminer à l'intérieur de celles-ci la périodicité encore désignée par "Pitch" dans le langage anglo-saxon, du signal de parole Ces trames sont positionnées arbitrairement dans le signal de parole et une seule valeur de voisement est fournie pour chaque trame Comme les trames sont regroupées en blocs de 2, 6 ou 8 trames par exemple et pour que le débit alloué au voisement soit réduit, toutes les combinaisons de voisement possibles ne sont généralement pas autorisées Il est généralement considéré en effet comme improbable qu'il puisse exister une ou deux trames voisées isolées au milieu d'un
paquet de trames non voisées, ou l'inverse Ceci conduit dans les réali-
sations habituelles à mettre en oeuvre un processus de décision de voise-
ment qui fonctionne en deux passes, une première passe suivant laquelle une première décision de voisement locale est prise au niveau de chaque trame, celle-ci résultant de l'examen des valeurs de différents paramètres du signal de parole et une deuxième passe pour corriger les décisions prises lors de la première passe et supprimer dans les parties voisées les petits paquets de trames non voisées et vice versa Naturellement le fonctionnement des dispositifs correspondants repose sur une grande part d'heuristique (basée sur des expérimentations, des apprentissages, etc) qui est la plupart du temps satisfaisant dans des conditions peu
sévères mais qui se dégrade très rapidement dès lors que le signal de pa-
role est perturbé par exemple par du bruit.
Le but de l'invention est de pallier les inconvénients précités.
A cet effet, l'invention a pour objet un procédé de décision de voi-
sement pour vocodeur à très faible débit suivant lequel le signal de pa-
role est échantillonné et segmenté en trames de durée constante carac-
térisé en ce qu'il consiste à considérer l'évolution du signal de parole sur un nombre K déterminé de trames successives en affectant à chaque trame courante N un score à chacun des états possibles d'évolution du
signal de parole en fonction des taux de corrélation d'échantillons répar-
tis dans chaque trame, à déterminer dans chaque trame courante l'état d'évolution du signal de parole qui a le score maximal pour remonter à partir de cet état à l'état le plus probable de la trame n-K en passant successivement par les états de score maximal de chaque trame précédente. D'autres caractéristiques et avantages de l'invention apparaîtront
ci-après à l'aide de la description qui suit faite en regard des dessins
annexés qui représentent: La figure 1 les différentes étapes du procédé selon l'invention
mises sous la forme d'un organigramme.
La figure 2 un diagramme d'états pour montrer le mécanisme des transitions mises en oeuvre dans le procédé selon l'invention permettant
d'effectuer des décisions de voisement avec un maximum de vraisem-
blance. La figure 3 un exemple de fonctionnement du mécanisme d'état
représenté à la figure 2 sur cinq trames successives.
La figure 4 un graphe montrant comment une décision de voise-
ment peut être prise en compte par un cheminement des états sur cinq
trames successives.
La figure 5 un mode de réalisation d'un dispositif pour la mise en
oeuvre du procédé selon l'invention.
Le procédé selon l'invention qui est représenté schématiquement par les blocs 1 à 5 sur la figure 1 effectue une décision de voisement sur des plages de signal de parole de durée multiple du "pitch" Cette durée est calculée entre deux valeurs extrêmes prédéterminées, qui sont une valeur minimale pour prendre en compte suffisamment de signal et une valeur maximale pour à la fois limiter la charge de calcul et tenir compte de la vitesse de variation naturelle des caractéristiques de la parole Le traitement commence par le calcul de trois paramètres qui sont un taux de corrélation à long terme noté RM, un taux de corrélation à l'ordre 1 noté R 1 et un taux de passage à O noté Tppz Ces calculs sont figurés
sur les blocs 1, 2 et 3 de la figure 1.
Le taux de corrélation à long terme RM est calculé suivant l'expression N Y, Sn Snmj RM = MA Xm=MAM+A N N 1 ( 1 K 1 + S N 2 Sn 2 n= 1 nr= 1
dans laquelle M représente une valeur de "pitch" en nombre d'échantil-
lons, Sn et Sn m sont des amplitudes d'échantillons de signal, N désigne le nombre d'échantillons analysés, K est une constante et A représente une fraction de M Ce calcul permet de fournir la vraie valeur du "pitch"
lorsque le taux de corrélation qui est obtenu présente une valeur maxi-
male Pour un son parfaitement voisé, RM est égal à 1, tandis qu'il est pratiquement nul pour un son aléatoire (non voisé) La constante K 1 évite les divisions par zéro et fournit une valeur très faible de RM dans
les silences de parole o la puissance est très faible.
Le taux de corrélation à l'ordre 1, R 1 est calculé suivant l'expres-
sion N R 1 = n= 1 ( 2) j K 2 + N Sn 2 ú Sn-1
dans laquelle Sn et Sn-1 représentent comme précédemment les ampli-
tudes de N échantillons et K 2 est une constante.
Pour un son voisé, R 1 est très voisin de 1 et il se rapproche de -1 pour un son non voisé La constante K 2 permet de donner à R 1 une
valeur pratiquement nulle durant les silences.
Le taux de passage par zéro, Tppz fournit le rapport entre le nombre de changements de signe de chaque échantillon Sn, ce taux évolue entre une valeur presque nulle pour un son voisé et une valeur
proche de 1 pour un son non voisé.
Le traitement continue, de la façon figurée par le bloc 4 sur la figure 1 par une normalisation des paramètres RN, R 1 et Tppz déterminés précédemment Cette normalisation a pour effet de fixer les valeurs des paramètres RN, R 1 et Tppz entre les deux valeurs O et 1, la valeur O correspondant au son parfaitement non voisé et la valeur 1 correspon- dant au son parfaitement voisé Les valeurs normalisées obtenues sont ensuite pondérées par des coefficients pondérateurs Cx 1, OE 2 et OE 3 pour former une quantité Z définie par la relation Z = c, RM + ad 2 1) + OE 3 (-T Ppz) 3)
En prenant soin de choisir les valeurs des coefficients pondéra-
teurs telle que la relation al + c L 2 + c X 3 = 1 soit vérifiée, Z prend alors la valeur 1 pour les sons parfaitement voisés et la valeur O pour les sons parfaitement non voisés Les paramètres cx 1, a 2 et a 3 peuvent par exemple être déterminés comme suit al = 0,45, OE 2 = 0,35 et
a'3 = 0,2 mais leurs valeurs optimales ne peuvent être réellement trou-
vées que par un ajustement expérimental des valeurs des coefficients ai
en fonction notamment des filtrages sur les échantillons de signal Sn.
L'adaptation à un niveau variable de bruit ambiant a lieu en constatant qu'ajouter du bruit aux signaux voisés a pour conséquence de diminuer les taux de corrélation RM et R 1 et augmenter le taux de passage à zéro Tppz, c'est-à-dire, de diminuer globalement la valeur maximale ZMAX possible pour Z à un instant donné Pour cela une mise à jour d'une estimée de ZMAX est réalisée et la quantité relative z = Z/ZMAX ( 4)
sert alors d'indicateur brut de voisement compte tenu du bruit.
La quantité ZMAX peut être estimé à chaque nouvelle valeur de Z
en mettant à jour ZMAX par chaque nouvelle valeur de Z, si Z est supé-
rieure à la valeur ZMAX ou si la nouvelle valeur de Z est inférieure à ZMAX, en calculant la quantité ZMAX suivant la relation ZMAX = ( 1-e) ZMAX ( 5) dont la décroissance est définie par une constante de temps qui est fonction de e pour suivre l'évolution du bruit, cette constante de temps
étant d'autant plus élevée que ú est petit.
La décision de voisement qui est figurée par le bloc 5 sur la figure 1 a lieu sur un critère de décision par maximum de vraisemblance, en considérant l'évolution possible sur signal de parole sur plusieurs trames successives, en affectant dans chaque nouvelle trame un score à chacun des états possibles d'évolution dépendant de la valeur du nombre z obte-
nue de la relation ( 4).
Pour rendre compte d'un état de voisement sur une durée mini-
male, par exemple de trois trames consécutives, cela conduit à considé-
rer une logique combinatoire à 6 états possibles de voisement, tels que définis dans le tableau de la figure 2, dans lequel "V" signifie "voisé" et
"N" signifie "non voisé", et le graphe des transitions de la figure 3 repré-
sentant les transitions entre états possibles pour parvenir à la trame cou-
rante N à partir des états possibles de la trame précédente n-1 Il est à noter sur la figure 3 que chaque état d'une trame N est précédé d'un ou de deux états dans la trame n-1 précédente Ainsi dans la trame N l'état NNV est précédé de l'état NNN, l'état NVV est précédé de l'état NNV, l'état VVV est précédé soit de l'état NVV soit de l'état VVV, l'état NNN est précédé soit de l'état NNN lui-même soit de l'état VNN, l'état VNN
est précédé de l'état VVN et l'état VVN est précédé de l'état VVV.
Naturellement, ce type de mécanisme peut très bien être adapté à des durées différentes d'o dépendront dans chaque cas le nombre
d'états à considérer.
A chacun des états d'arrivée possibles à la trame N est affecté un score Pour chacun d'eux, le score retenu est le plus grand possible parmi ceux obtenus en additionnant ou en soustrayant suivant les signes indiqués sur les flèches représentant les transitions entre états sur la figure 3, la valeur de z calculée par la relation ( 4) précédente à laquelle il est éventuellement retranchée une valeur de seuil prédéterminée ZO comprise entre O et 1 Pour tenir compte du fait que certains états de
départ deviennent interdits du fait que leur valeur de score devient infi-
nie, les états d'arrivée correspondant sont également interdits.
Par exemple, le score SA 2 de l'état d'arrivée 2 (VVV) sur la figure 3 est déterminé par l'une des relations:
SA 2 = MAX ((SD 1 +Z-ZO); SD 2 +(Z-ZO)
si les états de départ SD 1 et SD 2 sont tous deux autorisés.
SA 2 = SD 1 + (Z-ZO) si l'état de départ 2 est interdit.
SA 2 = SD 2 + (Z-ZO) si l'état de départ 1 est interdit
o SA 2 = Infini si les états de départ 1 et 2 sont tous les deux inter-
dits Dans ce dernier cas l'état 2 est interdit comme état de départ à la
trame suivante.
Naturellement à chaque nouvelle trame le procédé mémorise les scores d'arrivée qui servent ensuite de scores de départ pour la trame
suivante et le tableau des états précédents est également mémorisé.
La décision finale a lieu sur toutes les trames avec un certain retard c'est-à-dire que la décision de voisement à l'instant d'arrivée de la
trame N sera celle de la trame n-K de la façon représentée par l'organi-
gramme de la figure 4 Le procédé consiste à rechercher parmi les six états d'arrivée celui dont le score est le plus élevé, puis il remonte K moins une fois de suite de l'état auquel il est parvenu à la trame n-i
(i = 0, 1,, K-1) à l'état précédent qui est mémorisé pour cette trame.
Dans l'exemple de la figure 4 qui représente une situation avec un retard
de cinq trames, à la trame N l'état 1 est supposé avoir le meilleur score.
Du fait que cet état a, suivant le diagramme des transitions de la figure 3, comme état précédent l'état O à la trame n-i, le procédé remonte à celui-ci et continue de façon similaire jusqu'à la trame n-5 suivant les traits gras continus de la figure 4 L'état auquel le procédé remonte ainsi
est l'état VVN qui correspond à la trame n-5 non voisée de l'état 5.
Cependant le procédé ne vaut que si la contrainte de trois trames successives de même état de voisement est respectée ce qui n'est pas toujours le cas si le procédé s'arrête au stade précédent En effet étant donné que la trame n-5 correspond à l'état 5, la trame n-4 ne peut être dans ce cas que dans l'état 4, seul état auquel il est possible de parvenir d'après la figure 3 en partant de l'état 5, la remontée dans les états lors de la prochaine trame devant aboutir obligatoirement à l'état 5 dans la trame n-4 La suite du traitement consiste alors pour tous les états possibles à la trame N à éliminer les états (ici les états 0, 3, 4 et 5) à partir desquels il n'est pas possible de remonter à l'état 5, dans la trame n-4 en positionnant leurs scores à l'infini Dans l'exemple de la figure 4 l'état 1 n'est bien entendu par éliminé, car c'est à partir de lui qu'à été amorcée la remontée dans les états et l'état 2 est conservé car le procédé peut remonter à partir de lui à l'état 5 dans la trame n-4 (traits
gras tiretés).
Si dans un autre exemple, la remontée initiale aurait conduit à l'état 3 (trames n-5), sachant que l'état 3 ne peut être suivi que des états O ou 3 (trame n-4), tous les états dans la trame N qui ne remontent pas aux états O ou 3 dans la trame n-4 auraient été éliminés Ce procédé d'élimination d'états a entre autres avantages celui de fournir en sortie un train de valeurs de voisement satisfaisant systématiquement la contrainte (absence d'îlot de voisement/non voisement isolés) Si côté réception, cette contrainte n'est pas vérifiée, cela signifie qu'il y a eu une erreur de transmission ce qui permet de prendre des mesures curatives par exemple, en positionnant à "voisé" l'indicateur de voisement dans la
zone incriminée.
Un dispositif pour la mise en oeuvre du procédé selon l'invention
est représenté à la figure 5 Ce dispositif comporte représentés respecti-
vement à l'intérieur de lignes fermées en pointillés un dispositif 6 de calcul du paramètre Z, un dispositif 7 de normalisation, un dispositif 8 de
décision finale Le dispositif de calcul du paramètre Z comporte un dis-
positif 9 de calcul d'autocorrélation à long terme de la valeur RM, un dis-
positif 10 de corrélation à l'ordre 1 du coefficient R 1 et un dispositif 11
de calcul de taux de passage à zéro du taux Tppz Les dispositifs de cal-
cul 9, 10 et 11 reçoivent simultanément chacun sur une première entrée les échantillons de signal Sn et effectuent les calculs correspondant aux relations ( 1), ( 2) et ( 3) précédentes à l'intérieur d'une fenêtre d'analyse fourni par un dispositif 12 qui détermine une durée d'analyse pour
chaque trame N en fonction de la valeur du "pitch" M Les circuits mul-
tiplieurs 13, 14, 15 sont couplés à la sortie des dispositifs de calcul 9, 10 et 11 pour appliquer lef, coeffticients de pondération x 1, x 2 et a C 3 aux M 1 + taux de corrélation RM et 2 et au taux de passage à zéro-Tppz Les résultats des calculs effectués par les circuits multiplieurs 13, 14, 15 sont appliqués sur les entrées d'un circuit sommateur 16 fournissant sur sa sortie k valeur Z La valeur Z de la relation ( 3) est appliquée à l'entrée du bloc de normalisation 7 Le bloc de normalisation 7 comporte un registre 17 de mémorisation du nombre Z maximum La sortie du registre 17 est couplée à une première entrée d'un circuit comparateur 18 dont la
deuxième entrée reçoit la valeur Z fournie par le dispositif de calcul 6.
L'entrée du registre 17 est reliée à la sortie d'un circuit multiplexeur 19 commandé par la sortie du circuit comparateur 18 pour appliquer à l'entrée du registre 17 soit la valeur Z telle quelle, soit le résultat du calcul fourni par un circuit multiplieur 20 possédant une première entrée d'opérande reliée à la sortie du registre 17 et une deuxième entrée d'opérande sur laquelle est appliquée le coefficient 1-s de la relation ( 5) décrite précédemment Un circuit diviseur 21 est couplé par une première entrée d'opérande à la sortie du registre 17 et par une deuxième entrée d'opérande à la sortie du dispositif 6 pour calculer la quantité "z" égale à Z/ZMAX La quantité "z" est appliquée à l'entrée du dispositif de décision finale 8 qui comporte un dispositif de calcul 22 des scores, de remontées des états et d'éliminations des états interdits couplé à une mémoire 23 des scores de départ S Di à une mémoire 24 des scores d'arrivée S Ai et à une mémoire 25 des états précédents Le dispositif de calcul des scores 22 reçoit d'autre part, sur une deuxième entrée la valeur de seuil Z 0, sur une troisième entrée le numéro de trames N et fournit sur une sortie les
décisions de voisement pour chacune des trames n-K.
Naturellement, la mise en oeuvre du procédé selon l'invention qui vient d'être décrite n'est pas unique et il va de soi que d'autres modes de réalisation mettant en oeuvre des microprocesseurs de traitement du signal notamment sont tout aussi envisageables, leur programmation
étant à la portée de l'homme de métier.

Claims (8)

REVENDICATIONS
1 Procédé de décision de voisement pour vocodeur à très faible débit suivant lequel le signal de parole est échantillonné et segmenté en trames de durée constante caractérisé en ce qu'il consiste à considérer l'évolution du signal de parole sur un nombre K déterminé de trames successives en affectant à chaque trame courante N un score à chacun des états possibles d'évolution du signal de parole en fonction des taux de corrélation d'échantillons répartis dans chaque trame ( 1, 2, 3), à déterminer ( 5) dans chaque trame courante l'état d'évolution du signal de parole qui a le score maximal pour remonter à partir de cet état à l'état le plus probable de la trame n-K en passant successivement par les
états de score maximal de chaque trame précédente.
2 Procédé selon la revendication 1 caractérisé en ce qu'il consiste à calculer ( 1) un taux de corrélation RM à long terme pour un intervalle
M égal à la valeur du "pitch" du signal de parole.
3 Procédé selon les revendications 1 et 2 caractérisé en ce qu'il
consiste à calculer ( 2) un taux de corrélation à l'ordre 1 pour déterminer
la nature voisé ou non du son correspondant aux échantillons corrélés.
4 Procédé selon l'une quelconque des revendications 1 à 3 carac-
térisé en ce qu'il consiste à déterminer ( 3) le taux de passages à zéro du
signal de parole.
Procédé selon l'une quelconque des revendications 2 à 4 carac-
térisé en ce qu'il consiste ( 4) à effectuer une sommation pondérée du taux de corrélation à long terme, du taux de corrélation à l'ordre 1 et du
taux de passage à zéro pour obtenir un incrément de score "z" et calcu-
ler à partir des scores possibles de chaque trame précédant une trame
courante les scores des états possibles d'arrivée.
6 Procédé selon la revendication 5 caractérisé en ce qu'il consiste
à donner des valeurs de score infini aux états interdits.
7 Procédé selon l'une quelconque des revendications 5 et 6
caractérisé en ce que la valeur d'incrément est égale à la somme pondé-
rée du taux de corrélation à long terme, du taux de corrélation du taux de corrélation à l'ordre 1 et du taux de passage à zéro diminuée d'une
valeur de seuil prédéterminée ZO.
8 Dispositif pour la mise en oeuvre du procédé selon l'une quel-
conque des revendications 1 à 7 caractérisé en ce qu'il comprend un
dispositif ( 6) de calcul de valeur d'incrément de score, couplé à un dispo- sitif de décision finale ( 8) comportant un dispositif de calcul des scores,
de remontée des états et d'élimination des états interdits par l'intermé-
diaire d'un dispositif de normalisation ( 7).
9 Dispositif selon la revendication 8 caractérisé en ce que le dispositif ( 6) de calcul de valeur d'incrément de score comporte un dispositif de calcul de corrélation à long terme ( 9), un dispositif de calcul de corrélation à l'ordre 1 ( 10) et un dispositif (I 11) de calcul de taux de
passage à zéro, couplés à un circuit sommateur ( 16).
Dispositif selon la revendication 9 caractérisé en ce que le dispositif ( 6) de calcul de valeur de score est formé par un processeur de
traitement du signal.
FR9114411A 1991-11-22 1991-11-22 Procede et dispositif de decision de voisement pour vocodeur a tres faible debit. Expired - Fee Related FR2684226B1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR9114411A FR2684226B1 (fr) 1991-11-22 1991-11-22 Procede et dispositif de decision de voisement pour vocodeur a tres faible debit.
EP92403087A EP0543719A1 (fr) 1991-11-22 1992-11-17 Procédé et dispositif de décision de voisement pour vocodeur à très faible débit
CA002083469A CA2083469A1 (fr) 1991-11-22 1992-11-20 Methode et dispositif de decisions pour vocodeur a tres faible debit binaire

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9114411A FR2684226B1 (fr) 1991-11-22 1991-11-22 Procede et dispositif de decision de voisement pour vocodeur a tres faible debit.

Publications (2)

Publication Number Publication Date
FR2684226A1 true FR2684226A1 (fr) 1993-05-28
FR2684226B1 FR2684226B1 (fr) 1993-12-24

Family

ID=9419216

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9114411A Expired - Fee Related FR2684226B1 (fr) 1991-11-22 1991-11-22 Procede et dispositif de decision de voisement pour vocodeur a tres faible debit.

Country Status (3)

Country Link
EP (1) EP0543719A1 (fr)
CA (1) CA2083469A1 (fr)
FR (1) FR2684226B1 (fr)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
CN106128480B (zh) * 2016-06-21 2019-08-13 安徽师范大学 一种对带噪语音进行语音活动检测的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2316682A1 (fr) * 1975-06-18 1977-01-28 Nippon Telegraph & Telephone Procede pour juger des conditions voisee et devoisee d'un signal de conversation
US4589131A (en) * 1981-09-24 1986-05-13 Gretag Aktiengesellschaft Voiced/unvoiced decision using sequential decisions

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2316682A1 (fr) * 1975-06-18 1977-01-28 Nippon Telegraph & Telephone Procede pour juger des conditions voisee et devoisee d'un signal de conversation
US4589131A (en) * 1981-09-24 1986-05-13 Gretag Aktiengesellschaft Voiced/unvoiced decision using sequential decisions

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EUROSPEECH 89, EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY vol. 2, Septembre 1989, PARIS FRANCE pages 264 - 267; EL-SHEIKH T. ;EL-GHONEMY M. ;MANSOUR O.: 'Toward a phoneme based word recognition system' *
IEEE TRANSACTIONS ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING. vol. 28, no. 4, Août 1980, NEW YORK US pages 398 - 407; CHONG K. ; HYEONG H.: 'Voiced Unvoiced Silence discrimination of speech by delta modulation' *
IEEE TRANSACTIONS ON AUDIO AND ELECTROACOUSTICS. vol. 21, no. 3, Juin 1973, NEW YORK US pages 154 - 160; MARKEL: '* Application of a digital inverse filter for automatic formant and Fo Analysis' *

Also Published As

Publication number Publication date
CA2083469A1 (fr) 1993-05-23
FR2684226B1 (fr) 1993-12-24
EP0543719A1 (fr) 1993-05-26

Similar Documents

Publication Publication Date Title
EP0127718B1 (fr) Procédé de détection d'activité dans un système de transmission de la voix
EP1016072B1 (fr) Procede et dispositif de debruitage d'un signal de parole numerique
EP0363233B1 (fr) Procédé et dispositif de synthèse de la parole par addition-recouvrement de formes d'onde
FR2520913A1 (fr) Procede et appareil de reconnaissance de mots-cles dans des paroles
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
US5617508A (en) Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US5826230A (en) Speech detection device
FR2520912A1 (fr) Procede et appareil de reconnaissance de parole continue
FR2520911A1 (fr) Procede et appareil d'analyse pour la reconnaissance de parole
EP1267325B1 (fr) Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede
EP0490740A1 (fr) Procédé et dispositif pour l'évaluation de la périodicité et du voisement du signal de parole dans les vocodeurs à très bas débit.
EP3078027B1 (fr) Procédé de détection de la voix
EP0685833B1 (fr) Procédé de codage de parole à prédiction linéaire
EP2080194B1 (fr) Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information
EP0506535B1 (fr) Procédé et système de traitement des pré-échos d'un signal audio-numérique codé par transformée fréquentielle
EP3192073B1 (fr) Discrimination et atténuation de pré-échos dans un signal audionumérique
EP0052041B1 (fr) Procédé de détection de la fréquence de mélodie dans un signal de parole, et dispositif destiné à la mise en oeuvre de ce procédé
FR2684226A1 (fr) Procede et dispositif de decision de voisement pour vocodeur a tres faible debit.
EP1016073B1 (fr) Procede et dispositif de debruitage d'un signal de parole numerique
EP1021805B1 (fr) Procede et disposition de conditionnement d'un signal de parole numerique
EP0573358B1 (fr) Procédé et dispositif de synthèse vocale à vitesse variable
EP0685836B1 (fr) Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole
EP0469997B1 (fr) Procédé de codage et codeur de parole à analyse par prédiction linéaire
EP0615374B1 (fr) Procédé et dispositif de traitement d'écho entre deux voies de transmission présentant entre elles un couplage
EP0596785A1 (fr) Procédé de discrimination de la parole en présence de bruits ambiants et vocodeur à faible débit pour la mise en oeuvre du procédé

Legal Events

Date Code Title Description
ST Notification of lapse