FR2480978A1 - Procede et dispositif de discrimination d'un signal de voie humaine - Google Patents

Procede et dispositif de discrimination d'un signal de voie humaine Download PDF

Info

Publication number
FR2480978A1
FR2480978A1 FR8107876A FR8107876A FR2480978A1 FR 2480978 A1 FR2480978 A1 FR 2480978A1 FR 8107876 A FR8107876 A FR 8107876A FR 8107876 A FR8107876 A FR 8107876A FR 2480978 A1 FR2480978 A1 FR 2480978A1
Authority
FR
France
Prior art keywords
circuit
signal
terminal
input
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8107876A
Other languages
English (en)
Other versions
FR2480978B1 (fr
Inventor
Akira Komatsu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bodysonic KK
Original Assignee
Bodysonic KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP1980054290U external-priority patent/JPS6137040Y2/ja
Priority claimed from JP5268280A external-priority patent/JPS56149097A/ja
Application filed by Bodysonic KK filed Critical Bodysonic KK
Publication of FR2480978A1 publication Critical patent/FR2480978A1/fr
Application granted granted Critical
Publication of FR2480978B1 publication Critical patent/FR2480978B1/fr
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

L'INVENTION CONCERNE UN PROCEDE ET UN DISPOSITIF DE DISCRIMINATION D'UN SIGNAL DE VOIE HUMAINE. UN CIRCUIT 5, 6, 7 EXTRAIT DU SIGNAL D'ENTREE DES COMPOSANTES DE FREQUENCES TRES GRAVES ET LES REDRESSE POUR FORMER UN SIGNAL DE COMMANDE D'UN AMPLIFICATEUR 4 A GAIN VARIABLE COMMANDE PAR TENSION. CET AMPLIFICATEUR RECOIT LE SIGNAL D'ENTREE A SA PROPRE ENTREE ET LE TRANSMET A SA SORTIE EN FONCTION DU SIGNAL DE COMMANDE QU'IL RECOIT. L'INVENTION S'APPLIQUE NOTAMMENT A UN GENERATEUR DE VIBRATIONS RESSENTIES PAR LE CORPS.

Description

La présente invention concerne un procédé de dis-
crimination d'un signal de voix humaine et d'autres signaux de son ainsi qu'un dispositif destiné à la mise en oeuvre
de ce procédé.
Différents sons sont présents dans le cadre de la vie humaine. Pour l'enregistrement et la reproduction de ces sons, il est nécessaire de les enregistrer et de les
reproduire avec une haute sensibilité et une haute fidéli-
té. Il suffit en général de répondre à ses conditions.
Dans le cas général, tous les sons reçus par exem-
ple par un microphone sont simplement amplifiés et repro-
duits uniformément. Mais dans certaines utilisations spé-
ciales, il devient nécessaire de classer les signaux d'en-
trée en fonction de leurs propriétés ou de leur type, et de soumettre les signaux d'un certain type à des traitements
différents de ceux des signaux d'autres types.
Il en est ainsi par exemple pour extraire des voix humaines parmi des bruits ou pour ne détecter que la voix d'un annonceur séparément d'autres sons, par exemple de musique, dans le cas de l' enregistrement des sons
diffusés par radiophonie ou par télévision. Il y a égale-
ment lieu d'appliquer cette technique à un générateur de
vibrations ressenties par le corps ou autre, qui a été ré-
cemment proposé et qui est entré en usage pratique.
Un générateur de vibrations ressenti par le corps est un dispositif dans lequel, dans le but de restituer l'ambiance avec un équipement de reproduction sonore, les signaux représentant les composantes dans le registre de la contrebasse, par exemple au-dessous de 150 Hz, et faisant partie des signaux de sortie d'un amplificateur qui sont
appliqués à des haut-parleurs (ou des écouteurs) sont con-
vertis en des vibrations mécaniques qui sont transmises au corps humain sous forme de vibrations ressenties par le corps, les sons de ces vibrations dans ce registre étant transmis simultanément à un auditeur afin d'accentuer les
sensations dans ce registre. Ce dispositif produit des ef-
fets, principalement dans le domaine de l'appréciation mu-
sicale. L'expérience a confirmé que si le dispositif est utilisé avec des sons autres que musicaux, par exemple des sons documentaires et des effets sonores associés avec un tremblement de terre ou la sensation d'un choc tel que le bruit d'un coup de feu, le son produit par un autobus ou une locomotive, le bruit produit par un gros arbre qu'on
abat, d'une explosion, et les sons de roulement et du mo-
teur d'un véhicule automobile, d'un tracteur etc., des ef-
fets d'ambiance et des effets drama iques qui ne peuvent être obtenus avec un équipement courant dé reproduction
sonore, peuvent être atteints.
Si un dispositif de ce genre est associé avec un appareil cinématographique,,de télévision ou autre, une présence réelle et de nombreux effets dramatiques peuvent être obtenus. A cet égard, un film cinématographique, une pièce de télévision ou autre contiennent en général une combinaison de voix humaines (conversation) de musique
et d'effets sonores.
Par conséquent, si ces signaux sonores sont fournis à l'auditeur sous la forme de vibrations ressenties par le
corps, sans subir aucun traitement supplémentaire, des ef-
fets puissants peuvent être obtenus par les sons associés avec un tremblement de terre 'et la sensation d'un choc, tandis que les vibrations ressenties par le corps sont
également produites par les voix humaines (conversation).
L'expérience a montré que cela conduisait à des sensations
très peu naturelles.
Dans le but d'obtenir de bons effets dans un film cinématographique, une pièce de télévision ou autre, il est donc souhaitable de disposer d'un dispositif qui réagit aux sons musicaux et aux effets sonores, mais sans réagir
aux voix humaines.
Un objet essentiel de l'invention est donc de pro-
poser un procédé et un dispositif de dicrimination d'un signal de voix humaine, produisant des résultats favorables
dans son application à différents usages comme l'apprécia-
tion d'un film cinématographique, une pièce de télévision
ou autre.
Le procédé selon l'invention repose sur le fa:it qu' une composante fondamentale de la voix humaine produite par une source de sons sous forme de cordes vocales est extraite principalement, de manière à discriminer la voix humaine des autres sons. Il y a lieu d'examiner maintenant la production et les caractéristiques de la voix humaine. Quand les cordes vocales vibrenten ouvrant et fermant la trachée à leurs fréquences naturelles, ces cordes vocales produisent des ondes périodiques de pulsation de pression. Il est connu que des ondes de pression sont des ondes puisées, voisines d'ondes en dents de scie, dont la composante fondamentale est de l'ordre d'une centaine et de quelques dizaines de
Hertz, et qui varie dans une plage d'une largeur consi-
dérable dans le cas de la voix d'un homme adulte pendant la conversation ordinaire. (Une onde pulsée est appelée ci-après une onde en dents de scie). Les ondes en dents de scie des cordes vocales acquièrent des caractéristiques complexes quant à la résonance et l'anti-résonance en se propageant dans le cavité vocale comprenant le pharynx, la cavité bucale, la cavité nasale etc. et elles sont émises
par les lèvres sous forme de paroles. (En général, les fré-
quences de résonance sont distribuées à des valeurs beau-
coup plus élevées que la fréquence fondamentale des ondes
en dents de scie des cordes vocales).
Cela est représenté schématiquement sur la Figure 2 en (a) à (c). La Figure 2 montre en (a) l'onde en dents de scie de la source sonore constituée par les cordes vocales
et en (b) la forme d'onde de la voix avec les caractéris-
tiques de voyelles dans la cavité vocale. Les ondes en dents de scie produites par des cordes vocales contiennent une grande quantité d'ha. rmoniques supérieures et par conséquent, lorsqu'elles acquièrent les caractéristiques des voyelles
dans la partie résonnante de la cavité vocale, elles pren-
nent l'allure représentée en (b) sur la Figure 2.
Il apparait sur cette figure que la composante fonda-
mentale diminue et que les composantes caractéristiques
augmentent considérablement.
Par ailleurs, et en général, lorsque les ondes en dents de scie sont modulées en amplitude par des ondes porteuses, une forme d'onde telle que celle représentée en (c) sur la Figure 2 est obtenue. La comparaison des courbes (b) et (c) de la Figure 2 montre que ces formes d'ondes sont très similaires sur le plan macroscopique
bien que leur moyen de production soit très différent.
Ainsi, si la forme d'onde vocale représentée en (b) sur la Figure 2 est considérée comme un type d'onde
modulée en amplitude, sa détection permet d'extraire fa-
cilement et préférentiellement la composante fondamentale
de la source sonore des cordes vocales. C'est là le prin-
cipe fondamental de l'invention.
Un dispositif selon l'invention repose sur le
fait qu'un circuit d'extraction du registre de la contre-
basse, qui extrait la composante des fréquences de ce re-
gistre, inférieures à celles des composantes fondamentales
de la voix humaine des signaux appliqués à une borne d'en-
trée, est connecté à une entrée d'un dispositif de comman-
de, par exemple un amplificateur à gain variable commandé par tension dont le gain varie en fonction d'une tension
appliquée à sa borne de commande; ce dispositif de com-
mande est lui-même commandé par un signal de sortie du circuit d'extraction de basse fréquence, permettant ainsi de discriminer un son accompagné par une sensation de choc, par exemple un tremblement de terre, contenant en
grande quantité des composantes à environ 60 Hz et au-
dessous, d'une voix humaine contenant seulement ces com-
posantes.
En outre, un dispositif selon l'invention com-
porte un circuit d'extraction de niveau d'entrée qui re-
dresse un signal d'entrée et intègre ou filtre un signal redressé pour obtenir un courant continu proportionnel au niveau du signal d'entrée et un circuit d'accentuation et d'extraction d'.une onde fondamentale de voix humaine
qui extrait préférentiellement du signal d'entrée une com-
posante fondamentale d'une source sonore constituée par des cordes vocales, ces deux circuits étant connectés à la borne d'entrée du circuit de commande; une borne de sortie du circuit d'extraction de niveau d'entrée et une borne de sortie du circuit d'accentuation et d'extraction dtonde fondamentale de voix humaine sont connectées à un circuit arithmétique qui effectue une opération de combi- naison du signal de sortie du circuit d'accentuation et
d'extraction d'onde fondamentale de voix humaine et du sig-
nal de sortie du circuit d'extraction de niveau d'entrée; la borne de sortie du circuit arithmétique est connectée à la borne de commande du dispositif de commande; il est
ainsi'possible de discriminer si le signal d'entrée repré-
sente une voix humaine ou un autre son en comparant l'un par rapport à l'autre le niveau global du signal d'entrée
et la composante d'onde fondamentale des cordes vocales ex-
traite préférentiellement du signal d'entrée.
D'autres caractéristiques et avantages de l'inven-
tion appraîtront au cours de la description qui va suivre.
Aux dessins annexés, donnés uniquement à titre d'exemples nullement limitatifs: La Figure 1 est un schéma simplifié d'un exemple d'un dispositif destiné à la mise en oeuvre du procédé selon l'invention, la Figure 2 représente schématiquement des formes d'ondes de voix humaine et de sons musicaux, etc.,
la Figure 3 est un schéma simplifié d'un disposi-
tif destiné à une meilleure mise en oeuvre du procédé selon l'invention, la Figure 4 est un schéma simplifié d'un circuit
détecteur constituant le circuit d'accentuation et d'ex-
traction d'onde fondamentale de voix humaine-de la figure 3;
les Figures 5 et 6 sont chacune un schéma simpli-
fié d'un circuit détecteur utilisé.en pratique, et
la Figure 7 est un schéma simplifié d'un autre dis-
positif selon l'invention.
L'invention sera donc décrite ci-après dans un
exemple d'application à un générateur de vibrations res-
senties par le corps. Si l'on étudie les composantes de la voix humaine, de la musique, des effets sonores etc., il 24%e975
apparali que la région inférieure des voix h'liaines (prirn-
cipalement des voix masculines) s'étend uniformément juJs-
qu'au-dessous de 80 Hz et que la région supérieure s-- <end
jusqu'au-dessus de 10 KHz à la fois pour les voix mascu-
lines et féminines, bien que cela dépende également des
circonstances d'enregistrement et de différences indivi-
duelles. Il existe un très grand nombre de types d'effets sonores avec des spectres de fréquences différents. Un tremblement de terre ou un son du même genre donnant la sensation d'un choc se caractérise par le fait qu'il
contient une large distribution de fréquences et une gran-
de quantité de composantes de très basse fréquence. La dis-
tribution des fréquences des sons musicaux est souvent uniforme et large comparativement avec celle des autres sons. Par conséquent, il serait possible de distinguer les voix humaines des autres sons en les faisant passer par un filtre approprié. Mais la fréquence de coupure d'un
filtre passe-bas qui doit couper les composantes fondamen-
tales de fréquences basses des voix humaines allant jus-
qu'en-dessous de 80 Hz, comme cela a été indiqué ci-des-
sus, doit être placée à 60 Hz o au-dessous, ce qui pose un problème. Plus particulièrement, parmi les composantes
de fréquence au-dessous d'environ 150 Hz, qui sont effi-
caces comme vibrations ressenties par le corps, la densi-
té des composantes est la plus élevée dans le spectre voi sin de 100 Hz et cette densité de distribution s'abaisse au-dessous de 50 à 60 Hz. Par conséquent, la plupart des composantes valables pour les vibrations ressenties par
le corps dans les signaux ayant traversé le filtre passe-
bas précité sont coupées, et l'effet du générateur de vi-
brations est considérablement amoindri.
Etant donné que le son associé avec le tremblement
de terre contient aussi suffisamment de composantes so-
nores graves à 60 Hz et au-dessous, il peut produire des vibrations ressenties par le corps. Mais en l'absence des composantes voisines de 100 Hz, une sensation réelle
n'est pas perçue et des vibrations uniformes d'une sen-
sation sans couleurs sont produites. Cela ressemble exac-
tement au son d'une enceinte acoustique dont le haut-
parleur des fréquences élevées est déconnecté, de sorte qu'elle ne peut émettre les sons aigus. La Figure 1 illustre un exemple d'un cincuit permettant d'éliminer cet inconvénient. Sur cette figure, la référence 1 désigne une borne d'entrée qui reçoit un signal de son provenant de l'amplificateur. Un premier filtre passe-bas 3 dont la fréquence de coupure est de l'ordre de 150 Hz, et un amplificateur 4 à gain variable
commandé par tension sont connectés entre la borne d'en-
trée 1 et la borne de sortie 2.
Le filtre passe-bas 3 a pour fonction d'extraire de son signal d'entrée la composante sonore du registre de la contre-basse, au-dessous d'environ 150 Hz, convenant pour les vibrations ressenties par le corps, et de fournir
la composante extraite au générateur de vibrations. L'am-
plificateur 4 à gain variable commandé par tension con-
siste en un amplificateur dont le-gain augmente. ou dimi-
nue à l'application d'une tension aâla borne de commande 4a. Dans l'exemple présent, un amplificateur dont le gain
augmente avec une tension positive appliquée est utilisé,.
La borne d'entrée 1 est également connectée à l'entrée d'un second filtre passe-bas 5 dont la fréquence de coupure est de l'ordre de-60 Hz. La sortie de ce second
filtre 5 est connectée à la borne de commande ha de l'am-
plificateur 4 à gain variable commandé par tension, par 1' intermédiaire d'un circuit redresseur 6 ainsi que d'un
circuit d'intégration 7.
Dans ce circuit, lorsqu'un effet sonore tel que celui associé avec un tremblement de terre, contenant en quantité des composantes graves de 60 Hz et au-dessous est
appliqué à la borne d'entrée 1 comme signal de son d'en-
trée, les deux filtres passe-bas laissent passer les com-
posantes graves du signal. Le signal de sortie du second filtre 5 est redressé par le circuit redresseur 6 et il est ensuite intégré dans le circuit d'intégration 7. La tension de sortie du circuit d'intégration 7 est appliquée
à la borne de commande 4a de l'amplificateur 4 à gain va-
riable commandé par tension et elle en augmente le gain.
Ainsi, le signal des composantes graves qui a traversé le premier filtre passe-bas 3 est amplifié et appliqué à la borne de sortie 2. Ainsi, si un générateur de vibrations ressenties par le corps est connecté à la borne de sortie
2, l'auditeur peut ressentir ces vibrations. Des vibra-
tions réelles peuvent être reçues car le signal de sortie
contient des composantes de fréquences voisines de 100 Hz.
Le cas sera maintenant décrit o un signal de voix humaine est appliqué comme signal d'entrée. Etant donné que la voix humaine contient peu de composantes graves de Hz et au-dessous, ces composantes ne traversent pas le
second filtre passe-bas 5 de sorte que la tension de sor-
tie du circuit d'intégration 7 diminue. Le gain de l'ampli-
ficateur 4 diminue donc, le signal qui traverse le filtre passe-bas 3 est à peine amplifié et le signal à la borne
de sortie 2 est nul ou très faible. Ainsi, la voix hu-
maine ne produit pratiquement pas de vibrations ressenties
par le corps.
Ainsi, la voix humaine ne produit pratiquement
pas de vibrations ressenties par le corps.
Mais même avec ce circuit, le but recherché n'est que partiellement atteint. Parmi les sons musicaux et les effets sonores par lesquels il est souhaité produire des vibrations ressenties par le corps, il en existe beaucoup qui ne contiennent pas de composantes à 60 Hz et au- dessous, ou qui n'en contiennent que peu. Ainsi, l'appareil de la Figure 1 'qui ne peut produire de vibrations ressenties par le corps quand les composantes à 60 Hz et au-dessous n'existent pas, n'est pas toujours satisfaisant La Figure 3 est un schéma simplifié d'un appareil selon l'invention permettant de résoudre ce problème. Cet appareil a pour fonction d'accentuer et d'extraire des composantes produites par la source sonore constituée par des cordes vocales, et àles comparer avec le niveau -total du signal d'entrée afin de discriminer la voix humaine des
autres sons.
Cet appareil comporte un circuit 8 d'extraction
de niveau d'entrée, un circuit 9 d'accentuation et extrac-
tion d'ondes fondamentales de la voix humaine, un circuit arithmétique 10, un filtre passe-bas 3 et un amplificateur 4 à gain variable commandé par tension, tels que décrits ci-dessus. Tout d'abord, le circuit 9 d'accentuation et
d'extraction de la fréquence fondamentale de la voix hu-
maine sera décrit en détail. Ce circuit est essentielle-
ment un circuit détecteur. Cela sera expliqué en regard du circuit simple représenté sur la Figure 4. Le circuit de
la Figure 4 comporte un détecteur 11 et un filtre passe-ban-
de 12 qui sélectionne la bande de 30 à 300 Hz. Ce circuit permet d'extraire la composante fondamentale de la source
sonore constituée par des cordes vocales.
Par ailleurs, la Figure 2 montre en (d) la forme d'onde d'un son autre que celui de la voix humaine, par exemple la forme d'onde d'un son musical. Un signal de ce genre présente un large spectre de fréquences à partir d'unerégion des fréquences basses jusqu'à-une région des fréquences élevées, comme le montre la Figure. Quand ce signal est détecté et transmis parle filtre passe-bande du circuit de la Figure 4, l'amplitude du signal à la borne de sortie de ce circuit n'est pas très élevée. Cela peut être attribué au fait que, étant donné que la bande-de fréquence du signal initial est large, le pourcentage des composantes qui traversent le filtre passe-bande 12 par
rapport au signal d'entrée est réduit quand le signal ini-
tial est détecté et a traversé le filtre 12, et aussi au
fait que la forme d'onde n'a pas une forme définie permet-
tant de la considérer comme une onde modulée en amplitude
comme celle représentée en (b) sur la Figure 2.
Par conséquent, quand le signal d'entrée et le signal de sortie du circuit de la Figure 4 sont redressés, pondérés de façon appropriée et sont comparés et calculés, il devient possible de distinguer la voix humaine des autres sons.Autrement dit, lorsqu'un signal d'entrée de niveau 2-Y 97g fixe est appliqué au circuit de la Figure 4, un signal de sortie dont le niveau est relativement élevé *Xst considéré comme une voix humaine tandis qu'un signal de sortie dont le niveau est relativement bas est considéré comme un autre son. Etant donné qu'une forme d'onde présentant les caractéristiques d'une voyelle n'est pas une simple onde sinusoïdale comme l'onde porteuse représentée en (c) sur la Figure 2, la forme d'onde de voix humaine représentée en (b) sur la Figure 2 n'est pas symétrique verticalement, comme l'onde modulée en amplitude représentée en (c), mais
elle-est généralement asymétrique dans la direction verti-
cale dans la plupart des cas, comme représenté en (b). Pour
cette raison, dans le cas de la détection du signal d'en-
trée avec le circuit de la Figure 4, la solution des cal-
culs diffère considérablement suivant que l'enveloppe est
prise sur le côté positif ou sur le côté négatif.
Dans le cas de la forme d'onde (b) de la Figure 2,
il apparait que la possibilité de discrimination est amé-
liorée avec l'enveloppe sur le côté positif car avec cette enveloppe, le niveau du signal à la borne de sortie de la Figure 4 est plus élevé. La forme d'onde (b) de la Figure 2 présente des crêtes élevées sur le côté positif mais le cas
inverse existe en fait lorsque des crêtes élevées apparais-
sent sur le côté négatif. Par conséquent, le détecteur ll de la Figure 4 doit extraire l'enveloppe du niveau le plus
élevé sur le côté positif ou sur le côté négatif, ou ex-
traire les enveloppes sur les deux côtés positif et néga-
tif et les additionner.
Dans le but de remplir cette condition, le circuit
de détection doit être du type à redressement des deux al-
ternances. Mais étant donné qu'un circuit redresseur à deux
alternances est un type de circuit multiplicateur de fré-
quence, la fréquence d'entrée est doublée. Il sera mainte-
nant supposé que le circuit de détection 11 est du type à redressement des deux alternances dans le circuit de la Figure 4 et qu'un signal sinusoïdal à 50 Hz est appliqué
à l'entrée. Dans ce cas, un signal pulsé contenant une com-
posante fondamentale de 100 Hz (fréquence doublée) apparait à la sortie de détection ce dont il résulte que le signal traverse le filtre passe- bande 12 dont la bande passante est de 80 à 300 Hz. Ainsi, quand le son grave associé avec
de la musique ou u:n tremblement de terre est reçu, sa fré-
quence est multipliée pour-obtenir le signal de sortie ce
qui présente l'inconvénient que la possibilité de discri-
mination est réduite.
Dans le but d'éliminer cet inconvénient, le circuit représenté sur la Figure 5 comporte un filtre passe-haut
14 coupant la. région des sons graves qui n'est pas très im-
portante pour la discrimination de la voix humaine. Même
si le circuit de détection qui-suit, du type à redresse-
ment des deux alternances, effectue une multiplication de fréquence, la composante qui traverse le filtre passe-bande 12 diminue. Les résultats d'expérience ont montré qu'il
oonvient de régler la fréquence de coupure du filtre passe-
haut 13 à environ 130 Hz.
Le signal de sortie du filtre passe-bande 12 est
redressé par le circuit redresseur 15 qui suit (convertis-
seur alternatif-continu). En outre, le.s composantes de
fréquences élevées du signal de sortie du circuit redres-
seur 15 sont coupées par le filtre passe-bande 16 qui suit, et ce signal devient un signal continu proportionnel
au signal de sortie du filtre passe-bande 12.
La Figure 6 représente un exemple d'un autre cir-
cuit qui effectue les mêmes opérations. Dans ce cas, la
partie intermédiaire du circuit de la Figure 5 a -été mo-
difiée. Dans ce circuit, les circuits de détection 17et 18 ne sont pas du type à deux alternances avec multiplication
de fréquence, mais du type à redressement-d'une seule al-
ternance de manière à extraire l'enveloppe positive avec le circuit de détection 17 et l'enveloppe négative avec le circuit de détection 18. La polarité du signal détecté
pour l'enveloppe négative est inversée par un circuit d'in-
version 19.
Les signaux détectés respectifs sont appliqués à des filtres passe-bande 20 et 21 et sont redressés par des
circuits redresseurs 22 et 23. Ensuite, les signaux re-
dressés sont combinés et appliqués à un filtre passe-bas
16. Le filtre passe-haut 13 à l'entrée est inutile en prin-
cipe, mais il est préférable pour améliorer la possibilité de discrimination. Les circuits détecteurs et-redresseurs des Figures 4 à 6 peuvent être à volonté des circuits de valeur absolue ou des circuits de détection linéaire afin
de réduire les erreurs de fonctionnement résultant de l'ab-
sence de linéarité.
Le circuit 8 d'extraction de niveau d'entrée de la Figure 3 sera maintenant expliqué. Ce circuit intègre ou filtre le signal d'entrée redressé et délivre une tension
continue proportionnelle au niveau d'entrée.
Les entrées du circuit 8 d'extraction de niveau d'en-
trée et du circuit 9 d'accentuation et d'extraction d'onde fondamentale dela voix humaine sont connectées àla borne d'entrée 1 avec l'entrée du filtre passe-bas 3. Les sorties du circuit 8 d'extraction de niveau d'entrée et du circuit 9 d'accentuation et d'extraction de l'onde fondamentale de voix humaine sont connectés respectivement aux entrées lOa
et lOb de l'unité arithmétique 10.
Le signal de sortie du circuit 8 d'extraction de niveau d'entrée et le signal de sortie du circuit 9 d'accentuation et d'extraction d'onde fondamentale sont pondérés à des niveaux appropriés. En outre, une pondération appropriée
par exemple une sélection de la constante de temps du cir-
cuit d'intégration ou la fréquence de coupure du filtre passe-bas de filtrage est effectuée dans la région de l'axe
des temps.
En utilisant les signaux de sortie pondérés de façon
appropriée, le circuit arithmétique 10 exécute une opéra-
tion de combinaison du signal de sortie du circuit 9 d'ac-
centuation et d'extraction de fondamentale de voix humaine et du signal de sortie du circuit 8 d'extraction de niveau d'entrée. Comme cela sera expliqué par la suite, le circuit arithmétique 10 soustrait le premier signal du second. Dans le cas o le signal d'entrée est un signal de voix humaine
le signal de sortie du circuit 9 d'accentuation et d'ex-
* traction d'onde fondamentale de voix humaine devient supé-
rieur à celui du circuit 8 d'extraction de niveau d'entrée étant donné la pondération appropriée, et par conséquent une solution dans la direction négative est donnée à la sortie du circuit arithmétique 10. Au contraire, dans le cas o le signal d'entrée représente de la musique ou autre son, le signal de sortie du circuit 9 d'accentuation et
d'extraction devient inférieur à celui du circuit 8 d'ex-
traction de niveau d'entrée et par conséquent, la solu-
tion du circuit arithmétique 10 passe dans la direction positive.
Par ailleurs, le signal d'entrée passe par le fil-
tre passe-bas 3 (dont la fréquence de coupure est de l'or-
dre de 150 Hz) pour en extraire les composantes efficaces pour les vibrations ressenties par le corps, et il est appliqué à l'amplificateur 4 à gain variable commandé par tension. Par conséquent, si le signal d'entrée représente une voix humaine, le signal de sortie de l'amplificateur 4 est inhibé ou affaibli tandis que si le signal d'entrée représente un autre son, le gain de l'amplificateur 4 est augmenté, ce qui augmente l'amplitude du signal de
sortie.
L'amplificateur 4 à gain variable commandé par tension peut être remplacé par un filtre à fréquence
variable commandé par tension. Il peut également être rem-
placé par unep orte sous forme d'un commutateur analogique
ou similaire. Mais étant donné que dans ce cas, la commu-
tation fermeture-ouverture par tout ou rien produit une
sensation non naturelle, la oommande progressive et conti-
nue de fermeture et l'ouverture basée sur l'augmentation et la diminutionanalogique dans un amplificateur 4 à gain
variable ou autre est plus favorable.
Dans la description faite ci-dessus, les voix
humaines n'ont été considérées que comme des phonèmes sonores. Etant donné que le spectre des phonèmes sourds (consonnes produites sans vibrations des cordes vocales) se trouve dans une bande plus élevée, il est coupé par le filtre passe-bas pour extraire le signal des vibrations ressenties par le corps, (avec une fréquence de coupure d'environ 150 Hz), et cela ne pose aucun problème (filtre 2 <7
passe-bas 3 de la Figure 1 ou de la Figure 3).
Même dans le cas des phonèmes sonores, les volx dont les fréquences fondamentales sont élevées, par exemple les voix des enfants, les voix féminines et les voix aiguës dans une chanson ne posent aucun problème pour la même rai- son. Il a été vérifié expérimentalement que la différence de possibilité de discrimination sur la base des langues différentes est à peine sensible, probablement pour la
même raison.
La Figure 7 est un schéma simplifié d'un mode pra-
tique de réalisation, pour la mise en oeuvre de l'invention, dans lequel les éléments des deux circuits des Figures 1 et 3 sont combinés. Dans ce cas, deux bornes d'entrée 1 sont connectées pour recevoir des signaux de deux canaux et pour les mélanger au moyen d'un circuit mélangeur 24. La sortie
du circuit mélangeur 24 est connectée à un filtre infra-
sonore 25 destiné à éliminer les infra-sons inutiles à
Hz et au-dessous.
La sortie du filtre infra-sonore 25 est connectée
à un circuit aboutissant à un amplificateur 4 à gain varia-
ble commandé par tension par l'intermédiaire d'un filtre
passe-bas 3 afin d'extraire un signal de vibrations ressen-
ties par le corps (avec une fréquence de coupure de 150 Hz) et à un circuit aboutissant à.un circuit correcteur 26. Ce dernier applique à l'avance à la bande des graves et à la bande des aigus des courbes de correction appropriées afin
d'améliorer la possibilité de distinction de la voix hu-
maine. L'étage qui suit le circuit correcteur 26 est un
circuit 27 de compression de niveau dont la-sortie est con-
nectée aux entrées d'un circuit 28 d'extraction des graves,
d'un circuit 8 d'extraction de niveau d'entrée et d'un cir-
cuit 9 d'accentuation et d'extraction d'onde fondamentale de voix humaine. Les sorties de ces circuits 28, 8 et 9 sont connectées respectivement aux entrées 'Oc, 10a et lob
d'un circuit arithmétique 10.
Le circuit 27 de compression de niveau a pour fonc-
tion de comprimer la plage dynamique du signal d'entrée c480978 afin d'éviter que des erreurs soient produites pendant la discrimination et les opérations (si le niveau est trop bas, la discrimination est difficile tandis que s'il est
trop haut, un amplificateur opérationnel est saturé).
Le circuit 28 d'extraction des graves est un circuit qui détecte un son contenant en abondance les composantes dans le registre de la contrebasse, comme celle associées avec
un tremblement de terre, et il correspond à la partie en-
cadrée en traits mixtes sur la Figure 1. Le circuit 8 d'ex-
traction de niveau d'entrée et le circuit 9 d'accentuation
et d'extraction d'onde fondamentale de voix humaine corres-
pondent aux circuits de même référence sur la Figure 3.
Dans cette disposi.tion,le circuit arithmétique 10
a pour fonction de soustraire le signal de sortie du cir-
cuit 9 d'accentuation et d'extraction de la somme du signal de sortie du circuit 28 d'extraction des graves et de celui du circuit 8 d'extraction de niveau d'entrée. De même que dans le cas de la Figure 3, la différence qui en résulte
est utilisée pour commander l'amplificateur 4 à gain varia-
ble. De bons résultats sont obtenus si la pondération du
circuit 28 d'extraction des fréquences très basses est com-
parativement élevéeet si en outre une bande-morte est pré-
vue pour empêcher le circuit de réagir à des niveaux au-
dessous d'une valeur seuil.

Claims (8)

REVENDICATIONS
1 - Procédé de discrimination d'un signal de voix
humaine, caractérisé en ce qu'une partie de phonèmes so-
nores de la voix humaine, considérée comme une onde modu-
lée en amplitude et obtenue par modulation d'une source sonore constituée par des cordes vocales avec son onde por- teuse qui est une partie de forme d'onde consistant en des
fréquences caractéristiques de voyelles ou autres, produi-
tes par une cavité vocale ou autre, est détectée (9) de manière à accentuer et à extraire une composante d'onde fondamentale de la source sonore constituée par des cordes
vocales afin de discriminer la voix humaine d'autres sons.
2 - Dispositif de discrimination d'un signal de voix humaine, caractérisé en ce qu'il comporte un dispositif
de commande (4) avec une borne d'entrée, une borne de sor-
tie et une borne de commande (4a) et destiné à commander un signal qui passe de ladite borne d'entrée à ladite borne de sortie par un signal appliqué à ladite borne de commande, et un circuit (5, 6, 7) d'extraction du registre de la contrebasse, destiné à extraire les composantes du registre de la contrebasse dont les fréquences sont inférieures à
cellesde la composante d'onde fondamentale de la voix hu-
maine du signal appliqué à ladite borne d'entrée dudit dis-
positif de commande (4), une borne d'entrée dudit circuit
d'extraction étant connectée à la borne d'entrée dudit dis-
positif de commande et la borne de sortie dudit dispositif
d'extraction constituant la borne de commande dudit dispo-
sitif de commande.
3 - Dispositif selon la revendication 2, caracté-
risé en ce que ledit dispositif de commande (4) est un am-
plificateur à gain variable commandé par tension dont le gain varie en fonction de la tension appliquée à sa borne
de commande (4a).
4 - Dispositif selon la revendication 2, caracté-
risé en ce que ledit dispositif de commande (4) est un filtre à fréquence variable commandé par tension qui
commande une fréquence du signal passant de sa borne d'en-
trée à sa borne de sortie en fonction d'une tension appli-
quée à sa borne de commande (4a).
- Dispositif selon la revendication 2, caracté- risé en ce que ledit dispositif de commande (4) est une porte réalisée sous la forme d'un commutateur analogique destinée à fermer et à ouvrir par tout ou rien un circuit entre ses bornes d'entrée et de sortie en fonction d'une
tension appliquée à sa borne de commande (ha).
6 - Dispositif selon l'une quelconque des revendi-
cations 2 à 5, caractérisé en ce qu'il comporte un second filtre passebas (3) disposé entre ladite borne d'entrée
dudit dispositif de commande (4)et une borne d'entrée du-
dit premier filtre passe-bas (5), un signal d'entrée lui
étant appliqué par la borne d'entrée du filtre passe-
bas. 7 - Dispositif de discrimination d'un signal de voix humaine, caractérisé en ce qu'il comporte un circuit
(8) d'extraction de niveau d'entrée qui redresse un sig-
nal d'entrée et intègre le signal redressé pour obtenir
un courant continu proportionnel au niveau du signal d'en-
trée et un circuit (9) d'accentuation et d'extraction
d'onde fondamentale de la voix humaine qui extrait préfé-
rentiellement du signal d'entrée une composante d'onde
fondamentale d'une source sonore constituée par des cor-
des vocales, ces circuits étant connectés à une borne d'entrée-d'un dispositif de commande (4) comprenant aussi une borne de sortie et une borne de commande (4a) et qui commande le passage d'un signal de ladite borne d'entrée à ladite borne de sortie en fonction d'un signal appliqué
à ladite borne de commande, la borne de sortie dudit cir-
cuit (8) d'extraction de niveau d'entrée et dudit circuit (9) d'accentuation et d'extraction d'onde fondamentale de
la voix humaine étant connectées à un circuit arithméti-
que (îo) qui effectue une opération de combinaison du signal de sortie dudit circuit (9) d'accentuation et d'extraction d'onde fondamentale de la voix humaine et du signal de sortie du circuit (8) d'extraction de niveau d'entrée, la borne de sortie dudit circuit arithmétique
étant connectée à ladite borne de commande (4a) dudit dis-
positif de commande (4).
8 - Dispositif selon la revendication 7, caractérisé en ce que ledit dispositif de commande (4) est un amplificateur à gain variable commandé par tension dont le gain varie en fonction d'une tension appliquée à sa borne de commande,
9 - Dispositif selon la revendication 7, caracté-
risé en ce que ledit dispositif de commande (4) est un fil-
tre à fréquence variable commandé par tension qui comman-
de la fréquence du signal passant de sa borne d'entrée à sa borne de sortie en fonction d'une tension appliquée à
sa borne de commande.
- Dispositif selon la revendication 7, caracté-
risé en ce que ledit dispositif de commande (4) est une porte réalisée sous la forme d'un commutateur analogique qui ferme et qui.ouvre par tout ou rien un circuit entre sa borne d'entrée et sa borne de sortie en fonction d'une
tension appliquée à sa borne de commande.
11 - Dispositif selon l'une quelconque des reven-
dications 7 à 10, caractérisé en ce qu'il comporte un se--
cond filtre passe-bas (3) disposé entre ladite borne d'en-
trée dudit dispositif de commande (4) et ledit circuit (8) d'extraction de niveau d'entrée ainsi que dudit circuit (9) d'accentuation et d'extraction d'onde fondamentale de
la voix humaine, le signal d'entrée lui étant fourni à par-
tir de la borne d'entrée dudit circuit d'extraction de ni-
veau d'entrée ainsi que dudit circuit d'accentuation et
d'extraction d'onde fondamentale de la voix humaine.
FR8107876A 1980-04-21 1981-04-21 Procede et dispositif de discrimination d'un signal de voie humaine Expired FR2480978B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP1980054290U JPS6137040Y2 (fr) 1980-04-21 1980-04-21
JP5268280A JPS56149097A (en) 1980-04-21 1980-04-21 Human voice signal identifying method

Publications (2)

Publication Number Publication Date
FR2480978A1 true FR2480978A1 (fr) 1981-10-23
FR2480978B1 FR2480978B1 (fr) 1985-12-13

Family

ID=26393319

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8107876A Expired FR2480978B1 (fr) 1980-04-21 1981-04-21 Procede et dispositif de discrimination d'un signal de voie humaine

Country Status (5)

Country Link
CA (1) CA1184506A (fr)
DE (1) DE3115801A1 (fr)
FR (1) FR2480978B1 (fr)
GB (2) GB2077078B (fr)
IT (1) IT1142404B (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1985000264A1 (fr) * 1983-06-20 1985-01-17 Raymond Capel Dispositif pour creer une ambiance lumineuse variable

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1339256B1 (fr) * 2003-03-03 2017-12-27 Sonova AG Procédé pour la fabrication des dispositifs acoustiques et pour la réduction des perturbations dues au vent

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3102236A (en) * 1960-05-05 1963-08-27 Collins Radio Co Squelch circuit controlled by demodulated voice signal
US3336533A (en) * 1964-03-13 1967-08-15 Motorola Inc Electronic circuit
FR2050782A5 (fr) * 1969-06-25 1971-04-02 Cit Alcatel
US3798559A (en) * 1971-04-20 1974-03-19 Matsushita Electric Ind Co Ltd Noise reduction system
US4068092A (en) * 1974-11-08 1978-01-10 Oki Electric Industry Co., Ltd. Voice control circuit

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3377428A (en) * 1960-12-29 1968-04-09 Ibm Voiced sound detector circuits and systems
GB1094357A (en) * 1964-12-09 1967-12-13 Mullard Ltd Improvements in or relating to speech filters
GB1120541A (en) * 1965-08-11 1968-07-17 Dolby Ray Milton Improvements in noise reduction systems
US3513260A (en) * 1967-10-13 1970-05-19 Ibm Speech presence detector
US3678416A (en) * 1971-07-26 1972-07-18 Richard S Burwen Dynamic noise filter having means for varying cutoff point
US4051331A (en) * 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4025721A (en) * 1976-05-04 1977-05-24 Biocommunications Research Corporation Method of and means for adaptively filtering near-stationary noise from speech
GB1591869A (en) * 1978-05-31 1981-06-24 Pye Elecronic Products Ltd Alternating signal detector

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3102236A (en) * 1960-05-05 1963-08-27 Collins Radio Co Squelch circuit controlled by demodulated voice signal
US3336533A (en) * 1964-03-13 1967-08-15 Motorola Inc Electronic circuit
FR2050782A5 (fr) * 1969-06-25 1971-04-02 Cit Alcatel
US3798559A (en) * 1971-04-20 1974-03-19 Matsushita Electric Ind Co Ltd Noise reduction system
US4068092A (en) * 1974-11-08 1978-01-10 Oki Electric Industry Co., Ltd. Voice control circuit

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE TRANSACTIONS ON COMMUNICATIONS, volume COM-26, no. 1, janvier 1978 (NEW YORK, US) P.G. DRAGO et al. "Digital dynamic speech detectors", pages 140-145 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1985000264A1 (fr) * 1983-06-20 1985-01-17 Raymond Capel Dispositif pour creer une ambiance lumineuse variable

Also Published As

Publication number Publication date
GB8403418D0 (en) 1984-03-14
CA1184506A (fr) 1985-03-26
IT8148303A0 (it) 1981-04-17
IT1142404B (it) 1986-10-08
GB2077078B (en) 1984-09-12
GB2143105A (en) 1985-01-30
DE3115801A1 (de) 1982-01-14
DE3115801C2 (fr) 1987-09-03
GB2143105B (en) 1985-07-24
GB2077078A (en) 1981-12-09
FR2480978B1 (fr) 1985-12-13

Similar Documents

Publication Publication Date Title
JP3478401B2 (ja) バス強調装置とその方法
US8750538B2 (en) Method for enhancing audio signals
US8352257B2 (en) Spectro-temporal varying approach for speech enhancement
EP2113913B1 (fr) Procédé et système de reconstitution de basses fréquences dans un signal audio
DE102012103553A1 (de) Audiosystem und verfahren zur verwendung von adaptiver intelligenz, um den informationsgehalt von audiosignalen in verbraucheraudio zu unterscheiden und eine signalverarbeitungsfunktion zu steuern
EP0867856A1 (fr) &#34;Méthode et dispositif de detection d&#39;activité vocale&#34;
EP0632586A1 (fr) Dispositif de commande automatique de sons à logique floue
WO2018146305A1 (fr) Methode et appareil de modification dynamique du timbre de la voix par decalage en fréquence des formants d&#39;une enveloppe spectrale
Taenzer et al. Investigating CNN-based Instrument Family Recognition for Western Classical Music Recordings.
US8219390B1 (en) Pitch-based frequency domain voice removal
US4506379A (en) Method and system for discriminating human voice signal
EP0673113B1 (fr) Système de caractérisation de sources de signaux
FitzGerald et al. Single channel vocal separation using median filtering and factorisation techniques
FR2568437A1 (fr) Appareil convertisseur audiofrequences, installation pour le traitement de sujets atteints de troubles audio-phonatoires et auditivo-verbaux comprenant un tel appareil et procede mettant en oeuvre une telle installation
FR2480978A1 (fr) Procede et dispositif de discrimination d&#39;un signal de voie humaine
US5373098A (en) Device for generating tone signals using modulation
FR2695750A1 (fr) Dispositif de traitement d&#39;un signal sonore et appareil comportant un tel dispositif.
US20050244019A1 (en) Method and apparatus to improve the reproduction of music content
JP3560087B2 (ja) 音信号処理装置およびサラウンド再生方法
JP3707135B2 (ja) カラオケ採点装置
Vega et al. Quantifying masking in multi-track recordings
RU2241305C1 (ru) Психоакустический процессор (адаптивный эквалайзер без обратных связей)
Mikami et al. Residual drum sound estimation for RPCA singing voice extraction
US4315452A (en) Electronic organ percussive modulator
JPH0511791A (ja) 効果音制御装置

Legal Events

Date Code Title Description
ST Notification of lapse