BE446049A - Device for artificially producing phonemes electrically - Google Patents

Device for artificially producing phonemes electrically

Info

Publication number
BE446049A
BE446049A BE446049DA BE446049A BE 446049 A BE446049 A BE 446049A BE 446049D A BE446049D A BE 446049DA BE 446049 A BE446049 A BE 446049A
Authority
BE
Belgium
Prior art keywords
frequency
speech
fundamental frequency
spectrum
amplitude
Prior art date
Application number
Other languages
French (fr)
Original Assignee
Philips Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Publication date
Publication of BE446049A publication Critical patent/BE446049A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

  

   <Desc/Clms Page number 1> 
 



  Dispositif permettant de produire artificiellement des phonèmes par   @   voie électrique. 



   La présente invention concerne un dispositif permettant de composer artificiellement la parole et l'utilisation d'un dis- positif de ce genre pour la transmission de la parole par voie élec- trique. Dans la transmission de la parole par voie électrique l'in- vention vise à exécuter cette transmission de telle façon que la bande de fréquences nécessaire soit bien plus étroite que la bande de fréquences occupée par les vibrations de la parole. 



   Dans un dispositif bien connu destiné à la transmission de la parole on déduit des vibrations de parole, du côté transmis- sion, au moyen d'un analyseur, certaines grandeurs caractérisant la parole qu'on transmet, au moyen de tensions de réglage, de façon modulée sur des ondes porteuses ayant une assez faible fréquence. 



  Ces grandeurs caractéristiques sont la fréquence fondamentale du   @   

 <Desc/Clms Page number 2> 

 spectre de la parole, à condition qu'elle soit présente, et l'amplitude des vibrations dans certaines parties du spectre de la parole. Dans le dispositif connu on divise le spectre de la parole en dix bandes de fréquences et, dans chaque bande, l'ampli- tude des vibrations qu'elle comprend est déterminée et fixée par une grandeur caractéristique, qu'on transmet au moyen d'une ten- sion de réglage. En tout il faut donc onze tensions de réglage, à savoir une qui est une mesure de la valeur instantanée de la fré- quence fondamentale, tandis que les dix autres tensions de régla- ge indiquent l'amplitude des vibrations dans une dizaine de bandes du spectre de la parole. 



   Du côté réception, les grandeurs caractéristiques trans- mises par les vibrations de commande servent à commander un dis- positif permettant de produire artificiellement des vibrations de parole. La grandeur caractéristique, qui est une mesure de la fréquence fondamentale du spectre de la parole, commande du côté réception l'oscillation engendrée par un générateur d'impulsions de telle façon que la fréquence fondamentale des impulsions corres- ponde toujours à la fréquence fondamentale du spectre initial de la parole. Les impulsions qui, outre la fréquence fondamentale, comprennent un grand nombre d'harmoniques plus élevés sont amenées à une dizaine de filtres passe-bande, dont les zones de transmis- sion correspondent respectivement aux dix bandes de fréquences en lesquelles est divisé le spectre de la parole du côté transmis- sion.

   Le circuit de sortie de chaque filtre passa-bande est relié à un amplificateur, dont le degré d'amplification est réglé auto- matiquement sous l'action de la tension de réglage qui est une mesure de l'amplitude des vibrations initiales de la parole com- prises dans la bande de fréquences qui correspond à la zone de transmission du filtre passe-bande. 



   Les phonèmes ne se composent pas tous d'une vibration fondamentale et d'un certain nombre d'harmoniques plus élevés, 

 <Desc/Clms Page number 3> 

 comme les voyelles. Ainsi, par exemple, les sifflantes se compo- sent d'un spectre de fréquences continu. Pour pouvoir transmettre aussi ces sons on a prévu du côté réception une source de courant qui produit un spectre de fréquences continu et est connectée au- tomatiquement au lieu du générateur d'impulsions lorsqu'il n'y a pas de fréquence fondamentale dans les vibrations de parole que l'on désire transmettre. 



   Dans le dispositif précité permettant de transmettre la parole on déduit, du c8té transmission, les grandeurs caractéristi- ques de la parole initiale. Toutefois, on peut aussi engendrer ces grandeurs caractéristiques par voie électromécanique, par exem- ple au moyen de touches manoeuvrées à la main. Ces touches comman- dent respectivement., par exemple, l'amplitude des oscillations amenées aux dix filtres passe-bande, la mise en circuit ainsi que la fréquence fondamentale du générateur d'impulsions ou la mise en circuit de la source qui produit un spectre de fréquences con- tinu. En manipulant convenablement les touches on peut composer tout à fait artificiellement un spectre de fréquences quelconque voulu qui correspond à celui des différents phonèmes. 



   Dans le dispositif connu toutes les oscillations compri- ses dans la même bande de fréquences sont reproduites avec la même amplitude ce qui provoque une perte de fidélité de la parole reproduite. En fait, des essais faits sur la parole ont montré , que, par suite de phénomènes de résonance dans les cavités de la bouche, de la gorge et du nez, certaines fréquences (dites "for- mants") apparaissent d'une façon particulièrement prononcée dans les divers phonèmes et ces formants déterminent essentiellement la phonalité.   Or,   le dispositif connu ne permet pas de reproduire complètement ces formants. 



   Dans le dispositif conforme à l'invention cet inconvé- nient est évité et on obtient en même temps l'avantage que le nombre des grandeurs caractérisant la parole, qui est nécessaire- 

 <Desc/Clms Page number 4> 

 pour la composition artificielle de la parole, est moindre que dans le dispositif connu précité. 



   Dans un dispositif permettant de produire artificielle- ment des phonèmes par voie électrique, dans lequel on produit, d'après le caractère du phonème à engendrer, un spectre continu d'oscillations ou d'impulsions dont la durée d'oscillation cor- respond à la fréquence fondamentale des phonèmes à produire qui comportent une fréquence fondamentale, on amène les oscillations produites, conformément à l'invention, à un certain nombre de cir- cuits oscillants dont la syntonisation est commandée respective- ment corrélativement aux formants des phonèmes à produire; de plus, les tensions prélevées sur les circuits oscillants sont combinées dans un rapport d'amplitude qui correspond au rapport d'amplitude des formants des phonèmes à produire. 



   Dans un dispositif destiné à la composition artificielle de la parole la mise en circuit de la source produisant un spec- tre d'oscillations continu ou du générateur d'impulsions, la syn- tonisation des circuits oscillants et la combinaison des tensions se produisant sur les circuits oscillants dans le rapport d'am- plitude convenable est commandée au moyen de touches manoeuvrées à la main. 



   Dans les dispositifs destinés à la transmission de la parole par voie électrique la commande a lieu au moyen de grandeurs caractéristiques produites du côté transmission. A cet effet on divise, conformément à l'invention, le spectre de la parole à transmettre du côté transmission en un certain nombre de zones de fréquences et on transmet la fréquence et l'amplitude du for- mant dans chaque zone respectivement au moyen d'une grandeur ca- ractéristique, les grandeurs caractéristiques qui sont une mesure de la fréquence des formants commandant respectivement la syntoni- sation des circuits oscillants du côté réception, et les   amplitu-   des des tensions prélevées sur ces circuits oscillants étant ré- glées respectivement en fonction de grandeurs caractéristiques qui   /\ sont   une mesure de l'amplitude des formants.

   

 <Desc/Clms Page number 5> 

 



   Dans le dispositif conforme à l'invention on détermine, comme on l'a dit plus haut, respectivement dans un certain nombre de bandes de fréquences du spectre de la parole la fréquence et l'amplitude de l'oscillation avant l'amplitude maximum et on les transmet au moyen de grandeurs caractéristiques, par exemple des oscillations de commande. Or, la question est de savoir le nom- bre minimum de bandes de fréquences dans lesquelles la détermina- tion des grandeurs en question doit avoir lieu pour assurer encore une transmission distincte de la parole. L'explication suivante du mécanisme de la production des phonèmes suffira à éclaircir ce point. 



   L'air comprimé dans les poumons passe sur les cordes vo- cales par le pharynx et la bouche, éventuellement aussi par les fosses nasales, vers l'extérieur. Lors de la prononciation des di- vers sons l'énergie du courant d'air est convertie en énergie vi- bratoire en certains endroits où le courant d'air est étranglé, par exemple dans l'intervalle entre les cordes vocales, dans l'es-      pace entre la langue et la luette, entre les dents, entre les lèvres. Les vibrations produites sont généralement des oscillations de relaxation et comprennent donc un grand nombre d'harmoniques. 



  Lorsque cette oscillation de relaxation initiale entre dans un ou plusieurs espaces de résonance constitués par le pharynx, les fos- ses nasales et la cavité buccale, 'ces espaces sont aspirés et mis en résonance ce qui a pour effet d'amplifier certains harmoniques de la vibration initiale. Les fréquences les plus favorisées, dites "formants", diffèrent d'un son à l'autre. 



   La plupart des consonnes, à savoir les consonnes vocali- ques et toutes les voyelles, qui sont les porteurs proprement dits de la parole, sont produites essentiellement avec la coopération des trois cavités de résonance précitées de sorte que ces sons comporteront en substance trois formants. Pour caractériser ces   derniers   il est nécessaire de déterminer la valeur et la position   @   

 <Desc/Clms Page number 6> 

 des trois résonances, de sorte qu'il est nécessaire de diviser le spectre de la parole en au moins trois bandes de fréquences et d'établir dans chaque bande à quelle fréquence il se produit un maximum de résonance et la valeur de ce maximum. 



   D'autres consonnes, telles que les consonnes explosives, sont caractérisées par des phénomènes de transition qui se produi- sent avant ou après la production d'une voyelle. 



   Dans la production de ces sons on livre brusquement pas- sage au courant d'air et l'arrête respectivement, ce qui a pour effet que les cavités de résonance de l'organe vocal sont res- pectivement excitées selon leurs vibrations propres et désexcitées avec évanouissement. Dans le cas où les consonnes en question pré- cèdent une voyelle le caractère de la voyelle détermine le mode d'excitation de l'oscillation de relaxation du courant d'air pro- duit par les cordes vocales. Si la consonne est précédée par une voyelle c'est la consonne qui détermine le mode d'évanouissement de l'oscillation de relaxation. 



   Pour la production artificielle de ces sons il s'agit donc en premier lieu de commander convenablement la fréquence pen- dant l'excitation ou l'évanouissement du générateur d'impulsions imitant électriquement les cordes vocales. 



   Des essais ont révélé que la plupart des phonèmes pro- duits artificiellement sont déjà suffisamment distincts lorsqu'ils comprennent trois formants. Le dispositif destiné à produire ar- tificiellement les phonèmes, faisant l'objet de la présente inven- tion, doit donc comprendre au moins trois circuits oscillants dont la syntonisation est commandée, ce qui nécessite trois gran- deurs caractéristiques pour commander l'amplitude des tensions qui apparaissent sur les circuits oscillants et, en outre, une grandeur caractéristique supplémentaire doit commander la mise en circuit de la source débitant un spectre d'oscillations continu ou la mise en circuit du générateur d'impulsions et la fréquence de 

 <Desc/Clms Page number 7> 

 ce dernier. En tout on a donc besoin d'au moins sept grandeurs ca-   ractéristiques.   



   Par conséquent, dans les dispositifs destinés à la trans- mission de la parole par voie électrique sept tensions de réglage suffisent. 



   La description du dessin annexé, donné à titre d'exem- ple non limitatif fera bien comprendre comment l'invention peut être réalisée, les particularités qui ressortent tant du dessin que du texte faisant bien entendu partie de celle-ci. 



   La fig. 1 est le schéma de principe d'un dispositif con- forme à l'invention pour transmettre la parole par voie électrique. 



   Le spectre d'oscillations produit en parlant dans le mi- crophone M du côté transmission Z est divisé en quatre octaves au moyen de quatre filtres passe-bandes F1, F2, F3 et F4. Il est sup- posé que, comme l'apprend la téléphonie, il faut reproduire pour une bonne intelligibilité de la parole une zone de fréquences de 200 à 3200 pér./sec., de sorte que les zones de transmission des filtres F1 à F4 peuvent être choisies comme suit: 
F1 200 à 400 pér./sec. 



   F2 400 à 800 pér./sec. 



   F3 800 à1600 pér. /sec. 



   F4 1600 à3200 pér./sec. 



   Les circuits de sortie des filtres sont reliés aux analyseurs A1, A2, A3, et A4 qui déterminent dans chacune des quatre bandes de fréquences la fréquence où il se produit l'oscil- lation ayant l'amplitude maximum et la valeur de cette amplitude. 



  Chaque analyseur débite deux tensions de réglage, dont l'une est proportionnelle à la fréquence, tandis que l'autre est proportion- nelle à l'amplitude de l'oscillation ayant l'amplitude maximum qui se produit dans une seule bande de fréquences. En outre, il y a du côté transmission un analyseur A5 qui détermine si les oscilla- tions produites par le microphone comprennent une fréquence fonda- mentale et la valeur de cette fréquence. Les neuf tensions de ré- page ainsi obtenues sont les grandeurs caractéristiques qui sont 

 <Desc/Clms Page number 8> 

 transmises par l'intermédiaire de lignes L1 à L9 au côté récep- tion 0 où elles commandent le dispositif destiné à la production artificielle de la parole.

   Ce dernier comprend un générateur d'impulsions G, qui produit des impulsions se composant d'une fré- quence fondamentale avec un grand nombre d'harmoniques plus éle- vées, et un générateur R qui produit un spectre continu d'oscil- lations électriques. La grandeur caractéristique, qui indique si les oscillations produites par le microphone M contiennent une fréquence fondamentale ou non et en même temps la valeur de la fréquence fondamentale éventuellement présente, grandeur qui est transmise sous la forme d'une tension de réglage par l'intermédiai- re de la ligne L9, commande les générateurs G et R. Cette commande est telle que lorsqu'on reçoit une tension de réglage par l'inter- médiaire de la ligne L9 le générateur G est mis en circuit, tan- dis que le générateur R est mis hors circuit.

   Dans ce cas la ten- sion de réglage règle en même temps la fréquence fondamentale des impulsions produites par le générateur G, de sorte que cette fré- quence correspond à la fréquence fondamentale des oscillations engendrées par le microphone M du côté transmission. 



   Quand on ne reçoit pas de tension de réglage par l'in- termédiaire de la ligne L9 le générateur R est mis en circuit automatiquement. 



   Les oscillations produites par les générateurs G ou R sont amenées à quatre circuits oscillants syntonisables R1, R2, R3 et R4 La syntonisation de ces circuits oscillants est réglée par les grandeurs caractéristiques qui sont une mesure de la fréquence de l'oscillation ayant l'amplitude maximum qui apparaît dans chacune des quatre bandes de fréquences différentes en les- quelles les filtres F1 et F4 divisent le spectre de fréquences du coté transmission. Ces grandeurs caractéristiques sont donc les tensions de réglage transmises par l'intermédiaire des lignes L2, L4, L6 et L8. Les tensions qui apparaissent sur les circuits os- eillant R1 à R4 sont amenées respectivement aux amplificateurs 

 <Desc/Clms Page number 9> 

 V1 à V4 comportant un réglage automatique du degré d'amplification. 



  Ce réglage a lieu en fonction des grandeurs caractéristiques qui sont une mesure de l'amplitude de l'oscillation ayant   l'amplitu-   de maximum dans les quatre bandes de fréquences, à savoir les ten- sions de réglage transmises par l'intermédiaire des lignes L1, L3,   L5 et   L7. 



   Les circuits de sortie des amplificateurs V1 à V4 sont montés en parallèle. Le téléphone T est relié au circuit de sor- tie commun. 



   Pour expliquer le fonctionnement du dispositif précité il est supposé qu'on désire transmettre la voyelle "a" dont la fig. 2 montre le spectre de fréquences. La fréquence fondamentale est de 128 pér./sec. de sorte que le spectre se compose d'un cer- tain nombre d'harmoniques plus élevées de 128 pér./sec. dont le rapport des amplitudes correspond à celui des longueurs des lignes verticales sur la fig. 2. Les extrémités de ces lignes sont situées sur une courbe enveloppe qu'on peut imaginer se composer des trois courbes en pointillés qui présentent la forme de courbes de ré- sonance. D'après ce qu'on a expliqué plus haut au sujet de la production des voyelles on peut concevoir ces courbes comme les courbes de résonance- des espaces de résonance qui sont constitués par les cavités de la bouche, du nez et de la gorge, et déterminent les formants.

   Dans le spectre de la voyelle "a" ces formants se trouvent sur la fig. 2 à 640, 1280 et 2688 pér./sec., c'est-à-dire le 5me, 9me et 21me harmonique de la fréquence fondamentale de 128 pér. /sec. produite par les cordes vocales. 



   Pour produire artificiellement du côté réception 0 sur la   fig.   1 le spectre de fréquences montré sur la fig. 2, la fréquence du générateur de relaxation G doit être réglée sur 128 pér. /sec. et les circuits oscillants R2, R3 et R4 respectivement sur les fréquences 640, 1280 et 2688 pér. /sec., tandis que l'amplification 

 <Desc/Clms Page number 10> 

 des amplificateurs V2, V3 et V4 est réglée corrélativement aux amplitudes Il, I2 et I3 des formants dans le spectre montré sur la fig. 2. 



   Il résulte alors de la combinaison des courbes caractéris- tiques des circuits oscillants R2à   R   et des amplificateurs   V   à 
V4 une caractéristique amplitude/fréquence du dispositif récepteur 
0 qui correspond approximativement à la courbe enveloppe des li- gnes verticales sur la fig. 2. Lorsqu'on amène alors à ce disposi- tif les impulsions engendrées par le générateur G, ayant une fré- quence fondamentale de 128 pér. /sec., il se produit dans le cir- cuit de sortir commun des amplificateurs V1 à V4 un spectre de fréquences qui correspond approximativement au spectre de fréquen- ces initial montré sur la fig. 2. Le téléphone T reproduit ce spec- tre de fréquences comme le phonème "a". 



   Sur la fig. 1 on a supposé par raison de commodité que les grandeurs caractéristiques sont transmises sous la forme de tensions de réglage du côté transmission vers le côté réception sur des li- gnes distinctes Li à L9. En pratique il est préférable de moduler ces tensions de réglage sur des ondes porteuses, par exemple de la manière bien connue en télégraphie à onde porteuse multiplex. Pour la transmission des tensions de réglage modulées sur les ondes porteuses une largeur de bande de 25 pér./sec. suffit, de sorte que dans le système montré sur la fig. 1,   .où   il faut transmettre neuf tensions de réglage, il est nécessaire d'utiliser une largeur de bande totale de 9 x 25 = 225 pér./sec., en supposant que seule une bande latérale de chaque onde porteuse est émise. 



   Après l'explication précitée du schéma de principe montré sur la fig. 1, on décrira ci-après ces détails éventuels. 



   Analyseur pour la fréquence fondamentale A5. La fig. 3 représente le montage de l'analyseur A5 de la fig. 1 permettant de déterminer la fréquence fondamentale. Le spectre vocal à examiner, qui provient du microphone M sur la fig.l, est amené aux bornes   d'en-   trée 1 et 2 de l'analyseur de la fig. 3 auxquelles est relié un fil- 

 <Desc/Clms Page number 11> 

 tre 3 ayant une zone de transmission de 50 à 400 pér. /sec. En fait, des essais sur la parole ont montré que la fréquence fondamentale des sons ayant une telle fréquence fondamentale a une valeur de 
75 à 350 pér. /sec. en fonction de la hauteur de la voix des diver- ses personnes. S'il y a une fréquence fondamentale elle tombera donc dans la zone de transmission du filtre 3. 



   Il est dérisable que le filtre coupe les basses fréquen- ces inférieures à 50 pér.Sec. pour éviter une fausse réaction de l'analyseur sur les basses fréquences provoquées par les pauses entre les syllabes et mots successifs. 



   Par suite de l'assez grande largeur de la zone de trans- mission du filtre 3 ce dernier laissera passer, outre la fréquence fondamentale, des harmoniques de cette oscillation; toutefois, l'amplitude de la fréquence fondamentale domine dans une mesure plus ou moins grande. On se sert de cette différence d'amplitu- de pour éliminer complètement la fréquence fondamentale. Le cir- cuit de sortir du filtre 3 est relié au circuit de la grille de commande d'un tube amplificateur 4.

   Ce circuit comporte une ré- sistance 6 shuntée par le condensateur 5, élément qui présente des dimensions telles que la perte de tension provoquée à travers la résistance 6 par le courant de la grille de commande circulant dans le tube 4 a pour effet de régler toujours la polarisation de la grille en fonction de l'amplitude des oscillations amenées par l'intermédiaire du filtre 3 de telle façon qu'il circule encore juste du courant de grille pour l'amplitude maximum. En utilisant un tube dont la courbe caractéristique présente une forte courbure dans la zone du voisinage du point où la tension de grille est nulle, on assure que l'oscillation avec l'amplitude maximum, à sa- voir la fréquence fondamentale, soit amplifiée dans une plus grande mesure que l'amplitude d'harmoniques éventuels de la fréquence fon- damentale.

   Les oscillations amplifiées apparaissent à travers une résistance 7 intercalée dans le conducteur cathodique du tube 4. 

 <Desc/Clms Page number 12> 

 



   En pratique il est recommandé d'utiliser en cascade un certain nombre d'étages qui sont connectés de la même manière que le tube 4 et précèdent ce dernier, afin de donner à la différence d'amplitude avec la fréquence fondamentale dans les harmoniques présents une si grande valeur qu'il se produit à travers la résis- tance 7, en substance seule, une oscillation ayant la fréquence fondamentale. Cette oscillation est amenée au tube 8 monté en limitateur qui transforme la fréquence fondamentale sinusoïdale mon- trée sur la fig. 4b, en une oscillation qui présente une forme approximativement rectangulaire comme le montre la fig. 4b. Au moyen du transformateur différentiel 9 l'oscillation montrée sur la fig. 4b est transformée en une tension en forme d'impulsion montrée sur la fig. 4c qui est amenée à la grille de commande d'un tube relais 10.

   Entre l'anode et la cathode de ce tube est connecté un condensateur 11 qui est chargé à partir d'une source de tension continue par l'intermédiaire de la résistance 12, de sorte que l'anode du tube relais 10 acquiert une tension positive par rapport à la cathode. Le montage est réglé de telle façon que chaque fois que la tension amène à la grille de commande du tube relais une impulsion positive par l'intermédiaire de l'enroulement secondaire du transformateur 9 le tube relais est amorcé et le condensateur 11 se décharge brusquement, après quoi la décharge qui jaillit dans le tube relais s'éteint et le condensateur est re- chargé par l'intermédiaire de la bobine de réactance 12.

   L'impul- sion de courant produite à chaque instant où le tube est amorcé provoque, à travers la résistance 13, des impulsions de tension périodiques montrées sur la fig. 4d, dont la fréquence correspond à la fréquence fondamentale. La composante de tension continue de ces impulsions, qui est une mesure de la fréquence fondamentale, est éliminée au moyen du filtre constitué par la résistance 14 et le condensateur 15 et amenée aux bornes 16,   17.   



   De la sorte on obtient la grandeur caractéristique qui est une mesure de la fréquence fondamentale de la parole à trans- 

 <Desc/Clms Page number 13> 

 mettre sous la forme d'une tension de réglage entre les bornes 16 et 17. Cette tension de réglage est transmise vers le côté réception par l'intermédiaire de la ligne L9 montrée sur la fig.l, qui est reliée aux bornes 16 et 17 montrées sur la fig. 3. 



   Les phonèmes ne contiennent souvent pas ou sensiblement pas de fréquence fondamentale, mais un certain nombre d'harmoni- ques plus élevés. Dans ces cas la fréquence fondamentale corres- pond à la périodicité de l'oscillation. Dans l'analyseur cette os- cillation est déformée, parce que les grandes amplitudes sont am- plifiées dans une plus grande mesure que ne le sont les faibles amplitudes. En même temps il se produit une limitation par le cou- rant de grille de sorte que les amplitudes les plus grandes sont amplifiées jusqu'à une valeur déterminée, ce qui s'effectue dans le tube 4 et les étages précédents qui sont connectés de la même manière. Dans le dernier étage la différence d'amplitude est si grande que seule l'amplitude la plus grande est transmise. 



   Analyseurs A1 à A4. 



   La fig. 5 représente le schéma de connexion des analy- seurs A1 à A4, dont chacun est constitué par un dispositif per- mettant de déterminer la fréquence et un dispositif permettant de déterminer l'amplitude de l'oscillation avec l'amplitude maximum dans une des quatre bandes de fréquences en lesquelles les filtres F1 à F4 divisent la parole à transmettre. Cette bande de fréquence est amenée aux bornes d'entrée 18 et 19. Le montage et le fonction- nement du premier dispositif correspond en substance à ceux du dis- positif destiné à déterminer la fréquence fondamentale montré sur la fig. 3, de sorte qu'on se   réfèrera"à   cette fig. pour l'expliquer. 



  Il est à remarquer, cependant, que la tension de réglage, qui est une mesure de la fréquence de l'oscillation avec l'amplitude maxi- mum, apparaît entre les bornes 16 et 17. Sur la fig. 5 les éléments de couplage correspondants portent les mêmes chiffres de référence que sur la fig. 3. 



  Entre les tubes 4 et 8 est prévu un transformateur 20, 

 <Desc/Clms Page number 14> 

 dont le secondaire est relié au dispositif destiné à déterminer l'amplitude de l'oscillation avec l'amplitude maximum. Ce dis- positif comporte un redresseur 21 qui est connecté en série avec une résistance 22 shuntée par le condensateur 23. Le montage fonc- tionne comme un détecteur de crête, de sorte qu'il se produit à travers la résistance une tension redressée qui est proportionnel- le à l'amplitude de l'oscillation avec l'amplitude maximum. La tension redressée à travers la résistance 22,après avoir été éga- lisée au moyen d'un filtre constitué par la résistance 24 et le condensateur 25, est amenée aux bornes de sortie 26, 27. 



   Générateur d'impulsions et générateur destiné à produire un spectre d'oscillations continu. 



   La fig. 6 montre le montage du générateur d'impulsions G et le montage du générateur R destiné à produire un spectre d'os- cillations continu. Le générateur d'impulsions comporte un tube à décharges 100 dont les grilles 101 et 102 sont couplées entre elles à travers le condensateur 103. A travers la résistance 104 une tension positive est amenée à la grille 102, tandis que la tension de réglage, qui est transmise sur la ligne L9 montrée sur la fig.l, est amenée à la grille 101 à travers une résistance 105. 



  Cette tension de réglage apparaît entre les bornes 106, 107. Entre la grille 101 et la terre est connecté le condensateur 108. Le montage de ce générateur d'impulsions est connu de sorte qu'il est superflu de l'expliquer plus en détail. 



   Le générateur G produit des impulsions ayant une fré- quence qui est fonction de la tension de réglage entre les bornes 106 et 107 et ces impulsions sont amenées au circuit de grille d'un tube à décharges 109. Cette commande de la fréquence par la tension de réglage se fait de telle façon que la fréquence corres- ponde toujours à la fréquence fondamentale du spectre vocal initial engendré par le microphone M montré sur la fig. 1. Lorsque le spec- tre vocal ne contient pas de fréquence fondamentale (il n'y a alors 

 <Desc/Clms Page number 15> 

 pas non plus de tension de réglage entre les bornes 106 et   107)   le générateur G est bloqué et ne produit pas d'impulsions. 



   Le générateur R destiné à produire un spectre d'oscilla- tions continu est constitué par une résistance 110 intercalée dans le circuit d'entrée de l'amplificateur lll. A travers la ré- sistance 110 il se produit, par suite d'un mouvement électronique de Broxn dans la matière de la résistance, une tension de bruit qui, comme on le sait, est constituée par un spectre d'oscilla- tions continu. Ce spectre d'oscillations continu est amplifié par l'amplificateur 111 et amené au réseau d'atténuation 112 dont l'atténuation est réglée par la perte de tension à travers les ré- sistances 113 et 114 dans le circuit anodique du tube à décharges électriques 115. La tension de réglage apparaissant entre les bor- nes 106 et 107 est amenée à la grille de commande de ce tube.

   Le montage du réseau d'atténuation 110 et du tube 113 correspond en- tièrement à celui du réseau d'atténuation 212   et 216   expliqué ci- après et du tube 221 montré sur la fig. 7 à laquelle on se référera en l'espèce. Le fonctionnement du réseau d'atténuation 112 conjoin- tement avec le tube   ils   est tel qu'en l'absence d'une tension de réglage entre les bornes 106 et 107 le réseau d'atténuation trans- met au circuit de grille du tube amplificateur 116 la tension qui apparaît dans le circuit de sortir de l'amplificateur 111. Cette transmission est bloquée aussit8t qu'il se produit une tension de réglage entre les bornes 106 et   107.   



   En résumé, il résulte de ce qui précède qu'en présence d'une tension de réglage entre les bornes 106 et 107 le généra- teur d'impulsions G amène au tube 109 des impulsions dont la fré- quence correspond à la fréquence fondamentale des phonèmes à transmettre..Par contre, il n'y a pas de transmission vers le tube 116 du spectre d'oscillations continu se produisant à travers la résistance 110. En l'absence de la tension de réglage en question le tube 109 ne reçoit pas d'impulsions, tandis que le tube 116 reçoit un spectre d'oscillations continu.

   A travers la résistance 

 <Desc/Clms Page number 16> 

 117 intercalée dans le circuit anodique commun des tubes 109 et 116 apparaissent donc soit des impulsions de tension soit une tension constituée par un spectre d'oscillations continu, suivant que les phonèmes à transmettre contiennent une fréquence fondamenta- le ou non. 



   Les bornes 118 et 119 de la résistance 117 sont reliées aux bornes de sortie des circuits oscillants syntonisables. 



   Circuits oscillants syntonisables R1 à   R.   



   Tous les circuits oscillants syntonisables R1 à R4 sont connectés de la même manière, de sorte qu'il suffit d'expliquer l'un d'eux, par exemple le circuit oscillant R1, dont le montage est représenté sur la fig. 7. Le circuit oscillant syntonisable est constitué par un condensateur 201 et l'impédance d'entrée Z qui est montée en parallèle avec ce dernier, d'un tube à décharges 202 monté en réactance. Le circuit anodique de ce tube comporte une résistance 203, et le circuit anodique et le circuit de grille sont couplés entre eux au moyen d'une bobine 204. L'impédance d'en- trée Z de ce montage est donnée par l'expression 
 EMI16.1 
 où L représente l'inductance de la bobine 204, R la résistance 203 et S la pente du tube 202. Il résulte de cette expression que Z représente l'inductance d'une self induction. 
 EMI16.2 
 qui est fonction de la pente S.

   Cette pente est réglée par la ten- sion de réglage qui est une mesure de la fréquence du formant dans la bande de fréquences 200 à 400 pér./sec. et est transmise aux bornes 205 et 206 sur la fig. 7 par l'intermédiaire de la ligne L2 montrée sur la fig. 1. Le montage est réglé de telle façon que sous l'action de la tension de réglage la fréquence sur laquelle est accordé le circuit oscillant constitué par le condensateur 201 et l'impédance d'entrée Z corresponde à la fréquence du formant dans la bande de fréquences 200 à 400 pér. /sec. Par l'intermédiaire 

 <Desc/Clms Page number 17> 

 du transformateur   207   le circuit oscillant accordé est relié aux bornes 208, 209 auxquelles sont amenées les oscillations engen- drées par la source G ou R sur la fig. 1.

   La tension se produisant à travers le circuit oscillant est amenée, par l'intermédiaire d'un troisième enroulement du transformateur, à l'amplificateur V1 à amplification réglable. Le réglage de l'amplification se fait en s'arrangeant de façon que la tension de réglage que transmet la ligne L1, sur la fig.l, vers les bornes 210 et 211 de la fig. 7 règle l'atténuation d'un circuit amortisseur qui est intercalé dans le circuit d'entrée de l'amplificateur V1 et est constitué par quatre résistances non-linéaires qui sont fonction de la tension (par exemple des redresseurs secs) 212, 213, 214 et 215.

   Entre le point de connexion 216 des résistances 214 et 215 et un branche- ment médian 217 de l'enroulement primaire du transformateur 218 sont connectées deux résistances 219 et 220 qui sont en même temps in- tercalées dans le circuit anodique du tube amplificateur 221. La grille de commande et la cathode de ce tube sont reliées respecti- vement aux bornes 210 et 211. Le montage est réglé de telle façon que pour une valeur moyenne de la tension de réglage amenée aux bornes 210 et 211 il ne se produise.pas de tension entre les points 216 et 217. Quand la tension de réglage entre les bornes 210 et 211 augmente, le point 217 devient plus négatif, ce qui a pour effet que la résistance des résistances non-linéaires 212 et 213 augmente et celle des résistances non-linéaires 14 et 16 baisse.

   Lorsque, par contre, la tension de réglage entre les bornes 210 et 211 tom- be en-dessous de la valeur moyenne, le point 217 devient plus po- sitif, les résistances   212   et 213 diminuent et les résistances 214 et 216 augmentent. Dans le premier cas le réseau amortisseur pro- duit une atténuation réduite. 



   Sous l'action de la commande du circuit amortisseur par la tension de réglage la tension, qui apparaît à travers le cir- cuit oscillant constitué par le condensateur 201 et l'impédance Z, 

 <Desc/Clms Page number 18> 

 se produira dans le circuit de sortie 222, 223 de l'amplificateur V1 avec une amplification qui correspond à l'amplitude du formant dans la bande de fréquences 200 à 400 pér./sec. 



   La zone de transmission du circuit oscillant est choisie de telle façon que cette zone ne comprenne qu'un seul formant. 



   Le dispositif 0 du côté réception sur la fig.l peut aussi être utilisé indépendamment pour la production artificielle de la parole. Dans ce cas les tensions de réglage nécessaires sont pré- levées, par exemple, sur un certain nombre de sources de courant shuntées par des potentiomètres. On peut régler ces derniers au moyen de touches. La manipulation des touches demande un peu d'exer- cice; toutefois, au moyen de ce dispositif une personne bien entrai- née peut produire des phonèmes, des mots et des phrases. 



   Le dispositif conforme à l'invention, utilisé en télé- phonie, procure une économie considérable dans la bande de fréquen- ces nécessaire pour transmettre une conversation. Dans les métho- des usuelles de transmission par téléphonie on a besoin d'une ban- de de fréquences d'environ 3000 pér. /sec., tandis que dans l'exem- ple précité on n'utilise qu'une largeur de bande de 225 pér. /sec., de sorte que dans une largeur de bande de 3000 pér. /sec. des systèmes de téléphonie usuels l'invention permet d'avoir une dizaine de con- versations. 



   Le dispositif conforme à l'invention peut être utilisé avantageusement dans les installations à microphone et à haut-parleur dans lesquelles il était nécessaire jusqu'ici d'attacher beaucoup d'attention à l'élimination de réactions acoustiques. 



   Lorsqu'on utilise dans ces installations un dispositif conforme à la présente invention il n'y a pas de risque de voir se manifester ces réactions, parce que les oscillations vocales re- produites par le haut-parleur sont toujours légèrement différentes, -,en ce qui concerne la fréquence, des oscillations initiales.



   <Desc / Clms Page number 1>
 



  Device making it possible to artificially produce phonemes electrically.



   The present invention relates to a device for artificially composing speech and to the use of such a device for the transmission of speech by electrical means. In the transmission of speech by electrical means the invention aims to perform this transmission in such a way that the necessary frequency band is much narrower than the frequency band occupied by the vibrations of the speech.



   In a well-known device intended for the transmission of speech, we deduce from the vibrations of speech, on the transmission side, by means of an analyzer, certain quantities characterizing the speech which is transmitted, by means of adjustment voltages, of modulated on carrier waves having a fairly low frequency.



  These characteristic quantities are the fundamental frequency of @

 <Desc / Clms Page number 2>

 speech spectrum, provided it is present, and the amplitude of vibrations in parts of the speech spectrum. In the known device, the spectrum of speech is divided into ten frequency bands and, in each band, the amplitude of the vibrations which it comprises is determined and fixed by a characteristic quantity, which is transmitted by means of an adjustment voltage. In all, eleven adjustment voltages are therefore needed, namely one which is a measure of the instantaneous value of the fundamental frequency, while the ten other adjustment voltages indicate the amplitude of the vibrations in about ten bands of the frequency. spectrum of speech.



   On the reception side, the characteristic quantities transmitted by the control vibrations are used to control a device making it possible to artificially produce speech vibrations. The characteristic quantity, which is a measure of the fundamental frequency of the speech spectrum, controls on the reception side the oscillation generated by a pulse generator in such a way that the fundamental frequency of the pulses always corresponds to the fundamental frequency of the pulse generator. initial spectrum of speech. The pulses which, in addition to the fundamental frequency, include a large number of higher harmonics are fed to about ten band-pass filters, the transmission zones of which correspond respectively to the ten frequency bands into which the spectrum is divided. speech on the transmission side.

   The output circuit of each bandpass filter is connected to an amplifier, the degree of amplification of which is automatically adjusted under the action of the adjustment voltage which is a measure of the amplitude of the initial vibrations of the speech. included in the frequency band which corresponds to the transmission zone of the bandpass filter.



   Not all phonemes consist of a fundamental vibration and a number of higher harmonics,

 <Desc / Clms Page number 3>

 like vowels. So, for example, the sibilants consist of a continuous frequency spectrum. In order to be able to transmit these sounds also, a current source has been provided on the receiving side which produces a continuous spectrum of frequencies and is automatically connected instead of the pulse generator when there is no fundamental frequency in the vibrations. word that we want to transmit.



   In the aforementioned device making it possible to transmit the speech, the characteristic quantities of the initial speech are deduced from the transmission side. However, these characteristic quantities can also be generated electromechanically, for example by means of keys operated by hand. These keys respectively control, for example, the amplitude of the oscillations fed to the ten bandpass filters, the switching on as well as the fundamental frequency of the pulse generator or the switching on of the source which produces a spectrum. of continuous frequencies. By handling the keys properly, it is possible to compose quite artificially any desired frequency spectrum which corresponds to that of the different phonemes.



   In the known device, all the oscillations included in the same frequency band are reproduced with the same amplitude, which causes a loss of fidelity of the reproduced speech. In fact, tests carried out on speech have shown that, as a result of resonance phenomena in the cavities of the mouth, throat and nose, certain frequencies (called "forming") appear in a particular way. pronounced in the various phonemes and these formants essentially determine the phonality. However, the known device does not allow these formants to be completely reproduced.



   In the device according to the invention, this disadvantage is avoided and at the same time the advantage is obtained that the number of quantities characterizing the speech, which is necessary.

 <Desc / Clms Page number 4>

 for the artificial composition of speech, is less than in the aforementioned known device.



   In a device allowing the artificial production of phonemes by electrical means, in which one produces, according to the character of the phoneme to be generated, a continuous spectrum of oscillations or of impulses the oscillation duration of which corresponds to the fundamental frequency of the phonemes to be produced which include a fundamental frequency, the oscillations produced, in accordance with the invention, are brought to a certain number of oscillating circuits, the tuning of which is controlled respectively correlatively to the formants of the phonemes to be produced; in addition, the voltages taken from the oscillating circuits are combined in an amplitude ratio which corresponds to the amplitude ratio of the formants of the phonemes to be produced.



   In a device intended for the artificial composition of speech, the switching on of the source producing a continuous spectrum of oscillations or of the pulse generator, the synchronization of the oscillating circuits and the combination of the voltages produced on the Oscillating circuits in the proper amplitude ratio is controlled by means of manually operated keys.



   In devices intended for the transmission of speech by electrical means, the control takes place by means of characteristic quantities produced on the transmission side. For this purpose, according to the invention, the spectrum of the speech to be transmitted on the transmission side is divided into a certain number of frequency zones and the frequency and amplitude of the component in each zone are transmitted respectively by means of 'a characteristic quantity, the characteristic quantities which are a measure of the frequency of the formants controlling respectively the tuning of the oscillating circuits on the receiving side, and the amplitudes of the voltages taken from these oscillating circuits being set respectively in function of characteristic quantities which / \ are a measure of the amplitude of the formants.

   

 <Desc / Clms Page number 5>

 



   In the device according to the invention, as stated above, respectively, in a certain number of frequency bands of the speech spectrum, the frequency and the amplitude of the oscillation before the maximum amplitude and they are transmitted by means of characteristic quantities, for example control oscillations. Now, the question is to know the minimum number of frequency bands in which the determination of the quantities in question must take place in order to ensure further distinct transmission of speech. The following explanation of the mechanism of the production of phonemes will suffice to clarify this point.



   Compressed air in the lungs passes over the vocal cords through the pharynx and mouth, possibly also through the nasal passages, outward. When pronouncing the various sounds the energy of the air current is converted into vibratory energy in certain places where the air current is strangled, for example in the gap between the vocal cords, in the space between the tongue and the uvula, between the teeth, between the lips. The vibrations produced are generally relaxation oscillations and therefore include a large number of harmonics.



  When this initial relaxation oscillation enters one or more resonant spaces formed by the pharynx, nasal cavity and oral cavity, these spaces are sucked in and resonated, which has the effect of amplifying certain harmonics of the initial vibration. The most favored frequencies, called "formants", differ from one sound to another.



   Most of the consonants, namely the vocal consonants and all the vowels, which are the actual carriers of speech, are produced essentially with the cooperation of the three above-mentioned resonant cavities so that these sounds will consist essentially of three formants. To characterize these it is necessary to determine the value and the position @

 <Desc / Clms Page number 6>

 of the three resonances, so that it is necessary to divide the speech spectrum into at least three frequency bands and to establish in each band at which frequency there is a maximum resonance and the value of this maximum.



   Other consonants, such as explosive consonants, are characterized by transitional phenomena that occur before or after the production of a vowel.



   In the production of these sounds the passage is abruptly given to the air current and respectively stopped, which has the effect that the resonance cavities of the vocal organ are respectively excited according to their own vibrations and de-excited with fainting. In the case where the consonants in question precede a vowel, the character of the vowel determines the mode of excitation of the relaxation oscillation of the air current produced by the vocal cords. If the consonant is preceded by a vowel, it is the consonant which determines the fading mode of the relaxation oscillation.



   For the artificial production of these sounds, it is therefore first of all a question of suitably controlling the frequency during the excitation or fading of the pulse generator electrically imitating the vocal cords.



   Tests have shown that most artificially produced phonemes are already sufficiently distinct when they include three formants. The device intended to artificially produce the phonemes, which is the subject of the present invention, must therefore include at least three oscillating circuits, the tuning of which is controlled, which requires three characteristic quantities to control the amplitude of the sound. voltages which appear on the oscillating circuits and, in addition, an additional characteristic quantity must control the switching on of the source delivering a continuous spectrum of oscillations or the switching on of the pulse generator and the frequency of

 <Desc / Clms Page number 7>

 this last. In all, therefore, at least seven characteristic quantities are needed.



   Consequently, in devices intended for the transmission of speech by electrical means seven setting voltages are sufficient.



   The description of the appended drawing, given by way of non-limiting example, will make it clear how the invention can be implemented, the features which emerge both from the drawing and from the text, of course, forming part of it.



   Fig. 1 is the block diagram of a device in accordance with the invention for transmitting speech electrically.



   The oscillation spectrum produced by speaking into the microphone M on the transmission side Z is divided into four octaves by means of four band-pass filters F1, F2, F3 and F4. It is assumed that, as telephony learns, for good speech intelligibility it is necessary to reproduce a frequency zone of 200 to 3200 per. / Sec., So that the transmission zones of filters F1 to F4 can be chosen as follows:
F1 200 to 400 per. / Sec.



   F2 400 to 800 per. / Sec.



   F3 800 to 1600 per. /dry.



   F4 1600 to 3200 per. / Sec.



   The output circuits of the filters are connected to the analyzers A1, A2, A3, and A4 which determine in each of the four frequency bands the frequency at which the oscillation occurs having the maximum amplitude and the value of this amplitude.



  Each analyzer outputs two tuning voltages, one of which is proportional to frequency, while the other is proportional to the amplitude of the oscillation having the maximum amplitude that occurs in a single frequency band. In addition, on the transmission side there is an analyzer A5 which determines whether the oscillations produced by the microphone include a fundamental frequency and the value of that frequency. The nine page voltages thus obtained are the characteristic quantities which are

 <Desc / Clms Page number 8>

 transmitted via lines L1 to L9 to the reception side 0 where they control the device for the artificial production of speech.

   The latter comprises a pulse generator G, which produces pulses consisting of a fundamental frequency with a large number of higher harmonics, and a generator R which produces a continuous spectrum of electrical oscillations. . The characteristic quantity, which indicates whether the oscillations produced by the microphone M contain a fundamental frequency or not and at the same time the value of the fundamental frequency possibly present, quantity which is transmitted in the form of an adjustment voltage by the intermediary. - re of line L9, controls generators G and R. This control is such that when an adjustment voltage is received via line L9, generator G is switched on, while the generator R is switched off.

   In this case, the regulating voltage adjusts at the same time the fundamental frequency of the pulses produced by the generator G, so that this frequency corresponds to the fundamental frequency of the oscillations generated by the microphone M on the transmission side.



   When no control voltage is received via line L9, generator R is automatically switched on.



   The oscillations produced by the generators G or R are fed to four tunable oscillating circuits R1, R2, R3 and R4 The tuning of these oscillating circuits is regulated by the characteristic quantities which are a measure of the frequency of the oscillation having the amplitude maximum which appears in each of the four different frequency bands into which filters F1 and F4 divide the frequency spectrum on the transmission side. These characteristic quantities are therefore the adjustment voltages transmitted via the lines L2, L4, L6 and L8. The voltages which appear on the oscillating circuits R1 to R4 are respectively supplied to the amplifiers

 <Desc / Clms Page number 9>

 V1 to V4 with automatic adjustment of the amplification degree.



  This adjustment takes place as a function of the characteristic quantities which are a measure of the amplitude of the oscillation having the maximum amplitude in the four frequency bands, namely the adjustment voltages transmitted via the lines. L1, L3, L5 and L7.



   The output circuits of the amplifiers V1 to V4 are connected in parallel. Telephone T is connected to the common output circuit.



   To explain the operation of the aforementioned device, it is assumed that one wishes to transmit the vowel "a" of which FIG. 2 shows the frequency spectrum. The fundamental frequency is 128 per / sec. so that the spectrum is made up of a number of harmonics higher than 128 per / sec. the ratio of the amplitudes of which corresponds to that of the lengths of the vertical lines in FIG. 2. The ends of these lines are located on an envelope curve which can be imagined to be composed of three dotted curves which present the form of resonance curves. From what was explained above about vowel production we can conceive of these curves as resonance curves - resonance spaces which are formed by the cavities of the mouth, nose and throat, and determine the formants.

   In the spectrum of the vowel "a" these formants are found in fig. 2 to 640, 1280 and 2688 per / sec., I.e. the 5th, 9th and 21st harmonic of the fundamental frequency of 128 per. /dry. produced by the vocal cords.



   To produce artificially on the receiving side 0 in fig. 1 the frequency spectrum shown in fig. 2, the frequency of the relaxation generator G should be set to 128 per. /dry. and the oscillating circuits R2, R3 and R4 respectively on the frequencies 640, 1280 and 2688 per. / sec., while the amplification

 <Desc / Clms Page number 10>

 amplifiers V2, V3 and V4 is adjusted correlatively to the amplitudes II, I2 and I3 of the formants in the spectrum shown in FIG. 2.



   It then results from the combination of the characteristic curves of the oscillating circuits R2 to R and of the amplifiers V to.
V4 an amplitude / frequency characteristic of the receiving device
0 which corresponds approximately to the envelope curve of the vertical lines in fig. 2. When the pulses generated by generator G, having a fundamental frequency of 128 per are then brought to this device. / sec., it occurs in the circuit of common output of amplifiers V1 to V4 a frequency spectrum which corresponds approximately to the initial frequency spectrum shown in fig. 2. The telephone T reproduces this spectrum of frequencies as the phoneme "a".



   In fig. 1 it has been assumed for convenience that the characteristic quantities are transmitted in the form of adjustment voltages from the transmission side to the reception side on separate lines Li to L9. In practice, it is preferable to modulate these adjustment voltages on carrier waves, for example in the manner well known in multiplex carrier wave telegraphy. For the transmission of the modulated control voltages on the carrier waves a bandwidth of 25 per / sec. is sufficient, so that in the system shown in fig. 1, where it is necessary to transmit nine tuning voltages, it is necessary to use a total bandwidth of 9 x 25 = 225 per / sec., Assuming that only one sideband of each carrier wave is transmitted.



   After the aforementioned explanation of the block diagram shown in FIG. 1, these possible details will be described below.



   Analyzer for the fundamental frequency A5. Fig. 3 shows the assembly of the analyzer A5 of FIG. 1 used to determine the fundamental frequency. The vocal spectrum to be examined, which comes from the microphone M in fig.l, is brought to the input terminals 1 and 2 of the analyzer of fig. 3 to which is connected a wire

 <Desc / Clms Page number 11>

 tre 3 having a transmission area of 50 to 400 per. /dry. In fact, tests on speech have shown that the fundamental frequency of sounds having such a fundamental frequency has a value of
75 to 350 per. /dry. depending on the pitch of the voices of the various people. If there is a fundamental frequency it will therefore fall in the transmission zone of filter 3.



   It is derisable that the filter cuts low frequencies below 50 per.Sec. to avoid a false reaction of the analyzer on the low frequencies caused by the pauses between the successive syllables and words.



   As a result of the fairly large width of the transmission zone of filter 3, the latter will allow the harmonics of this oscillation to pass, in addition to the fundamental frequency; however, the amplitude of the fundamental frequency dominates to a greater or lesser extent. This difference in amplitude is used to completely eliminate the fundamental frequency. The circuit to leave the filter 3 is connected to the circuit of the control grid of an amplifier tube 4.

   This circuit comprises a resistor 6 shunted by capacitor 5, an element which has dimensions such that the voltage loss caused through resistor 6 by the current from the control grid flowing in tube 4 always has the effect of adjusting the polarization of the gate as a function of the amplitude of the oscillations brought by the intermediary of the filter 3 so that it still circulates just gate current for the maximum amplitude. By using a tube whose characteristic curve has a strong curvature in the region of the vicinity of the point where the gate voltage is zero, it is ensured that the oscillation with the maximum amplitude, ie the fundamental frequency, is amplified in greater than the amplitude of any harmonics of the fundamental frequency.

   The amplified oscillations appear through a resistor 7 inserted in the cathode conductor of tube 4.

 <Desc / Clms Page number 12>

 



   In practice, it is recommended to use in cascade a certain number of stages which are connected in the same way as tube 4 and precede the latter, in order to give the difference in amplitude with the fundamental frequency in the harmonics present a so great that it occurs through resistor 7, in substance alone, an oscillation having the fundamental frequency. This oscillation is brought to the tube 8 mounted as a limiter which transforms the sinusoidal fundamental frequency shown in FIG. 4b, in an oscillation which has an approximately rectangular shape as shown in fig. 4b. By means of the differential transformer 9 the oscillation shown in fig. 4b is transformed into a pulse-shaped voltage shown in fig. 4c which is brought to the control grid of a relay tube 10.

   Between the anode and the cathode of this tube is connected a capacitor 11 which is charged from a DC voltage source through the resistor 12, so that the anode of the relay tube 10 acquires a positive voltage relative to the cathode. The assembly is adjusted so that each time the voltage brings a positive pulse to the control grid of the relay tube via the secondary winding of transformer 9, the relay tube is ignited and capacitor 11 suddenly discharges, after which the discharge which bursts into the relay tube is extinguished and the capacitor is recharged via the reactance coil 12.

   The current pulse produced at each instant that the tube is ignited causes, through resistor 13, periodic voltage pulses shown in FIG. 4d, the frequency of which corresponds to the fundamental frequency. The DC voltage component of these pulses, which is a measure of the fundamental frequency, is eliminated by means of the filter formed by resistor 14 and capacitor 15 and fed to terminals 16, 17.



   In this way we obtain the characteristic quantity which is a measure of the fundamental frequency of the speech at transmission.

 <Desc / Clms Page number 13>

 put in the form of a setting voltage between terminals 16 and 17. This setting voltage is transmitted to the receiving side through the line L9 shown in fig.l, which is connected to terminals 16 and 17 shown in fig. 3.



   Phonemes often contain little or no fundamental frequency, but a number of higher harmonics. In these cases the fundamental frequency corresponds to the periodicity of the oscillation. In the analyzer this oscillation is distorted, because large amplitudes are amplified to a greater extent than low amplitudes. At the same time there is a limitation by the gate current so that the larger amplitudes are amplified up to a determined value, which takes place in the tube 4 and the previous stages which are connected from the same way. In the last stage the difference in amplitude is so great that only the largest amplitude is transmitted.



   Analyzers A1 to A4.



   Fig. 5 shows the connection diagram of the analyzers A1 to A4, each of which consists of a device for determining the frequency and a device for determining the amplitude of the oscillation with the maximum amplitude in one of the four frequency bands into which the filters F1 to F4 divide the speech to be transmitted. This frequency band is fed to the input terminals 18 and 19. The assembly and the operation of the first device corresponds in substance to those of the device for determining the fundamental frequency shown in FIG. 3, so that this Fig. Is referred to for explanation.



  Note, however, that the set voltage, which is a measure of the frequency of the oscillation with the maximum amplitude, appears between terminals 16 and 17. In fig. 5 the corresponding coupling elements bear the same reference numerals as in FIG. 3.



  Between tubes 4 and 8 is provided a transformer 20,

 <Desc / Clms Page number 14>

 the secondary of which is connected to the device intended to determine the amplitude of the oscillation with the maximum amplitude. This device comprises a rectifier 21 which is connected in series with a resistor 22 shunted by the capacitor 23. The circuit functions as a peak detector, so that a rectified voltage occurs across the resistor which is proportional to the amplitude of the oscillation with the maximum amplitude. The voltage rectified across resistor 22, after being equalized by means of a filter formed by resistor 24 and capacitor 25, is fed to output terminals 26, 27.



   Pulse generator and generator intended to produce a continuous spectrum of oscillations.



   Fig. 6 shows the assembly of the pulse generator G and the assembly of the generator R intended to produce a continuous oscillation spectrum. The pulse generator has a discharge tube 100, the gates 101 and 102 of which are coupled together through the capacitor 103. Through the resistor 104 a positive voltage is supplied to the gate 102, while the adjustment voltage, which is transmitted on the line L9 shown in fig.l, is brought to the gate 101 through a resistor 105.



  This adjustment voltage appears between the terminals 106, 107. Between the gate 101 and the earth is connected the capacitor 108. The assembly of this pulse generator is known so that it is superfluous to explain it in more detail.



   Generator G produces pulses having a frequency which is a function of the setting voltage between terminals 106 and 107 and these pulses are fed to the gate circuit of a discharge tube 109. This frequency control by voltage This adjustment is done in such a way that the frequency always corresponds to the fundamental frequency of the initial vocal spectrum generated by the microphone M shown in fig. 1. When the speech spectrum does not contain a fundamental frequency (there is then no

 <Desc / Clms Page number 15>

 no adjustment voltage between terminals 106 and 107) generator G is blocked and does not produce pulses.



   The generator R intended to produce a continuous spectrum of oscillations consists of a resistor 110 interposed in the input circuit of amplifier III. Through the resistance 110 there is produced, as a result of an electronic Broxn movement in the material of the resistance, a noise voltage which, as we know, is constituted by a continuous spectrum of oscillations. This continuous spectrum of oscillations is amplified by the amplifier 111 and brought to the attenuation network 112, the attenuation of which is regulated by the loss of voltage across the resistors 113 and 114 in the anode circuit of the electric discharge tube. 115. The adjustment voltage appearing between terminals 106 and 107 is supplied to the control grid of this tube.

   The assembly of the attenuation network 110 and of the tube 113 corresponds entirely to that of the attenuation network 212 and 216 explained below and of the tube 221 shown in FIG. 7 which will be referred to in this case. The operation of the attenuation network 112 together with the tube is such that in the absence of an adjustment voltage between the terminals 106 and 107 the attenuation network transmits to the gate circuit of the amplifier tube 116 is the voltage which appears in the circuit to output from amplifier 111. This transmission is blocked as soon as a setting voltage occurs between terminals 106 and 107.



   In summary, it follows from the foregoing that in the presence of an adjustment voltage between the terminals 106 and 107 the pulse generator G supplies to the tube 109 pulses whose frequency corresponds to the fundamental frequency of the pulses. phonemes to be transmitted. On the other hand, there is no transmission to tube 116 of the continuous oscillation spectrum occurring through resistor 110. In the absence of the adjustment voltage in question, tube 109 does not receive no pulses, while tube 116 receives a continuous spectrum of oscillations.

   Through resistance

 <Desc / Clms Page number 16>

 117 interposed in the common anode circuit of the tubes 109 and 116 therefore appear either voltage pulses or a voltage constituted by a continuous spectrum of oscillations, depending on whether the phonemes to be transmitted contain a fundamental frequency or not.



   Terminals 118 and 119 of resistor 117 are connected to the output terminals of the tunable oscillating circuits.



   Tunable oscillating circuits R1 to R.



   All the tunable oscillating circuits R1 to R4 are connected in the same way, so that it suffices to explain one of them, for example the oscillating circuit R1, the assembly of which is shown in fig. 7. The tunable oscillating circuit consists of a capacitor 201 and the input impedance Z which is connected in parallel with the latter, of a discharge tube 202 mounted in reactance. The anode circuit of this tube comprises a resistor 203, and the anode circuit and the gate circuit are coupled together by means of a coil 204. The input impedance Z of this assembly is given by the expression
 EMI16.1
 where L represents the inductance of the coil 204, R the resistance 203 and S the slope of the tube 202. It follows from this expression that Z represents the inductance of a self induction.
 EMI16.2
 which is a function of the slope S.

   This slope is regulated by the adjustment voltage which is a measure of the frequency of the modifier in the frequency band 200 to 400 per / sec. and is transmitted to terminals 205 and 206 in fig. 7 via the line L2 shown in FIG. 1. The assembly is adjusted in such a way that under the action of the adjustment voltage the frequency to which the oscillating circuit formed by the capacitor 201 is tuned and the input impedance Z corresponds to the frequency of the forming in the band. of frequencies 200 to 400 per. /dry. Via

 <Desc / Clms Page number 17>

 of transformer 207, the tuned oscillating circuit is connected to terminals 208, 209 to which the oscillations generated by source G or R in FIG. 1.

   The voltage produced through the oscillating circuit is supplied, via a third winding of the transformer, to the amplifier V1 with adjustable amplification. The amplification adjustment is made by arranging so that the adjustment voltage transmitted by line L1, in fig.l, to terminals 210 and 211 in fig. 7 adjusts the attenuation of a damper circuit which is interposed in the input circuit of amplifier V1 and is formed by four non-linear resistors which are a function of the voltage (for example dry rectifiers) 212, 213, 214 and 215.

   Between the connection point 216 of the resistors 214 and 215 and a middle branch 217 of the primary winding of the transformer 218 are connected two resistors 219 and 220 which are at the same time inserted in the anode circuit of the amplifier tube 221. The control grid and the cathode of this tube are connected respectively to the terminals 210 and 211. The assembly is adjusted in such a way that for an average value of the adjustment voltage supplied to the terminals 210 and 211 it does not occur. voltage between points 216 and 217. As the set voltage between terminals 210 and 211 increases, point 217 becomes more negative, causing the resistance of non-linear resistors 212 and 213 to increase and that of resistors. non-linear 14 and 16 drop.

   When, on the other hand, the set voltage between terminals 210 and 211 falls below the average value, point 217 becomes more positive, resistors 212 and 213 decrease and resistors 214 and 216 increase. In the first case, the damping network produces reduced attenuation.



   Under the action of the control of the damper circuit by the adjustment voltage, the voltage which appears through the oscillating circuit formed by the capacitor 201 and the impedance Z,

 <Desc / Clms Page number 18>

 will occur in the output circuit 222, 223 of the amplifier V1 with an amplification which corresponds to the amplitude of the forming in the frequency band 200 to 400 per./sec.



   The transmission zone of the oscillating circuit is chosen such that this zone comprises only a single forming.



   The device 0 on the receiving side in fig. 1 can also be used independently for the artificial production of speech. In this case the necessary adjustment voltages are taken, for example, from a certain number of current sources shunted by potentiometers. These can be adjusted using keys. Handling the keys requires a little practice; however, by means of this device a well-trained person can produce phonemes, words and sentences.



   The device according to the invention, used in telephony, provides a considerable saving in the frequency band necessary for transmitting a conversation. In the usual methods of transmission by telephone, a frequency band of about 3000 per is required. / sec., whereas in the above example only a bandwidth of 225 per is used. / sec., so that in a bandwidth of 3000 per. /dry. conventional telephony systems, the invention makes it possible to have about ten calls.



   The device according to the invention can be used advantageously in microphone and loudspeaker installations in which it has hitherto been necessary to pay much attention to the elimination of acoustic reactions.



   When a device according to the present invention is used in these installations, there is no risk of these reactions occurring, because the vocal oscillations reproduced by the loudspeaker are always slightly different, -, in as far as frequency is concerned, initial oscillations.

 

Claims (1)

RESUME. ABSTRACT. ------------- Cette invention concerne: 1.- On dispositif permettant de produire artificiellement des phonèmes par voie électrique, dans lequel on produit, selon le caractère du phonème à engendrer, un spectre continu d'oscillations ou d'impulsions, dont la durée d'oscillation correspond à la fré- quence fondamentale des phonèmes à produire qui comportent une fré- quence fondamentale, dans lequel dispositif les oscillations pro- duites sont amenées à un certain nombre de circuits oscillants, dont la syntonisation est commandée respectivement corrélativement aux formants des phonèmes à produire, ------------- This invention relates to: 1.- A device making it possible to artificially produce phonemes by electrical means, in which, depending on the character of the phoneme to be generated, a continuous spectrum of oscillations or pulses, the duration of oscillation corresponds to the frequency of fundamental frequency of the phonemes to be produced which include a fundamental frequency, in which device the oscillations produced are brought to a certain number of oscillating circuits, the tuning of which is controlled respectively correlatively to the formants of the phonemes to be produced, et les tensions prélevées sur les circuits oscillants sont combinées dans un rapport d'amplitude qui correspond au rapport d'amplitude des formants dans les phonèmes à produire.' 2.- Un dispositif destiné à la transmission de la parole par voie électrique au moyen de grandeurs caractérisant la parole, dans lequel une de ces grandeurs est une mesure de la fréquence fondamentale du spectre de la parole et un dispositif comme spé- cifié en 1.- est utilisé du côté réception, et dans lequel dis- positif le spectre de la parole à transmettre est divisé du côté transmission en un certain nombre de zones de fréquences et la fré- quence et l'amplitude du formant présent dans chaque zone sont transmises respectivement par une grandeur caractéristique, and the voltages taken from the oscillating circuits are combined in an amplitude ratio which corresponds to the amplitude ratio of the formants in the phonemes to be produced. 2.- A device intended for the transmission of speech by electrical means by means of quantities characterizing speech, in which one of these quantities is a measure of the fundamental frequency of the spectrum of the speech and a device as specified in 1 .- is used on the receiving side, and in which the device the spectrum of the speech to be transmitted is divided on the transmission side into a number of frequency zones and the frequency and amplitude of the constituent present in each zone are transmitted respectively by a characteristic quantity, les grandeurs caractéristiques qui sont une mesure de la fréquence des formants commandant respectivement la syntonisation des cir- cuits oscillants du côté réception et les amplitudes des tensions prélevées sur des circuits oscillants étant réglées respectivement en fonction des grandeurs caractéristiques qui sont une mesure de l'amplitude des formants, ces dispositifs spécifiés en 1.- et 2.- )pouvant présenter, en outre, les particularités suivantes prises <Desc/Clms Page number 20> séparément ou en combinaison: the characteristic quantities which are a measure of the frequency of the formants respectively controlling the tuning of the oscillating circuits on the receiving side and the amplitudes of the voltages taken from the oscillating circuits being adjusted respectively as a function of the characteristic quantities which are a measure of the amplitude formants, these devices specified in 1.- and 2.-) possibly exhibiting, in addition, the following particularities taken <Desc / Clms Page number 20> separately or in combination: a. la zone de réglage de chaque circuit oscillant est choisie de telle façon que la zone ne comprenne qu'un seul formant. b. chaque circuit oscillant est constitué par un condensa- teur ou une self avec lequel est connecté en parallèle l'impédance' d'entrée d'un tube à décharges monté en réactance, laquelle impé- dance d'entrée se comporte comme une self ou capacité, et la pente du tube à décharges est réglée en fonction de la grandeur caracté- ristique qui est une mesure de la fréquence du formant. c. la grandeur caractéristique qui est une mesure de la fréquence fondamentale du spectre de la parole, est obtenue par déformation d'une vibration qui comprend un certain nombre d'harmo- niques éventuellement avec la fréquence fondamentale elle-même. at. the adjustment zone of each oscillating circuit is chosen in such a way that the zone comprises only one single forming. b. each oscillating circuit is constituted by a capacitor or an inductor with which is connected in parallel the input impedance of a discharge tube connected in reactance, which input impedance behaves like an inductor or capacitor , and the slope of the discharge tube is adjusted according to the characteristic magnitude which is a measure of the frequency of the forming. vs. the characteristic quantity which is a measure of the fundamental frequency of the spectrum of speech, is obtained by deformation of a vibration which comprises a certain number of harmonics possibly with the fundamental frequency itself.
BE446049D 1941-06-20 Device for artificially producing phonemes electrically BE446049A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
NL883391X 1941-06-20

Publications (1)

Publication Number Publication Date
BE446049A true BE446049A (en) 1942-07-31

Family

ID=19853615

Family Applications (1)

Application Number Title Priority Date Filing Date
BE446049D BE446049A (en) 1941-06-20 Device for artificially producing phonemes electrically

Country Status (3)

Country Link
BE (1) BE446049A (en)
FR (1) FR883391A (en)
GB (1) GB611533A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2883465A (en) * 1953-12-17 1959-04-21 Vilbig Friedrich Frequency band transformer

Also Published As

Publication number Publication date
FR883391A (en) 1943-07-02
GB611533A (en) 1948-11-01

Similar Documents

Publication Publication Date Title
US1951669A (en) Method and apparatus for producing sound
van Noorden Minimum differences of level and frequency for perceptual fission of tone sequences ABAB
US7792680B2 (en) Method for extending the spectral bandwidth of a speech signal
US2098956A (en) Signaling system
US4627094A (en) Electronic audio signal processor
BE516392A (en) MUSIC SYNTHESIZER DEVICE
Gabor New possibilities in speech transmission
US2458227A (en) Device for artificially generating speech sounds by electrical means
US3528011A (en) Limited energy speech transmission and receiving system
BE446049A (en) Device for artificially producing phonemes electrically
FR2563957A1 (en) TELEPHONE CIRCUIT, INTEGRABLE MONOLITHICALLY, GENERATOR OF CONTROL SIGNALS FOR INDICATORS OF TAXATION OF SUBSCRIBERS
US3101390A (en) Apparatus for audio-vocal conditioning
FR2682255A1 (en) FLASHING DECORATIVE LIGHT APPARATUS BASED ON MUSIC.
FR2566605A1 (en) MONOLITHICALLY INTEGRABLE TELEPHONE CIRCUIT, CONTROL SIGNAL GENERATOR FOR SUBSCRIBER TAX INDICATORS
DE2613513A1 (en) Hearing aid adapting output to wearers disability - halves frequencies and mixes them back with original microphone output
FR2525022A1 (en) LOW FREQUENCY TRANSFORMER
JPS61501883A (en) squelch circuit
Sundberg et al. Long-term average spectrum analysis of phonatory effects of noise and filtered auditory feedback
US3551588A (en) Vocoder filter system
SU1223285A1 (en) Device for compressing frequency range of audio signals
BE573066A (en)
US1701911A (en) Acoustic apparatus
DE1940384C3 (en) Electrical method for harmonizing the fundamental course of speech synthesis and circuit arrangement
RU2260252C2 (en) Communication device using voiceless speech
Slaymaker Bandwidth compression by means of vocoders