CH423886A - Anordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip - Google Patents

Anordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip

Info

Publication number
CH423886A
CH423886A CH727165A CH727165A CH423886A CH 423886 A CH423886 A CH 423886A CH 727165 A CH727165 A CH 727165A CH 727165 A CH727165 A CH 727165A CH 423886 A CH423886 A CH 423886A
Authority
CH
Switzerland
Prior art keywords
speech
pulses
circuit
excitation
monostable multivibrator
Prior art date
Application number
CH727165A
Other languages
English (en)
Inventor
Lamparter Helmut
Knauft Guenter
Wilhelm Ing Spruth
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of CH423886A publication Critical patent/CH423886A/de

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description


  Anordnung zur Sprachverarbeitung nach dem     Kanalvocoderprinzip       Verschiedene bekannte Verfahren ermöglichen  eine Sprachübertragung mit verminderter Bandbreite.  Die für die Einengung der Bandbreite verwendeten  Methoden basieren fast immer auf dem Aufbau der  Sprache, die sich aus stimmhaften und     stimmlosen     Lauten zusammensetzt.

   Stimmhafte Sprachabschnitte  werden aus einer periodischen Folge stark gedämpf  ter Schwingungen gebildet.     Stimmlosen    Sprach  abschnitten jedoch fehlt dieser periodische     Charakter.     Das     Frequenzspektrum    der stimmhaften Laute setzt  sich aus einem System diskreter Frequenzen zusam  men, welches durch die Vielfachen der Sprachgrund  frequenz     entsteht    (Linienspektrum). Das Spektrum  der stimmlosen Laute ist ein kontinuierliches Spek  trum mit vorwiegend hohen     Frequenzanteilen.     



  Die am meisten verbreiteten Verfahren zerlegen  das     Sprachspektrum    in eine Anzahl von Frequenz  bändern und stellen die Sprache als Abhängige zweier  Funktionen dar. Die erste Funktion, die als soge  nannte     Spektrumfunktion    bezeichnet wird, gibt die  Energie an, die in jedem Frequenzband nach der  Aufteilung enthalten ist. Die zweite Funktion, die so  genannte Anregungsfunktion, definiert die Sprach  grundfrequenz zu bestimmten, feststehenden Punk  ten gleicher Phasenlage.  



  Einige bekannte Systeme, die diese Methoden  verwenden, benutzen Einrichtungen, die die Unter  scheidung stimmhafter Sprachabschnitte von stimm  losen ermöglichen. Während die Arbeitsweise der  Einrichtungen zur Bestimmung stimmhafter Sprach  abschnitte sowohl durch die Spektrum- als auch  durch die Anregungsfunktion bestimmt wird, besteht  ihr Aufbau hauptsächlich aus einem Impulsgenerator,  welcher periodische Impulse liefert. Die Arbeits  weise der Einrichtungen zur Identifizierung stimm  loser Sprachabschnitte wird dagegen nur von der         Spe'ktrumfunktion    bestimmt. Hauptbestandteil dieser  Einrichtungen ist ein Rauschgenerator, der das so  genannte  weisse Rauschens> produziert.

   Der Nach  teil dieser Systeme liegt in der gewaltigen     Komplexi-          bilität    der erforderlichen Stromkreise und deren Be  darf an aktiven Komponenten.  



  Man hat deshalb auch schon Systeme vorgeschla  gen, bei denen beide Gruppen von     Sprachlauten      die     stimmhaften    wie auch die     stimmlosen    - sowohl  für die Sprachanalyse als auch für die     -synthese    in  der gleichen Weise behandelt werden. Die Anregungs  funktion wird hier in jedem Falle abgeleitet, wobei  sie durch das Zeitintervall bestimmt wird, welches  sich als Abstand zweier Punkte gleicher Phasenlage  einer Schwingung ergibt, die ein Bandfilter durch  laufen hat, dessen     Durchlassbereich    im unteren Teil  des Sprachspektrums (beispielsweise zwischen 80 und  300 Hz) liegt. Verwendet werden hierbei als Punkte  gleicher Phasenlage vorzugsweise Nulldurchgänge  einer Richtung.

   Bei der Analyse stimmhafter Sprach  abschnitte entspricht die so gewonnene Anregungs  funktion der     Sprachgrundperiode.    Für     stimmlose     Sprachabschnitte gibt sie eine  scheinbare Sprach  grundperiode  an, deren     Impulse    bei der Sprach  synthese in gleicher Weise verwendet werden können,  wie die wirkliche     Sprachgrundperiode.    Die Spektrum  funktion wird bei diesen bekannten Einrichtungen  mit Hilfe von Bandfiltern erzeugt, deren momentane  Energie zu von der Anregungsfunktion bestimmten       Zeitpunkten    abgetastet wird.  



  Dieses System bietet gegenüber den bereits be  kannten Systemen beträchtliche Vorteile. Dennoch  ergeben sich, soweit es sich um stimmlose Sprach  abschnitte handelt, folgende Schwierigkeiten:  1. Während bestimmter Zeitintervalle ist die Ener  gie im Bandfilter des Anregungskanals prak-           tisch    0. Es ist daher nicht möglich, die An  regungsfunktion zu bestimmen und folglich auch  unmöglich, die Analyse in den     Spektrumkanälen     durchzuführen.  



  2. Auch der zu grosse zeitliche Abstand der An  regungsimpulse bei den scheinbaren Grundperi  oden erschwert die spätere Sprachsynthese. Eine       übereinstimmung    in Theorie und Praxis     zeigt,     dass für eine korrekte Synthese eine     mittlere    Im  pulsfolgefrequenz     notwendig    ist, die über 1     kHz     liegt. Die tatsächliche,     mittlere    Frequenz der Im  pulse der Anregungsfunktion     liegt    aber sehr viel  tiefer.  



  Es ist daher die Aufgabe der vorliegenden Erfin  dung, die vorstehend geschilderten Schwierigkeiten  bei     impulserregten        Kanalvocodern    sowohl bei der  Analyse als auch bei der Synthese des Sprachsignals  zu beseitigen.  



  Die     erfindungsgemässe    Anordnung zur Sprach  verarbeitung nach dem     Kanalvocoderprinzip    besteht  darin, dass bei     deir    Sprachanalyse     stimmloser     Laute, deren Energie im Anregungskanal     nahezu     null ist, die Anregungsimpulse zur     Abtastung    der       Spektrumkanäle    von einer     Ersatzschaltung    erzeugt  werden, dass ferner Mittel vorgesehen sind, die  die     Abtastfunktion    der Ersatzschaltung     während    der  Dauer von Sprachpausen bestimmter Länge blockie  ren,

   dass weiter eine Einrichtung zur     Gewinnung    eines       Unterscheidungssignals    für stimmlose Sprachlaute  vorgesehen ist und dass in der     Syntheseeinrichtung     eine weitere     Ersatzschaltung    vorgesehen ist, die bei  Vorhandensein des Unterscheidungssignals die Steuer  impulse für die Synthese     stimmloser    Sprachabschnitte  erzeugt.  



  Die Ersatzschaltung zur Erzeugung von An  regungsimpulsen bei der Analyse     stimmloser    Laute  kann dadurch     gekennzeichnet    sein, dass ein mono  stabiler     Multivibrator    vorgesehen ist, dessen Steuer  eingang mit dem Anregungskanal verbunden ist und  welcher durch die Anregungsimpulse in seiner insta  bilen Lage gehalten wird, und dass ferner ein Impuls  generator mit dem monostabilen     Multivibrator    ver  bunden ist, dessen Ersatzimpulse immer dann aus  gewertet werden, wenn sich der monostabile Multi  vibrator in seinem stabilen Zustand befindet.  



  Die     Blockiereinrichtung    zur Sperrung der Ab  tastimpulse für die     Spektrumfunktion    bei Sprach  pausen ist beispielsweise derart aufgebaut, dass das  Sprachsignal zunächst in einem Verstärker     verstärkt     und dann zu einem     Schwellwertschalter    übertragen  wird, dessen     Ausgangssignale    den nachgeschalteten  monostabilen     Multivibrator    in seiner instabilen Lage  halten,

   und dass schliesslich     beim    Ausbleiben der  Signale der monostabile     Multivibrator    in seine stabile  Lage übergeht und über eine     Koinzidenzschaltung     die     übertragung    der     Abtastimpulse    sperrt.  



  Der Aufbau der Ersatzschaltung zur Erzeugung  von Steuersignalen für die Synthese stimmloser  Sprachabschnitte ist beispielsweise dadurch     gekenn-          zeichnet,    dass ein     Zufallsimpulsgenerator    vorgesehen    ist, dessen     Ausgangsimpulse    zu einer Torschaltung  übertragen werden, welche diese Impulse nur dann  passieren lässt, wenn das     Nullausgangssignal    eines     bi-          stabilen        Multivibrators,

      welcher durch das Unter  scheidungssignal für stimmlose Laute in seine      Null -          Lage    und durch die Impulse der Anregungsfunktion  in seine      Eins -Lage    gesteuert wird, die Torschaltung  öffnet, so dass die Impulse des     Zufallsimpulsgene-          rators    über ein ODER-Tor die Steuerung der     Spek-          trumfunktion    übernehmen.  



  Im folgenden wird die Erfindung an Hand eines  durch Zeichnungen erläuterten     Ausführungsbeispieles          näher    beschrieben. Es zeigen:       Fig.    1 eine Darstellung des Linienspektrums eines  stimmhaften Sprachabschnittes,       Fig.    2 das kontinuierliche Spektrum eines stimm  losen Sprachabschnittes,       Fig.    3 das Blockschaltbild eines     Sprachanaly-          sators,          Fig.    4 eine Einrichtung zur Erzeugung eines  Signals, welches     stimmlose    Sprachabschnitte be  schreibt und       Fig.    5 eine Einrichtung zur Sprachsynthese.  



  Die stimmhaften Laute sind gekennzeichnet durch  ein     Frequenzspektrum,    welches die     Grundfrequenz     (im Bereich von 80 bis 300 Hz) und mehrere Har  monische mit unterschiedlicher Amplitude umfasst. In       Fig.    1 ist ein derartiges Spektrum dargestellt. Stimm  lose Laute haben dagegen ein kontinuierliches Spek  trum, dessen     Frequenzanteile,    die in den Bereich von  80 bis 300 Hz fallen, nur eine sehr geringe Energie  besitzen, die manchmal, abhängig von dem jeweils  vorliegenden Laut, auch 0 sein kann. Ein solches       kontinuierliches    Spektrum ist in     Fig.    2 dargestellt.  



  Die     Abtastung    der     Spektrumkanäle,    durch die die       Spektrumfunktion    abgeleitet wird, wird durch die       Impulse    der Anregungsfunktion gesteuert. Beim Vor  liegen von stimmlosen Lauten, deren Energie     im    Be  reich der     Anregungsfunktion    0 oder nahezu 0 ist,       kann    diese     Abtastung    nicht mehr durchgeführt wer  den.

   Die     Fig.    3 zeigt dagegen eine Einrichtung, mit  deren     Hilfe    zu jeder Zeit, das heisst auch bei der  Analyse stimmloser Laute, die     Abtastung    der     Spek-          trumkanäle    möglich ist.  



  In dieser Einrichtung wird das zu analysierende  Sprachsignal s (t) über die Leitung 1 zu dem System  übertragen, welches im wesentlichen aus folgenden  Einheiten besteht:  <I>a) Einheit zur Erzeugung der Anregungsfunktion</I>  Diese Einheit     enthält    ein Bandfilter 2, einen  Detektor 3 zur Ermittlung der Nulldurchgänge,  einen Impulsgenerator 4, einen     Zähler    5 und eine       UND-Schaltung    6.  



  <I>b) Einheit zur Erzeugung der</I>     Spektrumf        unktion     Diese Einheit umfasst die     Spektrumkanalfilter    71  bis     7",    die UND-Tore 81 bis     8"    und die     Analog-          Digital-Wandler   <B>91</B> bis     9n.         <I>c) Blockiereinheit</I>  Diese Einheit besteht im wesentlichen aus einem  Verstärker 10, einer     Schwellwertschaltung    11,  einem monostabilen     Multivibrator    12 und einer  UND-Schaltung 13.  



  Zusätzlich zu den Steuerkreisen     enthält    die Ein  richtung auch Schaltungsanordnungen zur Erzeugung  der     Spektrumfunktion.    Die Erzeugung der Spektrum  funktion wird durch einen     Abtastimpuls    mit konstan  ter Impulsbreite bewirkt, der von dem     Abtastimpuls-          generator    14 erzeugt und über die Torschaltung 13  zu dem     Spektrumanalysator    übertragen wird. Der  Schaltkreis 14 liefert immer dann einen     Abtast-          impuls,    wenn er entweder von einem     Impuls    aus dem  Anregungskanal oder einem Impuls einer Ersatz  schaltung angeregt wird.

   Die Ersatzschaltung selbst  besteht aus einem monostabilen     Multivibrator    15 und  einem Impulsgenerator 16.  



  Die Impulse, die nun entweder von dem     An-          regungsanalysator    oder von der Ersatzschaltung ge  liefert werden, werden über das ODER-Tor 17 zu  dem Schaltkreis 14 übertragen.  



  Der Analysator     enthält    darüber hinaus noch fol  gende Einrichtungen: einen Schaltkreis 18, welcher  ein Erkennungssignal liefert, wenn stimmlose Sprach  abschnitte analysiert werden (Einzelheiten dieser  Schaltung     sind    in     Fig.    4 dargestellt), und ein Regi  ster 19.  



  Die Arbeitsweise dieses Analysators kann am  besten     im        Zusammenhang    mit der     Fig.    3 erläutert  werden. Wenn über die Leitung 1 stimmhafte Sprach  abschnitte zu dem     Bandfilter    2 gelangen, dann ent  steht an dessen Ausgang ein Signal mit einer merk  lichen Amplitude, so dass der Detektor 3 einen Recht  eckimpuls erzeugen kann. Er erzeugt diese Impulse  vorzugsweise immer dann, wenn das Eingangssignal  Nulldurchgänge einer Richtung, z. B. in aufsteigen  der Richtung, durchläuft. Jeder dieser Impulse öffnet  die     UND-Schaltung    6, so dass der     Zählerstand    .des  Zählers 5 zu dem Register 19 übertragen werden  kann.  



  Nach jeder     übertragung    des     Zählerstandes    wird  der Zähler 5 durch den     gleichen    Impuls wieder ge  löscht. Die über die     UND-Schaltung    6 zu dem Re  gister 19 übertragenen     Signale    geben daher die An  zahl der Impulse an, die von dem Impulsgenerator 4  zwischen zwei aufeinanderfolgenden Nulldurchgän  gen abgegeben wurden. Diese Zahl ist daher ein Mass  für die Länge des Zeitintervalls zwischen zwei aufein  anderfolgenden Nulldurchgängen, das heisst ein Mass  für die Periode der Grundwelle des im Augenblick  analysierten Sprachsignals.  



  Die von dem Detektor 3 gelieferten Signale wer  den auch über die ODER-Schaltung 17 zu dem Ab  tastimpulsgenerator 14     übertragen.    Jedesmal, wenn  dieser Generator einen Impuls erhält, löst er einen  Steuerimpuls zur Erzeugung der     Spektrumfunktion     aus, welcher zu den Torschaltungen 81 bis<B>8,1</B> über  tragen wird. Dadurch werden die Ausgangssignale    der Bandfilter 71 bis<B>7.</B> zu den     Analog-Digital-Wand-          lern    91 bis     9"    übertragen. Diese Wandler liefern  codierte Signale, die in digitaler     Form    den Wert der  Energie in den einzelnen Bändern angeben.

   Ein sol  cher Satz von codierten Signalen stellt die Spektrum  funktion dar, die zu dem Register 19 übertragen  wird.  



  Wenn das Sprachsignal     s(t)    auf der Leitung 1       stimmlos    ist, dann ist es möglich, dass der Pegel die  ses Signals am Ausgang des Bandfilters 2 so niedrig  ist, dass der Detektor 3 nicht anspricht und so keine  Ausgangsimpulse erzeugen kann. In diesem Falle  versorgt eine Ersatzschaltung den Generator 14 mit       Impulsen.    Diese Ersatzschaltung     enthält    einen mono  stabilen     Multivibrator    15 mit einer Impulsperiode  von 12 ursec und einen     Impulsgenerator    16, der alle  3 ursec einen Impuls abgibt, wenn sich der monosta  bile     Multivibrator    15 in seinem stabilen Zustand be  findet.

   Der monostabile     Multivibrator    15 wird durch  die Impulse des Detektors 3 in seinem instabilen Zu  stand gehalten. Wenn dieser Detektor beim Vorliegen       stimmloser    Laute     nicht        mehr    in der Lage     i'st,    Impulse  abzugeben, deren Periode gleich oder grösser als  12 ursec ist, dann kehrt der monostabile Multi  vibrator 15 in seinen stabilen Zustand zurück, so dass  der Impulsgenerator 16 alle 3 ursec einen Impuls  abgeben kann, welcher den Generator 14 über die  ODER-Schaltung 17 und damit die Erzeugung der       Spektrumfunktion    steuert. Dieser Vorgang läuft so  lange ab, bis der Detektor 3 wieder einen Impuls ab  gibt.  



  Um während der Dauer von Sprachpausen die  unnötige Registrierung der Signale zu vermeiden, ist  eine Blockeinrichtung vorgesehen, die die     übertra-          gung    der Impulse des Generators 14 zu den Tor  schaltungen 81 bis     8"    sperrt, wenn die Dauer der  Pause 100 ursec überschreitet.  



  Diese Einrichtung enthält einen Verstärker 10,  einen     Schwellwertschalter    11 und einen monostabilen       Multivibrator    12, dessen Periode 100 ursec beträgt.  Dieser monostabile     Multivibrator    wird durch die  Ausgangsimpulse des     Schwellwertschalters    11, die  dieser so lange liefert, als die Ausgangssignale des       Verstärkers    10 einen     bestimmten    Pegel überschreiten,  in seinem instabilen Zustand gehalten.

   Wenn schliess  lich der Verstärker 10 während Sprachpausen, die  grösser als 100 ursec sind, keine Signale mehr ent  hält oder nur Signale oder Rauschen mit unter  schwelliger Amplitude empfängt, kehrt der monosta  bile     Multivibrator    12 in seinen stabilen Zustand zu  rück und sperrt die UND-Schaltung 13.  



  Die Ausgangssignale der     Analog-Digital-Wandler     91 bis     9n    werden ausser zu dem Register 19 auch noch  zu einer Einrichtung 18 übertragen. Einzelheiten die  ser Schaltung 18     sind    in     Fig.    4 dargestellt. Diese Ein  richtung dient dazu, ein Steuersignal zu liefern, wenn  stimmlose Sprachabschnitte analysiert werden. Zur  Erleichterung der Erklärung wird angenommen, dass  das Frequenzband     zur    Ableitung der     Spektrumfunk-          tion    in 16 Kanäle zerlegt ist.

   Die Einrichtung besteht      dann aus vier     Addierschaltungen    20a bis 20d, einem  Vergleichskreis 21, einer     ODER-Schaltung    22, wel  cher ein     Inverter    23     nachgeschaltet    ist, und     einer          ODER,Schaltung    24. Die     Addierschaltung    20a sum  miert die     Werte,    die von den vier     Analog-Digital-          Wandlern    des untersten Frequenzbandes geliefert  werden.

   Die     Addierschaltung        20b    summiert die Ener  giewerte der folgenden vier Frequenzbänder, bis       schliesslich    die     Addierschaltung    20d die Energiewerte  in den vier     Kanälen,    die den höchsten Frequenzbän  dern entsprechen, aufsummiert.

   Der Vergleichskreis  21 vergleicht dann die Ergebnisse der     Addierschal-          tung    20a mit den Ergebnissen der anderen drei       Addierschaltungen,    und wenn die Werte, die von der       Addierschaltung    20a     ermittelt    worden sind,     kleiner     sind als die der anderen drei, wird ein Ausgangssignal  des Vergleichskreises 21 zu der     ODER-Schaltung    24  übertragen.

   Die ODER-Schaltung 22 dagegen über  trägt dann ein Signal, wenn einer der Werte, die von  den Wandlern 91 bis 9n     geliefert    werden, von 0 ver  schieden ist, und der mit der     ODER-Schaltung    22  verbundene     Inverter    23 liefert     folglich    immer     dann     ein Signal, wenn alle     Werte    0 sind. Die     ODER-          Schaltung    24 liefert unter zwei Voraussetzungen ein       Ausgangssignal:     Die erste Voraussetzung ist erfüllt, wenn der Ver  gleichskreis 21 ein Ausgangssignal abgibt.

   Dieses ist  immer dann der     Fall,        wenn    die Energie der unteren  vier Frequenzbänder geringer ist als die Energie, die  in den anderen drei Gruppen von     Frequenzbändern     vorhanden ist. Die zweite Voraussetzung, bei der die  ODER-Schaltung 24 ein Signal abgibt, ist dann     er-          füllt,    wenn der     Inverter    23 ein     Ausgangssignal    er  zeugt. Dieses ist     immer    dann der Fall, wenn die un  teren vier Frequenzbänder überhaupt keine Energie       enthalten.     



  Obwohl diese Bedingungen nicht genau der Defi  nition der stimmlosen Laute entsprechen, sind sie  doch in der     Praxis    für Sprachanalyse und     -synthese-          geräte    geeignet.  



  Das     Ausgangssignal    der     ODER4Schaltung    24       wird    zu der Verarbeitungseinheit 19     (Fig.    3) über  tragen, die, wie bereits erwähnt, ebenfalls die ,Signale  der UND-Schaltung 6     (Anregungsfunktion)    und der  Codewandler 91 bis<B>9.</B>     (Spektrumfunktion)    empfängt.  In der Einrichtung 19 werden Speicheroperationen,  Operationen zur     Parallel-Serienwandlung    oder Par  allel-Gruppierung der     Signale,    je nach Verwendungs  zweck,     durchgeführt.     



  > Der vorstehend beschriebene Analysator     kann    für  verschiedene Anwendungen verwendet werden; so  können beispielsweise die     Signale    entweder im     Ana-          lysator    gespeichert oder zu einer     Recheneinrichtung     oder einem externen Speicher oder direkt über eine       Übertragungsleitung,    an deren fernem Ende eine Ein  richtung zur Sprachsynthese vorhanden ist, übertra  gen werden.  



       In        Fig.    5 ist eine     Einrichtung    zur Sprachsynthese  dargestellt. Diese     Einrichtung    erhält die Signale, die       o    von der Sprachanalyse     herrühren    und die- als eine    Folge von Bit-Gruppen (Wörtern)     zusammengestellt     sind. Jedes Wort ist repräsentativ für das Ergebnis  der Sprachanalyse zu einem bestimmten Augenblick.  Es setzt sich vollständig oder teilweise aus der An  regungsfunktion, der     Spektrumfunktion    und einem  Kennsignal für stimmlose Laute zusammen.  



  Diese zuletzt genannten Signale können direkt  von dem     Analysator    oder aber auch von einer ande  ren     Einrichtung,    beispielsweise einer Datenverarbei  tungseinheit, übertragen werden. Sie werden über die  Leitung 25 zu einer Eingangsschaltung 26 übertra  gen und     dort    auf den     Anregungs-    und auf den     Spek-          trumkanal    der     Sprachsyntheseeinrichtung    übertragen.

    Stammen die Signale aus einer elektronischen Daten  verarbeitungseinheit, dann kann die Einrichtung 26  entfallen, da die Signale von der     Verarbeitungseinheit     direkt auf die zwei Arten von Kanälen verteilt wer  den     können.     



  Der Anregungskanal besteht aus einem Register  27, einem Zähler 28 und einem Impulsgenerator 29.  Der     Spektrumkanal    enthält ebenfalls ein Register 30,  ferner einen     Digital-Aanalog-Wandler    31, eine Reihe  von Torschaltungen 321 bis     32",    ferner eine Reihe  von Bandfiltern 331 bis     33"    und eine Additions  schaltung 34. Der Arbeitsablauf im     Spektrumkanal     wird von einer Einrichtung her gesteuert, die aus dem       Kanalverteiler    35, der ODER-Schaltung 36, einem       Trigger    37, einem     Zufallsimpulsgenerator    39 und der  UND-Schaltung 38 besteht.  



  Für die Sprachsynthese werden die Signale, die  für die Anregungsfunktion repräsentativ sind, zu dem  Register 27 und die Signale, die für die Spektrum  funktion repräsentativ sind und das Unterscheidungs  signal für stimmlose Laute zu dem Register 30 ge  leitet. Der Wert, welcher im Register 27 (Anregungs  funktion) gespeichert ist, gibt den zeitlichen Abstand  zweier Nulldurchgänge einer     Richtung    eines analy  sierten     stimmhaften    Lautes an, wobei der Abstand  vom     Analysator    in Zeiteinheiten angegeben wird.  Wenn diese Einrichtung den in     Fig.    3 gezeigten Auf  bau besitzt, dann bedeuten die Zeiteinheiten den       zeitlichen    Abstand zweier Impulse des Impulsgene  rators 4.

   Der Impulsgenerator 29, der in     Fig.    5 dar  gestellt ist, liefert Impulse mit gleichem Zeitabstand.  Diese Impulse werden zu dem Zähler 28 übertra  gen, der abwärts zählt. Wenn er den Wert 0 erreicht,  gibt er einen Impuls an das ODER-Tor 36 und den       Trigger    37 ab und empfängt unmittelbar darauf in       paralleler    Übertragung die Daten, die     im    Register 27  gespeichert sind.     Daraufhin.    wird der Zähler von  neuem abwärts gezählt.

   Auf diese Weise versorgt der       Zähler    28 über das ODER-Tor 36 den Verteiler  35     mit    Impulsen, deren Abstand durch die Null  durchgänge der Anregungsfunktion bestimmt     wird.     Diese     Impulse    steuern durch den Verteiler 35 die       übertragung    einer Reihe von Impulsen, welche nach  einander die Torschaltungen 321 bis     32"    passieren  und so nacheinander, synchronisiert von diesen  Toren, die     übertragung    des Registerinhaltes 30  steuern,

   der verschiedene Teile der Spektrumfunk-           tion        bildet.    Der Inhalt des     Registers    30 besteht aus  einer Folge von codierten .Signalen, die die Energie  in verschiedenen Bändern des zu erzeugenden  Sprachsignals angeben. Diese Signale werden an  schliessend zu dem     Digital-Analog-Wandler    31 über  tragen und veranlassen diesen Wandler, eine Folge  von Impulsen zu erzeugen, deren Amplitude um die  Angaben über den entsprechenden Energiegehalt an  geben. Diese Impulse werden von den Toren 321 bis  32,1 zu den Bandfiltern 331 bis     33,1    übertragen, deren  Ausgangssignale in der     Addierschaltung    34 aufaddiert  werden.

   Das originale Sprachsignal wird durch das       Ausgangssignal    der     Addierschaltung    34 mit genügen  der Sprachqualität reproduziert.  



  Für     stimmhafte    Laute können nur die Impulse  des Zählers 28 in der     Sprachsyntheseeinrichtung    die  Verteilung der Signale zu den Bandfiltern, gemäss  dem bereits erläuterten Vorgang, veranlassen. Die       Impulsfolgefrequenz    dieses Zählers wird durch die  Anregungsfunktion bestimmt. Beim Vorliegen stimm  loser Sprachsignale ist das Auftreten der nach diesem  Verfahren gewonnenen Impulse rein zufällig und der  Abstand der Impulse oft zu gross, so dass Impulse des       Zufallsimpulsgenerators    39 die Verteilung der Signale  zu den Bandfiltern steuern müssen.

   Zu diesem  Zweck wird der bistabile Schalter 37 durch das Un  terscheidungssignal für stimmlose Laute in seinen  Nullzustand gesteuert, wenn dieses Signal in den Re  gistern 30 gespeichert ist. In diesem Zustand liefert  der bistabile Schalter 37 ein Signal, welches die  UND-Bedingung für das Tor 38 erfüllt, so     d'ass    die  Impulse des     Zufallsimpulsgenerators    39 über das  ODER-Tor 36 zu dem Verteiler 35 übertragen wer  den     können.    Diese     Impulse    haben dann die gleiche  Wirkung wie die Impulse des Zählers 28. Der bi  stabile Schalter 37 wird so lange in seinem Null  zustand gehalten, als das Unterscheidungssignal für       stimmlose    Laute in dem     Register    enthalten ist.

   Wenn  dieses Signal verschwindet, wird der bistabile Schalter  von dem ersten eintreffenden Impuls des Zählers 28  in seinen      Ein -Zustand    gesteuert. Daraufhin emp  fängt die     Verteilereinrichtung    35 wieder die Impulse  des Zählers 28.  



  Die mittlere     Folgefrequenz    der Impulse des Zu  fallsimpulsgenerators 39 ist wesentlich höher als die  Folgefrequenz der Impulse, die durch die Grund  frequenzmessung     im        Anregungskanal    gewonnen wer  den.

   Es hat sich     gezeigt,    dass die mittlere Abweichung  der Energiedichte zwischen einem     frequenzbegrenz-          ten    weissen Rauschen einerseits und einem Signal,  welches durch Zufallsimpulse gebildet wird, ander  seits nur dann etwa vergleichbar ist, wenn die mitt  lere     Impulsfolgefrequenz    in der Gegend der Mitte  des     Frequenzbandes    des weissen Rauschens     liegt.    In  folgedessen muss die mittlere     Irnpulsfolgefrequenz     der     Zufal'lirnpulse    grösser als 1     kHz    sein, damit die       stimmlosen    Laute korrekt reproduziert werden kön  nen.

   Um nun diese hohe     Impulsfolgefrequenz,    die     zur       Bildung von stimmlosen Lauten führt, deren Inten  sität verhältnismässig grösser ist als die der stimm  haften Laute, zu vermeiden, wird die Breite der Im  pulse, die von dem     Digital-Analog-Wandler    31 ge  liefert werden, verkleinert. Diese Verkleinerung der  Impulsbreite wird von dem Signal zur Unterschei  dung der stimmlosen Laute gesteuert. Die     übertra-          gung    dieses Steuersignals erfolgt über die Leitung  30a, die in     Fig.    5 dargestellt ist.

   Ferner ist es auch  möglich, die Amplitude oder das Verstärkungsmass  der     Addierschaltung    34 oder eines anderen Verstär  kers     ans'tell'e    der Breite dieser     Impulse    zu beein  flussen.

Claims (1)

  1. PATENTANSPRUCH Anordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip, dadurch gekennzeichnet, dass bei der Sprachanalyse stimmloser Laute, deren Ener gie im Anregungskanal nahezu null ist, die An regungsimpulse zur Abtastung der Spektrumkanäle von einer Ersatzschaltung (15, 16, Fig.3) erzeugt werden, dass Mittel (10, 11, 12 und 13) vorgesehen sind, welche die Abtastfunktion der Ersatzschaltung während der Dauer von Sprachpausen bestimmter Länge blockieren, dass eine Einrichtung (20a bis 20d, 21, 22, 23 und 24, Fig. 4)
    zur Gewinnung eines Un terscheidungssignals für stimmlose Sprachlaute vor gesehen ist und dass in der Syntheseeinrichtung (Fig. 5) eine weitere Ersatzschaltung (36, 37, 38 und 39) vorgesehen ist, die beim Vorhandensein des Unterscheidungssignals die Steuerimpulse für die Syn these stimmloser Sprachabschnitte erzeugt. UNTERANSPRÜCHE 1.
    Anordnung nach Patentanspruch, dadurch ge kennzeichnet, dass in der Ersatzschaltung zur Erzeu gung von Anregungsimpulsen bei der Analyse stimm loser Laute ein monostabiler Multivibrator (15, Fig. 3) vorgesehen ist, dessen Steuereingang mit dem Anregungskanal verbunden ist und welcher durch die Anregungsimpulse in seiner instabilen Lage gehalten wird, dass ferner ein Impulsgenerator (16) mit dem monostabilen Multivibrator verbunden ist, dessen Er satzimpulse immer dann ausgewertet werden, wenn sich der monostabile Multivibrator in seinem stabilen Zustand befindet. 2.
    Anordnung nach Patentanspruch, dadurch ge kennzeichnet, dass in der Blockiereinrichtung zur Sperrung der Abtastimpulse für die Spektrumfunk- tion bei Sprachpausen das Sprachsignal [s (t), Fig. 3] zunächst in einem Verstärker (10) verstärkt und dann zu einem Schwellwertschalter (11) übertragen wird, dessen Ausgangssignale einen nachgeschalteten mono stabilen Multivibrator (12)
    in seiner instabilen Lage halten und dass schliesslich beim Ausbleiben der Signale der monostabile Multivibrator in seine stabile Lage übergeht und über eine Koinzidenzschaltung (13) die Übertragung der Abtastimpulse sperrt.
CH727165A 1964-05-26 1965-05-24 Anordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip CH423886A (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR7396A FR1415552A (fr) 1964-05-26 1964-05-26 Perfectionnements aux systèmes d'analyse et de reconstitution de la voix

Publications (1)

Publication Number Publication Date
CH423886A true CH423886A (de) 1966-11-15

Family

ID=39760576

Family Applications (1)

Application Number Title Priority Date Filing Date
CH727165A CH423886A (de) 1964-05-26 1965-05-24 Anordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip

Country Status (5)

Country Link
CH (1) CH423886A (de)
FR (2) FR1415552A (de)
GB (1) GB1087305A (de)
NL (1) NL6506472A (de)
SE (1) SE309265B (de)

Also Published As

Publication number Publication date
SE309265B (de) 1969-03-17
FR1415552A (fr) 1965-10-29
FR89151E (fr) 1967-05-19
GB1087305A (en) 1967-10-18
NL6506472A (nl) 1965-11-29

Similar Documents

Publication Publication Date Title
EP0296588B1 (de) Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen
DE2151281A1 (de) Generator mit Frequenzsynthese
DE2820425A1 (de) Zufallrauschgenerator und einen derartigen generator aufweisende stochastische kodiervorrichtung
DE2245360A1 (de) Pseudo-zufallszahlengenerator fuer datenverarbeitung
DE2034623A1 (de) Verfahren und Vorrichtung fur die Zah lung von Sprachsignalen in Anwesenheit von Rauschen
DE3503306A1 (de) Datensignalerkennungseinrichtung
DE830067C (de) Verfahren zur Umwandlung von zeitmodulierten Signalen in Codeimpulse
DE19546805A1 (de) Impulsbreitenmodulationsschaltung
DE1937464C3 (de) Sprachanalysiergerät
DE2917454A1 (de) Verfahren und vorrichtung zum ueberwachen der aenderungsgroesse eines signals
DE2629403A1 (de) Vorrichtung zur zeitverzoegerung eines analogen informationseingangssignales
DE1060609B (de) Messvorrichtung zum genauen Bestimmen der Groesse und Richtung der Bewegungen eines Gegenstandes relativ zu einem festen Bezugssystem
DE2850555C2 (de)
DE1905680A1 (de) Anlage zur Signalverarbeitung
DE2111072A1 (de) Verfahren und Vorrichtung zum Unterscheiden zwischen Sprache und Rauschen
CH423886A (de) Anordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip
DE4006251C1 (en) Recognising periodicity in pseudo-stochastic sequence of bits - using comparison registers charged with different cycle and generating alarm if last bits of series correspond
DE2624173A1 (de) Signal-erkennungsschaltung
DE3335026C2 (de)
DE1258910B (de) Schaltungsanordnung zur Sprachverarbeitung nach dem Kanalvocoderprinzip
DE2902133C3 (de) Verfahren und Vorrichtung zur Übertragung binär-codierter Datenworte
DE2214521A1 (de) Sprachsyntheseschaltung
DE1271203B (de) Verfahren und Anordnung zur Gewinnung der Anregungsfunktion bei Kanalvocodern
DE1562049A1 (de) Verfahren und Einrichtung zum Ausloeschen von Stoerungen im Funkverkehr
DE3825884C2 (de)