<Desc/Clms Page number 1>
Schaltungsanordnung zum Glätten der Grundtoninformation in impulserregten Kanalvocodersystemen
Die Erfindung betrifft eine Schaltungsanordnung zum Glätten der durch Rauschen des Sprachsignals ge- störten Grundtoninformation bei impulserregten Kanalvocodersystemen.
Bei Kanalvocodern mit Impulsanregung werden bekanntlich die Anregungsimpulse bei der Sprachanalyse in den sogenannten Anregungskanälen ANK (Fig. l) mit Hilfe eines nicht linearen Gliedes NLG, eines Bandfilters BP, eines Diskriminators ND, zur Feststellung der Null-Durchgänge einer Richtung des an seinem Eingang liegenden Signals und eines nachfolgenden Impulsformers IF sowohl für stimmlose als auch für stimmhafte Signale erzeugt. Wenn das Eingangssprachsignal durch Rauschen gestört ist, dann werden von dieser Schaltung, je nach deren Empfindlichkeit und abhängig von der Höhe des Rauschpegels Impulse erzeugt, die den Null-Durchgängen des Rauschsignals und nicht denen des Sprachsignals entsprechen.
Auf Grund dieser falschen Analyseergebnisse führt die spätere Sprachsynthese, die mit diesen Analyseergebnissen durchgeführt, wird zu entsprechend verschlechterter Sprachqualität, die sich besonders bei der Analyse und Synthese stimmhafter Sprachsignale bemerkbar macht.
Da nicht immer rauschfreie oder durch Rauschen nur wenig gestörte Sprachsignale vorliegen, ist zur Beseitigung dieses Nachteiles bereits die Verwendung einer durch einen Stimmhaft-Stimmlos-Diskrimina- tor zur Wirkung bringbaren Schaltung vorgeschlagen worden, die zur Erzeugung auf ein bestimmtes Zeitintervall bezogener Mittelwerte der Impulsabstände dient, indem zunächst in einer ersten Stufe die Periodendauer der Anregungsimpulse des Zeitintervalls gemessen und gespeichert wird,
in einer zweiten Stufe die von der ersten Stufe ermittelten Zeitwerte summiert werden und in einer dritten Stufe die Summe der Zeitwerte durch die Zahl der Perioden dividiert wird und das so erhaltene Zeitmass der mittleren Periodendauer einerseits zur Verschiebung des Zeitintervalls um die mittlere Periodendauer und anderseits als Intervallmass bei der Erzeugung der neuen Anregungsimpulse durch eine vierte Stufe verwendet wird.
Die Aufgabe der Erfindung besteht darin, eine Weiterbildung einer derartigen Anordnung anzugeben. Dies wird gemäss der Erfindung dadurch erreicht, dass eine Einrichtung zur Messung des Impulsab-
EMI1.1
t. zweiercher zur Speicherung n aufeinanderfolgender Werte des Impulsabstandes vorgesehen sind, deren Ausgänge mit je einer Konstantfaktor-Multiplizierschaltung zur Multiplikation der Abstandswerte mitnormierten Gewichten verbunden sind und die Ausgänge der Konstantfaktor-Multiplizierschaltungen mit einer Summierschaltung verbunden sind, welche die Summe der Eingangswerte bildet und an ihrem Ausgang den Mittelwert von n aufeinanderfolgenden Anregungsimpulsabständen erzeugt, und ferner eine
EMI1.2
EMI1.3
EMI1.4
<Desc/Clms Page number 2>
notwendige Divisionseinrichtung, die naturgemäss relativ aufwendig ist, verzichtet werden kann.
Weitere vorteilhafte Ausgestaltungen der Erfindung sind aus den Ansprüchen zu ersehen. Im folgenden wird ein Ausführungsbeispiel der Erfindung an Hand von Zeichnungen erläutert. Es zeigen: Fig.1 ein Blockschaltbild des Anregungskanals eines impulserregten Kanalvocoders mit der Schaltung für die Glättung der Grundtoninformation bei der Analyse stimmhafter Sprachsignale und Fig. 2 ein Blockschaltbild der Glättungsschaltung.
Die in Fig. l für die Analyse stimmhafter Sprachabschnitte eingefügte Glättungsschaltung -- GS -- empfängt an ihrem Eingang eine Impulsfolge. Im folgenden wird angenommen, dass innerhalb eines be-
EMI2.1
falls von j 1 bis j2 numeriert werden, wobei der Abstand zwischen dem j-ten und dem (j + 1)-ten Im- puls mit Ar. bezeichnet ist.
Da die Schaltung nicht vollkommen trägheitslos arbeiten kann, zumal auch Speicherfunktionen in- nerhalb der Operation dieser Schaltung eine Rolle spielen, ist es natürlich, dass das Zeitintervall -- TI 0 -gegenüber dem Zeitintervall-TI.-um eine gewisse Zeitspanne verzögert ist.
EMI2.2
EMI2.3
EMI2.4
EMI2.5
EMI2.6
EMI2.7
EMI2.8
EMI2.9
wobei
EMI2.10
ist.
<Desc/Clms Page number 3>
Eine Einrichtung zur Erzeugung gewogener Mittelwerte bei der Analyse stimmhafter Sprachsignale zeigt die Fig. l. Hier wird das Sprachsignal-SpS-- zunächst in üblicher Weise in eine Reihe von Spektrumkanälen --SpK--, die hier nicht weiter behandelt werden und in einen Anregungskanal- AnKzerlegt.
Ferner ist in Fig. l noch ein Diskriminatorkanal-DK-vorgesehen, der das Sprachsignal einem Diskriminator-D-zuführt, welcher feststellt, ob das im Augenblick vorliegende Sprachsignal stimmhaft oder stimmlos ist. Diese Unterscheidung ist erforderlich, da die Messung der Periodendauer nur bei stimmhaften Abschnitten des Sprachsignals vorgenommen wird. Der Anregungskanal-ANK- (Fig. 1) enthält in bekannter Weise zunächst ein nichtlineares Glied --NLG-- und einen Bandpass --BP-- zur Eliminierung der Grundwelle des Sprachsignals. Der nachfolgende Schaltkreis --ND-- stellt dann die Nulldurchgänge einer Richtung des Sprachsignals fest und gibt seine Information an einen Impulsformer --IF-, der je Nulldurchgang einer Richtung einen definierten Rechteckimpuls abgibt.
Die Torschaltung - T-übernimmt zusammen mit dem Diskriminator-D-, über dessen Leitung --sh-- die Stimmhaft-Information zur Torschaltung übertragen wird, die Steuerfunktion für die Messung der Periodendauer nur stimmhafter Abschnitte des Sprachsignals. Die Torschaltung --T2 -- dagegen schaltet die Rechteckimpulse der Anregungsfunktion während der stimmlosen Abschnitte des Sprachsignals direkt auf den Aus- gang-ANK'- (Fig. l) des Anregungskanals.
Immer, wenn also stimmhafte Sprachsignale festgestellt werden, werden die Anregungsimpulse, die von dem Impulsformer --IF-- über die Torschaltung --T1-- und die Leitung --11-- geliefert werden. zu der Glättungsschaltung --GS-- übertragen.
Ein ausführliches Blockschaltbild dieser Glättungsschaltung zeigt die Fig. 2. Am Eingang (Leitung l) liegt eine Impulsfolge, wie sie vom Anregungskanal während stimmhafter Abschnitte des Sprachsignals geliefert wird. Jeder der Eingangsimpulse bewirkt die Abspeicherung des Zählerstandes von --Z1 -- und
EMI3.1
Zählers --Zl -- aufschiebeleitung- vsl--eine Umspeicherung in der Weise, dass jeder Zählerstand der Reihe nach alle Speicher --SPl bis SPn--der Kette durchläuft. In der Speicherkette sind so die Messergebnisse der letzt-
EMI3.2
ZujedemSpeicher --SP1 bisSPn-- der KettegibtBedingung :
EMI3.3
Die so bewerteten Grundtonperioden werden mit Hilfe einer Addiereinrichtung-A-addiert.
Die Summe der bewerteten Grundtonperioden stellt einen gewogenen Mittelwert der eben vergangenen n letzten Grundtonperioden dar. Das Ergebnis der Addition wird mit jedem Eingangsimpuls in das erste Glied einer Kette von m Speichern (Sl bisS) eingespeichert. Jeder Eingangsimpuls bewirkt auch ein Umspeichern innerhalb der Kette derart, dass jeder der berechneten Mittelwerte die ganze Speicherkette durchläuft. Insgesamt sind in der Kette die letzten m berechneten Mittelwerte gespeichert.
Mit jedem Ausgangsimpuls auf der Leitung --La -- wird der Inhalt eines Speichers-Sl bis Sm--der Kette über die Torschaltung --T8-- in einen weiteren Speicher --S-- abgespeichert (ohne den Speicher der Kette zu löschen) und steuert von diesem Speicher aus die Zeitdauer bis zum Auftreten des nächsten Ausgangsimpulses auf der Leitung--1 2 Die Steuerung erfolgt dadurch, dass der Inhalt des Speichers--S-- mit dem Stand eines Zählers"Z -- verglichen wird, an dessen Eingang derselbe Zähltakt --ZT - - liegt, wie am Eingang des bereits erwähnten Zählers Z--. Bei Gleichheit von Zählerstand und Speicherinhalt wird, durch ein Ausgangssignal von der Torschaltung --T --, die auch die Vergleichsschaltung enthalten kann, eingeleitet,
in einer Impulsformerstufe --IPF-- ein Anregungsimpuls auf Leitung-l--
<Desc/Clms Page number 4>
erzeugt. Durch diesen Impuls wird auch der Zähler-Z-auf Null zurückgestellt. Ausserdem wird durch diesen Impuls bewirkt, dass der Inhalt jenes Speichers --S-- der Kette zur Speicherung der Mit- telwerte, der den nächstfolgenden Mittelwert enthält, zur Steuerung der Zeit bis zum nächsten Ausgangsimpuls herangezogen wird. Zur Steuerung des Abspeicherns des jeweils richtigen Mittelwertes dient ein Adressenzähler --AZ--. Mit jedem Eingangsimpuls wird die im Adressenzähler befindliche Adresse eines Speichers der Kette bis Sm-- über Leitung --vsl-- um eins vermehrt, da der richtige Speicherinhalt um einen Platz in der Kette weitergerückt ist.
Mit jedem Ausgangsimpuls wird die Adresse um eins vermindert, da der nächstfolgende Mittelwert um einen Platz näher beim Eingang der Kette gespeichert ist. Die Anzahl m der Glieder der Speicherkette bis SP -hängt davon ab, wie gross die Differenz zwischen kleinstmöglicher und grösstmöglicher Periodendauer am Eingang der Anordnung ist. Je grösser diese Differenz ist, desto mehr Glieder muss die Kette enthalten. Vorzugsweise wird der Adressenzähler --AZ-- auf der mittleren Adresse (m + 1)/2 stehen. Während einer Periodendauer des Ausgangssignales dürfen dann bis zu (m + 1)/2 Eingangsimpulse auftreten, ohne dass die richtige Funk tionsweise gestört ist. Ebenso dürfen während einer Periode der Eingangsgrösse bis zu (m+1)/2 Ausgangsimpulse auftreten.
Für ein einwandfreies Funktionieren zu Beginn und zum Ende einer Eingangsimpulsfolge sind einige besondere Massnahmen notwendig. Die Ausgangsstellung der Anordnung ist : Adressenzähler auf Adresse - -1--, angesteuert über Eingang-a- (Fig. 2), alle Speicher gelöscht, Zähltakt abgeschaltet, beide Zählerstände null. Wie bereits beschrieben, hat der erste Impuls der Eingangsimpulsfolge neben den erläuterten Funktionen auch die Aufgabe den Zähltakt einzuschalten. Nach dem (n + 1)-ten Eingangsimpuls kann der Mittelwert über die ersten n Impulsabstände gebildet werden. Nach dem (n + 2)-ten Eingangsimpuls ist dieser erste brauchbare Mittelwert im ersten Glied der entsprechenden Speicherkette gespeichert.
Nach dem [ (n + 1) + (m + l)/2]-ten Eingangsimpuls ist er im (m + 1)/2-tenGliedder Kette gespeichert. Inzwischen steht der Adressenzähler auf Adresse --1-- (letzte Stufe von-AZ-) ; - -1-- ist definiert :
EMI4.1
Bei dieser Adresse stellt sich der Adressenzähler verzögert (Dly) über b zurück auf die Adresse
EMI4.2
halt des [ (m + l)/2]-ten Speichers der Kette zur Steuerung des Zeitabstandes bis zum zweiten Ausgangsimpuls verwendet wird. Nunmehr setzt die bereits beschriebene normale Funktion der Anordnung ein.
Der erste Impuls am Ausgang tritt mit dem [ (n + 1) + (m + 1)/2] -ten Eingangsimpuls auf. Da die Impulsfolge am Ausgang aus ebenso vielen Impulsen wie die Impulsfolge am Eingang bestehen soll, müs- sen nach dem letzten Eingangsimpuls am Ausgang noch n + (m + 1)/2 Impulse auftreten.
Nimmt man an, dass der Adressenzähler beim Auftreten des letzten Eingangsimpulses auf (m + 1)/2 steht, dann werden zunächst noch (m + 1)/2 Ausgangsimpulse erzeugt, ohne dass besondere Massnahmen ergriffen werden müssen. Sollen noch weitere n Ausgangsimpulse erzeugt werden, dann muss dafür gesorgt werden, dass der Speicher, dessen Inhalt mit dem Zählerstand verglichen wird, um den zeitlichen Abstand zwischen aufeinanderfolgenden Ausgangsimpulsen zu steuern, nicht mit Nullen überschrieben werden kann (ein Löschen darf nur über einen eigenen Eingang möglich sein). Dann wird der Inhalt dieses Speichers so lange zur Steuerung der Ausgangsimpulse verwendet, bis der Adressenzähler auf der Adresse -k steht.
Die Adresse -k liegt n Positionen vor der Anfangsadresse --1-- : - k =-n.
EMI4.3
ordnung befindet sich in der Ausgangsstellung.
Die so gewonnenen Mittelwerte der Periodendauer der Anregungsimpulse enthalten allerdings keine Informationen mehr über kleine Änderungen, die im Sprachsignal von Periode zu Periode auftreten. Die Mittelwertbildung wird daher vernünftigerweise nur dort angewendet, wo der Qualitätsverlust der synthetischen Sprache, verursacht durch die Fälschung der Analyseergebnisse durch Rauschen gegen den
<Desc/Clms Page number 5>
Qualitätsgewinn, verursacht durch die Berücksichtigung kleiner Schwankungen der Periodendauer, überwiegt.
Die Anordnung zum Glätten der Grundtoninformation kann daher eine Zusatzeinrichtung darstellen, die es ermöglichen soll, auch stark verrauschte Sprachsignale zu analysieren ohne bei der Synthese gegenüber der herkömmlichen Methode eine schlechtere Sprachqualität zu erzielen, mit dem Vorteil, dass das in vieler Hinsicht günstige Konzept des impulserregten Kanalvocoders nicht aufgegeben werden muss. Zwar erfordert die Zusatzeinrichtung eine Stimmhaft-Stimmlos-Unterscheidung, doch wird diese nicht im üblichen Sinn verwendet. Sie dient nur dazu, für stimmhafte Abschnitte des Sprachsignals die Mittelwertbildung im Anregungskanal zu veranlassen.
PATENTANSPRÜCHE :
1. Schaltungsanordnung zum Glätten der durch Rauschen des Sprachsignals gestörten Grundtoninformation bei impulserregten Kanalvocodersystemen, in denen eine durch einen Stimmhaft-StimmlosDiskriminator bei Vorliegen stimmhafter Sprachsignale zur Wirkung bringbare Schaltung zur Erzeugung auf ein bestimmtes Zeitintervall bezogener Mittelwerte der Impulsabstände der Anregungsimpulse dient,
EMI5.1
(Z"T, BSSPn) zur Speicherung n aufeinanderfolgender Werte des Impulsabstandes vorgesehen sind, deren Ausgänge mit je einer Konstantfaktor- Multiplizierschaltung (B 1 bis Bb) zur Multiplikation der Abstandswerte mit normierten Gewichten (F 1bis Fn) verbunden sind, und die Ausgänge der Konstantwert-Multipli- zierschaltungen mit einer Summierschaltung (A)
verbunden sind, welche die Summe der Eingangswerte bildet und an ihrem Ausgang den Mittelwert von n aufeinanderfolgenden Anregungsimpulsabstän-
EMI5.2
EMI5.3