-
Die Erfindung betrifft ein Verfahren und eine Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe, bei dem die Sprachinformationen auf Sprachpausen überprüft werden und bei dem für jede Sprachpause eine Information über den Pausenbeginn und eine Information über die Pausenlänge erzeugt und abgespeichert wird.
-
Gesprochene Informationen enthalten bekanntlich für die Informationserkennung redundante Informationen. Bekannte Verfahren, wie beispielsweise die sogenannte Differenz- PCM (DPCM) und die adaptive Differenz-PCM (ADPCM) dienen der Reduzierung der in gesprochenen Informationen enthaltenen Redundanz. Bei diesen bekannten Verfahren führen jedoch zwischen Sprachinformationen auftretende Pausen gerade bei längeren Pausen noch zu erheblichen Bitraten.
-
Aus der DE-OS 33 02 503 ist ein Verfahren zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe bekannt, bei dem die Sprachinformationen auf Sprachpausen überprüft werden und bei dem für jede Sprachpause eine Information über den Pausenbeginn und eine Information über die Pausenlänge erzeugt und abgespeichert wird. Bei der Wiedergabe bleibt zwar die Sprechercharakteristik erhalten, die Wiedergabezeit kann aber, da die ursprünglich aufgetretenen Pausen in der ursprünglichen Länge wiedergegeben werden, gerade bei einer Vielzahl längerer Pausen erheblich anwachsen.
-
Der Erfindung liegt demgegenüber die Aufgabe zugrunde, ein Verfahren und eine Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe anzugeben, bei dem die Wiedergabezeit der Sprachinformationen verringert und dabei die ursprüngliche Geschwindigkeit der gesprochenen Informationen beibehalten wird.
-
Die Erfindung zeichnet sich durch den Vorteil aus, daß Sprachpausen in der ursprünglichen Länge oder verkürzt wiedergebbar sind.
-
Bei der Wiedergabe verkürzter Sprachpausen kann in vorteilhafter Weise durch geeignete Wahl des Verkürzungsfaktors die Sprechercharakteristik erhalten werden.
-
Die Erfindung wird nun anhand der Zeichnung in einem zum Verständnis erforderlichen Umfang beschrieben.
-
Die Zeichnung zeigt eine Anordnung zur Abspeicherung und Wiedergabe von in Sprachinformationen auftretenden Sprachpausen. Die Anordnung zur Abspeicherung der Sprachpausen besteht aus einer Sprachpausenerkennungseinrichtung DET 1, die sowohl eine steuerbare Schalteinrichtung S 1 als auch einen steuerbaren Generator PBG zur Erzeugung von Pausenbeginninformationen steuert. Der Generator PBG steuert seinerseits einen steuerbaren Generator PLG 1 zur Erzeugung von Pausenlängeninformationen. Die von der Sprachpausenerkennungseinrichtung DET 1 gesteuerte Schalteinrichtung S 1 ist eingangsseitig mit den Ausgängen der Generatoren PBG und PLG 1 verbunden. Der Schalteinrichtung S 1 werden vom Eingang E der Abspeicherungsanordnung die Sprachinformationen zugeführt, in denen Sprachpausen auftreten können. Die Sprachinformationen können der Schalteinrichtung S ≙Ç%] 1 in analoger oder digitaler Form gegebenenfalls nach Codierung und/oder nach Reduzierung der Sprachredundanz zugeführt werden. In der Zeichnung ist dementsprechend ein Analog-/Digitalwandler A/D und ein PCM-/ ADPCM-Modulator MOD dargestellt. An der Ausgangsseite der Schalteinrichtung S ≙Ç%] 1 befindet sich der zur Aufnahme von Sprach- und Sprachpauseninformationen bestimmte Speicher SP.
-
Die Anordnung zur Wiedergabe der abgespeicherten Sprach- und Sprachpauseninformationen umfaßt den Speicher SP, eine Steuereinrichtung ST, die den Abruf der abgespeicherten Informationen bewirkt, eine Informationsbewertungseinrichtung DET 2, die eine Schalteinrichtung S 2 steuert. Die Informationsbewertungseinrichtung DET 2 steuert ferner einen Generator PLG 2, der aufgrund ihm zugeführter Pausenlängeninformationen Pausen entsprechender Längen erzeugt. Die aus dem Speicher SD abgerufenen Sprachinformationen werden im Ausführungsbeispiel einem PCM-/ADPCM- Demodulator DEM sowie einem Digital-/Analogwandler D/A zugeführt. Die von der Informationsbewertungseinrichtung DET 2 gesteuerte Schalteinrichtung S 2 schaltet entweder die Sprachinformationen oder die vom Generator PLG 2 erzeugten Pausen an den Ausgang A der Wiedergabeanordnung durch. Die Steuereinrichtung ST kann wie in der Zeichnung durch den gestrichelten Pfeil angedeutet, über den Generator PLG 2 auf die Erzeugung der Pausen einwirken.
-
Der Anordnung werden über den Eingang E Sprachinformationen zugeführt, in denen Sprachpausen auftreten können. Diese Sprachinformationen können der Anordnung in analoger oder digitaler Form zugeführt werden. Die Sprachpausenerkennungseinrichtung DET 1 kann in an sich bekannter Weise so ausgebildet sein, daß sie Sprachinformationen in analoger und/oder digitaler Form auf Sprachpausen überprüft und diese erkennt.
-
Die Sprachpausenerkennungseinrichtung DET 1 möge einen Sprachdetektor mit variablem Sprachschwellwert und einen Geräuschdetektor mit variablem Geräuschschwellwert umfassen. Der Sprachschwellwert ist so dimensioniert, daß die Sprachpausenerkennungseinrichtung DET 1, die die über den Eingang E, den Analog-/Digitalwandler A/D und den Modulator MOD laufenden Informationen an die Schalteinrichtung S 1 für einen bestimmten Zeitraum, beispielsweise mindestens 170 ms, durchschaltet, um ein unerwünschtes Wegschneiden von abklingenden Sprachteilen zu verhindern, während eine besondere Verzögerungsschaltung in der Einrichtung DET 1 durch eine Verzögerung für einen bestimmten Zeitraum, beispielsweise 4 ms, ein unerwünschtes Wegschneiden von anklingenden Sprachteilen verhindert. Unerwünschte Geräusche, wie beispielsweise Hintergrundgeräusche während Sprachpausen oder Störungen, die mit einer vorgegebenen Anzahl, beispielsweise maximal zweimal, den Sprachschwellwert überschreiten, werden auf diese Weise aus den abzuspeichernden Informationen ausgeblendet.
-
Der Geräuschschwellwert wird durch eine besondere Steuerung innerhalb der Einrichtung DET 1 fortlaufend in der Weise bereichnet, daß ein bestimmter Prozentsatz, von z. B. vier Prozent, der Geräuschabtastwerte den Geräuschschwellwert überschreiten. Hierzu wird innerhalb eines bestimmten Zeitraums von beispielsweise 150 ms die Zahl der Überschreitungen des Geräuschschwellwerts ermittelt. Die Steuerung der Einrichtung DET 1 bewirkt bei höheren Überschreitungszahlen eine Anhebung des Geräuschschwellwertes, während bei einer geringeren Überschreitungsanzahl der Geräuschschwellwert gesenkt wird. Die Anpassung der Geräuschschwellwerte an den jeweiligen Geräuschpegel erfolgt nur in Sprachpausen. Hierzu kann ein besonderer Freigabeschwellwert von beispielsweise minus 23 dBmO festgelegt werden, der von typischem Leitungsgeräusch nicht überschritten wird, jedoch von Sprachspitzen mit niedrigem Pegel. Bei sehr großem Geräuschpegel bewirkt die Sprachpausenerkennungseinrichtung DET 1 die Durchschaltung aller über den Eingang E zugeführten Informationen.
-
Die Sprachpausenerkennungseinrichtung DET 1 schaltet die von Eingang E zugeführten Informationen an die Schalteinrichtung S 1 durch, wenn der Sprechschwellwert durch die gelieferten Informationen zum dritten Mal überschritten wird. Von diesem Zeitpunkt erfolgt für die Durchschaltung für einen bestimmten Zeitraum, beispielsweise 500 ms, unabhängig von weiteren Überschreitungen des Sprachschwellwerts. Treten in diesem Zeitraum jedoch wiederum mindestens drei Sprachschwellüberschreitungen auf, so bleibt die Durchschaltung um den gleichen Zeitraum verlängert. Ansonsten erkennt die Einrichtung DET 1 in den zugeführten Informationen eine Pause.
-
Die Sprachpausenerkennungseinrichtung DET 1 schaltet in den Zeiten, in denen sie in den der Anordnung über den Eingang E zugeführten Informationen Sprachinformationen erkennen kann, die Schaltvorrichtung S 1 in der Weise, daß die Anordnung über den Eingang E zugeführten Informationen gegebenenfalls nach Analog-/Digitalwandlung, Codierung und Komprimierung in den Speicher SP aufgenommen wird. In Zeiten, in denen die Einrichtung DET 1 in den der Anordnung über den Eingang E zugeführten Informationen keine Sprachinformation erkennen kann, schaltet sie die Schalteinrichtung S 1 in der Weise, daß der Pausenbeginngenerator mit dem Speicher SP verbunden wird. Der Generator PBG erzeugt eine Pausenbeginninformation, die dem Speicher SP zugeführt wird und im Anschluß an die während des vorangegangenen Schaltzustandes abgespeichert wird. Der Generator PBG steuert mit dem Beginn der Sprachpause den Generator PLG 1 an, während die Sprachpausenerkennungseinrichtung DET 1 die Schalteinrichtung S 1 in der Weise steuert, daß der Generator PLG 1 mit dem Speicher SP verbunden wird. Der Generator PLG 1 mißt den Zeitraum der Pausenlänge und gibt eine entsprechend codierte Pausenlängeninformation an den Speicher SP ab, bevor die Einrichtung DET 1 die der Sprachpause folgenden Sprachinformationen über die Schalteinrichtung S 1 dem Speicher SP zugeführt.
-
Im Anschluß an Sprachinformationen werden also im Speicher SP eine Sprachpausenbeginninformation sowie eine Sprachpausenlängeninformation abgespeichert, bevor gegebenenfalls nach einer Prüfinformation wiederum Sprachinformationen abgespeichert werden.
-
Die Steuereinrichtung ST bewirkt den Abruf der abgespeicherten Informationen. Der Abruf kann beispielsweise durch entsprechende Bedienung eines Tastenfeldes oder durch Wahl eines Sonderkennzeichens erfolgen. Die aus dem Speicher SP ausgelesenen Informationen werden sowohl dem Demodulator DEM und dem Digital-/Analogwandler D/A als auch der Informationsbewertungseinrichtung DET 2 zugeführt. Diese kann in der Weise ausgebildet sein, daß sie in den aus dem Speicher SP ausgelesenen Informationen Sprachpausen erkennt. Die Erkennung von Pausenbeginn- und Pausenlängeninformationen erfolgt in einfacher Weise, wenn sich die Pausenbeginn-Informationen in codierter Form von den codierten Sprachinformationen unterscheiden und die Pausenlängeninformationen, und gegebenenfalls die daran anschließenden Prüfinformationen ein festes Format aufweisen.
-
Die Informationsbewertungseinrichtung DET 2 schaltet die Schalteinrichtung S 2 in der Weise, daß Sprachinformationen an den Ausgang A der erfindungsgemäßen Anordnung durchgeschaltet werden, während durch die Pausenbeginninformationen sowohl der Generator PLG 2 als auch die Schalteinrichtung S 2 angesteuert werden. Der mit dem Pausenbeginn einsetzende neue Schaltzustand der Einrichtung S 2 wird entsprechend der von der Informationsbewertungseinrichtung DET 2 erkannten Pausenlängeninformation gehalten. Der Generator PLG 2 decodiert die ihm zugeführte Pausenlängeninformation und gibt diese an die Einrichtung DET 2 ab, die ihrerseits durch entsprechende Ansteuerung der Schalteinrichtung S 2 den Sprachinformationsweg an den Ausgang A der Anordnung durchschaltet bzw. nicht durchschaltet, so daß auf diese Weise in den am Ausgang A abgreifbaren Sprachinformationen Sprachpausen definierter Länge erzeugt werden.
-
Die am Ausgang A wiedergegebenen Pausen weisen dabei die gleiche Länge wie die ursprünglich am Eingang E auftretenden Pausen auf. Durch eine von der Steuerung ST dem Generator PLG 2 zugeführte Information läßt sich die Länge der wiederzugebenden Pausen verkürzen. Durch geeignete Wahl eines Verkürzungsfaktors lassen sich die verkürzten Pausen mit gleicher Pausenlänge wiedergeben. Es ist jedoch auch möglich, daß ursprüngliche Pausen mit einer Pausenlänge innerhalb eines vorgegebenen Minimal- und Maximalwerts durch Pausen wiedergegeben werden, deren Längen den vorgegebenen Minimalwert umfassen sowie einen Zeitwert, der proportional zu dem den Minimalwert übersteigenden Zeitwert der ursprünglichen Pausen ist. Als Minimalwert kann beispielsweise 0,5 s, als Maximalwert 1,5 s gewählt werden. Durch geeignete Wahl des Verkürzungsfaktors, beispielsweise 0,25 bis 0,5, bzw. des Minimal- und Maximalwertes läßt sich die Sprechercharakteristik gut erkennbar nachbilden.