DE4307905A1

DE4307905A1 - Verfahren zur Speicherung und Wiedergabe eines Audiosignals

Info

Publication number: DE4307905A1
Application number: DE19934307905
Authority: DE
Inventors: Juergen Dipl Ing Kaaden
Original assignee: Deutsche Thomson Brandt GmbH
Current assignee: Deutsche Thomson Brandt GmbH
Priority date: 1993-03-12
Filing date: 1993-03-12
Publication date: 1994-09-15

Description

Die Erfindung geht aus von einem Verfahren zur Speicherung und Wiedergabe eines Audiosignals gemäß dem Oberbegriff des An spruchs 1.

Hohe Rechenleistung und Verarbeitungsgeschwindigkeit sowie geringer Preis neuartiger Rechner und PC′s machen es möglich, z. B. im sogenannten Bereich Multimedia, Texte in derartigen Festkörperspeicher zu speichern. Es ist dann möglich, vollautomatisch eine derartige Textstelle aus einem Speicher ei nes Rechners abzurufen, mit Hilfe eines D/A-Wandlers in ein analoges Audiosignal umzusetzen und dann wiederzugeben.

Wegen der hohen Datenrate mit einer Taktfrequenz von ca. 20 kHz und einer Auflösung von 8 oder 16 Bit ist es dabei bekannt, zur Einsparung von Speichervolumen die Speicherung zu Beginn einer erkannten Sprachpause zu unterbrechen und statt dessen nur ein Kennsignal, z. B. ein Wort, für die Dauer der Sprachpause zu speichern. Mit dem Kennsignal wird dann bei der Wiedergabe die ursprüngliche Sprachpause wieder in das wiedergegebene Audiosi gnal eingefügt. Das geschieht vorzugsweise dadurch, daß der Au diokanal während der Sprachpause gemutet, also stummgeschaltet wird. Das kann dadurch erfolgen, daß während der Sprachpause ein statisches Wort eingefügt wird.

Es hat sich in der Praxis gezeigt, daß ein derartiges Audiosi gnal mit stummgeschalteten Sprachpausen subjektiv unangenehm empfunden wird.

Der Erfindung liegt die Aufgabe zugrunde, einen derartigen subjektiv unangenehmen Eindruck bei der Wiedergabe des Audiosi gnal zu verringern. Diese Aufgabe wird durch die im Anspruch 1 angegebenen Erfindung gelöst. Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.

Die Erfindung beruht auf folgenden Überlegungen und Erkenntnis sen. In der Natur oder bei der Wiedergabe eines üblichen analogen Audiosignals ist während der Sprachpausen auch stets ein mehr oder weniger lautes Hintergrundgeräusch wirksam und wahrnehmbar, z. B. ein Windgeräusch, Hallgeräusche, Störungen oder Magnetbandrauschen. Ein derartiges geringes Störgeräusch während der Sprachpausen wird offenbar subjektiv als normal empfunden. Bei der Wiedergabe des beschriebenen digitalen Audiosignals liefert jedoch der D/A-Wandler während der Sprachpausen überhaupt kein Signal. Da das Ausgangssignal eines derartigen D/A-Wandlers auch keine Rauschanteile enthält, kommt es somit während der Sprachpausen zu einer absoluten Stille. Während einer solchen absoluten Stille erhöht automatisch das Ohr des Zuhörers seine Empfindlichkeit, ähnlich wie das Auge bei einer sehr kleinen Helligkeit. Am Ende der Sprachpause tritt dann das Audiosignal wieder mit seiner vollen Amplitude auf, wodurch es zu einem sehr abrupten Übergang zwischen absoluter Stille und normaler Lautstärke kommt.

Zu Beseitigung dieses subjektiv unangenehmen Eindrucks wird da her gemäß der Erfindung bei der Wiedergabe während der Sprach pausen ein ein Hintergrundgeräusch darstellendes digitales Füllsignal in das Signal eingefügt, das dann am Ausgang des D/A- Wandlers in dem analogen Audiosignal für die Wiedergabe das an sich in der Praxis auftretende Hintergrundgeräusch oder Störge räusch für eine subjektiv angenehme Sprachempfindung wieder her stellt oder simuliert.

Für das Füllsignal gibt es eine Reihe verschiedener Signalquel len. Das Füllsignal kann einem Rauschgenerator entnommen werden und ein sogenanntes weißes Rauschen darstellen. Das Füllsignal kann auch einem digitalen Zufallsfolgegenerator entnommen werden. Es ist auch möglich, periodisch wiederkehrend immer daßelbe, einem Speicher entnommene Füllsignal während der Sprachpause einzufügen.

Die erfindungsgemäße Lösung ermöglicht somit auf einfache Weise trotz der Unterbrechung in der Speicherung des Audiosignals wäh rend der Sprachpausen und der an sich vorgenommene Stummschal tung bei der Wiedergabe eine natürliche Sprachwiedergabe ohne genannten subjektiv unangenehmen Störungen. Vorzugsweise wird die Erfindung bei der Sprachwiedergabe angewendet. Eine Anwen dung bei Musikwiedergabe ist ebenfalls denkbar, jedoch weniger wichtig, weil bei Musikwiedergabe andere Verhältnisse zwischen lauten und leisen Stellen vorliegen.

Die Erfindung wird im folgenden anhand der Zeichnung erläutert. Darin zeigen

Fig. 1 das analoge Audiosignal, das bei der Erfindung für die Sprachwiedergabe generiert wird,

Fig. 2, 3 im Prinzip den Signalaufbau mit den Textstellen und den Sprachpausen und

Fig. 4 ein Blockschaltbild zur Realisierung des erfindungsge mäßen Verfahrens.

Fig. 1 zeigt das durch die Erfindung erzeugte analoge Audiosi gnal. Während einer Sprachpause P zwischen zwei Textstellen T1, T2 ist das Rauschsignal R künstlich eingefügt. Während der Sprachpause P, in der an sich völlige Ruhe herrschen würde, wird dadurch das für die angenehme Sprachempfindung notwendige Hintergrundgeräusch wieder eingeführt oder simuliert.

Fig. 2, 3 zeigen jeweils zwei aufeinanderfolgende Textsignale Text 1, Text 2, zwischen denen Sprachpausen P1, P2, P3 liegen. Jeweils in den Pausen P1, P2, P3 werden digitale Füllsignale FS1, FS2 und FS3 eingefügt. Vorzugsweise FS1=FS2=FS3.

In Fig. 3 sind zwischen den Textsignalen Text1 und Text2 unterschiedliche Füllsignale FS1, FS2, FS3 eingefügt.

In Fig. 4 ist für die Erzeugung des digitalen Füllsignals ein Pseudozufallsgenerator 1 vorgesehen, bestehend aus mehreren Flip Flop′s mit teilweiser Rückführung auf ein EXKLUSIV/ODER GATTER. Die Ausgangssignale der Flip Flop′s sind an einen Eingang des D/A-Wandlers 2 angelegt. An den anderen Eingang des D/A-Wandlers 2 ist der Textpassagenspeicher 3 angeschlossen, der die durch Pausen P getrennten Textsignale gemäß Fig. 1 bis 3 liefert. Der Rechner 4 steuert einerseits den Textpassagenspeicher 3 zur Ausgabe der Textsignale und außerdem den D/A-Wandler 2 zur Einfügung der Füllsignale FS gemäß Fig. 2, 3. Am Ausgang 5 des D/A-Wandlers 2 steht dann das analoge Audiosignal gemäß Fig. 1 mit einem während der Sprachpausen P eingefügten Füllsignal, das das für die subjektiv angenehme Sprachempfindung notwendige Hin tergrundgeräusch wieder in das Signal einfügt. Die Lautstärke wahl erfolgt vom Rechner 4 entweder direkt im D/A-Wandler 2 oder in der dem D/A-Wandler 2 folgenden Analogsignalverarbeitung.

Grundsätzlich kann ein bestimmtes Füllsignal aus einem Generator oder einem Speicher während einer Sprachpause mehrmals nachein ander eingefügt werden, da das Füllsignal keinen Sprachinhalt darstellt, der verständlich sein müßte. Es können auch mehrere Pausenfüllerspeicher vorgesehen sein, die von dem zentralen Rechner gesteuert werden. Es ist auch möglich, in jeder Text pause eine Füllersequenz zu erstellen und nur die endgültig zu speichern, die dem Mittelwert aller entspricht. Auch dabei ist wieder nur ein Pausefüllerspeicher vorhanden, der vom Rechner gesteuert wird.

Claims

1. Verfahren zur Speicherung und Wiedergabe eines Audiosignals, bei dem während einer Sprachpause nur ein Kennsignal über die Dauer der Sprachpause gespeichert und bei der Wiedergabe das Signal für diese Zeit stummgeschaltet wird, dadurch gekennzeichnet, daß bei der Wiedergabe während der Sprach pausen (P) ein ein Hintergrundgeräusch darstellendes digita les Füllsignal (FS) in das Signal eingefügt wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) einem Speicher (1) entnommen wird.

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) zeitlich kürzer ist als die Sprachpausen (P) und während einer Sprachpause (P) periodisch wiederholt ein gefügt wird.

4. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß meh rere, je ein Füllsignal (FS) enthaltende Speicher vorgesehen sind, die von einem Rechner gesteuert werden.

5. Verfahren nach Anspruch 2 oder 4, dadurch gekennzeichnet, daß in jeder Sprachpause (P) ein Füllsignal (FS) erstellt und um dasjenige endgültig gespeichert wird, das dem Mittelwert aller Füllsignale entspricht.

6. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) einem Rauschgenerator entnommen wird.

7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Amplitude des digitalen Rauschsignals so eingestellt wird, daß sie den kleinsten, während der aktiven Sprachzeiten er kannten Amplitudenwert um einen oder wenige logische Zustände unterschreitet.

8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) einem Zufallsfolgegenerator (1) entnommen wird.

9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für jede Pause (P) dasselbe Füllsignal (FS) verwendet wird.