DE4307905A1 - Verfahren zur Speicherung und Wiedergabe eines Audiosignals - Google Patents

Verfahren zur Speicherung und Wiedergabe eines Audiosignals

Info

Publication number
DE4307905A1
DE4307905A1 DE19934307905 DE4307905A DE4307905A1 DE 4307905 A1 DE4307905 A1 DE 4307905A1 DE 19934307905 DE19934307905 DE 19934307905 DE 4307905 A DE4307905 A DE 4307905A DE 4307905 A1 DE4307905 A1 DE 4307905A1
Authority
DE
Germany
Prior art keywords
signal
speech
during
pause
fill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19934307905
Other languages
English (en)
Inventor
Juergen Dipl Ing Kaaden
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Thomson Brandt GmbH
Original Assignee
Deutsche Thomson Brandt GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Thomson Brandt GmbH filed Critical Deutsche Thomson Brandt GmbH
Priority to DE19934307905 priority Critical patent/DE4307905A1/de
Publication of DE4307905A1 publication Critical patent/DE4307905A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/16Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C2207/00Indexing scheme relating to arrangements for writing information into, or reading information out from, a digital store
    • G11C2207/16Solid state audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

Die Erfindung geht aus von einem Verfahren zur Speicherung und Wiedergabe eines Audiosignals gemäß dem Oberbegriff des An­ spruchs 1.
Hohe Rechenleistung und Verarbeitungsgeschwindigkeit sowie geringer Preis neuartiger Rechner und PC′s machen es möglich, z. B. im sogenannten Bereich Multimedia, Texte in derartigen Festkörperspeicher zu speichern. Es ist dann möglich, vollautomatisch eine derartige Textstelle aus einem Speicher ei­ nes Rechners abzurufen, mit Hilfe eines D/A-Wandlers in ein analoges Audiosignal umzusetzen und dann wiederzugeben.
Wegen der hohen Datenrate mit einer Taktfrequenz von ca. 20 kHz und einer Auflösung von 8 oder 16 Bit ist es dabei bekannt, zur Einsparung von Speichervolumen die Speicherung zu Beginn einer erkannten Sprachpause zu unterbrechen und statt dessen nur ein Kennsignal, z. B. ein Wort, für die Dauer der Sprachpause zu speichern. Mit dem Kennsignal wird dann bei der Wiedergabe die ursprüngliche Sprachpause wieder in das wiedergegebene Audiosi­ gnal eingefügt. Das geschieht vorzugsweise dadurch, daß der Au­ diokanal während der Sprachpause gemutet, also stummgeschaltet wird. Das kann dadurch erfolgen, daß während der Sprachpause ein statisches Wort eingefügt wird.
Es hat sich in der Praxis gezeigt, daß ein derartiges Audiosi­ gnal mit stummgeschalteten Sprachpausen subjektiv unangenehm empfunden wird.
Der Erfindung liegt die Aufgabe zugrunde, einen derartigen subjektiv unangenehmen Eindruck bei der Wiedergabe des Audiosi­ gnal zu verringern. Diese Aufgabe wird durch die im Anspruch 1 angegebenen Erfindung gelöst. Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
Die Erfindung beruht auf folgenden Überlegungen und Erkenntnis­ sen. In der Natur oder bei der Wiedergabe eines üblichen analogen Audiosignals ist während der Sprachpausen auch stets ein mehr oder weniger lautes Hintergrundgeräusch wirksam und wahrnehmbar, z. B. ein Windgeräusch, Hallgeräusche, Störungen oder Magnetbandrauschen. Ein derartiges geringes Störgeräusch während der Sprachpausen wird offenbar subjektiv als normal empfunden. Bei der Wiedergabe des beschriebenen digitalen Audiosignals liefert jedoch der D/A-Wandler während der Sprachpausen überhaupt kein Signal. Da das Ausgangssignal eines derartigen D/A-Wandlers auch keine Rauschanteile enthält, kommt es somit während der Sprachpausen zu einer absoluten Stille. Während einer solchen absoluten Stille erhöht automatisch das Ohr des Zuhörers seine Empfindlichkeit, ähnlich wie das Auge bei einer sehr kleinen Helligkeit. Am Ende der Sprachpause tritt dann das Audiosignal wieder mit seiner vollen Amplitude auf, wodurch es zu einem sehr abrupten Übergang zwischen absoluter Stille und normaler Lautstärke kommt.
Zu Beseitigung dieses subjektiv unangenehmen Eindrucks wird da­ her gemäß der Erfindung bei der Wiedergabe während der Sprach­ pausen ein ein Hintergrundgeräusch darstellendes digitales Füllsignal in das Signal eingefügt, das dann am Ausgang des D/A- Wandlers in dem analogen Audiosignal für die Wiedergabe das an sich in der Praxis auftretende Hintergrundgeräusch oder Störge­ räusch für eine subjektiv angenehme Sprachempfindung wieder her­ stellt oder simuliert.
Für das Füllsignal gibt es eine Reihe verschiedener Signalquel­ len. Das Füllsignal kann einem Rauschgenerator entnommen werden und ein sogenanntes weißes Rauschen darstellen. Das Füllsignal kann auch einem digitalen Zufallsfolgegenerator entnommen werden. Es ist auch möglich, periodisch wiederkehrend immer daßelbe, einem Speicher entnommene Füllsignal während der Sprachpause einzufügen.
Die erfindungsgemäße Lösung ermöglicht somit auf einfache Weise trotz der Unterbrechung in der Speicherung des Audiosignals wäh­ rend der Sprachpausen und der an sich vorgenommene Stummschal­ tung bei der Wiedergabe eine natürliche Sprachwiedergabe ohne genannten subjektiv unangenehmen Störungen. Vorzugsweise wird die Erfindung bei der Sprachwiedergabe angewendet. Eine Anwen­ dung bei Musikwiedergabe ist ebenfalls denkbar, jedoch weniger wichtig, weil bei Musikwiedergabe andere Verhältnisse zwischen lauten und leisen Stellen vorliegen.
Die Erfindung wird im folgenden anhand der Zeichnung erläutert. Darin zeigen
Fig. 1 das analoge Audiosignal, das bei der Erfindung für die Sprachwiedergabe generiert wird,
Fig. 2, 3 im Prinzip den Signalaufbau mit den Textstellen und den Sprachpausen und
Fig. 4 ein Blockschaltbild zur Realisierung des erfindungsge­ mäßen Verfahrens.
Fig. 1 zeigt das durch die Erfindung erzeugte analoge Audiosi­ gnal. Während einer Sprachpause P zwischen zwei Textstellen T1, T2 ist das Rauschsignal R künstlich eingefügt. Während der Sprachpause P, in der an sich völlige Ruhe herrschen würde, wird dadurch das für die angenehme Sprachempfindung notwendige Hintergrundgeräusch wieder eingeführt oder simuliert.
Fig. 2, 3 zeigen jeweils zwei aufeinanderfolgende Textsignale Text 1, Text 2, zwischen denen Sprachpausen P1, P2, P3 liegen. Jeweils in den Pausen P1, P2, P3 werden digitale Füllsignale FS1, FS2 und FS3 eingefügt. Vorzugsweise FS1=FS2=FS3.
In Fig. 3 sind zwischen den Textsignalen Text1 und Text2 unterschiedliche Füllsignale FS1, FS2, FS3 eingefügt.
In Fig. 4 ist für die Erzeugung des digitalen Füllsignals ein Pseudozufallsgenerator 1 vorgesehen, bestehend aus mehreren Flip Flop′s mit teilweiser Rückführung auf ein EXKLUSIV/ODER GATTER. Die Ausgangssignale der Flip Flop′s sind an einen Eingang des D/A-Wandlers 2 angelegt. An den anderen Eingang des D/A-Wandlers 2 ist der Textpassagenspeicher 3 angeschlossen, der die durch Pausen P getrennten Textsignale gemäß Fig. 1 bis 3 liefert. Der Rechner 4 steuert einerseits den Textpassagenspeicher 3 zur Ausgabe der Textsignale und außerdem den D/A-Wandler 2 zur Einfügung der Füllsignale FS gemäß Fig. 2, 3. Am Ausgang 5 des D/A-Wandlers 2 steht dann das analoge Audiosignal gemäß Fig. 1 mit einem während der Sprachpausen P eingefügten Füllsignal, das das für die subjektiv angenehme Sprachempfindung notwendige Hin­ tergrundgeräusch wieder in das Signal einfügt. Die Lautstärke­ wahl erfolgt vom Rechner 4 entweder direkt im D/A-Wandler 2 oder in der dem D/A-Wandler 2 folgenden Analogsignalverarbeitung.
Grundsätzlich kann ein bestimmtes Füllsignal aus einem Generator oder einem Speicher während einer Sprachpause mehrmals nachein­ ander eingefügt werden, da das Füllsignal keinen Sprachinhalt darstellt, der verständlich sein müßte. Es können auch mehrere Pausenfüllerspeicher vorgesehen sein, die von dem zentralen Rechner gesteuert werden. Es ist auch möglich, in jeder Text­ pause eine Füllersequenz zu erstellen und nur die endgültig zu speichern, die dem Mittelwert aller entspricht. Auch dabei ist wieder nur ein Pausefüllerspeicher vorhanden, der vom Rechner gesteuert wird.

Claims (9)

1. Verfahren zur Speicherung und Wiedergabe eines Audiosignals, bei dem während einer Sprachpause nur ein Kennsignal über die Dauer der Sprachpause gespeichert und bei der Wiedergabe das Signal für diese Zeit stummgeschaltet wird, dadurch gekennzeichnet, daß bei der Wiedergabe während der Sprach­ pausen (P) ein ein Hintergrundgeräusch darstellendes digita­ les Füllsignal (FS) in das Signal eingefügt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) einem Speicher (1) entnommen wird.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) zeitlich kürzer ist als die Sprachpausen (P) und während einer Sprachpause (P) periodisch wiederholt ein­ gefügt wird.
4. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß meh­ rere, je ein Füllsignal (FS) enthaltende Speicher vorgesehen sind, die von einem Rechner gesteuert werden.
5. Verfahren nach Anspruch 2 oder 4, dadurch gekennzeichnet, daß in jeder Sprachpause (P) ein Füllsignal (FS) erstellt und um dasjenige endgültig gespeichert wird, das dem Mittelwert aller Füllsignale entspricht.
6. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) einem Rauschgenerator entnommen wird.
7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Amplitude des digitalen Rauschsignals so eingestellt wird, daß sie den kleinsten, während der aktiven Sprachzeiten er­ kannten Amplitudenwert um einen oder wenige logische Zustände unterschreitet.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Füllsignal (FS) einem Zufallsfolgegenerator (1) entnommen wird.
9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für jede Pause (P) dasselbe Füllsignal (FS) verwendet wird.
DE19934307905 1993-03-12 1993-03-12 Verfahren zur Speicherung und Wiedergabe eines Audiosignals Withdrawn DE4307905A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19934307905 DE4307905A1 (de) 1993-03-12 1993-03-12 Verfahren zur Speicherung und Wiedergabe eines Audiosignals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19934307905 DE4307905A1 (de) 1993-03-12 1993-03-12 Verfahren zur Speicherung und Wiedergabe eines Audiosignals

Publications (1)

Publication Number Publication Date
DE4307905A1 true DE4307905A1 (de) 1994-09-15

Family

ID=6482642

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19934307905 Withdrawn DE4307905A1 (de) 1993-03-12 1993-03-12 Verfahren zur Speicherung und Wiedergabe eines Audiosignals

Country Status (1)

Country Link
DE (1) DE4307905A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19882753B4 (de) * 1997-10-16 2004-01-29 Motorola Ltd., Basingstoke Hintergrundrauschen-Kontrastreduzierung für Umschaltungen mit einer Änderung der Sprachcoder

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4890259A (en) * 1988-07-13 1989-12-26 Information Storage Devices High density integrated circuit analog signal recording and playback system
DE4013395A1 (de) * 1989-04-28 1990-10-31 Hitachi Ltd Einrichtung zum codieren und entcodieren von sprache, mit einer wiedergabefunktion fuer hintergrundgeraeusche
DE4111781A1 (de) * 1991-04-11 1992-10-22 Ibm Computersystem zur spracherkennung

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4890259A (en) * 1988-07-13 1989-12-26 Information Storage Devices High density integrated circuit analog signal recording and playback system
DE4013395A1 (de) * 1989-04-28 1990-10-31 Hitachi Ltd Einrichtung zum codieren und entcodieren von sprache, mit einer wiedergabefunktion fuer hintergrundgeraeusche
DE4111781A1 (de) * 1991-04-11 1992-10-22 Ibm Computersystem zur spracherkennung

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19882753B4 (de) * 1997-10-16 2004-01-29 Motorola Ltd., Basingstoke Hintergrundrauschen-Kontrastreduzierung für Umschaltungen mit einer Änderung der Sprachcoder

Similar Documents

Publication Publication Date Title
DE69816221T2 (de) Sprachschnellheitsveränderungsverfahren und vorrichtung
DE60002483T2 (de) Skalierbares kodierungsverfahren für hochqualitätsaudio
DE69127048T2 (de) Verfahren und Vorrichtung zur Editierung von MIDI-Dateien
DE4227826C2 (de) Digitales Verarbeitungsgerät für akustische Signale
DE69533822T2 (de) Verfahren zur Wiedergabe von Audiosignalen und Vorrichtung dafür
DE69126655T2 (de) Verfahren und Vorrichtung zur gleichzeitig Erzeugung eines Ausgangssignals aus digitalen Audio-Daten und durch MIDI synthesierter Musik
DE4313175C2 (de) Verfahren und Vorrichtung zum Aufzeichnen von Audiosignalen in einen Speicher mit direktem Zugriff
DE2920298A1 (de) Binaere interpolatorschaltung fuer ein elektronisches musikinstrument
DE2806429A1 (de) Elektronischer rechner mit synthetisch erzeugter sprachanzeige
DE9006717U1 (de) Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
DE3430850C2 (de)
EP1105867B1 (de) Verfahren und vorrichtungen zur koartikulationsgerechten konkatenation von audiosegmenten
EP0042555B1 (de) Verfahren zur digitalen Hüllkurvensteuerung eines polyphonen Musiksyntheseinstruments und Schaltungsanordnung zur Durchführung des Verfahrens
DE102019215301A1 (de) Klangsignalerzeugungsvorrichtung, klangsignalerzeugungsverfahren und klangsignalerzeugungsprogramm
DE69233622T2 (de) Vorrichtung zur Erzeugung von Ansagen
DE68926423T2 (de) Aufzeichnungs- und Wiedergabegerät für PCM-Tonsignale
DE10022586A1 (de) Verfahren zum Erzeugen einer Sprachdatenbank für einen Zielwortschatz zum Trainieren eines Spracherkennungssystems
AT403969B (de) Verfahren zur kompression eines analogen signals
DE2836736A1 (de) System zum kodieren von tiefen- und hoehenausdruckseffekten bei der aufnahme von der tastatur eines elektronischen klaviers
DE4307905A1 (de) Verfahren zur Speicherung und Wiedergabe eines Audiosignals
EP0372639A2 (de) System zur Spracherkennung
DE3784212T2 (de) Digitale stummschaltung.
DE102006036583A1 (de) Hörhilfe mit einem Audiosignalerzeuger und Verfahren
DE3873873T2 (de) Verfahren und vorrichtung zur erlangung und wiedergabe von komplexen musiktoenen.
DE602004006401T2 (de) Aktualisieren eines verborgenen datenkanals

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8141 Disposal/no request for examination