DE4307905A1 - Verfahren zur Speicherung und Wiedergabe eines Audiosignals - Google Patents
Verfahren zur Speicherung und Wiedergabe eines AudiosignalsInfo
- Publication number
- DE4307905A1 DE4307905A1 DE19934307905 DE4307905A DE4307905A1 DE 4307905 A1 DE4307905 A1 DE 4307905A1 DE 19934307905 DE19934307905 DE 19934307905 DE 4307905 A DE4307905 A DE 4307905A DE 4307905 A1 DE4307905 A1 DE 4307905A1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- speech
- during
- pause
- fill
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 title claims description 12
- 101150107341 RERE gene Proteins 0.000 claims 1
- 241001484259 Lacuna Species 0.000 abstract 1
- 239000000945 filler Substances 0.000 description 3
- 230000035807 sensation Effects 0.000 description 3
- 101150087426 Gnal gene Proteins 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C7/00—Arrangements for writing information into, or reading information out from, a digital store
- G11C7/16—Storage of analogue signals in digital stores using an arrangement comprising analogue/digital [A/D] converters, digital memories and digital/analogue [D/A] converters
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C2207/00—Indexing scheme relating to arrangements for writing information into, or reading information out from, a digital store
- G11C2207/16—Solid state audio
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
Die Erfindung geht aus von einem Verfahren zur Speicherung und
Wiedergabe eines Audiosignals gemäß dem Oberbegriff des An
spruchs 1.
Hohe Rechenleistung und Verarbeitungsgeschwindigkeit sowie
geringer Preis neuartiger Rechner und PC′s machen es möglich,
z. B. im sogenannten Bereich Multimedia, Texte in derartigen
Festkörperspeicher zu speichern. Es ist dann möglich,
vollautomatisch eine derartige Textstelle aus einem Speicher ei
nes Rechners abzurufen, mit Hilfe eines D/A-Wandlers in ein
analoges Audiosignal umzusetzen und dann wiederzugeben.
Wegen der hohen Datenrate mit einer Taktfrequenz von ca. 20 kHz
und einer Auflösung von 8 oder 16 Bit ist es dabei bekannt, zur
Einsparung von Speichervolumen die Speicherung zu Beginn einer
erkannten Sprachpause zu unterbrechen und statt dessen nur ein
Kennsignal, z. B. ein Wort, für die Dauer der Sprachpause zu
speichern. Mit dem Kennsignal wird dann bei der Wiedergabe die
ursprüngliche Sprachpause wieder in das wiedergegebene Audiosi
gnal eingefügt. Das geschieht vorzugsweise dadurch, daß der Au
diokanal während der Sprachpause gemutet, also stummgeschaltet
wird. Das kann dadurch erfolgen, daß während der Sprachpause ein
statisches Wort eingefügt wird.
Es hat sich in der Praxis gezeigt, daß ein derartiges Audiosi
gnal mit stummgeschalteten Sprachpausen subjektiv unangenehm
empfunden wird.
Der Erfindung liegt die Aufgabe zugrunde, einen derartigen
subjektiv unangenehmen Eindruck bei der Wiedergabe des Audiosi
gnal zu verringern. Diese Aufgabe wird durch die im Anspruch 1
angegebenen Erfindung gelöst. Vorteilhafte Weiterbildungen der
Erfindung sind in den Unteransprüchen angegeben.
Die Erfindung beruht auf folgenden Überlegungen und Erkenntnis
sen. In der Natur oder bei der Wiedergabe eines üblichen
analogen Audiosignals ist während der Sprachpausen auch stets
ein mehr oder weniger lautes Hintergrundgeräusch wirksam und
wahrnehmbar, z. B. ein Windgeräusch, Hallgeräusche, Störungen
oder Magnetbandrauschen. Ein derartiges geringes Störgeräusch
während der Sprachpausen wird offenbar subjektiv als normal
empfunden. Bei der Wiedergabe des beschriebenen digitalen
Audiosignals liefert jedoch der D/A-Wandler während der
Sprachpausen überhaupt kein Signal. Da das Ausgangssignal eines
derartigen D/A-Wandlers auch keine Rauschanteile enthält, kommt
es somit während der Sprachpausen zu einer absoluten Stille.
Während einer solchen absoluten Stille erhöht automatisch das
Ohr des Zuhörers seine Empfindlichkeit, ähnlich wie das Auge bei
einer sehr kleinen Helligkeit. Am Ende der Sprachpause tritt
dann das Audiosignal wieder mit seiner vollen Amplitude auf,
wodurch es zu einem sehr abrupten Übergang zwischen absoluter
Stille und normaler Lautstärke kommt.
Zu Beseitigung dieses subjektiv unangenehmen Eindrucks wird da
her gemäß der Erfindung bei der Wiedergabe während der Sprach
pausen ein ein Hintergrundgeräusch darstellendes digitales
Füllsignal in das Signal eingefügt, das dann am Ausgang des D/A-
Wandlers in dem analogen Audiosignal für die Wiedergabe das an
sich in der Praxis auftretende Hintergrundgeräusch oder Störge
räusch für eine subjektiv angenehme Sprachempfindung wieder her
stellt oder simuliert.
Für das Füllsignal gibt es eine Reihe verschiedener Signalquel
len. Das Füllsignal kann einem Rauschgenerator entnommen werden
und ein sogenanntes weißes Rauschen darstellen. Das Füllsignal
kann auch einem digitalen Zufallsfolgegenerator entnommen
werden. Es ist auch möglich, periodisch wiederkehrend immer
daßelbe, einem Speicher entnommene Füllsignal während der
Sprachpause einzufügen.
Die erfindungsgemäße Lösung ermöglicht somit auf einfache Weise
trotz der Unterbrechung in der Speicherung des Audiosignals wäh
rend der Sprachpausen und der an sich vorgenommene Stummschal
tung bei der Wiedergabe eine natürliche Sprachwiedergabe ohne
genannten subjektiv unangenehmen Störungen. Vorzugsweise wird
die Erfindung bei der Sprachwiedergabe angewendet. Eine Anwen
dung bei Musikwiedergabe ist ebenfalls denkbar, jedoch weniger
wichtig, weil bei Musikwiedergabe andere Verhältnisse zwischen
lauten und leisen Stellen vorliegen.
Die Erfindung wird im folgenden anhand der Zeichnung erläutert.
Darin zeigen
Fig. 1 das analoge Audiosignal, das bei der Erfindung für die
Sprachwiedergabe generiert wird,
Fig. 2, 3 im Prinzip den Signalaufbau mit den Textstellen und den
Sprachpausen und
Fig. 4 ein Blockschaltbild zur Realisierung des erfindungsge
mäßen Verfahrens.
Fig. 1 zeigt das durch die Erfindung erzeugte analoge Audiosi
gnal. Während einer Sprachpause P zwischen zwei Textstellen T1,
T2 ist das Rauschsignal R künstlich eingefügt. Während der
Sprachpause P, in der an sich völlige Ruhe herrschen würde, wird
dadurch das für die angenehme Sprachempfindung notwendige
Hintergrundgeräusch wieder eingeführt oder simuliert.
Fig. 2, 3 zeigen jeweils zwei aufeinanderfolgende Textsignale
Text 1, Text 2, zwischen denen Sprachpausen P1, P2, P3 liegen.
Jeweils in den Pausen P1, P2, P3 werden digitale Füllsignale
FS1, FS2 und FS3 eingefügt. Vorzugsweise FS1=FS2=FS3.
In Fig. 3 sind zwischen den Textsignalen Text1 und Text2
unterschiedliche Füllsignale FS1, FS2, FS3 eingefügt.
In Fig. 4 ist für die Erzeugung des digitalen Füllsignals ein
Pseudozufallsgenerator 1 vorgesehen, bestehend aus mehreren Flip
Flop′s mit teilweiser Rückführung auf ein EXKLUSIV/ODER GATTER.
Die Ausgangssignale der Flip Flop′s sind an einen Eingang des
D/A-Wandlers 2 angelegt. An den anderen Eingang des D/A-Wandlers
2 ist der Textpassagenspeicher 3 angeschlossen, der die durch
Pausen P getrennten Textsignale gemäß Fig. 1 bis 3 liefert. Der
Rechner 4 steuert einerseits den Textpassagenspeicher 3 zur
Ausgabe der Textsignale und außerdem den D/A-Wandler 2 zur
Einfügung der Füllsignale FS gemäß Fig. 2, 3. Am Ausgang 5 des
D/A-Wandlers 2 steht dann das analoge Audiosignal gemäß Fig. 1
mit einem während der Sprachpausen P eingefügten Füllsignal, das
das für die subjektiv angenehme Sprachempfindung notwendige Hin
tergrundgeräusch wieder in das Signal einfügt. Die Lautstärke
wahl erfolgt vom Rechner 4 entweder direkt im D/A-Wandler 2 oder
in der dem D/A-Wandler 2 folgenden Analogsignalverarbeitung.
Grundsätzlich kann ein bestimmtes Füllsignal aus einem Generator
oder einem Speicher während einer Sprachpause mehrmals nachein
ander eingefügt werden, da das Füllsignal keinen Sprachinhalt
darstellt, der verständlich sein müßte. Es können auch mehrere
Pausenfüllerspeicher vorgesehen sein, die von dem zentralen
Rechner gesteuert werden. Es ist auch möglich, in jeder Text
pause eine Füllersequenz zu erstellen und nur die endgültig zu
speichern, die dem Mittelwert aller entspricht. Auch dabei ist
wieder nur ein Pausefüllerspeicher vorhanden, der vom Rechner
gesteuert wird.
Claims (9)
1. Verfahren zur Speicherung und Wiedergabe eines Audiosignals,
bei dem während einer Sprachpause nur ein Kennsignal über
die Dauer der Sprachpause gespeichert und bei der Wiedergabe
das Signal für diese Zeit stummgeschaltet wird, dadurch
gekennzeichnet, daß bei der Wiedergabe während der Sprach
pausen (P) ein ein Hintergrundgeräusch darstellendes digita
les Füllsignal (FS) in das Signal eingefügt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das
Füllsignal (FS) einem Speicher (1) entnommen wird.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das
Füllsignal (FS) zeitlich kürzer ist als die Sprachpausen (P)
und während einer Sprachpause (P) periodisch wiederholt ein
gefügt wird.
4. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß meh
rere, je ein Füllsignal (FS) enthaltende Speicher vorgesehen
sind, die von einem Rechner gesteuert werden.
5. Verfahren nach Anspruch 2 oder 4, dadurch gekennzeichnet, daß
in jeder Sprachpause (P) ein Füllsignal (FS) erstellt und um
dasjenige endgültig gespeichert wird, das dem Mittelwert
aller Füllsignale entspricht.
6. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das
Füllsignal (FS) einem Rauschgenerator entnommen wird.
7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die
Amplitude des digitalen Rauschsignals so eingestellt wird,
daß sie den kleinsten, während der aktiven Sprachzeiten er
kannten Amplitudenwert um einen oder wenige logische Zustände
unterschreitet.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das
Füllsignal (FS) einem Zufallsfolgegenerator (1) entnommen
wird.
9. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß für
jede Pause (P) dasselbe Füllsignal (FS) verwendet wird.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19934307905 DE4307905A1 (de) | 1993-03-12 | 1993-03-12 | Verfahren zur Speicherung und Wiedergabe eines Audiosignals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19934307905 DE4307905A1 (de) | 1993-03-12 | 1993-03-12 | Verfahren zur Speicherung und Wiedergabe eines Audiosignals |
Publications (1)
Publication Number | Publication Date |
---|---|
DE4307905A1 true DE4307905A1 (de) | 1994-09-15 |
Family
ID=6482642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19934307905 Withdrawn DE4307905A1 (de) | 1993-03-12 | 1993-03-12 | Verfahren zur Speicherung und Wiedergabe eines Audiosignals |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE4307905A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19882753B4 (de) * | 1997-10-16 | 2004-01-29 | Motorola Ltd., Basingstoke | Hintergrundrauschen-Kontrastreduzierung für Umschaltungen mit einer Änderung der Sprachcoder |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4890259A (en) * | 1988-07-13 | 1989-12-26 | Information Storage Devices | High density integrated circuit analog signal recording and playback system |
DE4013395A1 (de) * | 1989-04-28 | 1990-10-31 | Hitachi Ltd | Einrichtung zum codieren und entcodieren von sprache, mit einer wiedergabefunktion fuer hintergrundgeraeusche |
DE4111781A1 (de) * | 1991-04-11 | 1992-10-22 | Ibm | Computersystem zur spracherkennung |
-
1993
- 1993-03-12 DE DE19934307905 patent/DE4307905A1/de not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4890259A (en) * | 1988-07-13 | 1989-12-26 | Information Storage Devices | High density integrated circuit analog signal recording and playback system |
DE4013395A1 (de) * | 1989-04-28 | 1990-10-31 | Hitachi Ltd | Einrichtung zum codieren und entcodieren von sprache, mit einer wiedergabefunktion fuer hintergrundgeraeusche |
DE4111781A1 (de) * | 1991-04-11 | 1992-10-22 | Ibm | Computersystem zur spracherkennung |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19882753B4 (de) * | 1997-10-16 | 2004-01-29 | Motorola Ltd., Basingstoke | Hintergrundrauschen-Kontrastreduzierung für Umschaltungen mit einer Änderung der Sprachcoder |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69816221T2 (de) | Sprachschnellheitsveränderungsverfahren und vorrichtung | |
DE60002483T2 (de) | Skalierbares kodierungsverfahren für hochqualitätsaudio | |
DE69127048T2 (de) | Verfahren und Vorrichtung zur Editierung von MIDI-Dateien | |
DE4227826C2 (de) | Digitales Verarbeitungsgerät für akustische Signale | |
DE69533822T2 (de) | Verfahren zur Wiedergabe von Audiosignalen und Vorrichtung dafür | |
DE4313175C2 (de) | Verfahren und Vorrichtung zum Aufzeichnen von Audiosignalen in einen Speicher mit direktem Zugriff | |
DE3046338A1 (de) | Elektronische uhr mit aufzeichnungsfunktion | |
DE2920298A1 (de) | Binaere interpolatorschaltung fuer ein elektronisches musikinstrument | |
DE9006717U1 (de) | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen | |
DE3430850C2 (de) | ||
EP1105867B1 (de) | Verfahren und vorrichtungen zur koartikulationsgerechten konkatenation von audiosegmenten | |
EP0042555B1 (de) | Verfahren zur digitalen Hüllkurvensteuerung eines polyphonen Musiksyntheseinstruments und Schaltungsanordnung zur Durchführung des Verfahrens | |
DE102019215301A1 (de) | Klangsignalerzeugungsvorrichtung, klangsignalerzeugungsverfahren und klangsignalerzeugungsprogramm | |
DE69233622T2 (de) | Vorrichtung zur Erzeugung von Ansagen | |
DE68926423T2 (de) | Aufzeichnungs- und Wiedergabegerät für PCM-Tonsignale | |
DE10022586A1 (de) | Verfahren zum Erzeugen einer Sprachdatenbank für einen Zielwortschatz zum Trainieren eines Spracherkennungssystems | |
AT403969B (de) | Verfahren zur kompression eines analogen signals | |
DE2836736A1 (de) | System zum kodieren von tiefen- und hoehenausdruckseffekten bei der aufnahme von der tastatur eines elektronischen klaviers | |
DE4307905A1 (de) | Verfahren zur Speicherung und Wiedergabe eines Audiosignals | |
EP0372639A2 (de) | System zur Spracherkennung | |
DE3784212T2 (de) | Digitale stummschaltung. | |
DE102006036583A1 (de) | Hörhilfe mit einem Audiosignalerzeuger und Verfahren | |
DE3873873T2 (de) | Verfahren und vorrichtung zur erlangung und wiedergabe von komplexen musiktoenen. | |
DE602004006401T2 (de) | Aktualisieren eines verborgenen datenkanals | |
DE2209548C3 (de) | Elektrische Sprachsynthetisatorschaltung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8141 | Disposal/no request for examination |