DE3425026C2 - Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen - Google Patents

Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen

Info

Publication number
DE3425026C2
DE3425026C2 DE19843425026 DE3425026A DE3425026C2 DE 3425026 C2 DE3425026 C2 DE 3425026C2 DE 19843425026 DE19843425026 DE 19843425026 DE 3425026 A DE3425026 A DE 3425026A DE 3425026 C2 DE3425026 C2 DE 3425026C2
Authority
DE
Germany
Prior art keywords
speech
information
pause
pauses
det
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19843425026
Other languages
English (en)
Other versions
DE3425026A1 (de
Inventor
Peter G. 8000 München Jensen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE19843425026 priority Critical patent/DE3425026C2/de
Publication of DE3425026A1 publication Critical patent/DE3425026A1/de
Application granted granted Critical
Publication of DE3425026C2 publication Critical patent/DE3425026C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Sprachinformationen werden auf Sprachpausen überwacht. Für jede Sprachpause wird eine Pausenbeginn- und eine Pausenlängeninformation erzeugt und im Anschluß an die eigentlichen Sprachinformationen abgespeichert. Nach dem Abruf der abgespeicherten Daten werden mit Hilfe der Pausenbeginn- und Pausenlängeninformationen Pausen regeneriert. Pausen lassen sich mit der ursprünglichen Länge oder verkürzt wiedergeben, wobei durch geeignete Wahl des Verkürzungsfaktors die Sprechercharakteristik beibehalten werden kann.

Description

  • Die Erfindung betrifft ein Verfahren und eine Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe, bei dem die Sprachinformationen auf Sprachpausen überprüft werden und bei dem für jede Sprachpause eine Information über den Pausenbeginn und eine Information über die Pausenlänge erzeugt und abgespeichert wird.
  • Gesprochene Informationen enthalten bekanntlich für die Informationserkennung redundante Informationen. Bekannte Verfahren, wie beispielsweise die sogenannte Differenz- PCM (DPCM) und die adaptive Differenz-PCM (ADPCM) dienen der Reduzierung der in gesprochenen Informationen enthaltenen Redundanz. Bei diesen bekannten Verfahren führen jedoch zwischen Sprachinformationen auftretende Pausen gerade bei längeren Pausen noch zu erheblichen Bitraten.
  • Aus der DE-OS 33 02 503 ist ein Verfahren zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe bekannt, bei dem die Sprachinformationen auf Sprachpausen überprüft werden und bei dem für jede Sprachpause eine Information über den Pausenbeginn und eine Information über die Pausenlänge erzeugt und abgespeichert wird. Bei der Wiedergabe bleibt zwar die Sprechercharakteristik erhalten, die Wiedergabezeit kann aber, da die ursprünglich aufgetretenen Pausen in der ursprünglichen Länge wiedergegeben werden, gerade bei einer Vielzahl längerer Pausen erheblich anwachsen.
  • Der Erfindung liegt demgegenüber die Aufgabe zugrunde, ein Verfahren und eine Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe anzugeben, bei dem die Wiedergabezeit der Sprachinformationen verringert und dabei die ursprüngliche Geschwindigkeit der gesprochenen Informationen beibehalten wird.
  • Die Erfindung zeichnet sich durch den Vorteil aus, daß Sprachpausen in der ursprünglichen Länge oder verkürzt wiedergebbar sind.
  • Bei der Wiedergabe verkürzter Sprachpausen kann in vorteilhafter Weise durch geeignete Wahl des Verkürzungsfaktors die Sprechercharakteristik erhalten werden.
  • Die Erfindung wird nun anhand der Zeichnung in einem zum Verständnis erforderlichen Umfang beschrieben.
  • Die Zeichnung zeigt eine Anordnung zur Abspeicherung und Wiedergabe von in Sprachinformationen auftretenden Sprachpausen. Die Anordnung zur Abspeicherung der Sprachpausen besteht aus einer Sprachpausenerkennungseinrichtung DET 1, die sowohl eine steuerbare Schalteinrichtung S 1 als auch einen steuerbaren Generator PBG zur Erzeugung von Pausenbeginninformationen steuert. Der Generator PBG steuert seinerseits einen steuerbaren Generator PLG 1 zur Erzeugung von Pausenlängeninformationen. Die von der Sprachpausenerkennungseinrichtung DET 1 gesteuerte Schalteinrichtung S 1 ist eingangsseitig mit den Ausgängen der Generatoren PBG und PLG 1 verbunden. Der Schalteinrichtung S 1 werden vom Eingang E der Abspeicherungsanordnung die Sprachinformationen zugeführt, in denen Sprachpausen auftreten können. Die Sprachinformationen können der Schalteinrichtung S ≙Ç%] 1 in analoger oder digitaler Form gegebenenfalls nach Codierung und/oder nach Reduzierung der Sprachredundanz zugeführt werden. In der Zeichnung ist dementsprechend ein Analog-/Digitalwandler A/D und ein PCM-/ ADPCM-Modulator MOD dargestellt. An der Ausgangsseite der Schalteinrichtung S ≙Ç%] 1 befindet sich der zur Aufnahme von Sprach- und Sprachpauseninformationen bestimmte Speicher SP.
  • Die Anordnung zur Wiedergabe der abgespeicherten Sprach- und Sprachpauseninformationen umfaßt den Speicher SP, eine Steuereinrichtung ST, die den Abruf der abgespeicherten Informationen bewirkt, eine Informationsbewertungseinrichtung DET 2, die eine Schalteinrichtung S 2 steuert. Die Informationsbewertungseinrichtung DET 2 steuert ferner einen Generator PLG 2, der aufgrund ihm zugeführter Pausenlängeninformationen Pausen entsprechender Längen erzeugt. Die aus dem Speicher SD abgerufenen Sprachinformationen werden im Ausführungsbeispiel einem PCM-/ADPCM- Demodulator DEM sowie einem Digital-/Analogwandler D/A zugeführt. Die von der Informationsbewertungseinrichtung DET 2 gesteuerte Schalteinrichtung S 2 schaltet entweder die Sprachinformationen oder die vom Generator PLG 2 erzeugten Pausen an den Ausgang A der Wiedergabeanordnung durch. Die Steuereinrichtung ST kann wie in der Zeichnung durch den gestrichelten Pfeil angedeutet, über den Generator PLG 2 auf die Erzeugung der Pausen einwirken.
  • Der Anordnung werden über den Eingang E Sprachinformationen zugeführt, in denen Sprachpausen auftreten können. Diese Sprachinformationen können der Anordnung in analoger oder digitaler Form zugeführt werden. Die Sprachpausenerkennungseinrichtung DET 1 kann in an sich bekannter Weise so ausgebildet sein, daß sie Sprachinformationen in analoger und/oder digitaler Form auf Sprachpausen überprüft und diese erkennt.
  • Die Sprachpausenerkennungseinrichtung DET 1 möge einen Sprachdetektor mit variablem Sprachschwellwert und einen Geräuschdetektor mit variablem Geräuschschwellwert umfassen. Der Sprachschwellwert ist so dimensioniert, daß die Sprachpausenerkennungseinrichtung DET 1, die die über den Eingang E, den Analog-/Digitalwandler A/D und den Modulator MOD laufenden Informationen an die Schalteinrichtung S 1 für einen bestimmten Zeitraum, beispielsweise mindestens 170 ms, durchschaltet, um ein unerwünschtes Wegschneiden von abklingenden Sprachteilen zu verhindern, während eine besondere Verzögerungsschaltung in der Einrichtung DET 1 durch eine Verzögerung für einen bestimmten Zeitraum, beispielsweise 4 ms, ein unerwünschtes Wegschneiden von anklingenden Sprachteilen verhindert. Unerwünschte Geräusche, wie beispielsweise Hintergrundgeräusche während Sprachpausen oder Störungen, die mit einer vorgegebenen Anzahl, beispielsweise maximal zweimal, den Sprachschwellwert überschreiten, werden auf diese Weise aus den abzuspeichernden Informationen ausgeblendet.
  • Der Geräuschschwellwert wird durch eine besondere Steuerung innerhalb der Einrichtung DET 1 fortlaufend in der Weise bereichnet, daß ein bestimmter Prozentsatz, von z. B. vier Prozent, der Geräuschabtastwerte den Geräuschschwellwert überschreiten. Hierzu wird innerhalb eines bestimmten Zeitraums von beispielsweise 150 ms die Zahl der Überschreitungen des Geräuschschwellwerts ermittelt. Die Steuerung der Einrichtung DET 1 bewirkt bei höheren Überschreitungszahlen eine Anhebung des Geräuschschwellwertes, während bei einer geringeren Überschreitungsanzahl der Geräuschschwellwert gesenkt wird. Die Anpassung der Geräuschschwellwerte an den jeweiligen Geräuschpegel erfolgt nur in Sprachpausen. Hierzu kann ein besonderer Freigabeschwellwert von beispielsweise minus 23 dBmO festgelegt werden, der von typischem Leitungsgeräusch nicht überschritten wird, jedoch von Sprachspitzen mit niedrigem Pegel. Bei sehr großem Geräuschpegel bewirkt die Sprachpausenerkennungseinrichtung DET 1 die Durchschaltung aller über den Eingang E zugeführten Informationen.
  • Die Sprachpausenerkennungseinrichtung DET 1 schaltet die von Eingang E zugeführten Informationen an die Schalteinrichtung S 1 durch, wenn der Sprechschwellwert durch die gelieferten Informationen zum dritten Mal überschritten wird. Von diesem Zeitpunkt erfolgt für die Durchschaltung für einen bestimmten Zeitraum, beispielsweise 500 ms, unabhängig von weiteren Überschreitungen des Sprachschwellwerts. Treten in diesem Zeitraum jedoch wiederum mindestens drei Sprachschwellüberschreitungen auf, so bleibt die Durchschaltung um den gleichen Zeitraum verlängert. Ansonsten erkennt die Einrichtung DET 1 in den zugeführten Informationen eine Pause.
  • Die Sprachpausenerkennungseinrichtung DET 1 schaltet in den Zeiten, in denen sie in den der Anordnung über den Eingang E zugeführten Informationen Sprachinformationen erkennen kann, die Schaltvorrichtung S 1 in der Weise, daß die Anordnung über den Eingang E zugeführten Informationen gegebenenfalls nach Analog-/Digitalwandlung, Codierung und Komprimierung in den Speicher SP aufgenommen wird. In Zeiten, in denen die Einrichtung DET 1 in den der Anordnung über den Eingang E zugeführten Informationen keine Sprachinformation erkennen kann, schaltet sie die Schalteinrichtung S 1 in der Weise, daß der Pausenbeginngenerator mit dem Speicher SP verbunden wird. Der Generator PBG erzeugt eine Pausenbeginninformation, die dem Speicher SP zugeführt wird und im Anschluß an die während des vorangegangenen Schaltzustandes abgespeichert wird. Der Generator PBG steuert mit dem Beginn der Sprachpause den Generator PLG 1 an, während die Sprachpausenerkennungseinrichtung DET 1 die Schalteinrichtung S 1 in der Weise steuert, daß der Generator PLG 1 mit dem Speicher SP verbunden wird. Der Generator PLG 1 mißt den Zeitraum der Pausenlänge und gibt eine entsprechend codierte Pausenlängeninformation an den Speicher SP ab, bevor die Einrichtung DET 1 die der Sprachpause folgenden Sprachinformationen über die Schalteinrichtung S 1 dem Speicher SP zugeführt.
  • Im Anschluß an Sprachinformationen werden also im Speicher SP eine Sprachpausenbeginninformation sowie eine Sprachpausenlängeninformation abgespeichert, bevor gegebenenfalls nach einer Prüfinformation wiederum Sprachinformationen abgespeichert werden.
  • Die Steuereinrichtung ST bewirkt den Abruf der abgespeicherten Informationen. Der Abruf kann beispielsweise durch entsprechende Bedienung eines Tastenfeldes oder durch Wahl eines Sonderkennzeichens erfolgen. Die aus dem Speicher SP ausgelesenen Informationen werden sowohl dem Demodulator DEM und dem Digital-/Analogwandler D/A als auch der Informationsbewertungseinrichtung DET 2 zugeführt. Diese kann in der Weise ausgebildet sein, daß sie in den aus dem Speicher SP ausgelesenen Informationen Sprachpausen erkennt. Die Erkennung von Pausenbeginn- und Pausenlängeninformationen erfolgt in einfacher Weise, wenn sich die Pausenbeginn-Informationen in codierter Form von den codierten Sprachinformationen unterscheiden und die Pausenlängeninformationen, und gegebenenfalls die daran anschließenden Prüfinformationen ein festes Format aufweisen.
  • Die Informationsbewertungseinrichtung DET 2 schaltet die Schalteinrichtung S 2 in der Weise, daß Sprachinformationen an den Ausgang A der erfindungsgemäßen Anordnung durchgeschaltet werden, während durch die Pausenbeginninformationen sowohl der Generator PLG 2 als auch die Schalteinrichtung S 2 angesteuert werden. Der mit dem Pausenbeginn einsetzende neue Schaltzustand der Einrichtung S 2 wird entsprechend der von der Informationsbewertungseinrichtung DET 2 erkannten Pausenlängeninformation gehalten. Der Generator PLG 2 decodiert die ihm zugeführte Pausenlängeninformation und gibt diese an die Einrichtung DET 2 ab, die ihrerseits durch entsprechende Ansteuerung der Schalteinrichtung S 2 den Sprachinformationsweg an den Ausgang A der Anordnung durchschaltet bzw. nicht durchschaltet, so daß auf diese Weise in den am Ausgang A abgreifbaren Sprachinformationen Sprachpausen definierter Länge erzeugt werden.
  • Die am Ausgang A wiedergegebenen Pausen weisen dabei die gleiche Länge wie die ursprünglich am Eingang E auftretenden Pausen auf. Durch eine von der Steuerung ST dem Generator PLG 2 zugeführte Information läßt sich die Länge der wiederzugebenden Pausen verkürzen. Durch geeignete Wahl eines Verkürzungsfaktors lassen sich die verkürzten Pausen mit gleicher Pausenlänge wiedergeben. Es ist jedoch auch möglich, daß ursprüngliche Pausen mit einer Pausenlänge innerhalb eines vorgegebenen Minimal- und Maximalwerts durch Pausen wiedergegeben werden, deren Längen den vorgegebenen Minimalwert umfassen sowie einen Zeitwert, der proportional zu dem den Minimalwert übersteigenden Zeitwert der ursprünglichen Pausen ist. Als Minimalwert kann beispielsweise 0,5 s, als Maximalwert 1,5 s gewählt werden. Durch geeignete Wahl des Verkürzungsfaktors, beispielsweise 0,25 bis 0,5, bzw. des Minimal- und Maximalwertes läßt sich die Sprechercharakteristik gut erkennbar nachbilden.

Claims (3)

1. Verfahren zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen und zu deren Wiedergabe, bei dem die Sprachinformationen auf Sprachpausen überprüft werden und bei dem für jede Sprachpause eine Information über den Pausenbeginn und eine Information über die Pausenlänge erzeugt und abgespeichert wird, dadurch gekennzeichnet, daß zur Wiedergabe von Pausen die Pausenbeginn- und Pausenlängeninformationen mit einem Verkürzungsfaktor kombiniert werden und Pausen gegenüber der ursprünglichen Pausenlänge verkürzt wiedergegeben werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß ursprüngliche Pausen mit einer Pausenlänge innerhalb eines vorgegebenen Minimal- und Maximalwerts durch Pausen wiedergegeben werden, deren Längen den vorgegebenen Minimalwert sowie einen weiteren Zeitwert umfassen, der proportional zu dem den Minimalwert übersteigenden Zeitwert der ursprünglichen Pausen ist.
3. Anordnung zur Durchführung des Verfahrens nach Anspruch 1 oder 2, gekennzeichnet durch eine Sprachpausenerkennungseinrichtung (DET 1), eine von dieser Einrichtung (DET 1) steuerbaren Schalteinrichtung (S 1) und einen ebenfalls von der Einrichtung (DET 1) steuerbaren Generator (PBG) zur Erzeugung der Pausenbeginninformationen, durch einen vom Generator (PBG) steuerbaren Generator (PLG 1) zur Erzeugung der Pausenlängeninformationen, einen zur Aufnahme von Sprach- und Sprachpauseninformationen bestimmten Speicher (SP), durch eine den Abruf der abgespeicherten Informationen bewirkende Steuereinrichtung (ST), eine Sprach- und Sprachpauseninformationen erkennende Einrichtung (DET 2), eine von der Einrichtung (DET 2) steuerbare Schalteinrichtung (S 2) und durch einen von der Einrichtung (DET 2) und mit Verkürzungsinformationen steuerbaren Generator (PLG 2) zur Erzeugung verkürzter Pausenlängen.
DE19843425026 1984-07-06 1984-07-06 Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen Expired DE3425026C2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19843425026 DE3425026C2 (de) 1984-07-06 1984-07-06 Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19843425026 DE3425026C2 (de) 1984-07-06 1984-07-06 Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen

Publications (2)

Publication Number Publication Date
DE3425026A1 DE3425026A1 (de) 1986-02-06
DE3425026C2 true DE3425026C2 (de) 1987-01-08

Family

ID=6240062

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19843425026 Expired DE3425026C2 (de) 1984-07-06 1984-07-06 Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen

Country Status (1)

Country Link
DE (1) DE3425026C2 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0537804B1 (de) * 1987-01-16 1997-07-23 Sharp Kabushiki Kaisha Sprachaufzeichnungsgerät mit Komprimierung von Sprachpausen
FI115867B (fi) * 1996-12-20 2005-07-29 Nokia Corp Menetelmä ja järjestelmä puhelun tallentamiseksi muistivälineelle

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4449190A (en) * 1982-01-27 1984-05-15 Bell Telephone Laboratories, Incorporated Silence editing speech processor

Also Published As

Publication number Publication date
DE3425026A1 (de) 1986-02-06

Similar Documents

Publication Publication Date Title
DE69226500T2 (de) Verfahren und Gerät zur Sprachsignalübertragung
DE3302503C2 (de)
DE3009677A1 (de) Verfahren zur erkennung von sprache und sprachpausen
DE3117920C2 (de) Verfahren und Vorrichtung zur angenäherten Darstellung eines Analogsignals mit reduzierter Datenmenge
DE3534064A1 (de) Empfangsgeraet
DE69431025T2 (de) Signalkodier- oder -dekodiergerät und Aufzeichnungsmedium
DE2820418A1 (de) Nachrichtensignal-verschluesselungsgeraet
DE9006717U1 (de) Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen
DE69822085T2 (de) Änderung der Sprachabspielgeschwindigkeit mittels Wavelet-Kodierung
EP0508547B1 (de) Schaltungsanordnung zur Spracherkennung
DE19715126A1 (de) Sprachsignal-Codiervorrichtung
DE3520275C2 (de)
EP0993672B1 (de) Verfahren zur codierung und/oder decodierung von sprachsignalen unter verwendung einer langzeitprädiktion und eines mehrimpulsanregungssignals
DE2828219A1 (de) Verfahren zur aufzeichnung und wiedergabe digitaler daten auf magnetspeicher
EP0047386B1 (de) Verfahren zum Beseitigen von akustischen Störsignalen
DE3425026C2 (de) Verfahren und Anordnung zur Abspeicherung von in Sprachinformationen auftretenden Sprachpausen
DE2854401C2 (de) Anrufbeantworter
EP0027233B1 (de) Verfahren zur Codierung von Analogsignalen
EP0905954A2 (de) Verfahren zum Aufzeichnen eines digitalisierten Audiosignals und Telefonanrufbeantworter
DE4203436A1 (de) Datenreduzierte sprachkommunikation
DE3104551C2 (de) Elektronischer Textgeber zur Abgabe von Kurztexten
DE3515805A1 (de) Rauschunterdrueckungssystem
DE69720324T2 (de) System zur Aufzeichnung und/oder Wiedergabe eines digitalen Audiopulskodemodulationssignals
DE4426534C2 (de) Verfahren zur Steuerung der Signalaufzeichnung für einen digitalen Anfrufbeantworter
DE2909822C2 (de) Daten-Codierer mit Schreib-Vorkompensierung und MFM-Algorithmus

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8339 Ceased/non-payment of the annual fee