DE3810068C2 - - Google Patents

Info

Publication number
DE3810068C2
DE3810068C2 DE19883810068 DE3810068A DE3810068C2 DE 3810068 C2 DE3810068 C2 DE 3810068C2 DE 19883810068 DE19883810068 DE 19883810068 DE 3810068 A DE3810068 A DE 3810068A DE 3810068 C2 DE3810068 C2 DE 3810068C2
Authority
DE
Germany
Prior art keywords
signal
amplitude
speech
period
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE19883810068
Other languages
English (en)
Other versions
DE3810068A1 (de
Inventor
Hans Wilhelm Dipl.-Ing. 5100 Aachen De Gierlich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tenovis GmbH and Co KG
Original Assignee
Telenorma Telefonbau und Normalzeit GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telenorma Telefonbau und Normalzeit GmbH filed Critical Telenorma Telefonbau und Normalzeit GmbH
Priority to DE19883810068 priority Critical patent/DE3810068A1/de
Priority to EP19890102876 priority patent/EP0334023A3/de
Publication of DE3810068A1 publication Critical patent/DE3810068A1/de
Application granted granted Critical
Publication of DE3810068C2 publication Critical patent/DE3810068C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Erkennung von Sprach­ signalen, wobei diese zunächst einem Teifpaß zugeführt werden, dessen Durchlaßbereich im Bereich der Sprachgrundfrequenz liegt.
Auf dem Gebiet der Elektroakustik ist die Erkennung von Sprachsig­ nalen von großer Bedeutung, da das Vorliegen von Sprachsignalen als Kriterium für die Anhebung der Verstärkung herangezogen werden kann. So wird beispielsweise zur akustischen Entkopplung von Freisprech­ einrichtungen die Verstärkung des Sende- oder auch des Empfangssig­ nals in Abhängigkeit vom Vorliegen eines Sprachsignals gesteuert. Das gleiche gilt auch für Konferenzeinrichtungen.
In der US-PS 44 84 344 wird ein durch Sprachsignale gesteuerter Schalter beschrieben, wobei die Signale zunächst einem Tiefpaß­ filter zugeführt werden, welches für Frequenzen unterhalb von 750 Hz durchlässig ist. Die am Ausgang des Filters anstehenden Sig­ nale werden einem Silbenfolgefilter zugeführt, wobei mit Hilfe einer Offset-Schwelle eine Unterscheidung zwischen zwei Signalzuständen mög­ lich ist. In dem einen Zustand wird der Schalter betätigt und läßt Sprachsignale durch, während bei deren Fehlen der Schalter geöffnet ist.
Weiterhin ist aus der DE-OS 18 02 502 eine Schaltungsanordnung zur Feststellung der Anwesenheit von Sprachlauten bekannt, bei welcher die Signale einem Spitzendetektor zugeführt werden, dessen Zeitkon­ stante einerseits ausreichend groß ist, um periodische Signale bis oberhalb der Grundfrequenz und Dauerstörungen in Gleichstromsignale zu verwandeln und andererseits klein genug ist, um Änderungen der Sprachgrundfrequenz zu folgen, wobei eine vom Spitzendetektor ge­ speiste Differenzzierschaltung und ein Signalfühler zur Überwachung der Wiederholungsfrequenz der differenzierten Signale vorhanden ist.
Nachteilig bei dieser Schaltungsanordung ist, daß periodische, nicht modulierte Störsignale, deren Frequenz im Bereich der Sprachgrundfre­ quenz liegt, nicht in allen Fällen mit eindeutiger Sicherheit von Sprachsignalen unterschieden werden können.
Die Aufgabe der Erfindung besteht nun darin, ein Verfahren zur Er­ kennung von Sprachsignalen anzugeben, bei welchem auch mit großer Sicherheit periodische, nicht modulierte Störsignale, deren Fre­ quenz im Bereich der Sprachgrundfrequenz liegt, von Sprachsignalen unterschieden werden.
Diese Aufgabe wird dadurch gelöst, daß das Tiefpaßfilter eine obere Grenzfrequenz von höchstens 400 Hz aufweist, daß am Ausgang des Tief­ paßfilters auftretende Signale auf einem vorgegebenen Amplitudenwert geprüft werden, daß bei Vorhandensein eines Signals vorgegebener Dauer (ZF) oberhalb des vorgegebenen Amplitudenwerts eine Periode (PF) er­ zeugt wird, daß bei Auftreten eines weiteren Signals dieser Dauer (ZF) oberhalb des vorgegebenen Amplitudenwerts während der Periode (PF) ein Zeitfenster (F) erzeugt wird, und daß dann ein Sprachsignal erkannt wird, wenn eine erste Amplitude der vorgegebenen Dauer (ZF), eine zweite Amplitude der vorgegebenen Dauer (ZF) während der Periode (PF) und eine dritte Amplitude vorgegebener Dauer (ZF) während des Zeitfensters (F) aufgetreten sind, wobei die vorgegebene Dauer der Hälfte der kürzesten Periode der Sprachgrundfrequenz entspricht.
Die Signale werden zunächst nach Amplitudenhöchstwerten überprüft. Sobald ein Amplitudenhöchstwert festgestellt wird, wird das Zeitfenster einer Periode erzeugt. Fällt in dieses Zeitfenster ein weiteres Signal vorgegebener Dauer oberhalb des vorgegebenen Amplitudenwerts, so wird ein weiteres Zeitfenster erzeugt. Fällt in das zweite Zeitfenster wiederum ein Signal bestimmter Dauer oberhalb des vorgegebenen Amplituden­ werts, so handelt es sich bei den Signalen um Sprachsignale. Da die be­ handelten Signale zuerst ein Tiefpaßfilter durchlaufen haben, welches nur Signale der Sprachgrundfrequenz durchläßt, so kann bei einer Sprach­ grundfrequenz der Signale von 80 hz bereits nach weniger als 40 ms festgestellt werden, ob es sich um Sprachsignale handelt. Die Reaktions­ zeit der Erkennung von Sprachsignalen nach dem erfindungsgemäßen Ver­ fahren ist demnach erstaunlich kurz, so daß es kaum zu einer Unter­ drückung von Anfangssilben kommt.
Die Erfindung wird anhand eines Ausführungbeispiels näher erläutert, welches in der Zeichnung dargestellt ist.
Es zeigt
Fig. 1 eine Darstellung der Perioden eines Sprach­ signals in Verbindung mit den Auswertekriterien und
Fig. 2 das Blockschaltbild für eine Anordnung zur Durch­ führung des Verfahrens.
Die in Fig. 1 dargestellten drei Amplituden A 1 bis A 3 sind die Amplituden eines Sprachsignals, welche am Ausgang eines Tiefpaßfilters anstehen, dessen Grenzfrequenz bei ca. 400 Hz liegt. Die dem Eingang des Tiefpaßfilters zuge­ führten Signale werden beispielsweise von einem Mikrofon erzeugt und setzen sich aus Raumgeräuschen und Sprachsignalen zusammen.
Das erfindungsgemäße Verfahren zur Erkennung von Sprachsignalen benutzt nun zur Analyse im wesentlichen den Frequenzbereich der Sprachgrundfrequenz (80 bis 333 Hz). Das wichtigste Merkmal zur Erkennung von Sprachsignalen ist die Periodendauer der Schwingungen der Sprachsignale, die bei der Sprachgrundfrequenz je nach Sprecher im Bereich von 3 bis 12,5 ms liegt. Dieses erste Merkmal dient zur Unterscheidung zwischenSprache und Störgeräusch. Zur sicheren Er­ kennung von Sprachsignalen ist die Detektion von Nulldurchgängen im Sprachsignal nicht sinnvoll, da sich bei Störung, beispielsweise durch Rauschen, die Anzahl der Nulldurchgänge so stark erhöhen kann, so daß eine Erkennung von Sprache auf diese Weise nicht mehr möglich ist. Das Verfahren gemäß der Erfindung benutzt zur Erkennung von Sprache die Maxima des Sprachsignals. Liegen diese dann doch innerhalb eines vorgegebenen Amplituden-Zeitfensters, so ist ein erstes Kriterium für das Vorhandensein von Sprachsignalen gegeben. Einen wesentlichen Einfluß auf die Periodenerkennung hat die Wahl der Fensterparameter.
1. Fenstergröße für ein örtliches Amplitudenmaximum
Die Fenstergröße wird derart gewählt, daß diese kleiner ist als die Hälfte der kleinstmöglichen Periode der Sprachgrundfrequenz, damit sowohl positive als auch negative Maximalwerte des Sprach­ signals erkannt werden können. Dies ist notwendig, da das Sprach­ signal bezüglich des Aussteuerungsbereichs nicht symmetrisch ist. Die Fenstergröße beträgt demnach ca. 0,9 ms.
2. Amplitudenfenster
Die Amplitudentoleranz der Maximalwerte ist bei ungestörtem Sprachsignal über einige Perioden sehr gering, kann aber bei hohen Störpegeln infolge additiver Überlagerung des Störsignals deutlich vergrößert werden. Das Amplitudenfenter beträgt ca. plus­ minus 20% des ersten Maximums.
3. Abstandstoleranz der gefundenen Maximalwerte
Bei ungestörter Sprache ist der Abstand der Maximalwerte der Signale nicht konstant, da das Sprachsignal frequenz­ moduliert wird. Ein streng periodischer Verlauf des Anregungs­ signals kann nicht erwartet werden, die Schwankungen der Sprach­ grundfrequenz können deshalb erheblich sein. Einen quasi perio­ dischen Verlauf weisen jedoch die stimmhaften, eingeschwungenen Laute auf. Wird das Signal gestört (beispielsweise additiv durch Rauschen), so kann sich eine zusätzliche Verschiebung der Signalmaxima in zeitlicher Richtung ergeben. Durchgeführte Untersuchungen haben gezeigt, daß der Toleranzbereich für die Detektion der Signalmaxima ca. 15% betragen kann.
Unter diesen Randbedingungen kann davon ausgegangen werden, daß auch bei ungestörtem Sprachsignal nie mehr als 10 Perioden des Signals die vorgegebenen Kriterien erfüllen, so daß anhand des erfindungsgemäßen Verfahrens auch periodische, nicht modulierte Störsignale, deren Frequenz im Bereich der Sprachgrundfrequenz liegt, von Sprachsignalen unterschieden werden können.
Sobald ein Maximalwert erkannt wird, wird dessen zeitliche Position abgespeichert. Erfüllt der nächste auftretende Maximalwert nicht die weiter unten beschriebenen Bedingungen, so werden die Daten des ersten Maximalwertes gelöscht und diejenigen des nächsten Maximalwertes an dessen Stelle eingespeichert.
Bei dem in Fig. 1 gezeigten Beispiel einer Amplitudenfolge wird davon ausgegangen, daß die gezeigten drei Maximalwerte M 1 bis M 3 sämtliche zur Erkennung von Sprachsignalen erforderliche Bedingungen erfüllen. Die Amplitude A 1 ist als Maximalwert er­ kannt worden, woraufhin deren Dauer t 1 als Periodendauer abge­ speichert wird. Bei der zeitlichen Mitte der Amplitude A 1 des ersten Maximums M 1 beginnt das Zeitfenster der Periode PF zu laufen, welches zwischen 3 und 12,5 ms geöffnet ist. Fällt nun die nächste Amplitude A 2 in das Zeitfenster der Periode PF, da deren Zeitfenster ZF innerhalb des Amplitudenfensters AF liegt, dann wird die Dauer der Amplitude A 2 als zweites Maximum durch Einspeicherung des Wertes t 2 gekennzeichnet. Liegt nun die Amplitude A 3 innerhalb eines Zeitfensters F, welches durch die Periodendauer t 2 ± 7,5% bestimmt wird, so wird auch der Zeitwert t 3 des dritten Maximums M 3 abgespeichert. Es wird noch darauf hingewiesen, daß das Amplitudenfenster AF als Schwelle in Abhängigkeit von dem Amplituden­ wert des ersten Maximums M 1 festgelegt wird.
Durch einen einfachen Zählvorgang zur Erfassung der drei aufeinander­ folgenden Amplituden A 1 bis A 3, welche die oben beschriebenen Be­ dinungen erfüllen, kann bereits auf Vorliegen eines Sprachsignals geschlossen werden, wobei in diesem Fall eine Abspeicherung der Perioden­ dauern t 1 bis t 3 nicht notwendig ist. Für eine genauere Bestimmung von Sprachsignalen können jedoch zwei Verfahren herangezogen werden, die im folgenden beschrieben werden.
Wurden mehrere Perioden einer Schwingung im Sprachgrundfrequenzbereich erkannt, so erfolgt die Bestimmung des Korrelationsgrades zwischen den einzelnen Perioden. Durch eine Kreuzkorrelation zwischen den aufneinander­ folgenden Signalabschnitten einer Periodenlänge werden hohe Werte für den normierten Kreuzkorrelationskoeffizienten in den Bereichen erreicht, in denen Sprache vorhanden ist. Handelt es sich bei der detektierten Periode jedoch nur um zufällige Maxima im vorgegebenen Intervall, so ergibt die Korrelationsanalyse kleine Werte.
mit:
N p = Periodenlänge (in Abtastwerten)
s(n) = Eingangssignal
M = Anzahl der detektierten Perioden
Zur Bestimmung von KKF (k · N p) wird die zweite bzw. im Falle der Detektion mehrer Perioden auch die dritte Periode mit der ersten korreliert. Werden drei Perioden korreliert, so wird zur Entschei­ dung der kleinere der beiden Werte herangezogen. Dies vermindert ins­ besondere bei Störung durch Rauschsignale die Fehlerhäufigkeit bei zufällig detektierten Perioden. Werden mehr Perioden zur Detektion herangezogen, so vermindert sich die Detektionsgeschwindigkeit, eine weitere Verbesserung ist jedoch nicht zu erzielen, da die Werte von KKF (k · N p) aufgrund der Amplituden- und Frequenzmodulation des Sprach­ signals deutlich abnehmen.
Eine weitere Verbesserung der Entscheidung kann dadurch erzielt werden, wenn anstelle der Auswertung der Kreuzkorrelationsfunktion zur Sprach­ entscheidung der normierte mittlere quadratische Fehler zwischen den erkannten Perioden benutzt wird.
mit k = 1, 2, 3
mit:
Δ f ² = normierter mittlerer quadratischer Fehler
Die Verwendung dieses Fehlerkriteriums führt bei ungestörter Sprache zu ähnlichen Ergebnissen, wie die Bildung der KKF (k · N p). Unter­ schiede ergeben sich jedoch bei gestörtem Sprachsignal. Bei Bildung der KKF (k · N p) führt die Unterscheidung zwischen Sprache und Störung anhand des Korrelationskoeffizientens häufiger zu Fehlentscheidungen als die Bildung 1 - Δ f ².
Sowohl KKF (k · N p) als auch 1 - Δ f ² können Werte im Bereich von 0 bis 1 annehmen. Überschreitet der Wert von KKF (k · N p) bzw. von 1 - Δ f ² einen Wert von beispielsweise 0,7, so wird das Eingangssignal als Sprache markiert. Untersuchungen haben gezeigt, daß die Wahl der Schwelle unkritisch ist, sie kann auch im Bereich von 0,3 bis 0,9 ge­ wählt werden.
Der entscheidende Vorteil dieses Verfahrens zur Sprachdetektion ist die Erkennungszeit. Im ungünstigsten Fall, d. h. wenn der Sprecher eine Stimmgrundfrequenz von 80 Hz hat und bei einer Detektion von drei Perioden beträgt die Detektionszeit 37,5 ms.
Bei ungestörten Signalen ergibt die Analyse nach dem eingangs bechriebenen vereinfachten Verfahren annähernd die gleichen Ergebnisse, wie das Aus­ werteverfahren mit Kreuzkorrelation oder nach Ermittlung des mittleren quadratischen Fehlers. Die Erkennungsrate liegt im Mittel 5% unter der Erkennungsrate des zuvor beschriebenen Verfahrens, kann aber auch je nach Störschallsituation höhere Werte annehmen. Unterschiede zu dem vorgenannten Verfahren werden bei Störung der Sprachsequenz deutlich. Bei den gewählten Parametern kann die Periodenerkennung, abhängig vom jeweiligen Störgeräusch, für einige Störschallsituationen eine erhöhte Anzahl von Fehlentscheidungen liefern. Insbesondere bei Störung durch impulshaltige Signale werden Reflektionen des Störsignals, wenn sie die Kriterien für das Vorhandensein von Sprache erfüllen, als Sprache er­ kannt und führen zu Fehlentscheidungen. Die Detektion von sinusförmigen Störanteilen im Bereich der Sprachgrundfrequenz ist nur anhand der zeit­ lichen Dauer und Frequenzkonstanz dieses Störsignals möglich.
Die Auswahl des anzuwendenden Verfahrens zur Sprachdetektion wird im wesentlichen von den zu erwartenden Nutz-/Störleistungsverhältnissen sowie den Störgeräuschen bestimmt. Bei Nutz-/Störleistungsverhältnissen von größer 12 dB kann bereits das vereinfachte Detektionsverfahren ohne Rechenvorgänge angewandt werden. Sämtliche Verfahren haben jedoch nur eine kurze Signalverzögerung im Bereich der Detektionszeit (9 bis 37 ms) zur Folge, so daß Anfangssilben nicht unterdrückt werden.
Die Realisierung des vorgestellten Verfahrens kann beispielsweise mit Hilfe eines Signalprozessors SP (s. Fig. 2) erfolgen. Das analoge Signal des Mikrofons M wird über den Analog/Digitalwandler W 1 abge­ tastet und digitalisiert. Die so gewonnenen Abtastwerte können ge­ mäß dem erfindungsgemäßen Verfahren zur Sprachdetektion durch den Signal­ prozessor herangezogen werden. Wird Sprache erkannt, so kann das Mikrofon­ signal um einen festgelegten Betrag auf Veranlassung des Signalprozessors SP durch den Regelverstärker RV 1 verstärkt werden.
Eine derartige Anordnung ist beispielsweise für Mikrofone geeignet, welche sich in einem Raum mit einem großen Störgeräuschen befinden. Durch die Verstärkung der Sprachsignale wird auf diese Weise eine bessere Verständlichkeit erzielt.
Bei dem in Fig. 2 gezeigten Anwendungsbeispiel ist eine Freisprechein­ richtung vorhanden, wobei bei dieser bei Vorhandensein eines Sprachsignals im Signal des Mikrofons M der Regelverstärker RV 2 durch den Siganlpro­ zessor SP veranlaßt wird, das Signal für den Lautsprecher LS entsprechend zu dämpfen, um auf diese Weise eine akustische Rückkopplung zwischen Laut­ sprecher LS und Mikrofon M zu verhindern. Umgekehrt könnte auch bei Vor­ liegen von Sprachsignalen für den Lautsprecher LS der Regelverstärker RV 2 auf Veranlassung des Signalprozessors SP derart beeinflußt werden, daß diese das Eingangssignal höher verstärkt, um auf diese Weise eine bessere Verständlichkeit des Lautsprechersignals Ls zu erreichen.
Der Signalprozessor erhält an seinen Eingägne SE und EE Datenworte, welche die Abtastwerte der Signale darstellen. Ebenso werden an den Ausgängen SA und EA des Signalprozessors SP Datenworte an die ange­ schlossenen Leitungen angelegt. Zur Vermeidung der Unterdrückung von An­ fangssilben können die Eingangssignale mit Hilfe des Signalprozessors SP um eine Zeit verzögert werden, welche im Bereich der Erkennungszeit (5- 37 ms) liegen. Ebenso kann durch den Signalprozessor SP eine Abfallzeit für die die Regelverstärker RV beeinflussenden Steuersignale erzeugt werden, die in einer Größenordnung von 200 bis 900 ms liegt und zur Überbrückung von stimmlosen Lauten und kurzen Sprachpausen zwischen Wörtern und Sätzen dient. Die Funktion der Tiefpaßfilterung mit einer Grenzfrequenz von 400 Hz kann ebenfalls durch den Signalprozessor SP vorgenommen werden.
Eine andere Anwendung des erfindungsgemäßen Verfahrens ist auch im Rahmen einer Gegensprechanlage denkbar, wobei in Abhängigkeit von Sprahsignalen in der einen Richtung die andere Richtung auf Veranlassung des Signalpro­ zessors entsprechend gedämpft wird.
Auf den Aufbau eines Signalprozessors wird im Rahmen dieser Beschreibung nicht weiter eingegangen, derartige Signalprozessoren werden jedoch bei­ spielsweise von der Firma Texas Instruments unter der Bezeichnung TMS 320 oder von der Firma Fujitsu unter der Bezeichnung MB 8764 vertrieben. Ein solchen Signalprozessor ist derart zu programmieren, daß die be­ schriebenen Verfahrensschritte selbständig ablaufen. Zur Umsetzung der analogen Signale in digitale Signale zur Signalverarbeitung in dem Signal­ prozessor SP dienen die Analog/Digital-Wandler W 1 und W 4, während die Um­ setzung der an den Ausgängen SA und EA auftretenden digitalen Signale in analoge Signale durch die Digital/Analog-Wandler W 2 und W 3 erfolgt.
Im Gegensatz zu dem in Fig. 2 gezeigten Blockschaltbild kann auch auf die Regelverstärker RV 1 und RV 2 verzichtet werden, wenn die Funktion der Verstärkung der Signale durch den Signalprozessor SP selbst übernommen wird, der auch als geeigneter Mikroprozessor ausgebildet sein kann. Ebenso ist die Durchführung des erfindungsgemäßen Verfahrens durch eine entsprechen­ de diskret aufgebaute analoge Schaltungsanordnung oder auch einen ent­ sprechend ausgebildeten Kundenschaltkreis denkbar.

Claims (18)

1. Verfahren zur Erkennung von Sprachsignalen, wobei diese zunächst einem Tiefpaßfilter zugeführt werden, dessen Durchlaßbereich im Bereich der Sprachgrundfrequenz liegt, dadurch gekennzeichnet daß das Tiefpaßfilter eine obere Grenzfrequenz von höchstens 400 Hz aufweist, daß am Ausgang des Tiefpaßfilters auftretende Signale auf einen vorgegebenen Amplitudenwert geprüft werden, daß bei Vorhanden­ sein eines Signals vorgegebener Dauer (ZF) oberhalb des vorgegebenen Amplitudenwertes eine Periode (PF) erzeugt wird, daß bei Auftreten eines weiteren Signals dieser Dauer (ZF) oberhalb des vorgegebenen Amplitudenwerts während der Periode (PF) ein Zeitfenster (F) erzeugt wird, und daß dann ein Sprachsignal erkannt wird, wenn eine erste Ampli­ tude der vorgegebenen Dauer (ZF), eine zweite Amplitude der vorgegebenen Dauer (ZF) während der Periode (PF) und eine dritte Amplitude vorge­ gebener Dauer (ZF) während des Zeitfensters (F) aufgetreten sind, wobei die vorgegebene Dauer der Hälfte der kürzesten Periode der Sprachgrund­ frequenz entspricht.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß sowohl positive als auch negative Amplituden überprüft werden.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Überprüfung der folgenden Amplituden über ein Amplituden­ fenster (AF) erfolgt, dessen Amplitudenbereich in Abhängigkeit von dem ersten erkannten Amplitudenhöchstwert festgelegt wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß das Amplitudenfenster einen Amplitudenbereich von +20 bis -20% des Amplitudenhöchstwertes aufweist.
5. Verfahren nach einem der Ansprüche 1 oder 3, dadurch gekennzeichnet, daß der Zeitraum zwischen dem ersten erkannten Amplitudenhöchst­ wert und der folgenden im Amplitudenfenster (AF) liegenden Amplitude innerhalb eines vorgegebenen Zeitrahmens gemessen wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß der Zeitrahmen (PF) zwischen 3 und 12,5 ms liegt.
7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß der dritte Amplitudenhöchstwert (A 3) in einem Zeitfenster (F) liegen muß, dessen Lage durch den Abstand zwischen dem ersten (A 1) und dem zweiten (A 2) Amplitudenhöchstwert bestimmt wird und innerhalb einer Toleranz von ± 7,5% desselben liegt.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die erste Periode und die zweite Periode bzw. die erste Periode und die dritte Periode zur Bestimmung der Kreuz-Korrelationsgrade benutzt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß aus den gemessenen Zeiträumen der ersten und der zweiten bzw. der ersten und der dritten Periode der normierte mittlere quadratische Fehler ermittelt wird.
10. Verfahren nach einem der Ansprüche 8 oder 9, dadurch gekennzeichnet, daß die ermittelten Werte mit Hilfe einer wählbaren Schwelle überprüft werden und daß bei Überschreiten der Schwelle durch einen ermittelten Wert ein Sprachsignal erkannt wird.
11. Verfahren nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, daß das analoge Eingangssignal einem Analog/Digital-Wandler zugeführt wird.
12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß das digitalisierte Eingangssignal einem Signalprozessor (SP) zugeführt wird, welcher ein, das Vorliegen eines Sprach­ signals kennzeichnendes Ausgangssignal liefert.
13. Verfahren für eine Mikrofonverstärkerschaltung mit einem Regel­ verstärker nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, daß bei Vorliegen eines Sprachsignals das Eingangssignal des Regelverstärkers (RV) auf Veranlassung des Signalprozessors um einen vorgegebenen Wert verstärkt wird.
14. Verfahren für eine ein Mikrofon und ein Lautsprecher aufweisen­ de Freisprecheinrichtung mit je einem Regelverstärker für das Mikrofon- und das Lautsprechersignal, nach einem der Ansprüche 1 bis 13, dadurch gekennzeichnet, daß bei Vorliegen eines Sprachsignals des Mikrofons (M) das Lautsprechersignal um einen vorgegebenen Wert durch den zugeord­ neten Regelverstärker (RV 2) auf Veranlassung des Signalprozessors (SP) gedämpft wird.
15. Verfahren nach einem der Ansprüche 12 bis 14, dadurch gekennzeichnet, daß durch den Signalprozessor (SP) das Mikrofonsignal um den Betrag der Erkennungszeit von Sprachsignalen verzögert wird.
16. Verfahren für eine Gegensprecheinrichtung mit je einem in jeder der beiden Richtungen liegenden Regelverstärker, nach einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß durch den Signalprozessor (SP) bei Vorliegen eines Sprachsig­ nals der betreffende Regelverstärker aufgesteuert und der andere Regelverstärker gedämpft wird.
17. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet daß das Steuersignal für den bzw. die Regelverstärker nach Aus­ bleiben eines Sprachsignals für eine bestimmte Zeit aufrechter­ halten wird.
18. Verfahren nach einem der Ansprüche 1 bis 17, dadurch gekennzeichnet, daß die Funktion der Regelverstärker (RV 1, RV 2) durch den Sig­ nalprozessor (SP) übernommen wird.
DE19883810068 1988-03-25 1988-03-25 Verfahren zur erkennung von sprachsignalen Granted DE3810068A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE19883810068 DE3810068A1 (de) 1988-03-25 1988-03-25 Verfahren zur erkennung von sprachsignalen
EP19890102876 EP0334023A3 (de) 1988-03-25 1989-02-20 Verfahren zur Erkennung von Sprachsignalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19883810068 DE3810068A1 (de) 1988-03-25 1988-03-25 Verfahren zur erkennung von sprachsignalen

Publications (2)

Publication Number Publication Date
DE3810068A1 DE3810068A1 (de) 1989-10-05
DE3810068C2 true DE3810068C2 (de) 1990-01-11

Family

ID=6350648

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19883810068 Granted DE3810068A1 (de) 1988-03-25 1988-03-25 Verfahren zur erkennung von sprachsignalen

Country Status (2)

Country Link
EP (1) EP0334023A3 (de)
DE (1) DE3810068A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5315688A (en) * 1990-09-21 1994-05-24 Theis Peter F System for recognizing or counting spoken itemized expressions
US5822726A (en) * 1995-01-31 1998-10-13 Motorola, Inc. Speech presence detector based on sparse time-random signal samples
SE503875C2 (sv) * 1995-06-19 1996-09-23 Tore Fjaellbrandt Metod och anordning för att bestämma en pitchfrekvens i en talsignal
FI991132A (fi) * 1999-05-18 2000-11-19 Voxlab Oy Menetelmä tutkia näytteistä muodostetun digitaalisen signaalin rytmisy yttä
DE10321625B4 (de) * 2003-05-13 2007-08-23 Gehrke Kommunikationssyteme Gmbh Signalübertragungsvorrichtung und Verfahren zum Regeln einer Signalübertragungsvorrichtung

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3513260A (en) * 1967-10-13 1970-05-19 Ibm Speech presence detector
US3751602A (en) * 1971-08-13 1973-08-07 Bell Telephone Labor Inc Loudspeaking telephone
FR2380612A1 (fr) * 1977-02-09 1978-09-08 Thomson Csf Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif
US4484344A (en) * 1982-03-01 1984-11-20 Rockwell International Corporation Voice operated switch
GB2137458B (en) * 1983-03-01 1986-11-19 Standard Telephones Cables Ltd Digital handsfree telephone

Also Published As

Publication number Publication date
DE3810068A1 (de) 1989-10-05
EP0334023A3 (de) 1991-02-06
EP0334023A2 (de) 1989-09-27

Similar Documents

Publication Publication Date Title
DE4126902C2 (de) Sprachintervall - Feststelleinheit
DE2719973C2 (de)
DE3101851C2 (de) Vorrichtung zum Erkennen von Sprache
DE3802903C2 (de)
DE69915711T2 (de) Verfahren und signalprozessor zur verstärkung von sprachsignal-komponenten in einem hörhilfegerät
DE3235279C2 (de) Spracherkennungseinrichtung
DE2518320A1 (de) Verfahren und detektorschaltung zum feststellen einer signalaktivitaet im tonfrequenzbereich bei einer fernsprechverbindungsleitung
DE3525472A1 (de) Anordnung zum detektieren impulsartiger stoerungen und anordnung zum unterdruecken impulsartiger stoerungen mit einer anordnung zum detektieren impulsartiger stoerungen
CH691787A5 (de) Klirrunterdruckung bei Hörgeräten mit AGC.
EP1101390B1 (de) Hörhilfe mit verbesserter sprachverständlichkeit durch frequenzselektive signalverarbeitung sowie verfahren zum betrieb einer derartigen hörhilfe
DE3810068C2 (de)
DE4106405A1 (de) Geraeuschunterdrueckungseinrichtung
DE3733983A1 (de) Verfahren zum daempfen von stoerschall in von hoergeraeten uebertragenen schallsignalen
DE69112855T2 (de) Sprachsignalverarbeitungsvorrichtung.
EP1458216B1 (de) Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen
EP1382034B1 (de) Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen
DE69208602T2 (de) Ein den Frequenzhub begrenzender Übertragungsschaltkreis
DE3779708T2 (de) Schaltungsanordnung zur isolationsgewaehrung zwischen den uebertragungswegen eines freisprechapparates.
DE3734446C2 (de)
EP0777130B1 (de) Digitales Verfahren zur Detektion zeitlich kurzer Pulse und Anordnung zur Durchführung des Verfahrens
DE3320751A1 (de) Schaltungsanordnung zum selbsttaetigen anpassen der lautstaerke eines lautsprechers an einen am lautsprecherort herrschenden stoergeraeuschpegel
DE2752657C2 (de)
DE19620031C1 (de) Verfahren zur automatischen Justierung einer Schalteinrichtung zum automatischen Umschalten zwischen einer Empfangsbetriebsart und einer Sendebetriebsart bei einer Freisprecheinrichtung eines Kommunikationsendgerätes
DE2334459C3 (de) Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung
EP0902416B1 (de) Verfahren und Einrichtung zum Erkennen einer Spracheingabe während einer Ansage

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: TELENORMA GMBH, 6000 FRANKFURT, DE

8327 Change in the person/name/address of the patent owner

Owner name: ROBERT BOSCH GMBH, 70469 STUTTGART, DE

8327 Change in the person/name/address of the patent owner

Owner name: TENOVIS GMBH & CO. KG, 60326 FRANKFURT, DE