DE2805478A1 - Diskriminatoranordnung fuer sprachsignale - Google Patents

Diskriminatoranordnung fuer sprachsignale

Info

Publication number
DE2805478A1
DE2805478A1 DE19782805478 DE2805478A DE2805478A1 DE 2805478 A1 DE2805478 A1 DE 2805478A1 DE 19782805478 DE19782805478 DE 19782805478 DE 2805478 A DE2805478 A DE 2805478A DE 2805478 A1 DE2805478 A1 DE 2805478A1
Authority
DE
Germany
Prior art keywords
signal
signals
test signal
test
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19782805478
Other languages
English (en)
Other versions
DE2805478C2 (de
Inventor
Pierre Deman
Jean Potage
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of DE2805478A1 publication Critical patent/DE2805478A1/de
Application granted granted Critical
Publication of DE2805478C2 publication Critical patent/DE2805478C2/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Analogue/Digital Conversion (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Description

- 4 Patentanwälte /no
Dipl.-Ing. Dipl.-Chem. Dipl.-Ing. ^ ^ '
E. Prinz - Dr. G. Hauser - G. Leiser
Ernsbergerstrasse 19
8 München 60
THOMSON - CSF 8. Februar 1978
173f Bd. Haussmann
75008 Paris / Frankreich
Unser Zeichen: T 3055
Diskriminatoranordnung für Sprachsignale
Die Erfindung bezieht sich auf eine Diskriminatoranordnung zur Erkennung von Sprachsignalen in einem Eingangssignal, wobei die Diskriminatoranordnung ein Entscheidungssignal liefert, das beispielsweise für die Steuerung eines Schalters verwendet werden kann.
Einfache Anordnungen dieser Art verwenden ein Kriterium mit guter zeitlicher Auflösung, das aber nur eine Wahrscheinlichkeitsvermutung darstellt; dieses Kriterium ist energetischer Art, d.h. es beruht auf der Energie oder der Amplitude des Signals in wenigstens einem Frequenzband.
Lei/Ma ORiGiMAL INSPECTED
809832/0974
Zur zahlenmäßigen Begrenzung der Unterteilungen der Sprache wird die Zeitkonstante bei der Unterbrechung in einem Übertragungssystem verlängert, was die Konversationen auf Wechselsprechverbindungen schwierig macht.
Kompliziertere Anordnungen, welche die vorstehenden Nachteile nicht aufweisen, arbeiten mit einer Verzögerung des Eingangssignals und mit einer sehr ausgeklügelten Entscheidungsschaltung, die einen Computer erfordert.
Aufgabe der Erfindung ist die Schaffung einer Diskriminatoranordnung für Sprachsignale, die gleichfalls eine Verzögerung des Eingangssignals anwendet, bei der aber nur eine Entscheidungsschaltung verwendet wird, die verhältnismäßig einfach bleibt und dennoch einen in der Praxis sehr gut ausreichenden Sicherheitsgrad ergibt.
Nach der Erfindung ist eine Diskriminatoranordnung für Sprachsignale, die in einem Eingangssignal enthalten sind, mit einer Verzögerungsleitung, die dem Eingangssignal eine Verzögerung der Dauer D erteilt, und mit einer Ausgangsschaltung, die ein Entscheidungssignal für das Vorhandensein von Sprachsignalen im Ausgangssignal der Verzögerungsleitung liefert, dadurch gekennzeichnet, daß eine erste Schaltung vorhanden ist, die ein erstes Prüfsignal liefert, das sich auf das Ausgangssignal der Verzögerungsleitung bezieht und die Wahrscheinlichkeit des Vorhandenseins von Sprachsignalen anzeigt und sowohl für stimmhafte Laute wie für stimmlose Laute repräsentativ ist, daß eine zweite Schaltung
809832/0974
vorhanden ist, die ein zweites Prüfsignal bildet, das mit einer durch die Ansprechzeit der zweiten Schaltung verursachten Verzögerung mit sehr großer Wahrscheinlichkeitsvermutung den Schluß auf das Vorhandensein von für stimmhafte Laute repräsentativen Signalen in dem Eingangssignal zuläßt, daß eine Anordnung zur Verlängerung des zweiten Prüfsignals um eine Dauer d vorhanden ist, daß die Ausgangsschaltung das Entscheidungssignal liefert, wenn gleichzeitig das erste Prüfsignal und das verlängerte zweite Prüfsignal vorhanden sind, und daß die Dauern D und d so bemessen sind, daß das verlängerte zweite Prüfsignal das Zeitintervall überschreitet, in dessen Verlauf die Signale, die das zweite Prüfsignal verursacht haben, am Ausgang der Verzögerungsleitung erscheinen, wobei der Beginn des zweiten Prüfsignals um eine Zeitspanne vor dem Beginn dieses Zeitintervalls liegt, welche die hörbare Identifizierung eines stimmlosen Konsonanten erlaubt, der einem stimmhaften Laut vorangeht, und das Ende dieses Zeitintervalls um eine Zeitspanne vor dem Ende des verlängerten zweiten Prüfsignals liegt, welche die Identifizierung eines stimmlosen Konsonanten erlaubt, der auf einen stimmhaften Laut folgt.
Weitere Merkmale und Vorteile der Erfindung ergeben sich aus der folgenden Beschreibung eines Ausführungsbeispiels anhand der Zeichnung. In der Zeichnung zeigen:
Fig. 1 das Prinzipschema einer Diskriminatoranordnung nach der Erfindung und
Fig. 2 das genauere Schaltbild einer bevorzugten AusfUhrungsform der Diskriminatoranordnung nach der Erfindung.
809832/0974
Es sei zunächst daran erinnert, daß ein stimmhafter Laut in einem Sprachsignal entweder durch einen Vokal oder durch einen stimmhaften Konsonanten gebildet ist.
Die stimmhaften Laute weisen genau definierte spektrale Eigenschaften auf, die in den stimmlosen Lauten, die durch die stummen Konsonanten gebildet sind, nicht vorhanden sind.
Bei der Anordnung von Fig. 1 empfängt der Eingang 1 ein Eingangssignal, das durch ein mit Geräuschen gemischtes Sprachsignal gebildet ist. Der Eingang 1 ist mit einer Verzögerungsleitung 2 verbunden, die dem Signal eine Verzögerung D erteilt und vorzugsweise durch eine Ladungsübertragungsanordnung gebildet ist. Der Ausgang der Verzögerungsleitung 2 ist mit dem Signaleingang eines Schalters 3 verbunden.
Wenn das Eingangssignal mit S(t) bezeichnet wird, ist das Ausgangssignal der Verzögerungsleitung das Signal S(t-D).
Die Entscheidung wird an dem verzögerten Eingangssignal getroffen; dies geschieht mittels eines ersten Früfsignals A von energetischem Charakter, das sich auf das verzögerte Eingangssignal S(t-D) bezieht, und mittels eines zweiten Signals W, das durch ein mit Hilfe des Eingangssignals gebildetes und um eine Dauer d verlängertes Prüfsignal V dargestellt ist, wobei das Signal V unter Vernachlässigung der Ansprechzeit der dieses Signal bildenden Schaltung einen stimmhaften Laut in dem Eingangssignal bezeichnet.
809832/0974
Die Dauer D ist so gewählt, daß sie die zuvor erwähnte Ansprechzeit umfaßt und darüber hinaus die Zeit, die für die hörbare Identifizierung eines einem stimmhaften Laut vorangehenden stimmlosen Konsonanten erforderlich ist.
Die Dauer d wird so groß gewählt, daß das Ende des Durchgangs der Signale, aufgrund welcher das zweite Prüfsignal geliefert worden ist, am Ausgang der Verzögerungsleitung dem Ende des verlängerten zweiten Prüfsignals um eine Zeitspanne vorangeht, die für die hörbare Identifizierung eines auf einen stimmhaften Laut folgenden stimmlosen Konsonanten ausreicht.
Die Signale A, V und W sind durch die Signalwerte "1" von entsprechenden digitalen Signalen a(t), v(t) bzw. w(t) gebildet.
Das erste Prüfsignal wird in einer Schaltung 4 gebildet, die von der Verzögerungsleitung gespeist wird.
Die Ansprechzeit der das energetische Signal liefernden Schaltung ist klein; sie liegt in der Größenordnung von einigen Millisekunden und kann dadurch kompensiert werden, daß das Signal, aufgrund dessen das energetische Signal gebildet wird, etwas vor dem Ausgang der Verzögerungsleitung abgegriffen wird.
Das Signal w(t) wird durch eine Anordnung 5 gebildet, die das Eingangssignal S(t) empfängt und das Signal v(t) liefert, sowie mit Hilfe eines Verzögerungsglieds 7, welches das Signal v(t) um eine Dauer d verzögert und ein Signal v(t-d) liefert, und einer ODER-Schaltung 8,
809832/0974
die eine ODER-Verknüpfung mit dem verzögerten Signal ν und dem nicht verzögerten Signal ν durchführt. Da die Dauer der Abgabe eines stimmhaften Lauts größer als die Verzögerungszeit d ist, erhält man somit das Signal w(t), dessen Signalwert "111 das Signal W bildet, d.h. das verlängerte Signal V.
Die Ausgänge der Anordnung 4 und der ODER-Schaltung 8 sind mit den beiden Eingängen einer UND-Schaltung 9 verbunden, deren Ausgang mit dem Steuereingang des Schalters 3 verbunden ist. Der Schalter 3 überträgt das verzögerte Sprachsignal, wenn ihm von der UND-Schaltung 9 der Signalwert "1" zugeführt wird.
Fig. 2 zeigt in näheren Einzelheiten eine Diskriminatoranordnung, die als Kriterium für das erste Prüfsignal A das Vorhandensein,von minimalen Energien in den Frequenzbändern 300-900 Hz und 1200-3400 Hz verwendet. Das Prüfsignal A entspricht dem digitalen Signalwert "1" eines entsprechenden digitalen Signals a(t).
Das Signal a(t) wird hier aus einem später ersichtlichen Grund dadurch erhalten, daß ein entsprechendes Signal b(t), das mit Hilfe des Signals S(t) gebildet wird, um eine Zeit Dr verzögert wird; das Signal B ist das Signal, das durch den Signalwert H1n des Signals b(t) gebildet ist.
Das zweite Prüfsignal ergibt sich aus der Kombination von mehreren elementaren Prüfsignalen, von denen jedes durch den Signalwert M1n eines entsprechenden digitalen Signals dargestellt ist.
809832/0974
Die zuvor angegebenen PrUfkriterien stellen nur ein Beispiel dar. Eine vereinfachte Version könnte sich auf eine begrenzte Auswahl aus diesen Prüfkriterien beschränken, von denen wenigstens eines für die stimmhafte Sprache kennzeichnend ist, während eine noch weiter ausgebildete Version eine Kombination von einer größeren Anzahl von Erkennungskriterien für die Sprache verwenden könnte.
Die bei dem hier beschriebenen Beispiel verwendeten Kriterien sind:
U : energetisches Ungleichgewicht oberhalb eines bestimmten Schwellenwertes zwischen den Frequenzbändern 300-900 Hz und 1200-3400 Hz;
M : Vorhandensein einer zwischen 70 und 300 Hz liegenden Modulation im Frequenzband 300-900 Hz;
M1: Vorhandensein einer zwischen 70 und 300 Hz liegenden Modulation im Frequenzband 1200-3400 Hz;
Z : Dichte der Nulldurchgänge unterhalb eines bestimmten Schwellenwertes im Eingangssignal;
Z': Dichte der Nulldurchgänge unterhalb eines bestimmten Schwellenwertes im differenzierten Eingangssignal.
Die entsprechenden digitalen Signale werden mit u(t), m(t), m'(t), z(t) und z'(t) bezeichnet.
809832/0974
Das Frequenzintervall von 70 bis 300 Hz enthält die Modulationsfrequenzen von 110 und 220 Hz, welche die mittleren Vibrationsfrequenzen der Stimmbänder bei einem Mann bzw. bei einer Frau sind.
Die Kriterien Z und Z1 entsprechen einem Spektrum, in welchem Formanten enthalten sind; die Formanten sind als eine zeitliche Folge von spektralen Komponenten gleicher oder benachbarter Frequenzen definiert und begrenzen die Anzahl der absoluten oder relativen Maxima im Spektrum der Sprache.
Das zweite komplexe Prüfsignal V ist durch den Signalwert "1" des folgenden Signals v(t) definiert:
v(t) = u(t) . fm(t) + mf(t)l + b(t) . z(t) . z»(t)
Aus dieser logischen Gleichung ist zu erkennen, daß das Vorhandensein eines stimmhaften Lauts in dem einen und/oder dem anderen der folgenden Fälle angenommen wird:
1) Es wird eine zwischen 70 und 300 Hz liegende Modulationsfrequenz entdeckt und es besteht eine ausreichende energetische Differenz zwischen den Frequenzbändern 300-900 Hz und 1200-3400 Hz. Das Vorhandensein einer Modulationsfrequenz zwischen 70 und 300 Hz für sich allein erlaubt es nämlich noch nicht, diese Modulation der Resonanzfrequenz der Stimmbänder zuzuschreiben; sie könnte beispielsweise von einem Motor verursacht sein. In Verbindung mit dem energetischen Ungleichgewicht ist aber dieses Kriterium gut, wie die Erfahrung gezeigt hat.
809832/0974
2) Der zweite Fall läßt wegen Z und Zf das Vorhandensein von Formanten vermuten; die Erfahrung hat aber gezeigt, daß es gut ist, eine energetische Bedingung hinzuzufügen, um sicherzugehen, daß es sich auch tatsächlich um ein von Formanten verursachtes Spektrum und nicht um ein Störspektrum handelt.
Insgesamt ist das Kriterium V im Zeitpunkt t ein gutes Kriterium für das Vorhandensein von Signalen, die einen stimmhaften Laut darstellen.
Es sollen nun die entsprechenden Schaltungen beschrieben werden.
Fig. 2 zeigt wieder den Eingang 1, die Verzögerungsleitung 2 und den Schalter 3 von Fig. 1.
Die das Signal S(t) empfangende und das energetische Signal b(t) liefernde Anordnung enthält zwei Bandfilter 10 und 14, die vom Eingang 1 gespeist werden. Das Durchlaßband des Filters 10 beträgt 300-900 Hz, und das Durchlaßband des Filters 14 beträgt 1200 bis 3400 Hz. Auf das Filter 10 folgen eine Diode 11, ein Tiefpaßfilter 12 mit einer Grenzfrequenz von 100 Hz und ein Komparator 13, der an seinem Eingang H+M das Ausgangssignal des Tiefpaßfilters 12 und an seinem Eingang M-n eine positive Bezugsschwellenspannung IL. empfängt. Das Bandfilter 14 speist, abgesehen von dem Wert der Bezugsspannung, eine gleichartige Schaltung mit einer Diode 15, einem Tiefpaßfilter 16 und einem Komparator 61, dessen Eingang "-" eine Bezugsspannung Rq empfängt, die unter der Bezugsspannung R1 liegt. Die Komparatoren 13 und 61 liefern,
809832/0974
wie auch die anderen in der Schaltung enthaltenen Komparatoren, ein Signal "1", wenn das dem Eingang "+" zugeführte Signal über dem am Eingang "-" anliegenden Signal liegt, und im entgegengesetzten Fall ein Signal "0". Die Ausgänge der Komparatoren 13 und 61 sind mit den beiden Eingängen einer UND-Schaltung 62 verbunden, die das Signal b(t) liefert. Andererseits sind die Ausgänge der Filter 12 und 16 mit den Eingängen "+·' und "-" einer Subtrahierschaltung 17 verbunden, deren Ausgang mit dem Eingang "+" eines Komparators 18 verbunden ist, dessen Eingang "-" eine dritte Bezugsspannung FL, empfängt. Dieser Komparator liefert das Signal U.
An die Ausgänge der Dioden 11 und 15 sind andererseits die Eingänge von zwei Bandfiltern 19 bzw. 20 mit dem Durchlaßband 70 bis 300 Hz angeschlossen, denen jeweils eine Diode 21 bzw. 22 nachgeschaltet ist.
An diese Dioden ist jeweils ein Tiefpaßfilter 23 bzw. 24 mit der Grenzfrequenz 50 Hz angeschlossen.
Der Ausgang jedes Tiefpaßfilters 23» 24 ist mit dem Eingang "+" eines Komparators 25 bzw. 26 verbunden, dessen Eingang '·-" eine Bezugsspannung R, bzw. R^ empfängt. Ein ausreichend hoher Schwellenwert des Ausgangssignals des Tiefpaßfilters 23 oder des Tiefpaßfilters 24 ist normalerweise für das Vorhandensein einer Modulation mit einer Stimmband-Resonanzfrequenz in der Nähe von 110 Hz bzw. 220 Hz kennzeichnend. Die Komparatoren 25 und 26 liefern die Signale m(t) bzw. m'(t).
809832/0974
An den Eingang 1 ist ferner der Eingang "+" eines Komparators 27 angeschlossen, dessen Eingang "-" an Masse liegt. Jede ansteigende Flanke des Ausgangssignals des Komparators 27 löst eine monostabile Kippschaltung 28 aus, deren Ausgangsimpulse durch ein Tiefpaßfilter 29 mit der Grenzfrequenz 50 Hz integriert werden. Der Eingang 1 ist schließlich mit dem Eingang eines Differenzierglieds 30 verbunden, auf das eine Schaltung folgt, die der zuvor beschriebenen Schaltung gleich ist, also einen Null-Komparator 31, eine monostabile Kippschaltung 32 und ein Tiefpaßfilter 33 enthält.
Die Ausgangssignale der Filter 29 und 33 werden an den Eingang "-" eines Komparators 34 bzw. eines Komparators 35 angelegt; die Eingänge "+" dieser Komparatoren empfangen eine Bezugsspannung R,- bzw. Rg, und die Komparatoren liefern die Signale z(t) bzw. z'(t).
Die Entscheidung kann in festen Zeitintervallen getroffen werden, deren Dauer zwischen 3 und 10 ms liegt und beispielsweise 8 ms beträgt. Die sich auf den Zeitpunkt t beziehenden Signale b(t), u(t), m(t), m'(t), z(t) und z'(t) werden zu diesem Zweck in sechs D-Kippschaltungen 36, 37, 38, 39, 40, 41 abgetastet, deren Takteingänge Taktimpulse H mit der Periode 8 ms empfangen.
Die Ausgänge der Kippschaltungen 38 und 39 sind mit den beiden Eingängen einer ODER-Schaltung 42 verbunden, deren Ausgang an den ersten Eingang einer UND-Schaltung 43 angeschlossen ist, deren zweiter Eingang das Signal U von der Kippschaltung 37 empfängt.
809832/0974
- Ip -
Die abgetasteten Signale b(t), z(t) und z'(t) werden andererseits an die Eingänge einer UND-Schaltung 44 angelegt, die drei Eingänge hat. Die Ausgänge der UND-Schaltungen 43 und 44 sind mit den beiden Eingängen einer ODER-Schaltung 45 verbunden, die das abgetastete Signal v(t) liefert, da es mit Hilfe der abgetasteten Komponenten gebildet wird. Diesem abgetasteten Signal v(t) ist die gleiche, durch die Abtastung verursachte veränderliche Verzögerung erteilt wie ihren Komponenten und insbesondere wie dem abgetasteten Signal b(t).
Die abgetasteten Signale b(t) und v(t) werden an die Eingänge von zwei Schieberegistern 46 bzw. 47 angelegt, die an ihren Fortschalteeingängen die Taktimpulse H empfangen; diese beiden Schieberegister erteilen den Eingangssignalen Verzögerungen des Werts D1 bzw. d.
Das abgetastete Signal v(t) und das entsprechende verzögerte Signal werden an die beiden Eingänge einer ODER-Schaltung 48 angelegt, deren Ausgangssignal zusammen mit dem Ausgangssignal des Schieberegisters 47» welches das verzögerte Signal b(t) darstellt, an die beiden Eingänge einer UND-Schaltung 49 angelegt werden. Der Ausgang der UND-Schaltung 49 ist mit dem Signaleingang einer D-Kippschaltung 50 verbunden, deren Takteingang Impulse Hf empfängt, die um 4 ms gegen die Impulse H phasenverschoben sind. Das Ausgangssignal der Kippschaltung 50 wird an den Steuereingang des Schalters angelegt.
809832/0974
Es ist zu bemerken, daß bei der AusfUhrungsform von Fig. 2 eine doppelte Abtastung der Signale vorgenommen wird, nämlich eine Abtastung an den Eingangssignalen der digitalen Schaltung und die andere Abtastung am Ausgangssignal, wobei die Abtastung am Ausgangssignal mit Taktimpulsen erfolgt, die um 4 ms gegen die Taktimpulse versetzt sind, die zur Abtastung der Eingangssignale verwendet werden, wobei die beiden Impulsfolgen die gleiche Periode von 8 ms haben. Diese Art der Abtastung ist in theoretischer Hinsicht keineswegs notwendig. In der Praxis erlaubt sie aber den Betrieb der digitalen Schaltung mit stabilen Signalen, und sie ergibt ein Ausgangssignal, das ebenfalls eine gute Stabilität hat. Aus dieser Abtastung kann sich eine Verzögerung ergeben, die für einen Wechsel des Steuersignals gegenüber einem Wechsel von Sprachsignal zu Geräuschen oder von Geräuschen zu Sprachsignal im Ausgangssignal der Verzögerungsleitung von k bis 12 ms schwanken kann. Diese Verzögerung kann wie eine mittlere Verzögerung von 8 ms angesehen werden, die von einer Schwankung begleitet ist, die dem Absolutwert nach einen maximalen Wert von 4 ms hat. Eine Schwankung von so kurzer Dauer ist für einen Wechsel vom Sprachsignal zu Geräuschen nicht störend. Gegenüber einem Wechsel von Geräuschen zum Sprachsignal stört sie im allgemeinen nicht die Identifizierung eines Anfangslauts. Was die mittlere Verzögerung von 8 ms betrifft, kann diese dadurch kompensiert werden, daß die zuvor für die Zeitspanne D definierte Dauer um 8 ms vergrößert wird.
809832/0974
Vas die Zeit der Identifizierung eines stimmlosen Konsonanten betrifft, der einem stimmhaften Laut vorangeht oder auf einen stimmhaften Laut folgt, kann diese kaum kleiner als 20 ms bemessen werden und wird vorzugsweise auf 60 ms gebracht, damit sie für das Ohr angenehm ist.
Bei der Schaltung von Fig. 2 werden die auf diese Weise bestimmten Werte gegebenenfalls geringfügig verschoben, damit die Tatsache berücksichtigt wird, daß d und D1 Vielfache von 8 ms sind.
In Anwendungsfällen, in denen Sprachsignale von akustischen Geräuschen unterschieden werden müssen, die in der Umgebung des Mikrofons vorhanden sind, können andere technische Maßnahmen zum Aufnehmen des Schalls in Betracht gezogen werden, um die Entscheidung zwischen Sprache und Geräuschen zu erleichtern:
- gerichtete Aufnahme im Fall von Umgebungsgeräuschen mit mittlerem Pegel;
- differenzielle Aufnahme im Fall von Umgebungsgeräuschen mit hohem Pegel. Im letzten Fall ist es notwendig, die Nähe zwischen dem Mikrofon und den Lippen in Betracht zu ziehen.
Die angegebenen Speichermaßnahmen können zusätzlich angewendet werden.
äGJMAL INSPECTED 809832/0974
■■; - a

Claims (4)

Patentanwälte inn Dipl -Ing. Dipl.-Chem. Dipl.-Ing. fc " U J M- /O E. Prinz - Dr. G. Hauser - G. Leiser Ernsbergerstrasse 19 8 München 60 THOMSON - CSF 8. Februar 1978 173, Bd. Haussmann 75008 Paris / Frankreich Unser Zeichen; T 5055 Patentansprüche
1.) Diskriminatoranordnung für Sprachsignale, die in einem Eingangssignal enthalten sind, mit einer Verzögerungsleitung, die dem Eingangssignal eine Verzögerung der Dauer D erteilt, und mit einer Ausgangsschaltung, die ein Entscheidungssignal für das Vorhandensein von Sprachsignalen im Ausgangssignal der Verzögerungsleitung liefert, dadurch gekennzeichnet, daß eine erste Schaltung vorhanden ist, die ein erstes Prüfsignal liefert, das sich auf das Ausgangssignal der Verzögerungsleitung bezieht und die Wahrscheinlichkeit des Vorhandenseins von Sprachsignalen anzeigt und sowohl für stimmhafte Laute wie für stimmlose Laute repräsentativ ist, daß eine zweite Schaltung vorhanden ist, die ein zweites Prüfsignal bildet, das mit einer durch die Ansprechzeit der zweiten Schaltung verursachten Verzögerung mit sehr großer Wahrscheinli'chkeitsvermutung den Schluß auf das Vorhandensein von für
Lei/Ma 809832/0974
stimmhafte Laute repräsentativen Signalen in dem Eingangssignal zuläßt, daß eine Anordnung zur Verlängerung des zweiten Prüfsignals um eine Dauer d vorhanden ist, daß die Ausgangsschaltung das Entscheidungssignal liefert, wenn gleichzeitig das erste Prüfsignal und das verlängerte zweite Prüfsignal vorhanden sind, und daß die Dauern D und d so bemessen sind, daß das verlängerte zweite Prüfsignal das Zeitintervall überschreitet, in dessen Verlauf die Signale, die das zweite Prüfsignal verursacht haben, am Ausgang der Verzögerungsleitung erscheinen, wobei der Beginn des zweiten Prüfsignals um eine Zeitspanne vor dem Beginn dieses Zeitintervalls liegt, welche die hörbare Identifizierung eines stimmlosen Konsonanten erlaubt, der einem stimmhaften Laut vorangeht, und das Ende dieses Zeitintervalls um eine Zeitspanne vor dem Ende des verlängerten zweiten Prüfsignals liegt, welche die Identifizierung eines stimmlosen Konsonanten erlaubt, der auf einen stimmhaften Laut folgt,
2. Diskriminatoranordnung nach Anspruch 1, dadurch gekennzeichnet, daß jedes Prüfsignal durch einen digitalen Signalwert eines digitalen Signals dargestellt ist, und daß das zweite Prüfsignal sich aus der Verknüpfung von elementaren PrüfSignalen ergibt.
3. Diskriminatoranordnung nach Anspruch 2, dadurch gekennzeichnet, daß ein elementares Prüfsignal U dem Signalwert "1" eines Signals u(t) entspricht und ein energetisches Ungleichgewicht zwischen zwei Tonfrequenzbändern bezeichnet, das größer,als ein Schwellenwert ist, daß zwei elementare Prüfsignale
809832/0974
M, M' dem Signalwert "1" des einen bzw. des anderen von zwei digitalen Signalen m(t) bzw. m'(t) entsprechen und jeweils in einem von zwei Tonfrequenzbändern das Vorhandensein einer modulierenden Frequenz in einem Frequenzband angeben, das die Vibrationsfrequenzen der Stimmbändern enthält, daß zwei elementare Prüfsignale Z, Z1 dem Signalwert "1" des einen bzw. des anderen von zwei digitalen Signalen z(t) und z'(t) entsprechen und eine unter einem Schwellenwert liegende Dichte von Nulldurchgängen in dem Eingangssignal bzw. in dem differenzierten Eingangssignal darstellen, daß ein elementares Prüfsignal B dem Signalwert "1" eines digitalen Signals b(t) entspricht und eine Energie bezeichnet, die in wenigstens einem Tonfrequenzband über einem Schwellenwert liegt, und daß das zweite Prüfsignal V der Signalwert "1" des folgenden digitalen Signals ist:
v(t) = u(t) . hn(t) + m'(t)1 + b(t) · z(t) . z'(t)
4. Diskriminatoranordnung nach Anspruch 3, dadurch gekennzeichnet, daß das erste Prüfsignal durch den Signalwert "1" des verzögerten Signals b(t) gebildet ist.
809832/0974
DE2805478A 1977-02-09 1978-02-09 Schaltungsanordnung zur Diskriminierung von Sprachsignalen Expired DE2805478C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR7703606A FR2380612A1 (fr) 1977-02-09 1977-02-09 Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif

Publications (2)

Publication Number Publication Date
DE2805478A1 true DE2805478A1 (de) 1978-08-10
DE2805478C2 DE2805478C2 (de) 1983-03-31

Family

ID=9186505

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2805478A Expired DE2805478C2 (de) 1977-02-09 1978-02-09 Schaltungsanordnung zur Diskriminierung von Sprachsignalen

Country Status (10)

Country Link
US (1) US4158749A (de)
JP (1) JPS5398705A (de)
CA (1) CA1090919A (de)
DE (1) DE2805478C2 (de)
FR (1) FR2380612A1 (de)
GB (1) GB1547137A (de)
IL (1) IL53980A (de)
IT (1) IT1206584B (de)
NL (1) NL7801336A (de)
SE (1) SE7801410L (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2466825A1 (fr) * 1979-09-28 1981-04-10 Thomson Csf Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif
US4506379A (en) * 1980-04-21 1985-03-19 Bodysonic Kabushiki Kaisha Method and system for discriminating human voice signal
US4370521A (en) * 1980-12-19 1983-01-25 Bell Telephone Laboratories, Incorporated Endpoint detector
USRE32172E (en) * 1980-12-19 1986-06-03 At&T Bell Laboratories Endpoint detector
EP0091276A3 (de) * 1982-04-05 1985-03-06 Marten C. Jensen Tonmusterunterscheidungssystem
JPS59115625A (ja) * 1982-12-22 1984-07-04 Nec Corp 音声検出器
US4627091A (en) * 1983-04-01 1986-12-02 Rca Corporation Low-energy-content voice detection apparatus
GB2139054B (en) * 1983-04-22 1986-09-24 Gen Electric Co Plc Loudspeaking telephone instruments
DE3473373D1 (en) * 1983-10-13 1988-09-15 Texas Instruments Inc Speech analysis/synthesis with energy normalization
US4696039A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with silence suppression
IT1179803B (it) * 1984-10-30 1987-09-16 Cselt Centro Studi Lab Telecom Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio
FR2609194B1 (fr) * 1986-12-31 1991-10-11 Thomson Csf Terminal tactique de saisie de donnees exploitable sans l'aide de clavier
DE3810068A1 (de) * 1988-03-25 1989-10-05 Telefonbau & Normalzeit Gmbh Verfahren zur erkennung von sprachsignalen
DE4127295A1 (de) * 1991-08-17 1993-02-18 Koelchens Gert Dipl Ing Spracherkennungsschalter

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3400216A (en) * 1964-01-31 1968-09-03 Nat Res Dev Speech recognition apparatus
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache
DE2150336B2 (de) * 1971-10-08 1979-02-08 Siemens Ag, 1000 Berlin Und 8000 Muenchen Analysator fuer ein spracherkennungsgeraet
DE2536640B2 (de) * 1975-08-16 1979-02-08 Philips Patentverwaltung Gmbh, 2000 Hamburg
DE2021126B2 (de) * 1969-05-26 1979-11-29 Dialog Systems, Inc., Boston, Mass. (V.St.A.) Spracherkennungsanordnung

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5712999B2 (de) * 1974-04-08 1982-03-13
US3944753A (en) * 1974-10-31 1976-03-16 Proctor & Associates Company Apparatus for distinguishing voice and other noise signals from legitimate multi-frequency tone signals present on telephone or similar communication lines
US4027102A (en) * 1974-11-29 1977-05-31 Pioneer Electronic Corporation Voice versus pulsed tone signal discrimination circuit

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3400216A (en) * 1964-01-31 1968-09-03 Nat Res Dev Speech recognition apparatus
DE2021126B2 (de) * 1969-05-26 1979-11-29 Dialog Systems, Inc., Boston, Mass. (V.St.A.) Spracherkennungsanordnung
DE2150336B2 (de) * 1971-10-08 1979-02-08 Siemens Ag, 1000 Berlin Und 8000 Muenchen Analysator fuer ein spracherkennungsgeraet
DE2536640B2 (de) * 1975-08-16 1979-02-08 Philips Patentverwaltung Gmbh, 2000 Hamburg
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Also Published As

Publication number Publication date
US4158749A (en) 1979-06-19
JPS5398705A (en) 1978-08-29
IL53980A (en) 1979-12-30
SE7801410L (sv) 1978-08-10
NL7801336A (nl) 1978-08-11
GB1547137A (en) 1979-06-06
FR2380612A1 (fr) 1978-09-08
IL53980A0 (en) 1978-04-30
DE2805478C2 (de) 1983-03-31
FR2380612B1 (de) 1979-08-24
IT7820087A0 (it) 1978-02-09
CA1090919A (en) 1980-12-02
IT1206584B (it) 1989-04-27

Similar Documents

Publication Publication Date Title
DE2719973C2 (de)
DE2820425C2 (de) Binärer Zufallsrauschgenerator zur stochastischen Kodierung
DE19747885B4 (de) Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
EP0624866B1 (de) Frequenzanalyseverfahren
DE69831991T2 (de) Verfahren und Vorrichtung zur Sprachdetektion
DE2805478A1 (de) Diskriminatoranordnung fuer sprachsignale
DE3802903C2 (de)
DE3877781T2 (de) Automatische verstaerkungsregelungseinrichtung fuer videosignale.
DE60030365T2 (de) Mehrwegstörungsreduktionsschaltung und Audioausgangsschaltung eines FM-Empfängers
DE3541031A1 (de) Verfahren und vorrichtung zum demodulieren von hochfrequent modulierten signalen mittels digitaler filter und digitaler demodulatoren, sowie anwendung des verfahrens in einem fernsteuerempfaenger
DE69224625T2 (de) Verfahren zum detektieren eines disable-tonsignals eines echokompensators
DE2020753A1 (de) Einrichtung zum Erkennen vorgegebener Sprachlaute
DE19720651A1 (de) Hörgerät mit verschiedenen Baugruppen zur Aufnahme, Weiterverarbeitung sowie Anpassung eines Schallsignals an das Hörvermögen eines Schwerhörigen
DE2634426A1 (de) Bandkompressionseinrichtung
DE3102385A1 (de) Schaltungsanordnung zur selbstaetigen aenderung der einstellung von tonwiedergabegeraeten, insbesondere rundfunkempfaengern
DE1905680A1 (de) Anlage zur Signalverarbeitung
DE2251579A1 (de) Anordnung zur bestimmung von merkmalen eines elektrischen eingangssignals
DE2507986A1 (de) Tonfrequenz-unterdrueckungssystem
DE2855301A1 (de) Tonsignaldetektor
DE1547027C3 (de) Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen
DE2062589C3 (de) Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales
DE2912566A1 (de) Ton-decodierschaltung
DE69015753T2 (de) Tonsyntheseanordnung.
DE1903623A1 (de) Sprach-Synthetisator
DE2214521A1 (de) Sprachsyntheseschaltung

Legal Events

Date Code Title Description
OD Request for examination
D2 Grant after examination
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8339 Ceased/non-payment of the annual fee