DE2805478C2 - Schaltungsanordnung zur Diskriminierung von Sprachsignalen - Google Patents
Schaltungsanordnung zur Diskriminierung von SprachsignalenInfo
- Publication number
- DE2805478C2 DE2805478C2 DE2805478A DE2805478A DE2805478C2 DE 2805478 C2 DE2805478 C2 DE 2805478C2 DE 2805478 A DE2805478 A DE 2805478A DE 2805478 A DE2805478 A DE 2805478A DE 2805478 C2 DE2805478 C2 DE 2805478C2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- circuit
- input
- test
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Description
v(r) =
b(r) ■ z(r)
4. Schaltungsanordnung nach Anspruch 3, dadurch gekennzeichnet, daß das erste Prüfsignal a(t)
durch den Signalwert »1« des verzögerten Signals b(t) gebildet ist.
Die Erfindung betrifft eine Schaltungsanordnung zur Diskriminierung von Sprachsignalen, nach dem Oberbegriff
des Patentanspruchs 1.
In einfachen herkömmlichen Schaltungsanordnungen zur Diskriminierung von Sprachsignalen wird als Kri-
signal a(t) und das um die Dauer d verlängerte 30 terium die Energie oder Amplitude eines Signals in
wenigstens einem Frequenzband herangezogen. Derartige Anordnungen haben zwar eine gute zeitliche
Auflösung, sie beruhen jedoch nur auf einer Wahrscheinlichkeitsvermutung und arbeiten daher mit unbefriedigender
Genauigkeit. Um die Häufigkeit der beim Sprechen auftretenden Zwangsunterbrechungen
bei Wechselsprechverbindungen zu vermindern, kann die Zeitkonstante bei der Unterbrechung verlängert
werden, wodurch die Verständigung erschwert wird.
Aus der DE-AS 25 36 640 ist eine Schaltungsanordnung zur Diskriminierung von Sprachsignalen bekannt,
bei der die elektrischen Eingangssignale in einer Verzögerungsleitung verzögert werden, wobei die Verzögerungsdauer
der Zeitspanne entspricht, welche die
45 Diskriminatorschaltungen benötigen, um ein Entscheidungssignal abzugeben. Die Diskriminatorschaltungen
enthalten eine Reihe von Musterdetektoren, in denen die gefilterten Eingangssignale mit vorbestimmten Kriterien
verglichen werden. Derartige Anordnungen sind rung eines stimmlosen Konsonanten, der auf 50 äußerst komplex, so daß die Auswertung in einem
zweite Prüfsignal w(t) angelegt sind und deren
Ausgänge die Ausgangsschaltung (3) ansteuert, wenn gleichzeitig das erste Prüfsignal aft) und
das verlängerte zweite Prüfsignal w(t) vorhanden sind;
und die Dauern D und dso bemessen sind, daß
das verlängerte zweite Prüfsignal w(t) das Zeitintervall überschreitet, welches durch das am
Ausgang der Verzögerungsleitung (2) erscheinende Signal s(t—D) definiert ist, zu dem das
zweite Prüfsignal v(t) gehört, wobei der Beginn des zweiten Prüfsignals v(t) um eine solche
Zeitspanne vor dem Beginn dieses Zeitintervalls liegt, welche die hörbare Identifizierung
eines stimmlosen Konsonanten, der einem stimmhaften Laut vorangeht, erlaubt, und das
Ende dieses Zeitintervalls um eine solche Zeitspanne vor dem Ende des verlängerten zweiten
Prüfsignals w(t) liegt, welche die Identifizie-
einen stimmhaften Laut folgt, erlaubt.
2. Schaltungsanordnung nach Anspruch 1, dadurch gekennzeichnet, daß jedes Prüfsignal a(t), v(t),
w(t) durch einen digitalen Signalwert eines digitalen Signals dargestellt ist und daß das zweite Prüfsignal
v(t) durch eine Verknüpfung von mehreren elementarem Prüfsignalen gebildet ist.
3. Schaltungsanordnung nach Anspruch 2, dadurch gekennzeichnet, daß ein elementares Prüfsignal
Ladern Signalwert »1« eines Signals u(t) entspricht
und ein energetisches Ungleichgewicht zwischen zwei Tonfrequenzbändern bezeichnet, das
größer als ein Schwellenwert ist, daß zwei elementare Prüfsignale M, M' dem Signalwert »1« des
einen bzw. des anderen von zwei digitalen Signalen m(t) bzw. m'(t) entsprechen und jeweils in einem
von zwei Tonfrequenzbändern das Vorhandensein einer modulierenden Frequenz in einem Frequenz-Rechner
vorgenommen werden muß.
Bei einer ähnlichen, aus der DE-AS 21 50 336 bekannten Schaltungsanordnung zur Diskriminierung von
Sprachsignalen wird bestimmten, für Formanten charakteristischen Frequenzbereichen jeweils eine bestimmte
Verzögerung zugeordnet. Bei dieser Anordnung ist eine große Anzahl von parallelgeschalteten
Verarbeitungskanälen mit Bandpässen, Tiefpaßfiltern, Schwellwertdetektoren und dergl. erforderlich. Auch
eine aus der DE-AS 20 21 126 bekannte Schaltungsanordnung arbeitet mit einer Vielzahl von verschiedenen
Verzögerungsstufen und einer entsprechend großen Anzahl von parallelen Verarbeitungskanälen.
Aufgabe der Erfindung ist demgegenüber die Schaffung einer Schaltungsanordnung zur Diskriminierung
von Sprachsignalen, die auf dem Prinzip der Verzögerung des Eingangssignals beruht, jedoch nur eine, das
Entscheidungssignal abgebende Entscheidungsschal-
tung benötigt und dennoch mit geringem Aufwand einen hohen Sicherheitsgrad bei der Erkennung von
Sprachsignalen gewährleistet
Diese Aufgabe wird durch die Merkmale des Patentanspruchs 1 gelöst
Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
Ein Ausführungsbeispiel der Erfindung wird nun unter Bezugnahme auf die Zeichnung näher erläutert
In der Zeichnung zeigt
F i g. 1 eh·; Prinzipschema einer Ausführungsform der
Schaltungsanordnung; und
Fig.2 ein detailliertes Blockschaltbild dieser Ausführungsform.
Es sei zunächst daran erinnert, daß ein stimmhafter Laut in einem Sprachsignal entweder durch einen Vokal
oder durch einen stimmhaften Konsonanten gebildet ist
Oie stimmhaften Laute weisen genau definierte spektrale
Eigenschaften auf, die in den stimmlosen Lauten, die durch den stummen Konsonanten gebildet sind,
nicht vorhanden sind.
Bei der Anordnung von F i g. 1 empfängt der Eingang 1 ein Eingangssignal, das durch ein mit Geräuschen gemischtes
Sprachsignal gebildet ist. Der Eingang 1 ist mit einer Verzögerungsleitung 2 verbunden, die dem
Signal eine Verzögerung D erteilt und vorzugsweise durch eine Ladungsübertragungsanordnung gebildet
ist. Der Ausgang der Verzögerungsleitung 2 ist mit dem Signaleingang eines Schalters 3 verbunden.
Wenn das Eingangssignal mit S(t) bezeichnet wird,
ist das Ausgangssignal der Verzögerungsleitung das Signal S(t-D).
Die Entscheidung wird an dem verzögerten Eingangssignal getroffen; dies geschieht mittels eines ersten
Prüfsignals A von energetischem Charakter, das sich auf das verzögerte Eingangssignal S(t—D) bezieht,
und mittels eines zweiten Signals W, das durch ein mit Hilfe des Eingangssignals gebildetes und um eine Dauer
d verlängertes Prüfsignal V dargestellt ist, wobei das Signal V unter Vernachlässigung der Ansprechzeit der
dieses Signal bildenden Schaltung einen stimmhaften Laut in dem Eingangssignal bezeichnet.
Die Dauer D ist so gewählt, daß sie die zuvor erwähnte Ansprechzeit umfaßt und darüber hinaus die
Zeit, die für die hörbare Identifizierung eines einem stimmhaften Laut vorangehenden stimmlosen Konsonanten
erforderlich ist.
Die Dauer t/wird so groß gewählt, daß dap Ende des
Durchgangs der Signale, aufgrund welcher das zweite Prüfsignal V geliefert worden ist, am Ausgang der Verzögerungsleitung
dem Ende des verlängerten zweiten Prüfsignals IVum eine Zeitspanne vorangeht, die für die
hörbare Identifizierung eines auf einen stimmhaften Laut folgenden stimmlosen Konsonanten ausreicht.
Die Signale A, V und W sind durch die Signalwerte »1« von entsprechenden digitalen Signalen a(t), v(t)
bzw. w(t) gebildet.
Das erste Prüfsignal wird in einer Schaltung 4 gebildet, die von der Verzögerungsleitung gespeist wird.
Die Ansprechzeit der das energetische Signal liefernden Schaltung ist klein; sie liegt in der Größenordnung
von einigen Millisekunden und kann dadurch kompensiert werden, daß das Signal, aufgrund dessen das energetische
Signal gebildet wird, etwas vor dem Ausgang der Verzögerungsleitung abgegriffen wird.
Das Signal w(t) wird gebildet durch eine Anordnung
5, die das Eingangssignal S(t) empfängt und das Signal v(t) abgibt, ein Verzögerungsglied 7, welches das Signal
v(t) um eine Dauer d verzögert und ein Signal v(t—d) liefert und eine ODER-Schaltung 8, die eine ODER-Verknüpfung
mit dem verzögerten Signal v(t—d) und dem nicht verzögerten Signal v(t) durchführt Da die
Dauer der Abgabe eines stimmhaften Lauts größer als die Verzögerungszeit dist, erhält man somit das Signal
w(tX dessen Signalwert »1« das Signal Wbildet d.h.
das verlängerte Signal V.
ίο Die Ausgänge der Anordnung 4 und der ODER-Schaltung
8 sind mit den beiden Eingängen einer UND-Schaltung 9 verbunden, deren Ausgang mit dem Steuereingang
des Schalters 3 verbunden ist Der Schalter 3 überträgt das verzögerte Sprachsignal, wenn ihm von
der UND-Schaltung 9 der Signalwert »1« zugeführt wird.
Fig.2 zeigt in näheren Einzelheiten eine Diskriminatoranordnung,
die als Kriterium für das erste Prüfsignal A das Vorhandensein von minimalen Energien
in den Frequenzbändern 300—900 Hz und 1200 bis 3400 Hz verwendet Das Prüfsigna] A entspricht dem
digitalen Signalwert »1« eines entsprechenden digitalen Signals a(t).
Das Signal a(t) wird hier aus einem später ersichtliehen
Grund dadurch erhalten, daß ein entsprechendes Signal b(t), das mit Hilfe des Signals S(t) gebildet wird,
um eine Zeit D' verzögert wird; das Signal B ist das Signal, das durch den Signalwert »1« des Signals b(t)
gebildet ist.
Das zweite Prüfsignal ergibt sich aus der Kombination von mehreren elementaren Prüfsignalen, von
denen jedes durch den Signalwert »1« eines entsprechenden digitalen Signals dargestellt ist.
Eine vereinfachte Version der Diskriminatoranordnung könnte sich auf eine begrenzte Auswahl aus diesen
Prüfkriterien beschränken, von denen wenigstens eines für die stimmhafte Sprache kennzeichnend ist,
während eine noch weiter ausgebildete Version eine Kombination von einer größeren Anzahl von Erkennungskriterien
für die Sprache verwenden könnte.
Die bei dem hier beschriebenen Beispiel verwendeten Kriterien sind:
U energetisches Ungleichgewicht oberhalb eines bestimmten Schwellenwertes zwischen den Frequenzbändern
300-900 Hz und 1200-3400 Hz; M Vorhandensein einer zwischen 70 und 300 Hz liegenden
Modulation im Frequenzband 300 bis 900Hz;
so M' Vorhandensein einer zwischen 70 und 300 Hz liegenden Modulation im Frequenzband 1200 bis
3400 Hz;
Z Dichte der Nulldurchgänge unterhalb eines bestimmten Schwellenwertes im Eingangssignal;
Z' Dichte der Nulldurchgänge unterhalb eines bestimmten Schwellenwertes im differenzierten Eingangssignal.
Die entsprechenden digitalen Signale werden mit u(t), m(t), m'(t), z(t) und z'(t) bezeichnet.
Das Frequenzintervall von 70 bis 300 Hz enthält die Modulationsfrequenzen von 110 und 220 Hz, welche die
mittleren Vibrationsfrequenzen der Stimmbänder bei einem Mann bzw. bei einer Frau sind.
Di; Kriterien Zund Z'entsprechen einem Spektrum,
in welchem Formanten enthalten sind; die Formanten sind als eine zeitliche Folge von spektralen Komponenten
gleicher oder benachbarter Frequenzen definiert
und begrenzen die Anzahl der absoluten oder relativen Maxima im Spektrum der Sprache.
Das zweite komplexe Prüfsignal V ist durch den Signalwert »1« des folgenden Signals v(t) definiert:
v(r)
[m(0 + m'(0] + b(0 · z(0 · z'(0
Aus dieser logischen Gleichung ist zu erkennen, daß das Vorhandensein eines stimmhaften Lauts in dem
einen und/oder dem anderen der folgenden Fälle angenommen wird:
1. Es wird eine zwischen 70 und 300 Hz liegende Modulationsfrequenz
entdeckt, und es besteht eine ausreichende energetische Differenz zwischen den Frequenzbändern 300—900 Hz und !200 bis
3400 Hz. Das Vorhandensein einer Modulationsfrequenz zwischen 70 und 300 Hz für sich allein
erlaubt es nämlich noch nicht, diese Modulation der Resonanzfrequenz der Stimmbänder zuzuschreiben;
sie könnte beispielsweise von einem Motor verursacht sein. In Verbindung mit dem
energetischen Ungleichgewicht ist aber dieses Kriterium gut, wie die Erfahrung gezeigt hat.
2. Der zweite Fall läßt wegen Z und Z' das Vorhandensein
von Formanten vermuten; die Erfahrung hat aber gezeigt, daß es gut ist, eine energetische
Bedingung hinzuzufügen, um sicherzugehen, daß es sich auch tatsächlich um ein von Formanten verursachtes
Spektrum und nicht um ein Störspektrum handelt.
Insgesamt ist das Kriterium V im Zeitpunkt f ein gutes Kriterium für das Vorhandensein von Signalen,
die einen stimmhaften Laut darstellen.
Es sollen nun die entsprechenden Schaltungen beschrieben werden.
Fig.2 zeigt wieder den Eingang 1, die Verzögerungsleitung
2 und den Schalter 3 von F i g. 1.
Die das Signal S(t) empfangende und das energetische Signal Einliefernde Anordnung enthält zwei Bandfilter
10 und i4, die vom Eingang 1 gespeist werden.
Das Durchlaßband des Filters 10 beträgt 300—900 Hz, und das Durchlaßband des Filters 14 beträgt 1200 bis
3400 Hz. Auf das Filter 10 folgen eine Diode 11, ein Tiefpaßfilter 12 mit einer Grenzfrequenz von 100 Hz
und ein Komparator 13, der an seinem Eingang » + « das Ausgangssignal des Tiefpaßfilters 12 und an seinem
Eingang » —« eine positive Bezugsschwellenspannung R\ empfängt Das Bandfilter 14 speist, abgesehen von
dem Wert der Bezugsspannung, eine gleichartige Schaltung mit einer Diode 15, einem Tiefpaßfilter !6 und
einem Komparator 61, dessen Eingang » —« eine Bezugsspannung Ro empfängt die unter der Bezugsspannung
R\ liegt Die Komparatoren 13 und 61 liefern, wie auch die anderen in der Schaltung enthaltenen Komparatoren,
ein Signal »1«, wenn das dem Eingang » + « zugeführte Signal über dem am Eingang » — « anliegenden
Signal liegt und im entgegengesetzten Fall ein Signal »0«. Die Ausgänge der Komparatoren 13 und
61 sind mit den beiden Eingängen einer UND-Schaltung 62 verbunden, die das Signal b(t) liefert Andererseits
sind die Ausgänge der Filter 12 und 16 mit den Eingängen » + « und » —« einer Subtrahierschaltung 17
verbunden, deren Ausgang mit dem Eingang »+« eines Komparators 18 verbunden ist dessen Eingang » —«
eine dritte Bezugsspannung R2 empfängt Dieser Komparator
liefer· das Signal U.
An die Ausgänge der Dioden 11 und 15 sind andererseits
die Eingänge von zwei Bandfiltern 19 bzw. 20 mit dem Durchlaßband 70 bis 300 Hz angeschlossen, denen
jeweils eine Diode 21 bzw. 22 nachgeschaltet ist. An diese Dioden ist jeweils ein Tiefpaßfilter 23 bzw.
24 mit der Grenzfrequenz 50 Hz angeschlossen.
Der Ausgang jedes Tiefpaßfilters 23, 24 ist mit dem Eingang » + « eines Komparators 25 bzw. 26 verbunden,
dessen Eingang » —« eine Bezugsspannung Rz bzw. R*
ίο empfängt. Ein ausreichend hoher Schwellenwert des
Ausgangssignals des Tiefpaßfilters 23 oder des Tiefpaßfilters 24 ist normalerweise für das Vorhandensein einer
Modulation mit einer Stimmband-Resonanzfrequenz in der Nähe von 110 Hz bzw. 220 Hz kennzeichnend. Die
Komparatoren 25 und 26 liefern die Signale m(t) bzw. ■ -/»ι
I (l/.
An den Eingang 1 ist ferner der Eingang » + « eines Komparators 27 angeschlossen, dessen Eingang » —«
an Masse liegt. Jede ansteigende Flanke des Ausgangssignals des Komparators 27 löst eine monostabile Kippschaltung
28 aus, deren Ausgangsimpulse durch ein Tiefpaßfilter 29 mit der Grenzfrequenz 50 Hz integriert
werden. Der Eingang 1 ist schließlich mit dem Eingang eines Differenzierglieds 30 verbunden, auf das eine
Schaltung folgt, die der zuvor beschriebenen Schaltung gleich ist, also einen Null-Komparator 31, eine monostabile
Kippschaltung 32 und ein Tiefpaßfilter 33 enthält.
Die Ausgangssignale der Filter 29 und 33 werden an den Eingang » —« eines Komparators 34 bzw. eines Komparators 35 angelegt; die Eingänge » + « dieser Komparatoren empfangen eine Bezugsspannung Rs bzw. Rfn und die Komparatoren liefern die Signale z(t) bzw. z'(t).
Die Ausgangssignale der Filter 29 und 33 werden an den Eingang » —« eines Komparators 34 bzw. eines Komparators 35 angelegt; die Eingänge » + « dieser Komparatoren empfangen eine Bezugsspannung Rs bzw. Rfn und die Komparatoren liefern die Signale z(t) bzw. z'(t).
Die Entscheidung kann in festen Zeitintervallen getroffen werden, deren Dauer zwischen 3 und 10 ms liegt
und beispielsweise 8 ms beträgt. Die sich auf den Zeitpunkt t beziehenden Signale b(t), u(t), m(t), m'(t), z(t)
und z'(t) werden zu diesem Zweck in sechs D-Kippschaltungen 36,37,38,39,40,41 abgetastet, deren Takteingänge
Taktimpulse H mit der Periode 8 ms empfangen.
Die Ausgänge der Kippschaltungen 38 und 39 sind mit den beiden Eingängen einer ODER-Schaltung 42
verbunden, deren Ausgang an den ersten Eingang einer UND-Schaltung 43 angeschlossen ist deren zweiter
Eingang das Signal U von der Kippschaltung 37 empfängt
Die abgetasteten Signale b(t), z(t) und z'(t) werden
Die abgetasteten Signale b(t), z(t) und z'(t) werden
so andererseits an die Eingänge einer UND-Schaltung 44 angelegt die drei Eingänge hat Die Ausgänge der
UND-Schaltungen 43 und 44 sind mit den beiden Eingängen
einer ODER-Schaltung 45 verbunden, die das abgetastete Signal v(t) liefert da es mit Hilfe der abgetasteten
Komponenten gebildet wird. Diesem abgetasteten Signal v(t) ist die gleiche, durch die Abtastung
verursachte veränderliche Verzögerung erteilt wie ihren Komponenten und insbesondere wie dem abgetasteten
Signal öffjt
Die abgetasteten Signale b(t) und v(t) werden jeweils
an den Eingang eines Schieberegisters 46 bzw. 47 angelegt, die an ihren Fortschalteeingängen die Taktimpulse
//empfangen; diese beiden Schieberegister 46, 47 erteilen den Eingangssignalen Verzögerungen des
Werts D' bzw. d
Das abgetastete Signal v(t) und das entsprechende verzögerte Signal werden an die beiden Eingänge einer
ODER-Schaltung 48 angelegt, deren Ausgangssignal
zusammen mit dem Ausgangssignal des Schieberegisters 47, welches das verzögerte Signal b(t) darstellt,
an die beiden Eingänge einer UND-Schaltung 49 angelegt werden. Der Ausgang der UND-Schaltung 49 ist
mit dem Signaleingang einer D-Kippschaltung 50 verbunden, deren Takteingang Impulse H' empfängt, die
um 4 ms gegen die Impulse H phasenverschoben sind. Das Ausgangssignal der Kippschaltung 50 wird an den
Steuereingang des Schalters 3 angelegt.
Es ist zu bemerken, daß bei der Ausführungsform von F i g. 2 eine doppelte Abtastung der Signale vorgenommen
wird, nämlich eine Abtastung an den Eingangssignalen der digitalen Schaltung und die andere
Abtastung am Ausgangssignal, wobei die Abtastung am Ausgangssignal mit Taktimpuisen erfolgt, die um
4 ms gegen die Taktimpuise versetzt sind, die zur Abtastung der Eingangssignale verwendet werden, wobei
die beiden Impulsfolgen die gleiche Periode von 8 ms haben. Diese Art der Abtastung ist in theoretischer Hinsicht
keineswegs notwendig. In der Praxis erlaubt sie aber den Betrieb der digitalen Schaltung mit stabilen
Signalen, und sie ergibt ein Ausgangssignal, das ebenfalls eine gute Stabilität hat. Aus dieser Abtastung kann
sich eine Verzögerung ergeben, die für einen Wechsel des Steuersignals gegenüber einem Wechsel von
Sprachsignal zu Geräuschen oder von Geräuschen zu Sprachsignal im Ausgangssignal der Verzögerungsleitung
von 4 bis 12 ms schwanken kann. Diese Verzögerung kann wie eine mittlere Verzögerung von 8 ms angesehen
werden, die von einer Schwankung begleitet ist, die dem Absolutwert nach einen maximalen Wert
von 4 ms hat. Eine Schwankung von so kurzer Dauer ist für einen Wechsel vom Sprachsignal zu Geräuschen
nicht störend. Gegenüber einem Wechsel von Geräuschen zum Sprachsignal stört sie im allgemeinen nicht
die Identifizierung eines Anfangslauts. Was die mittlere Verzögerung von 8 ms betrifft, kann diese dadurch
kompensiert werden, daß die zuvor für die Zeitspanne D definierte Dauer um 8 ms vergrößert wird.
Was die Zeit der Identifizierung eines stimmlosen Konsonanten betrifft, der einem stimmhaften Laut
vorangeht oder auf einen stimmhaften Laut folgt, kann
ίο diese kaum kleiner als 20 ms bemessen werden und wird
vorzugsweise auf 60 ms gebracht, damit sie für das Ohr angenehm ist.
Bei der Schaltung von F i g. 2 werden die auf diese Weise bestimmten Werte gegebenenfalls geringfügig
verschoben, damit die Tatsache berücksichtigt wird, daß u und D' Vielfache von 8 ms sind.
In Anwendungsfällen, in denen Sprachsignale von akustischen Geräuschen unterschieden werden müssen,
die in der Umgebung des Mikrofons vorhanden sind, können andere technische Maßnahmen zum Aufnehmen
des Schalls in Betracht gezogen werden, um die Entscheidung zwischen Sprache und Geräuschen zu
erleichtern:
— gerichtete Aufnahme im Fall von Umgebungsgeräuschen mit mittlerem Pegel;
- differenzielle Aufnahme im Fall von Umgebungsgeräuschen mit hohem Pegel. Im letzteren Fall ist es notwendig, die nähe zwischen dem Mikrofon und den Lippen in Betracht zu ziehen.
- differenzielle Aufnahme im Fall von Umgebungsgeräuschen mit hohem Pegel. Im letzteren Fall ist es notwendig, die nähe zwischen dem Mikrofon und den Lippen in Betracht zu ziehen.
Die angegebenen Speichermaßnahmen können zusätzlich angewendet werden.
Hierzu 2 Blatt Zeichnungen
Claims (1)
1
Patentansprüche:
Patentansprüche:
ί. Schaltungsanordnung zur Diskriminierung von
Sprachsignalen, die in einem elektrischen Eingangssignal enthalten sind, mit einer Verzögerungsleitung,
die dem Eingangssignal eine Verzögerung der Dauer D erteilt, und mit einer Ausgangsschaltung,
die ein Entscheidungssignai für das Vorhandensein von Sprachsignalen im Ausgangssignal der Verzögerungsleitung
liefert, dadurch gekennzeichnet,
daß
— eine erste Schaltung (4) vorhanden ist, die ein
erstes Prüfsignal a(t) liefert, das von dem Ausgangssignal s(t—D) der Verzögerungsleitung
(2) abgeleitet ist und das Vorhandensein sowohl von stimmhaften als auch von stimmlosen Lauten
anzeigt;
— eine zweite Schaltung (5) vorhanden ist die ein zweites Prüfsignal v(t) bildet, das von dem Eingangssignal
s(t) vor der Verzögerungsleitung (2) abgeleitet ist und mit einer durch die Ansprechzeit
dieser zweiten Schaltung (5) verursachten Verzögerung das Vorhandensein von stimmhaften Lauten anzeigt;
— eine Anordnung (7) zur Verlängerung des zweiten Prüf signals v(t)um eine Dauer d vorhanden
ist;
— eine UN D-Verknüpfungsschaltung (9) vorgesehen
ist, an deren Eingänge das erste Prüfband angeben, das die Vibrationsfrequenzen der
Stimmbänder enthält, daß zwei elementare Prüfsignale Z, Z' dem Signalwert »1« des einen bzw. des
anderen von zwei digitalen Signalen z(t) und z'(t) entsprechen und eine unter einem Schwellenwert
liegende Dichte von Nulldurchgängen in dem Eingangssignal bzw. in dem differenzierten Eingangssignal
darstellen, daß ein elementares Prüfsignal B dem Signalwert »1« eines digitalen Signals //^entspricht
und eine Energie bezeichnet, die in wenigstens einem Tonfrequenzband über einem Schwellenwert
liegt, und daß das zweite Prüfsignal v(t) der Signalwert »1« des folgenden digitalen Signals ist:
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR7703606A FR2380612A1 (fr) | 1977-02-09 | 1977-02-09 | Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2805478A1 DE2805478A1 (de) | 1978-08-10 |
DE2805478C2 true DE2805478C2 (de) | 1983-03-31 |
Family
ID=9186505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2805478A Expired DE2805478C2 (de) | 1977-02-09 | 1978-02-09 | Schaltungsanordnung zur Diskriminierung von Sprachsignalen |
Country Status (10)
Country | Link |
---|---|
US (1) | US4158749A (de) |
JP (1) | JPS5398705A (de) |
CA (1) | CA1090919A (de) |
DE (1) | DE2805478C2 (de) |
FR (1) | FR2380612A1 (de) |
GB (1) | GB1547137A (de) |
IL (1) | IL53980A (de) |
IT (1) | IT1206584B (de) |
NL (1) | NL7801336A (de) |
SE (1) | SE7801410L (de) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2466825A1 (fr) * | 1979-09-28 | 1981-04-10 | Thomson Csf | Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif |
US4506379A (en) * | 1980-04-21 | 1985-03-19 | Bodysonic Kabushiki Kaisha | Method and system for discriminating human voice signal |
USRE32172E (en) * | 1980-12-19 | 1986-06-03 | At&T Bell Laboratories | Endpoint detector |
US4370521A (en) * | 1980-12-19 | 1983-01-25 | Bell Telephone Laboratories, Incorporated | Endpoint detector |
EP0091276A3 (de) * | 1982-04-05 | 1985-03-06 | Marten C. Jensen | Tonmusterunterscheidungssystem |
JPS59115625A (ja) * | 1982-12-22 | 1984-07-04 | Nec Corp | 音声検出器 |
US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
GB2139054B (en) * | 1983-04-22 | 1986-09-24 | Gen Electric Co Plc | Loudspeaking telephone instruments |
US4696039A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with silence suppression |
EP0140249B1 (de) * | 1983-10-13 | 1988-08-10 | Texas Instruments Incorporated | Sprachanalyse und Synthese mit Energienormalisierung |
IT1179803B (it) * | 1984-10-30 | 1987-09-16 | Cselt Centro Studi Lab Telecom | Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio |
FR2609194B1 (fr) * | 1986-12-31 | 1991-10-11 | Thomson Csf | Terminal tactique de saisie de donnees exploitable sans l'aide de clavier |
DE3810068A1 (de) * | 1988-03-25 | 1989-10-05 | Telefonbau & Normalzeit Gmbh | Verfahren zur erkennung von sprachsignalen |
DE4127295A1 (de) * | 1991-08-17 | 1993-02-18 | Koelchens Gert Dipl Ing | Spracherkennungsschalter |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1101723A (en) * | 1964-01-31 | 1968-01-31 | Nat Res Dev | Improvements in or relating to correlation circuits |
US3610831A (en) * | 1969-05-26 | 1971-10-05 | Listening Inc | Speech recognition apparatus |
DE2150336B2 (de) * | 1971-10-08 | 1979-02-08 | Siemens Ag, 1000 Berlin Und 8000 Muenchen | Analysator fuer ein spracherkennungsgeraet |
JPS5712999B2 (de) * | 1974-04-08 | 1982-03-13 | ||
US3944753A (en) * | 1974-10-31 | 1976-03-16 | Proctor & Associates Company | Apparatus for distinguishing voice and other noise signals from legitimate multi-frequency tone signals present on telephone or similar communication lines |
US4027102A (en) * | 1974-11-29 | 1977-05-31 | Pioneer Electronic Corporation | Voice versus pulsed tone signal discrimination circuit |
DE2536640C3 (de) * | 1975-08-16 | 1979-10-11 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur Erkennung von Geräuschen |
DE2649259C2 (de) * | 1976-10-29 | 1983-06-09 | Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg | Verfahren zum automatischen Erkennen von gestörter Telefonsprache |
-
1977
- 1977-02-09 FR FR7703606A patent/FR2380612A1/fr active Granted
-
1978
- 1978-02-06 US US05/875,679 patent/US4158749A/en not_active Expired - Lifetime
- 1978-02-06 NL NL7801336A patent/NL7801336A/xx not_active Application Discontinuation
- 1978-02-06 IL IL53980A patent/IL53980A/xx unknown
- 1978-02-07 CA CA296,602A patent/CA1090919A/en not_active Expired
- 1978-02-07 SE SE7801410A patent/SE7801410L/xx unknown
- 1978-02-07 GB GB4945/78A patent/GB1547137A/en not_active Expired
- 1978-02-09 IT IT7820087A patent/IT1206584B/it active
- 1978-02-09 DE DE2805478A patent/DE2805478C2/de not_active Expired
- 1978-02-09 JP JP1303578A patent/JPS5398705A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
IT7820087A0 (it) | 1978-02-09 |
DE2805478A1 (de) | 1978-08-10 |
FR2380612B1 (de) | 1979-08-24 |
GB1547137A (en) | 1979-06-06 |
SE7801410L (sv) | 1978-08-10 |
FR2380612A1 (fr) | 1978-09-08 |
IL53980A0 (en) | 1978-04-30 |
US4158749A (en) | 1979-06-19 |
NL7801336A (nl) | 1978-08-11 |
JPS5398705A (en) | 1978-08-29 |
IL53980A (en) | 1979-12-30 |
IT1206584B (it) | 1989-04-27 |
CA1090919A (en) | 1980-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2805478C2 (de) | Schaltungsanordnung zur Diskriminierung von Sprachsignalen | |
DE2629404C2 (de) | Rauschsperre zur Verarbeitung von demodulierten FM-Signalen | |
DE3802903A1 (de) | Einrichtung zur uebertragung von sprache | |
DE3034756C2 (de) | Audiosignalverarbeitungseinrichtung | |
DE2726440C2 (de) | Echounterdrückungsschaltung für Videosignale | |
DE2062589C3 (de) | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales | |
DE3213587C2 (de) | Vorrichtung zum Erzeugen eines das Klopfen einer Brennkraftmaschine charakterisierenden Signals | |
DE2507986A1 (de) | Tonfrequenz-unterdrueckungssystem | |
DE2251579A1 (de) | Anordnung zur bestimmung von merkmalen eines elektrischen eingangssignals | |
DE1547027C3 (de) | Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen | |
DE1208371B (de) | Anordnung zur Regelung der Frequenz des Oszillators fuer die Traegerwiedereinfuegung in einem Empfaenger fuer eine mit unterdruecktem Traeger arbeitende Einseitenbanduebertragung | |
DE2912566A1 (de) | Ton-decodierschaltung | |
DE2825327C2 (de) | Vorrichtung zur Erzeugung einer der Folge von Pulsschlägen entsprechenden Impulsfolge | |
DE1547029A1 (de) | Spracherkennungsgeraet | |
DE3246211C2 (de) | Schaltungsanordnung zur Detektion von Folgen identischer Binärwerte | |
DE2234707A1 (de) | Mit korrelation arbeitendes verfahren zur elektromagnetischen ortung und elektromagnetisches ortungssystem zur durchfuehrung des verfahrens | |
DE2214521A1 (de) | Sprachsyntheseschaltung | |
DE2702581C2 (de) | Verfahren und Schaltungsanordnungen zur Frequenzerkennung | |
EP0125610A1 (de) | Auswertung von elektrisch gewandelten Schallemissionssignalen | |
DE2019280C3 (de) | Elektrische Schaltungsanordnung zur Sprachsignalanalyse | |
DE2334459C3 (de) | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung | |
DE2631937C2 (de) | Filteranordnung | |
DE2429066C3 (de) | Fernbedienungssystem mit Übertragung mehrerer Informationen | |
DE3345295A1 (de) | Fm demodulatorschaltung | |
DE3109849C2 (de) | Schaltungsanordnung zur Identifikation von empfangenen Sendern mit gleichem Modulationsinhalt |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OD | Request for examination | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8320 | Willingness to grant licences declared (paragraph 23) | ||
8339 | Ceased/non-payment of the annual fee |