DE2805478A1 - Diskriminatoranordnung fuer sprachsignale - Google Patents
Diskriminatoranordnung fuer sprachsignaleInfo
- Publication number
- DE2805478A1 DE2805478A1 DE19782805478 DE2805478A DE2805478A1 DE 2805478 A1 DE2805478 A1 DE 2805478A1 DE 19782805478 DE19782805478 DE 19782805478 DE 2805478 A DE2805478 A DE 2805478A DE 2805478 A1 DE2805478 A1 DE 2805478A1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- signals
- test signal
- test
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003111 delayed effect Effects 0.000 claims description 9
- 210000001260 vocal cord Anatomy 0.000 claims description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000001934 delay Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Analogue/Digital Conversion (AREA)
- Monitoring And Testing Of Exchanges (AREA)
Description
- 4 Patentanwälte /no
Dipl.-Ing. Dipl.-Chem. Dipl.-Ing. ^ ^ '
E. Prinz - Dr. G. Hauser - G. Leiser
Ernsbergerstrasse 19
8 München 60
THOMSON - CSF 8. Februar 1978
173f Bd. Haussmann
75008 Paris / Frankreich
75008 Paris / Frankreich
Diskriminatoranordnung für Sprachsignale
Die Erfindung bezieht sich auf eine Diskriminatoranordnung
zur Erkennung von Sprachsignalen in einem Eingangssignal, wobei die Diskriminatoranordnung ein
Entscheidungssignal liefert, das beispielsweise für die Steuerung eines Schalters verwendet werden kann.
Einfache Anordnungen dieser Art verwenden ein Kriterium mit guter zeitlicher Auflösung, das aber nur eine Wahrscheinlichkeitsvermutung
darstellt; dieses Kriterium ist energetischer Art, d.h. es beruht auf der Energie
oder der Amplitude des Signals in wenigstens einem Frequenzband.
Lei/Ma ORiGiMAL INSPECTED
809832/0974
Zur zahlenmäßigen Begrenzung der Unterteilungen der Sprache wird die Zeitkonstante bei der Unterbrechung
in einem Übertragungssystem verlängert, was die Konversationen auf Wechselsprechverbindungen schwierig
macht.
Kompliziertere Anordnungen, welche die vorstehenden Nachteile nicht aufweisen, arbeiten mit einer Verzögerung
des Eingangssignals und mit einer sehr ausgeklügelten Entscheidungsschaltung, die einen Computer
erfordert.
Aufgabe der Erfindung ist die Schaffung einer Diskriminatoranordnung
für Sprachsignale, die gleichfalls eine Verzögerung des Eingangssignals anwendet, bei der
aber nur eine Entscheidungsschaltung verwendet wird, die verhältnismäßig einfach bleibt und dennoch einen
in der Praxis sehr gut ausreichenden Sicherheitsgrad ergibt.
Nach der Erfindung ist eine Diskriminatoranordnung für
Sprachsignale, die in einem Eingangssignal enthalten sind, mit einer Verzögerungsleitung, die dem Eingangssignal
eine Verzögerung der Dauer D erteilt, und mit einer Ausgangsschaltung, die ein Entscheidungssignal
für das Vorhandensein von Sprachsignalen im Ausgangssignal der Verzögerungsleitung liefert, dadurch gekennzeichnet,
daß eine erste Schaltung vorhanden ist, die ein erstes Prüfsignal liefert, das sich auf das Ausgangssignal
der Verzögerungsleitung bezieht und die Wahrscheinlichkeit des Vorhandenseins von Sprachsignalen
anzeigt und sowohl für stimmhafte Laute wie für stimmlose Laute repräsentativ ist, daß eine zweite Schaltung
809832/0974
vorhanden ist, die ein zweites Prüfsignal bildet, das mit einer durch die Ansprechzeit der zweiten Schaltung
verursachten Verzögerung mit sehr großer Wahrscheinlichkeitsvermutung den Schluß auf das Vorhandensein
von für stimmhafte Laute repräsentativen Signalen in dem Eingangssignal zuläßt, daß eine Anordnung zur Verlängerung
des zweiten Prüfsignals um eine Dauer d vorhanden ist, daß die Ausgangsschaltung das Entscheidungssignal liefert, wenn gleichzeitig das erste Prüfsignal
und das verlängerte zweite Prüfsignal vorhanden sind, und daß die Dauern D und d so bemessen sind, daß das verlängerte
zweite Prüfsignal das Zeitintervall überschreitet, in dessen Verlauf die Signale, die das zweite
Prüfsignal verursacht haben, am Ausgang der Verzögerungsleitung erscheinen, wobei der Beginn des zweiten Prüfsignals
um eine Zeitspanne vor dem Beginn dieses Zeitintervalls liegt, welche die hörbare Identifizierung
eines stimmlosen Konsonanten erlaubt, der einem stimmhaften Laut vorangeht, und das Ende dieses Zeitintervalls
um eine Zeitspanne vor dem Ende des verlängerten zweiten Prüfsignals liegt, welche die Identifizierung eines
stimmlosen Konsonanten erlaubt, der auf einen stimmhaften Laut folgt.
Weitere Merkmale und Vorteile der Erfindung ergeben sich aus der folgenden Beschreibung eines Ausführungsbeispiels
anhand der Zeichnung. In der Zeichnung zeigen:
Fig. 1 das Prinzipschema einer Diskriminatoranordnung nach der Erfindung und
Fig. 2 das genauere Schaltbild einer bevorzugten AusfUhrungsform
der Diskriminatoranordnung nach der Erfindung.
809832/0974
Es sei zunächst daran erinnert, daß ein stimmhafter Laut in einem Sprachsignal entweder durch einen Vokal
oder durch einen stimmhaften Konsonanten gebildet ist.
Die stimmhaften Laute weisen genau definierte spektrale Eigenschaften auf, die in den stimmlosen Lauten, die
durch die stummen Konsonanten gebildet sind, nicht vorhanden sind.
Bei der Anordnung von Fig. 1 empfängt der Eingang 1 ein Eingangssignal, das durch ein mit Geräuschen gemischtes
Sprachsignal gebildet ist. Der Eingang 1 ist mit einer Verzögerungsleitung 2 verbunden, die dem Signal
eine Verzögerung D erteilt und vorzugsweise durch eine Ladungsübertragungsanordnung gebildet ist. Der Ausgang
der Verzögerungsleitung 2 ist mit dem Signaleingang eines Schalters 3 verbunden.
Wenn das Eingangssignal mit S(t) bezeichnet wird, ist das Ausgangssignal der Verzögerungsleitung das Signal
S(t-D).
Die Entscheidung wird an dem verzögerten Eingangssignal getroffen; dies geschieht mittels eines ersten Früfsignals
A von energetischem Charakter, das sich auf das verzögerte Eingangssignal S(t-D) bezieht, und mittels
eines zweiten Signals W, das durch ein mit Hilfe des Eingangssignals gebildetes und um eine Dauer d verlängertes
Prüfsignal V dargestellt ist, wobei das Signal V unter Vernachlässigung der Ansprechzeit der dieses
Signal bildenden Schaltung einen stimmhaften Laut in dem Eingangssignal bezeichnet.
809832/0974
Die Dauer D ist so gewählt, daß sie die zuvor erwähnte Ansprechzeit umfaßt und darüber hinaus die Zeit, die
für die hörbare Identifizierung eines einem stimmhaften Laut vorangehenden stimmlosen Konsonanten erforderlich
ist.
Die Dauer d wird so groß gewählt, daß das Ende des Durchgangs der Signale, aufgrund welcher das zweite
Prüfsignal geliefert worden ist, am Ausgang der Verzögerungsleitung dem Ende des verlängerten zweiten
Prüfsignals um eine Zeitspanne vorangeht, die für die
hörbare Identifizierung eines auf einen stimmhaften Laut folgenden stimmlosen Konsonanten ausreicht.
Die Signale A, V und W sind durch die Signalwerte "1" von entsprechenden digitalen Signalen a(t), v(t) bzw.
w(t) gebildet.
Das erste Prüfsignal wird in einer Schaltung 4 gebildet, die von der Verzögerungsleitung gespeist wird.
Die Ansprechzeit der das energetische Signal liefernden Schaltung ist klein; sie liegt in der Größenordnung von
einigen Millisekunden und kann dadurch kompensiert werden, daß das Signal, aufgrund dessen das energetische
Signal gebildet wird, etwas vor dem Ausgang der Verzögerungsleitung abgegriffen wird.
Das Signal w(t) wird durch eine Anordnung 5 gebildet,
die das Eingangssignal S(t) empfängt und das Signal v(t) liefert, sowie mit Hilfe eines Verzögerungsglieds 7,
welches das Signal v(t) um eine Dauer d verzögert und ein Signal v(t-d) liefert, und einer ODER-Schaltung 8,
809832/0974
die eine ODER-Verknüpfung mit dem verzögerten Signal ν
und dem nicht verzögerten Signal ν durchführt. Da die Dauer der Abgabe eines stimmhaften Lauts größer als die
Verzögerungszeit d ist, erhält man somit das Signal w(t), dessen Signalwert "111 das Signal W bildet, d.h. das
verlängerte Signal V.
Die Ausgänge der Anordnung 4 und der ODER-Schaltung 8 sind mit den beiden Eingängen einer UND-Schaltung 9 verbunden,
deren Ausgang mit dem Steuereingang des Schalters 3 verbunden ist. Der Schalter 3 überträgt das verzögerte
Sprachsignal, wenn ihm von der UND-Schaltung 9 der Signalwert "1" zugeführt wird.
Fig. 2 zeigt in näheren Einzelheiten eine Diskriminatoranordnung,
die als Kriterium für das erste Prüfsignal A das Vorhandensein,von minimalen Energien in den Frequenzbändern
300-900 Hz und 1200-3400 Hz verwendet. Das Prüfsignal A entspricht dem digitalen Signalwert "1" eines
entsprechenden digitalen Signals a(t).
Das Signal a(t) wird hier aus einem später ersichtlichen Grund dadurch erhalten, daß ein entsprechendes Signal b(t),
das mit Hilfe des Signals S(t) gebildet wird, um eine Zeit Dr verzögert wird; das Signal B ist das Signal, das
durch den Signalwert H1n des Signals b(t) gebildet ist.
Das zweite Prüfsignal ergibt sich aus der Kombination von mehreren elementaren Prüfsignalen, von denen jedes
durch den Signalwert M1n eines entsprechenden digitalen
Signals dargestellt ist.
809832/0974
Die zuvor angegebenen PrUfkriterien stellen nur ein Beispiel dar. Eine vereinfachte Version könnte sich
auf eine begrenzte Auswahl aus diesen Prüfkriterien beschränken, von denen wenigstens eines für die stimmhafte
Sprache kennzeichnend ist, während eine noch weiter ausgebildete Version eine Kombination von einer
größeren Anzahl von Erkennungskriterien für die Sprache verwenden könnte.
Die bei dem hier beschriebenen Beispiel verwendeten Kriterien sind:
U : energetisches Ungleichgewicht oberhalb eines bestimmten Schwellenwertes zwischen den Frequenzbändern
300-900 Hz und 1200-3400 Hz;
M : Vorhandensein einer zwischen 70 und 300 Hz liegenden Modulation im Frequenzband 300-900 Hz;
M1: Vorhandensein einer zwischen 70 und 300 Hz
liegenden Modulation im Frequenzband 1200-3400 Hz;
Z : Dichte der Nulldurchgänge unterhalb eines bestimmten Schwellenwertes im Eingangssignal;
Z': Dichte der Nulldurchgänge unterhalb eines bestimmten
Schwellenwertes im differenzierten Eingangssignal.
Die entsprechenden digitalen Signale werden mit u(t), m(t), m'(t), z(t) und z'(t) bezeichnet.
809832/0974
Das Frequenzintervall von 70 bis 300 Hz enthält die Modulationsfrequenzen von 110 und 220 Hz, welche die
mittleren Vibrationsfrequenzen der Stimmbänder bei einem Mann bzw. bei einer Frau sind.
Die Kriterien Z und Z1 entsprechen einem Spektrum,
in welchem Formanten enthalten sind; die Formanten sind als eine zeitliche Folge von spektralen Komponenten
gleicher oder benachbarter Frequenzen definiert und begrenzen die Anzahl der absoluten oder relativen
Maxima im Spektrum der Sprache.
Das zweite komplexe Prüfsignal V ist durch den Signalwert "1" des folgenden Signals v(t) definiert:
v(t) = u(t) . fm(t) + mf(t)l + b(t) . z(t) . z»(t)
Aus dieser logischen Gleichung ist zu erkennen, daß das Vorhandensein eines stimmhaften Lauts in dem einen und/oder
dem anderen der folgenden Fälle angenommen wird:
1) Es wird eine zwischen 70 und 300 Hz liegende Modulationsfrequenz
entdeckt und es besteht eine ausreichende energetische Differenz zwischen den Frequenzbändern
300-900 Hz und 1200-3400 Hz. Das Vorhandensein einer Modulationsfrequenz zwischen 70 und 300 Hz für
sich allein erlaubt es nämlich noch nicht, diese Modulation der Resonanzfrequenz der Stimmbänder zuzuschreiben;
sie könnte beispielsweise von einem Motor verursacht sein. In Verbindung mit dem energetischen
Ungleichgewicht ist aber dieses Kriterium gut, wie die Erfahrung gezeigt hat.
809832/0974
2) Der zweite Fall läßt wegen Z und Zf das Vorhandensein
von Formanten vermuten; die Erfahrung hat aber gezeigt, daß es gut ist, eine energetische Bedingung
hinzuzufügen, um sicherzugehen, daß es sich auch tatsächlich um ein von Formanten verursachtes Spektrum
und nicht um ein Störspektrum handelt.
Insgesamt ist das Kriterium V im Zeitpunkt t ein gutes Kriterium für das Vorhandensein von Signalen, die einen
stimmhaften Laut darstellen.
Es sollen nun die entsprechenden Schaltungen beschrieben werden.
Fig. 2 zeigt wieder den Eingang 1, die Verzögerungsleitung 2 und den Schalter 3 von Fig. 1.
Die das Signal S(t) empfangende und das energetische Signal b(t) liefernde Anordnung enthält zwei Bandfilter
10 und 14, die vom Eingang 1 gespeist werden. Das Durchlaßband des Filters 10 beträgt 300-900 Hz, und das Durchlaßband
des Filters 14 beträgt 1200 bis 3400 Hz. Auf das Filter 10 folgen eine Diode 11, ein Tiefpaßfilter 12 mit
einer Grenzfrequenz von 100 Hz und ein Komparator 13, der an seinem Eingang H+M das Ausgangssignal des Tiefpaßfilters
12 und an seinem Eingang M-n eine positive
Bezugsschwellenspannung IL. empfängt. Das Bandfilter 14 speist, abgesehen von dem Wert der Bezugsspannung, eine
gleichartige Schaltung mit einer Diode 15, einem Tiefpaßfilter 16 und einem Komparator 61, dessen Eingang "-"
eine Bezugsspannung Rq empfängt, die unter der Bezugsspannung R1 liegt. Die Komparatoren 13 und 61 liefern,
809832/0974
wie auch die anderen in der Schaltung enthaltenen Komparatoren, ein Signal "1", wenn das dem Eingang "+"
zugeführte Signal über dem am Eingang "-" anliegenden
Signal liegt, und im entgegengesetzten Fall ein Signal "0". Die Ausgänge der Komparatoren 13 und 61 sind mit den beiden
Eingängen einer UND-Schaltung 62 verbunden, die das Signal b(t) liefert. Andererseits sind die Ausgänge der Filter
12 und 16 mit den Eingängen "+·' und "-" einer Subtrahierschaltung
17 verbunden, deren Ausgang mit dem Eingang "+" eines Komparators 18 verbunden ist, dessen Eingang "-"
eine dritte Bezugsspannung FL, empfängt. Dieser Komparator
liefert das Signal U.
An die Ausgänge der Dioden 11 und 15 sind andererseits die Eingänge von zwei Bandfiltern 19 bzw. 20 mit dem
Durchlaßband 70 bis 300 Hz angeschlossen, denen jeweils eine Diode 21 bzw. 22 nachgeschaltet ist.
An diese Dioden ist jeweils ein Tiefpaßfilter 23 bzw. 24 mit der Grenzfrequenz 50 Hz angeschlossen.
Der Ausgang jedes Tiefpaßfilters 23» 24 ist mit dem Eingang
"+" eines Komparators 25 bzw. 26 verbunden, dessen Eingang '·-" eine Bezugsspannung R, bzw. R^ empfängt.
Ein ausreichend hoher Schwellenwert des Ausgangssignals des Tiefpaßfilters 23 oder des Tiefpaßfilters 24 ist
normalerweise für das Vorhandensein einer Modulation mit einer Stimmband-Resonanzfrequenz in der Nähe von 110 Hz
bzw. 220 Hz kennzeichnend. Die Komparatoren 25 und 26 liefern die Signale m(t) bzw. m'(t).
809832/0974
An den Eingang 1 ist ferner der Eingang "+" eines
Komparators 27 angeschlossen, dessen Eingang "-" an Masse liegt. Jede ansteigende Flanke des Ausgangssignals
des Komparators 27 löst eine monostabile Kippschaltung 28 aus, deren Ausgangsimpulse durch ein
Tiefpaßfilter 29 mit der Grenzfrequenz 50 Hz integriert werden. Der Eingang 1 ist schließlich mit dem
Eingang eines Differenzierglieds 30 verbunden, auf das eine Schaltung folgt, die der zuvor beschriebenen
Schaltung gleich ist, also einen Null-Komparator 31,
eine monostabile Kippschaltung 32 und ein Tiefpaßfilter 33 enthält.
Die Ausgangssignale der Filter 29 und 33 werden an den Eingang "-" eines Komparators 34 bzw. eines Komparators
35 angelegt; die Eingänge "+" dieser Komparatoren empfangen eine Bezugsspannung R,- bzw. Rg, und die Komparatoren
liefern die Signale z(t) bzw. z'(t).
Die Entscheidung kann in festen Zeitintervallen getroffen werden, deren Dauer zwischen 3 und 10 ms liegt und beispielsweise
8 ms beträgt. Die sich auf den Zeitpunkt t beziehenden Signale b(t), u(t), m(t), m'(t), z(t) und
z'(t) werden zu diesem Zweck in sechs D-Kippschaltungen 36, 37, 38, 39, 40, 41 abgetastet, deren Takteingänge
Taktimpulse H mit der Periode 8 ms empfangen.
Die Ausgänge der Kippschaltungen 38 und 39 sind mit den beiden Eingängen einer ODER-Schaltung 42 verbunden, deren
Ausgang an den ersten Eingang einer UND-Schaltung 43 angeschlossen ist, deren zweiter Eingang das Signal U von
der Kippschaltung 37 empfängt.
809832/0974
- Ip -
Die abgetasteten Signale b(t), z(t) und z'(t) werden
andererseits an die Eingänge einer UND-Schaltung 44 angelegt, die drei Eingänge hat. Die Ausgänge der
UND-Schaltungen 43 und 44 sind mit den beiden Eingängen einer ODER-Schaltung 45 verbunden, die das abgetastete
Signal v(t) liefert, da es mit Hilfe der abgetasteten Komponenten gebildet wird. Diesem abgetasteten Signal
v(t) ist die gleiche, durch die Abtastung verursachte veränderliche Verzögerung erteilt wie ihren Komponenten
und insbesondere wie dem abgetasteten Signal b(t).
Die abgetasteten Signale b(t) und v(t) werden an die Eingänge von zwei Schieberegistern 46 bzw. 47 angelegt,
die an ihren Fortschalteeingängen die Taktimpulse H empfangen; diese beiden Schieberegister erteilen den
Eingangssignalen Verzögerungen des Werts D1 bzw. d.
Das abgetastete Signal v(t) und das entsprechende verzögerte Signal werden an die beiden Eingänge einer ODER-Schaltung
48 angelegt, deren Ausgangssignal zusammen mit dem Ausgangssignal des Schieberegisters 47» welches
das verzögerte Signal b(t) darstellt, an die beiden Eingänge einer UND-Schaltung 49 angelegt werden. Der
Ausgang der UND-Schaltung 49 ist mit dem Signaleingang einer D-Kippschaltung 50 verbunden, deren Takteingang
Impulse Hf empfängt, die um 4 ms gegen die Impulse H
phasenverschoben sind. Das Ausgangssignal der Kippschaltung 50 wird an den Steuereingang des Schalters
angelegt.
809832/0974
Es ist zu bemerken, daß bei der AusfUhrungsform von Fig. 2 eine doppelte Abtastung der Signale vorgenommen
wird, nämlich eine Abtastung an den Eingangssignalen der digitalen Schaltung und die andere Abtastung am
Ausgangssignal, wobei die Abtastung am Ausgangssignal mit Taktimpulsen erfolgt, die um 4 ms gegen die Taktimpulse
versetzt sind, die zur Abtastung der Eingangssignale verwendet werden, wobei die beiden Impulsfolgen
die gleiche Periode von 8 ms haben. Diese Art der Abtastung ist in theoretischer Hinsicht keineswegs
notwendig. In der Praxis erlaubt sie aber den Betrieb der digitalen Schaltung mit stabilen Signalen, und sie
ergibt ein Ausgangssignal, das ebenfalls eine gute Stabilität hat. Aus dieser Abtastung kann sich eine
Verzögerung ergeben, die für einen Wechsel des Steuersignals gegenüber einem Wechsel von Sprachsignal zu
Geräuschen oder von Geräuschen zu Sprachsignal im Ausgangssignal der Verzögerungsleitung von k bis 12 ms
schwanken kann. Diese Verzögerung kann wie eine mittlere Verzögerung von 8 ms angesehen werden, die von einer
Schwankung begleitet ist, die dem Absolutwert nach einen maximalen Wert von 4 ms hat. Eine Schwankung von so
kurzer Dauer ist für einen Wechsel vom Sprachsignal zu Geräuschen nicht störend. Gegenüber einem Wechsel von
Geräuschen zum Sprachsignal stört sie im allgemeinen nicht die Identifizierung eines Anfangslauts. Was die
mittlere Verzögerung von 8 ms betrifft, kann diese dadurch kompensiert werden, daß die zuvor für die Zeitspanne
D definierte Dauer um 8 ms vergrößert wird.
809832/0974
Vas die Zeit der Identifizierung eines stimmlosen Konsonanten betrifft, der einem stimmhaften Laut vorangeht
oder auf einen stimmhaften Laut folgt, kann diese kaum kleiner als 20 ms bemessen werden und wird vorzugsweise
auf 60 ms gebracht, damit sie für das Ohr angenehm ist.
Bei der Schaltung von Fig. 2 werden die auf diese Weise bestimmten Werte gegebenenfalls geringfügig verschoben,
damit die Tatsache berücksichtigt wird, daß d und D1 Vielfache von 8 ms sind.
In Anwendungsfällen, in denen Sprachsignale von akustischen Geräuschen unterschieden werden müssen, die in
der Umgebung des Mikrofons vorhanden sind, können andere technische Maßnahmen zum Aufnehmen des Schalls in Betracht
gezogen werden, um die Entscheidung zwischen Sprache und Geräuschen zu erleichtern:
- gerichtete Aufnahme im Fall von Umgebungsgeräuschen mit mittlerem Pegel;
- differenzielle Aufnahme im Fall von Umgebungsgeräuschen
mit hohem Pegel. Im letzten Fall ist es notwendig, die Nähe zwischen dem Mikrofon und den Lippen in Betracht
zu ziehen.
Die angegebenen Speichermaßnahmen können zusätzlich angewendet werden.
äGJMAL INSPECTED 809832/0974
■■; - a
Claims (4)
1.) Diskriminatoranordnung für Sprachsignale, die in einem
Eingangssignal enthalten sind, mit einer Verzögerungsleitung, die dem Eingangssignal eine Verzögerung der
Dauer D erteilt, und mit einer Ausgangsschaltung, die ein Entscheidungssignal für das Vorhandensein von
Sprachsignalen im Ausgangssignal der Verzögerungsleitung liefert, dadurch gekennzeichnet, daß eine
erste Schaltung vorhanden ist, die ein erstes Prüfsignal liefert, das sich auf das Ausgangssignal der
Verzögerungsleitung bezieht und die Wahrscheinlichkeit des Vorhandenseins von Sprachsignalen anzeigt und
sowohl für stimmhafte Laute wie für stimmlose Laute repräsentativ ist, daß eine zweite Schaltung vorhanden
ist, die ein zweites Prüfsignal bildet, das mit einer durch die Ansprechzeit der zweiten Schaltung verursachten
Verzögerung mit sehr großer Wahrscheinli'chkeitsvermutung
den Schluß auf das Vorhandensein von für
Lei/Ma 809832/0974
stimmhafte Laute repräsentativen Signalen in dem Eingangssignal zuläßt, daß eine Anordnung zur Verlängerung
des zweiten Prüfsignals um eine Dauer d vorhanden ist, daß die Ausgangsschaltung das Entscheidungssignal
liefert, wenn gleichzeitig das erste Prüfsignal und das verlängerte zweite Prüfsignal
vorhanden sind, und daß die Dauern D und d so bemessen sind, daß das verlängerte zweite Prüfsignal
das Zeitintervall überschreitet, in dessen Verlauf die Signale, die das zweite Prüfsignal
verursacht haben, am Ausgang der Verzögerungsleitung erscheinen, wobei der Beginn des zweiten
Prüfsignals um eine Zeitspanne vor dem Beginn dieses Zeitintervalls liegt, welche die hörbare Identifizierung
eines stimmlosen Konsonanten erlaubt, der einem stimmhaften Laut vorangeht, und das Ende
dieses Zeitintervalls um eine Zeitspanne vor dem Ende des verlängerten zweiten Prüfsignals liegt,
welche die Identifizierung eines stimmlosen Konsonanten erlaubt, der auf einen stimmhaften Laut folgt,
2. Diskriminatoranordnung nach Anspruch 1, dadurch gekennzeichnet, daß jedes Prüfsignal durch einen
digitalen Signalwert eines digitalen Signals dargestellt ist, und daß das zweite Prüfsignal sich aus
der Verknüpfung von elementaren PrüfSignalen ergibt.
3. Diskriminatoranordnung nach Anspruch 2, dadurch gekennzeichnet, daß ein elementares Prüfsignal U
dem Signalwert "1" eines Signals u(t) entspricht und ein energetisches Ungleichgewicht zwischen zwei
Tonfrequenzbändern bezeichnet, das größer,als ein Schwellenwert ist, daß zwei elementare Prüfsignale
809832/0974
M, M' dem Signalwert "1" des einen bzw. des anderen von zwei digitalen Signalen m(t) bzw. m'(t) entsprechen
und jeweils in einem von zwei Tonfrequenzbändern das Vorhandensein einer modulierenden Frequenz in einem
Frequenzband angeben, das die Vibrationsfrequenzen der Stimmbändern enthält, daß zwei elementare Prüfsignale
Z, Z1 dem Signalwert "1" des einen bzw. des anderen von zwei digitalen Signalen z(t) und z'(t)
entsprechen und eine unter einem Schwellenwert liegende Dichte von Nulldurchgängen in dem Eingangssignal bzw.
in dem differenzierten Eingangssignal darstellen, daß ein elementares Prüfsignal B dem Signalwert "1" eines
digitalen Signals b(t) entspricht und eine Energie bezeichnet, die in wenigstens einem Tonfrequenzband
über einem Schwellenwert liegt, und daß das zweite Prüfsignal V der Signalwert "1" des folgenden digitalen
Signals ist:
v(t) = u(t) . hn(t) + m'(t)1 + b(t) · z(t) . z'(t)
4. Diskriminatoranordnung nach Anspruch 3, dadurch gekennzeichnet, daß das erste Prüfsignal durch den
Signalwert "1" des verzögerten Signals b(t) gebildet ist.
809832/0974
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR7703606A FR2380612A1 (fr) | 1977-02-09 | 1977-02-09 | Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2805478A1 true DE2805478A1 (de) | 1978-08-10 |
DE2805478C2 DE2805478C2 (de) | 1983-03-31 |
Family
ID=9186505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2805478A Expired DE2805478C2 (de) | 1977-02-09 | 1978-02-09 | Schaltungsanordnung zur Diskriminierung von Sprachsignalen |
Country Status (10)
Country | Link |
---|---|
US (1) | US4158749A (de) |
JP (1) | JPS5398705A (de) |
CA (1) | CA1090919A (de) |
DE (1) | DE2805478C2 (de) |
FR (1) | FR2380612A1 (de) |
GB (1) | GB1547137A (de) |
IL (1) | IL53980A (de) |
IT (1) | IT1206584B (de) |
NL (1) | NL7801336A (de) |
SE (1) | SE7801410L (de) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2466825A1 (fr) * | 1979-09-28 | 1981-04-10 | Thomson Csf | Dispositif de detection de signaux vocaux et systeme d'alternat comportant un tel dispositif |
US4506379A (en) * | 1980-04-21 | 1985-03-19 | Bodysonic Kabushiki Kaisha | Method and system for discriminating human voice signal |
US4370521A (en) * | 1980-12-19 | 1983-01-25 | Bell Telephone Laboratories, Incorporated | Endpoint detector |
USRE32172E (en) * | 1980-12-19 | 1986-06-03 | At&T Bell Laboratories | Endpoint detector |
EP0091276A3 (de) * | 1982-04-05 | 1985-03-06 | Marten C. Jensen | Tonmusterunterscheidungssystem |
JPS59115625A (ja) * | 1982-12-22 | 1984-07-04 | Nec Corp | 音声検出器 |
US4627091A (en) * | 1983-04-01 | 1986-12-02 | Rca Corporation | Low-energy-content voice detection apparatus |
GB2139054B (en) * | 1983-04-22 | 1986-09-24 | Gen Electric Co Plc | Loudspeaking telephone instruments |
DE3473373D1 (en) * | 1983-10-13 | 1988-09-15 | Texas Instruments Inc | Speech analysis/synthesis with energy normalization |
US4696039A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with silence suppression |
IT1179803B (it) * | 1984-10-30 | 1987-09-16 | Cselt Centro Studi Lab Telecom | Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio |
FR2609194B1 (fr) * | 1986-12-31 | 1991-10-11 | Thomson Csf | Terminal tactique de saisie de donnees exploitable sans l'aide de clavier |
DE3810068A1 (de) * | 1988-03-25 | 1989-10-05 | Telefonbau & Normalzeit Gmbh | Verfahren zur erkennung von sprachsignalen |
DE4127295A1 (de) * | 1991-08-17 | 1993-02-18 | Koelchens Gert Dipl Ing | Spracherkennungsschalter |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3400216A (en) * | 1964-01-31 | 1968-09-03 | Nat Res Dev | Speech recognition apparatus |
DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
DE2150336B2 (de) * | 1971-10-08 | 1979-02-08 | Siemens Ag, 1000 Berlin Und 8000 Muenchen | Analysator fuer ein spracherkennungsgeraet |
DE2536640B2 (de) * | 1975-08-16 | 1979-02-08 | Philips Patentverwaltung Gmbh, 2000 Hamburg | |
DE2021126B2 (de) * | 1969-05-26 | 1979-11-29 | Dialog Systems, Inc., Boston, Mass. (V.St.A.) | Spracherkennungsanordnung |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5712999B2 (de) * | 1974-04-08 | 1982-03-13 | ||
US3944753A (en) * | 1974-10-31 | 1976-03-16 | Proctor & Associates Company | Apparatus for distinguishing voice and other noise signals from legitimate multi-frequency tone signals present on telephone or similar communication lines |
US4027102A (en) * | 1974-11-29 | 1977-05-31 | Pioneer Electronic Corporation | Voice versus pulsed tone signal discrimination circuit |
-
1977
- 1977-02-09 FR FR7703606A patent/FR2380612A1/fr active Granted
-
1978
- 1978-02-06 NL NL7801336A patent/NL7801336A/xx not_active Application Discontinuation
- 1978-02-06 IL IL53980A patent/IL53980A/xx unknown
- 1978-02-06 US US05/875,679 patent/US4158749A/en not_active Expired - Lifetime
- 1978-02-07 GB GB4945/78A patent/GB1547137A/en not_active Expired
- 1978-02-07 SE SE7801410A patent/SE7801410L/xx unknown
- 1978-02-07 CA CA296,602A patent/CA1090919A/en not_active Expired
- 1978-02-09 JP JP1303578A patent/JPS5398705A/ja active Pending
- 1978-02-09 IT IT7820087A patent/IT1206584B/it active
- 1978-02-09 DE DE2805478A patent/DE2805478C2/de not_active Expired
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3400216A (en) * | 1964-01-31 | 1968-09-03 | Nat Res Dev | Speech recognition apparatus |
DE2021126B2 (de) * | 1969-05-26 | 1979-11-29 | Dialog Systems, Inc., Boston, Mass. (V.St.A.) | Spracherkennungsanordnung |
DE2150336B2 (de) * | 1971-10-08 | 1979-02-08 | Siemens Ag, 1000 Berlin Und 8000 Muenchen | Analysator fuer ein spracherkennungsgeraet |
DE2536640B2 (de) * | 1975-08-16 | 1979-02-08 | Philips Patentverwaltung Gmbh, 2000 Hamburg | |
DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
Also Published As
Publication number | Publication date |
---|---|
US4158749A (en) | 1979-06-19 |
JPS5398705A (en) | 1978-08-29 |
IL53980A (en) | 1979-12-30 |
SE7801410L (sv) | 1978-08-10 |
NL7801336A (nl) | 1978-08-11 |
GB1547137A (en) | 1979-06-06 |
FR2380612A1 (fr) | 1978-09-08 |
IL53980A0 (en) | 1978-04-30 |
DE2805478C2 (de) | 1983-03-31 |
FR2380612B1 (de) | 1979-08-24 |
IT7820087A0 (it) | 1978-02-09 |
CA1090919A (en) | 1980-12-02 |
IT1206584B (it) | 1989-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2719973C2 (de) | ||
DE2820425C2 (de) | Binärer Zufallsrauschgenerator zur stochastischen Kodierung | |
DE19747885B4 (de) | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion | |
EP0624866B1 (de) | Frequenzanalyseverfahren | |
DE69831991T2 (de) | Verfahren und Vorrichtung zur Sprachdetektion | |
DE2805478A1 (de) | Diskriminatoranordnung fuer sprachsignale | |
DE3802903C2 (de) | ||
DE3877781T2 (de) | Automatische verstaerkungsregelungseinrichtung fuer videosignale. | |
DE60030365T2 (de) | Mehrwegstörungsreduktionsschaltung und Audioausgangsschaltung eines FM-Empfängers | |
DE3541031A1 (de) | Verfahren und vorrichtung zum demodulieren von hochfrequent modulierten signalen mittels digitaler filter und digitaler demodulatoren, sowie anwendung des verfahrens in einem fernsteuerempfaenger | |
DE69224625T2 (de) | Verfahren zum detektieren eines disable-tonsignals eines echokompensators | |
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
DE19720651A1 (de) | Hörgerät mit verschiedenen Baugruppen zur Aufnahme, Weiterverarbeitung sowie Anpassung eines Schallsignals an das Hörvermögen eines Schwerhörigen | |
DE2634426A1 (de) | Bandkompressionseinrichtung | |
DE3102385A1 (de) | Schaltungsanordnung zur selbstaetigen aenderung der einstellung von tonwiedergabegeraeten, insbesondere rundfunkempfaengern | |
DE1905680A1 (de) | Anlage zur Signalverarbeitung | |
DE2251579A1 (de) | Anordnung zur bestimmung von merkmalen eines elektrischen eingangssignals | |
DE2507986A1 (de) | Tonfrequenz-unterdrueckungssystem | |
DE2855301A1 (de) | Tonsignaldetektor | |
DE1547027C3 (de) | Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen | |
DE2062589C3 (de) | Verfahren zur Ermittlung der Grundfrequenze eines wenigstens zeitweise periodischen Signales | |
DE2912566A1 (de) | Ton-decodierschaltung | |
DE69015753T2 (de) | Tonsyntheseanordnung. | |
DE1903623A1 (de) | Sprach-Synthetisator | |
DE2214521A1 (de) | Sprachsyntheseschaltung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OD | Request for examination | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8320 | Willingness to grant licences declared (paragraph 23) | ||
8339 | Ceased/non-payment of the annual fee |