DE1772633A1 - Verfahren zur Spracherkennung - Google Patents
Verfahren zur SpracherkennungInfo
- Publication number
- DE1772633A1 DE1772633A1 DE19681772633 DE1772633A DE1772633A1 DE 1772633 A1 DE1772633 A1 DE 1772633A1 DE 19681772633 DE19681772633 DE 19681772633 DE 1772633 A DE1772633 A DE 1772633A DE 1772633 A1 DE1772633 A1 DE 1772633A1
- Authority
- DE
- Germany
- Prior art keywords
- circuit
- pulses
- zero
- circuits
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Description
Dipl.-Ing. Heinz Ciaessen
Patentanwalt 1772833
7 Stuttgart-Feuerbach
Kurze Straße 8
ISE/Reg. 3909
W.Bezdel -14 .
STANDARD TELEPHONES AND GABLES LIICETED, LONDON
Verfahren zur Spracherkennung
Die Priorität der Anmeldung Nr.29100/67 vom
23.6.1967 in Großbritannien wird in Anspruch
genommen.
Die Erfindung betrifft ein Verfahren zur Spracherkennung,bei dem
die Abstände der Nulldurchgänge der Sprachschwingung erfaßt und ausgewertet werden.
Solche Verfahren müssen so arbeiten, daß sie einen weiten. Bereich
der kennzeichnenden Muster erfassen, beispielsweise unterschiedliche Stimmlagen und Akzente. Auch kann ein von derselben Person
gesprochenes Wort '.in verschiedenem Kontext unterschiedlich klingen«
Verschiedene Verfahren zur Analyse komplexer Kurven sind bekannt.
Die Untersuchung des frequenz3pektrums liefert beispielsweise
wichtige charakteristische Muster der Sprache.Bei einem bekannten Verfahren wird die Information ermittelt, die in den
Nulldurchgängen des Sprachsignals enthalten ist.Die Abstände zwischen aufeinanderfolgenden Nulldurchgängen oder die Anzahl
der Nulldurchgänge in einer Zeiteinheit ist ein Maß für die
Frequenz des Sprachsignale.zu diesem Zeitpunkt.
Die Laute der Sprache können in verschiedene Klassen eingeteilt
wer den, z.B. Vokale, vokalähnliclie Laut© usw. Einige
dieser Klassen sind bei der Spracherkennung- wichtiger als
109021/0681
BAD ORIGINAL
ISE/Eeg. 3909 - 2 -
andere. Mehrere Klassen können als Nulldurchgangsverteilungen in einen Frequenzbereich definiert werden. Beispielsweise
können in einem Frequenzbereich von 200-1200 Hz die Vokale charakterisiert werden und die Nulldurchgangsverteilung
in diesem Bereich zu ihrer Klassifizierung. Mit der Erfindung wii?d ein Verfahren zur Ermittlung solcher
Lautklassen angegeben.
Die Erfindung ist dadurch gekennzeichnet, daß der dem möglichen Zeitbereich der Nulldurchgangsabstände entsprechende
Frequenzbereich in zwei oder mehr den zu erkennenden Lautklassen zugeordnete Bereiche unterteilt wird,
daß die aus diesen Bereichen gewonnenen Impulsfolgen je einem Digitalfilter zugeführt werden und daß deren
Ausgangssignale ge auf Einrichtungen zur Messung der
Differenzen der Wiederholungsfrequenz gegeben werden
und daß aus diesen Differenzen mittels einer Extremwertschaltung die Nulldurcligangsverteilung und damit der
Laut ermittelt wird.
10*821/0681
Die Erfindung wird Him. an Hand der Figuren beispielsweise
näher erläutert. Es zeigen:
Fig. 1 ein Blockschaltbild einer Anordnung zur Identifizierung
too zwei
Fig. 2 eine Schaltung zur Begrenzung eines Frequenzbereiches;
Pig. 3 ein digitales Filter für einen Frequenzbereich;
Fig. 4- eine Schaltung zur Messung der Bifferenzgeschwinäigkeit
der Ausgänge von zwei digitalen Filtern nach Fig. 5| '
Fig. 5 eine Exbrenwertsehaltung ;
Fig. 6 eine Integrierschaltung für ein erkanntes Lautsignal;
Fig. 7 die relative gegenseitige Änderung der Grenzen
zweier Frequenzbereiche ;
Fig. 8 eine Schaltung zum Ändern der Grenzwerte eines
Frequenzbereiches aufgrund der Bedeutung der Information, die sich in diesem Bereich befindet;
Fig. 9 eine Schaltung zum relativen gegenseitigen Indern
des Schwellwertes zweier Lautdetektoren.
Bei der zu beschreibenden Anordnung wird von dem bekannten
Verfahren der Nulldurchgangsanalyse Gebrauch gemacht. Bei
dieser können die Schaltkreise für digitale Signale ausgelegt
werden. Die Identifizierung verschiedener Laute beruht auf
einer Klassifizierung der Fulldurchgaagsintervalle, wobei
f SS 821/0681 ßÄD
die verschiedenen Klassen !Frequenzbereichen entsprechen.
Beispielsweise sind Nulldurchgangsintervalle, die in den Bereich von 0,5 "bis 1,0 Millisekunden fallen, einer Frequenz
von 1000 "bis 500 Hz äquivalent. Eine Schaltung, die nur einen Nulldurchgang in diesem Bereich auswählt, nennt man ein digitales
Filter.
In der Anordnung nach Fig. 1 gelangt das ankommende Sprachsignal zunächst auf eine Anzahl Frequenzbereich-Auswahleinrichtungen
oder Grenzfrequenzschaltungen 1, 2, 3· Die Aufgabe dieser Grenzfrequenzschaltungen 1, 2, 3 besteht darin, die
Bereichsgrenzen festzulegen, innerhalb deren die nachgesehalteten Einrichtungen arbeiten. Ist z.B. die Einrichtung
zum Identifizieren von zwei Lauten vorgesehen, von denen der eine in den Bereich von 200 bis 600 Hz und der andere in den
Bereich von 600 bis 1200 Hz fällt, dann liegen die Grenzfrequenzen
bei 200, 600 und 1200 Hz. Vergleicht man diese Grenzfrequenzen mit den Nulldurchgangsintervallen, dann
sieht man, daß ein Nulldurchgang, der in das Intervall ti bis t2 fällt, im höheren Frequenzbereich liegt, während
ein Nulldurchgang, der in das Intervall t2 bis t3 fällt, im niedrigeren Frequenzbereich liegt. Diese Zeitintervalle
sind auf die Zeit tO bezogen, d.h. auf den vorhergehenden Nulldurchgang. Die Schaltung 1 in der Fig. 1 dient dazu,
eine Grenze zur Zeit ti, die Schaltung 2 eine Grenze zur Zeit t2 und die Schaltung 3 eine Grenze zur Zeit t3 zu setzen.
Die Nulldurchgänge, die innerhalb der Kanalgrenzen liegen, werden mittels der digitalen Filterschaltungen 4· und 5 erkannt
und herausgesiebt. Die Ausgangssignale der Filter 4 und 5 sind Impulsfolgen, die die beiden Laute charakterisieren und
diese Impulsfolgen werden auf Differenzintegratorstufen 6 und gegeben, die die gewichtete Differenz integriert über eine
bestimmte Zeit zwischen den FiIterausgangen liefern.
Die gewichtetön Differenzen gelangen dann auf binäre Entscheidungsstufen
8 und 9, die das größte der differenzierten und integrierten Eingangssignale unter der Voraussetzung,
109821/0681
daß diese einen gegebenen minimalen Schwellwert "V. ^ überschreiten,
ermitteln. -
Eine weitere Verarbeitung der Signale dient dazu, Unsicherheiten
zu beseitigen, die dann auftreten, wenn die Ausgangssignale wäfeseael der Entscheidungsstufen 8 oder 9 unterbrochen werden,
wodurch angezeigt wird, daß ein oder mehrere andere Laute erkannt wurden. Hierzu dienen gewichtete Integrationsnetzwerke
10,11, die den binären Entscheidungsstufen 8,9 nachgeschaltet sind.
Die im Blockschaltbild nach Pig. 1 verwendeten Schaltkreise
werden nun im einzelnen beschrieben. Die G-renzschaliJungsn
1,2 und 3 sind untereinander gleich und, wie in Fig. 2 dargestellt,
geschaltet. Das Sprachsignal durchläuft zunächst einen nicht dargestellten Kfulldurchgangsdetektor,der Triggerimpulse an den Fulldurchgangsintervallen liefert. Diese
Impulse erhalt man zweckmäßigerweise durch Umwandeln des Analogsignales in ein Rechtecksignal,mit dem eine "bistabile
Stufe angesteuert wird. Beide bistabilen Ausgangssignale werden verwendet und man benötigt eine Mischstufe, um Triggerimpulse der richtigen Polarität zu erhalten« Diese Triggerimpulse werden dann auf eine erste monostabile Kippschaltung
gegeben, die Abtastimpulse erzeugt· Die Rückflanke des
Abtastiapulses fällt mit der Zeit to zusammen. Die Dauer
dieses Impulses ist sehr klein, verglichen mit dom kürzesten
vorkommenden Nulldurchgangsintervall. Dine aweite monostabile
Kippschaltung, die von der ersten gesteuert wird, erzeugt Rückstellimpulse.
Fig. 2 ist eine monostabile Kippschaltung, deren Zsitkonstantödurch
ein HG-GKLied bestimmt ist. Die Abtastimpulos gelaagen
zur Klemme 20» so daß der'Transistor 21 sum Keitpm&t %q
abgeschaltet wird. W#rd©n keine *©ifc«r«ra ITuXl&uxe&gisjjge
innerhalb der Periode t^ bis t^ Qi/kmmt t äaan tso&g&tet; der
Transistor z-um Zeitpunkt -t.* wieder tist. Smtt ^©αοΦίι «is
anderer Nulldurchgang innerhalb der Periode t~ "bis t,» auf,
dann wird das teilweise entladene RG-Glied wieder geladen
und der Transistor 3 abgeschaltet. Auf diese Weise bewirkt jeder nach dem Zeitpunkt ty, auftretende Nulldurchgang, daß
die Schaltung nach Fig. 2 ein Ausgangssignal zum Zeitpunkt t,,
erzeugt. Die Schaltung nach Fig. 2 entspricht der Grenzschaltung nach Pig. 1. Die Grenzschaltungen 2 und 3 sind gleich aufgebaut
wie die in Fig. 2 dargestellten, mit der Ausnahme, daß die Schaltung 2 eine Zeitkonstante tQ bis tp und die Schaltung
eine Zeitkonstante tQ bis t-, hat.
Fig. 3 zeigt die digitalen Filter 4 und 5 nach Fig. 1.
Jedes Filter hat zwei Eingänge 31 und 32, auf die die Ausgangssignale
der Grenzschaltungen 1 und 2 gegeben werden» Auf die digitalen Filter gelangt außerdem der Nulldurchgangsabtastimpuls
. über die Klemme 33· Die Schaltung ist eine torschaltung.
Der Transistor 3^ wird durch die Vorspannungen bei keinem
EingangsSignalen mit Klemmen 31» 32 und 33 i& Aus-Zustand
gehalten. Abtastimpulse, die auf die Klemme 33 gleichzeitig mit einem Signal an der Klemme 31 gelangen, wenn das Intervall
vom vorhergehenden Nulldurchgang größer als die Periode t^
ist5 bewirken, wenn gleichzeitig kein Signal an der Klemme
vorhanden ist, daß der Transistor 5^- für die Dauer des NuIldurchgangsabtastimpulses
einschaltet- Ist jedoch das Intervall größer als die Periode to» dann hat das Ausgangssignal von
der Schaltung 1 aufgehört und es wird stattdessen einv
Ausgangssignal von der Schaltung 2 an die Klemme 32 geliefert, wodurch verhindert isird, daß der Transistor einschaltet, wenn
der Nulldurehgangsabtastimpuls auftritt. Am Ausgang der
Schaltung nach Fig. 3 tritt sonit immer dann eine Impulsfolge
auf, wenn ein Nulldurchgang in die Periode t^j bis tg» bezogen
auf den vorhergehenden Nulldurchgang, fällt.
Die Schaltung 5 nach Fig. 1 ist ähnlich aufgebaut wie die
Schaltung 4· mit der Ausnahme, daß ihre Eingangssignale von
den Ausgängen der Schaltungen 2 und 3 herrühren. Am Ausgang
108821/0881 · bad obig.nal
-V-
?r Schaltung 5 tritt daher eine Impulsfolge auf, immer dann,
wenn ein Nulldurchgang in die Periode tP bis t^ nach dem
vorhergehenden Nulldurchgang fällt.
Die Ausgangs signale der Schaltungen 4 und 5 nach Fig. 1
zeigen das Vorhandensein einer besonderen Nulldurchgängsverteilung
im Sprachsignal an.Ba das Sprachsignal jedoch eine komplexe Kurve ist, kann es sein4 daß keines der beiden
Ausgangssignale allein auftritt. TJm festzustellen, ob es sich um einen bedeutungsvollen Ausgang handelt, ist es notwendig,
axe Differenz der beiden Signale zu bilden. Dies geschieht
mittels der Stufen 6 und- 7 nach, Fig. 1, die wie in Fig.
gezeigt, aufgebaut sind. Das Äusgangssignäl der Schaltung 4, das das Vorhandensein von Nulldurchgängen in der Periode t,,
bis to angibt, wird auf die Klemme 40 gegeben. Das Ausgangssignal
der Schaltung 5i das das Vorhandensein von Nulldurchgängen
in der Periode to " ^x angibt, soll vom Ausgangssignal
der Schaltung 4 abgezogen werden. Das invertierte Ausgangssignal
der Schaltung 5 wird daher auf die Klemme 41 gegeben.
Die Geschwindigkeit der Ausgangsimpuisfolge der Schaltung 4,
die ein bestimmtes Muster kennzeichnet, wird durch Laden eines RC-GlIedes gemessen. Das Eingangssignal (t>
- to) von der Schaltung 4 lädt das EG-Glied und das Eingangssignal
(t2 - ti) entlädt das Glied. Es wird darauf hingewigaen,
daß das Glied nur dann merkbar geladen wird, weun das
Eingangssignal (t- - ^). wesentlich größer ist als das
Eingangssignal (to -~frz). Auf diese Weise wird erreicht,
daß nur ein bedeutungsvolles Muster, das im Sprachsignal auftritt j ein Aus gangs signal erzeugt«, das größer ist als
eine Bezugsspannung V , die einstellbar ist. Die Schaltung ist ähnlich wie die Schaltung 6, sie arbeitet jedoch mit
den Eingangssignalen (t2 - t^} und (t^ -
Die Ausgangssignale der die Integrierte Differenz bildenden
Schaltungen 6 und 7 gelangen daan auf binäre Entscheidüngsstufen
δ und 9, die in Fig. 5 dargestellt sind. Diese geben
109821/0681
dann ein binäres Ausgangssignal ab, wenn das Eingangssignal einen vorgegebenen Schwellwert überschreitet, der für alle
Entscheidungsstufen gleich sein kann. Auf Jede der Entscheidungsstufen gelangt an deren Eingangsklemme 50 die oben
erwähnte' integrierte Differenz. Über den Transistor 51 sind alle Stufen mit einer gemeinsamen Bezugs spannung 7.-.
verbunden. Die Eingangsklemme 50 ist die Basis des Transistors 52,
der wiederum mit einer Emitterfolgerstufe, bestehend aus dem
Transistor 53» verbunden ist. Steigt das Eingangssignal an der Klemme 50 über den Schwellwert, dann leitet der Transistor 53
wenn sein Eingangssignal das höchste aller Eingangssignale ist
und er liefert ein binäres Ausgangssignal. Eine Inverterstufe die verstärkt, kann dem Ausgang der Schaltung nachgeschaltet
werden, wenn es für die nachfolgenden Stufen erforderlich ist. Das binäre Ausgangssignal gibt an, ob oder ob nicht eine bestimmte
Verteilung der Nulldurchgangsintervalle vorliegt. Fig. 5 zeigt auch, wie die anderen entsprechenden binären
Entseheidungsschaltungen, wie z.B. 9 in Fig. 1, mit der
gemeinsamen Bezugsspannung V. verbunden sind.
Um schließlich Unsicherheiten auszuschalten, wenn die Ausgangssignale
der binären Entscheidungsschaltungen kurz unterbrochen werden und damit zu zeigen, daß andere Lautklassen erkannt
wurden, werden diese Ausgangssignale integriert und das integrierte Ausgangssignal wird nochmals mit einem Schwellwert
verglichen, um sicherzustellen, daß es sich um ein bedeutungsvolles Ausgangssignal handelt. Die notwendigen Schaltungen 10
und 11 nach Fig. 1 sind in Fig. 6 dargestellt. Alle integrierenden Stufen können wiederum den gleichen Schwellwert V\,
haben, z.B. denselben wie in den Schaltungen 8 und 9· Bas
binäre Entseheidungssignal gelangt an die Klemme £0 und lädt
den Kondensator 61 über die Diode 62, wenn das fragliche Muster vorhanden ist und entlädt über die Diode 63, wenn das Muster
nicht vorhanden ist. Die Spannung am Kondensator 61 steuert den Transistor 64,der einschaltet, wenn das integrierte Eingangssignal
größer als V., ist. Die entsprechenden anderen
109821/0681
3909 - 9 -
integrierenden Schaltungen sind, wie durch die gestrichelte
Linie angedeutet, angeschlossen. Das Ausgangssignal von der Integratorstufe ist ein Impuls, der das "bedeutungsvolle Auftreten
einer besonderen NuIldurchgangsverteilung während einer bestimmten
Zeit anzeigt.
Da die Erkennugg von Lautklassen aus dem Sprachsignai weitgehend
von der Bedeutung der beobachteten Nulldurchgangsverteilungen abhängt (dargestellt durch die Spannung am
Kondensator nach 51Ig. 4-), ist es wünschenswert, an der Einrichtung
eine Einstellmöglichkeit vorzusehen, so daß die
Discrimination sich mit der Bedeutung der Nulldurohgaiigs-Verteilungen
ändert■» Steigt z.B, die Bedeutung einer bestimmten
Verteilung, so ist es wünschenswert, Nimmt z.B* die Bedeutung
einer bestimmten Verteilung au, dann ist es wünschenswerts
die Grenzen des Frequenzbereiches,innerhalb der die Verteilung
auftritt, zu erweitern. Umgekehrt sollten die Grenzen näher
zusammengerückt werden, wenn die Bedeutung der Verteilung
abnimmt. Im vorliegenden Falle wird dies erreicht, indem die
Verzögerungsschaltungen, die die Kanalgrenzen t,,, tp und t,
bestimmen, verändert werden» Fig. 7 zeigt, wie die Kanalgrenzen verschoben werden entsprechend dem Wechsel der Bedeutung
der Nulldurchgangsverteilung. Nach Fig. 1 mögen die beiden Nulldurchgangsverteilungen, die erkannt werden sollen, s. und Sp
sein. Sie fallen in die Frequenzbereiche f/.Ms fQ und fQ bis £^1
wobei fQ die gemeinsame Grenze ist, die die beiden Verteilungen
trennt. Es kann nützlich sein, die ursprüngliche Erkennung von Sx.
auf den Frequenzbereich f^, bis f~ zu beschränken. Nach einer
bestimmten Zeit stellt man fest, daß s^. vorhanden ist. Danach
ist es zweckmäßig, die Grenze f& zu verschieben, wobei der
Frequenzbereich erhöht wird, innerhalb s,. auftreten kann.
Der Grund, warum urpsrünglich der Bereich eingeschränkt wird, liegt darin, daß man die Möglichkeit einer Unsicherheit in
deiiunmittelbaren Umgebung von fQ vermeiden will, indem man
109821/0681
strengere Forderungen an die Erkennung dieses besonderen Musters stellt. Wenn diese Verteilung einmal erkannt wurde,
dann kann von dieser strengen Forderung abgegangen werden, und man erhält~dadurch mehr Information vom Frequenzbereich
in der unmittelbaren Umgebung von fQ, die proportional dem
Ausgangssignal ist, das die Verteilung kennzeichnet. Der Bereich ί-κ-ίρ » ^βΓ ^as Auster ®o enthält, wird ähnlich
behandelt.
Die Schaltung zur Änderung der Frequenzgrenzen ist in Fig. φ
gezeigt. Der erste Teil der Fig. 8 ist ähnlich der Schaltung nach Fig. 4- der integrierenden Differenzschaltung. Auf sie
gelangen die gleichen Eingangssignale wie bei Fig. 4-, und zwar
auf die Klemmen 80 und 81. Die Spannung am Kondensator 82 kennzeichnet die relativen Informationspegel in den beiden
Frequenzbereichen f^-^a und f-w-fp* -0^830 Spannung wird über
den rechten Teil der Schaltung zur Steuerung der Verschiebung der Grenze f verwendet. Die Spannung am Kondensator 82 wird
mit dem Kondensator 84 integriert und die integrierte Spannung
gelangt auf die Klemme 22 der Fig. 2. Die Veränderung der Spannung an der Klemmen 22 bewirkt eine entsprechende Veränderung
der Zeitkonstanten der Frequenzgrenzenschaltung,d.h.
die Zeit tp wird verändert. Die Polarität des Ausgangssignals
der Fig. 8 ist so gewählt, daß eine steigende integrierte Spannung am Kondensator 84· die Zeitkonstante der Schaltung
nach Fig. 2 verkleinert und umgekehrt. In der Anordnung nach Fig. 1 ist nur eine Frequenzgrenzenschaltung, die ^2 erzeugt,
für beide Kanäle vorgesehen. Unter diesen Umständen ergibt Jedes Ansteigen in einem Frequenzbereich ein entsprechendes
Absinken im anderen Frequenzbereich. Wenn für tp zwei Frequenzschaltungen
vorgesehen sind (t und t, entsprechen f und f^),
dann ist es möglich, jede Frequenzgrenze unabhängig von der anderen zu verschieben.
109821/0681
Es kann erforderlich sein, daß eine Frequenzgrenze nur in
einer Richtung verschoben werden muß. In diesem Falle wird die
Schaltung nach Fig. 8 durch eine Diode 85, die gestrichelt
dargestellt ist, verändert. Die Durchlaßrichtung dieser Diode
bestimmt, in welcher Richtung sich die Grenze nicht verschieben '
darf, indem die entsprechende Spannung 83-abge vom Kondensator
abgehalten wird.
Ein anderer Vorteil der Schaltung nach Fig. 8 ist darin zu
sehen, daß die Spannung, die an die Klemme 8? über den Widerstand
88 gegeben wird, eine Grundstellung für f ergibt.
el
Eine Änderung dieser Spannung ändert die Grundposition von f
und auf diese Weise ergibt sich einfach die Möglichkeit, die Schaltung auf verschiedene Sprecher, ζ.B. männliche und weibliche,
einzustellen. Diese Einstellung kann vom Sprecher selbst vorgenommen
werden. Manchmal kann es vorkommen, daß bei Lautübergängen einer ein Signal mit niederer Amplitude,verglichen
mit den anderen Lauten, ist und deshalb nicht erkannt wird. Wenn z.B. in der Folge β/., 3p und wieder s* , S2 eine niedere
Amplitude verglichen mit Sx, hat, könnte Sp nicht erkannt
werden. Diese Schwierigkeit kann umgangen werden, wenn man den Bezugspegel der integrierenden Differenzschaltungen 6,7
entsprechend dem Pegel der einzelnen erkannten Muster stetig
einstellt. Wird beispielsweise ein Ausgangssignal mit hoher Amplitude im Bereich t^, - ^2 erkannt, dann wird der Bezugspegel
der Schaltung 7 mittels der Schaltung 6 erhöht, wodurch es leichter ist, für das Ausgangssignal mit niederen Pegel im
Bereich tp - t,, dass ein Ausgangssignal von der Schaltung 7
erzeugt wird. Die Schaltung hierzu ist in Fig. 9 gezeigt.
Der Kondensator 41 entspricht dem Kondensator in der Schaltung nach Fig. 4 und der Kondensator 9I dem Kondensator der Schaltung
7 nach Fig». 1. Die beiden Kondensatoren 4-1 und 91 sind
über einen Emitterfolger 92, eine Diode 93» eine Zenerdiode
und einen Widerstand 95 verbunden. Ist die Amplitude des
(t^.- t2) Ausgangssignals groß, dann wird die höhere Ladung
am Kondensator 41 dazu benützt, die Ladung am Kondensator
109821/0681
ISE/Reg. 3909 - 12 -
zu erhöhen, wodurch die Bezugs spannung zur Schaltung 7 "beeinflußt
wird. Jede weitere zusätzliche Ladung, die über die Eingangsklemmen der Schaltung 7 hinzugefügt wird, hat eine
größere Ge samt ladung des Kondensators 91 zur !Folge. Eine
ähnliche Anordnung wird zur Beeinflussung der Bezugsspannung der Schaltung 6 verwendet, wenn das (to-tO Ausgangssignal
groß ist. Die Geschwindigkeit und das Maß der Beeinflussung wird über die Bauteile 93» 94·» 95 gesteuert.
S Patentansprüche 5 Bl.Zeichn.,9 Fig.
109821/0681
Claims (6)
1. Verfahren zur Spracherkennung, "bei dem die Abstände der
Nulldurchgänge der Sprachschwingung erfaßt und ausgewertet werden, dadurch gekennzeichnet, daß der dem möglichen
Zeitbereich der Nulldurchgangsabstände entsprechende
Frequenzbereich in zwei oder mehr den zu erkennenden Lautklassen
zugeordnete Bereiche unterteilt wird, g.gß die aus
diesen Bereichen gewonnenen Impulsfolgen je ein/Digitalfilter
zugeführt werden, und daß deren Ausgangssignale je auf Einrichtungen zur Messung der Differenzen der
Wiederholungsfrequenz gegeben werden und daß aus diesen Differenzen mittels einer Extremwertschaltung die Nulldurchgangsverteilung
und damit der Laut ermittelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
daß zur Aufteilung des Frequenzbereichs mehrere Verzögerungsglieder mit verschiedenen Zeitkonstanten dienen,
wobei Je zwei der Verzögerungsglieder die untere und obere Grenze einer Zeitperiode bilden, innerhalb der ein
folgender ETulldurchgang auftreten kann,
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet,
t daß die Einrichtungen zur Messung der Differenzen der
Wiederholungsfrequenz diese gewichten.
4-. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Ausgangssignale der Einrichtung ■zur Messung
der Differenzen der Wiederholungsfrequenz integriert werden.
Ne/Sd
5.6.68
5.6.68
109821/0681
5· Verfahren nach Anspruch 1-4, dadurch gekennzeichnet,
daß die Grenzen der Frequenzbereiche entsprechend der Bedeutung der Information in dem Bereich geändert werden.
6. Verfahr en nach -Anspruch 1-5» dadurch gekennzeichnet,
daß die Schwellwerte für die einzelnen Frequenzbereiche relativ zueinander verändert werden, um die Erkennung
von Signalen mit kleiner Amplitude zu ermöglichen.
109821/0681
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB29100/67A GB1180288A (en) | 1967-06-23 | 1967-06-23 | Analysing Complex Signal Waveforms |
Publications (1)
Publication Number | Publication Date |
---|---|
DE1772633A1 true DE1772633A1 (de) | 1971-05-19 |
Family
ID=10286148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19681772633 Pending DE1772633A1 (de) | 1967-06-23 | 1968-06-14 | Verfahren zur Spracherkennung |
Country Status (5)
Country | Link |
---|---|
US (1) | US3530243A (de) |
BE (1) | BE728044A (de) |
DE (1) | DE1772633A1 (de) |
FR (1) | FR1572699A (de) |
GB (1) | GB1180288A (de) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1282641A (en) * | 1969-05-14 | 1972-07-19 | Thomas Patterson | Speech encoding and decoding |
US3740476A (en) * | 1971-07-09 | 1973-06-19 | Bell Telephone Labor Inc | Speech signal pitch detector using prediction error data |
US3732405A (en) * | 1971-08-11 | 1973-05-08 | Nasa | Apparatus for statistical time-series analysis of electrical signals |
DE2228069C3 (de) * | 1972-06-09 | 1979-07-26 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und Einrichtung zur Unterdrückung von Störungen bei frequenzmodulierten Signalen |
US4388495A (en) * | 1981-05-01 | 1983-06-14 | Interstate Electronics Corporation | Speech recognition microcomputer |
US4761815A (en) * | 1981-05-01 | 1988-08-02 | Figgie International, Inc. | Speech recognition system based on word state duration and/or weight |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3344233A (en) * | 1967-09-26 | Method and apparatus for segmenting speech into phonemes | ||
US3162808A (en) * | 1959-09-18 | 1964-12-22 | Kurt H Haase | Wave form analyzing method for establishing fourier coefficients |
US3278685A (en) * | 1962-12-31 | 1966-10-11 | Ibm | Wave analyzing system |
SE301673B (de) * | 1963-05-08 | 1968-06-17 | G Fant | |
GB1101723A (en) * | 1964-01-31 | 1968-01-31 | Nat Res Dev | Improvements in or relating to correlation circuits |
GB1012765A (en) * | 1964-03-06 | 1965-12-08 | Standard Telephones Cables Ltd | Apparatus for the analysis of waveforms |
US3394309A (en) * | 1965-04-26 | 1968-07-23 | Rca Corp | Transient signal analyzer circuit |
-
1967
- 1967-06-23 GB GB29100/67A patent/GB1180288A/en not_active Expired
-
1968
- 1968-05-10 US US728146A patent/US3530243A/en not_active Expired - Lifetime
- 1968-06-14 DE DE19681772633 patent/DE1772633A1/de active Pending
- 1968-06-21 FR FR1572699D patent/FR1572699A/fr not_active Expired
-
1969
- 1969-02-07 BE BE728044D patent/BE728044A/xx unknown
Also Published As
Publication number | Publication date |
---|---|
FR1572699A (fr) | 1969-06-27 |
BE728044A (fr) | 1969-08-07 |
US3530243A (en) | 1970-09-22 |
GB1180288A (en) | 1970-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3105758C2 (de) | Vorrichtung zum Unterscheiden zwischen zwei Signalwerten | |
DE1472038A1 (de) | Verfahren zur Spracherkennung | |
DE3236000A1 (de) | Verfahren zum klassifizieren von audiosignalen | |
DE2524804A1 (de) | Verfahren und vorrichtung zur automatischen spracherkennung | |
DE2710877A1 (de) | Einbruch-alarmsystem | |
WO2020188054A1 (de) | Vorrichtung zur analyse von strömen in einem elektrischen verbraucher und verbraucher mit einer derartigen vorrichtung | |
DE2825651C2 (de) | ||
DE2355517C3 (de) | Verfahren und Einrichtung zum Feststellen des Auftretens einer erwarteten digitalen Signalfolgeart | |
DE1572516A1 (de) | Schaltungsanordnung fuer die Spracherkennung | |
DE1772633A1 (de) | Verfahren zur Spracherkennung | |
DE2431458C2 (de) | Verfahren und Anordnung zur automatischen Sprechererkennung | |
DE4428658A1 (de) | Verfahren zur Erkennung von Signalen mittels Fuzzy-Klassifikation | |
DE2526852B1 (de) | Schaltung zur erfassung der steigung einer brennspannungskurve | |
DE2915834A1 (de) | Vorrichtung zum ueberwachen des betriebsverhaltens eines senders | |
DE2144537C3 (de) | Meldeanlage | |
DE1954136C3 (de) | Schaltungsanordnung zur Überwachung einer periodischen elektrischen Meßspannung vorgegebener Frequenz | |
DE3204607C2 (de) | ||
DE2158985C3 (de) | Einrichtung zur Regelung des Verstärkungsgrades eines Wechselspannungsverstärkers | |
DE2547746A1 (de) | Vorrichtung mit einer messwertgeber-einheit zur erzeugung einer folge von spannungswerten und einer mittelwertbildungs-einheit | |
DE1797314C3 (de) | Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen ' | |
DE2334459C3 (de) | Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung | |
DE2062589A1 (de) | Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals | |
DE2912264A1 (de) | Verfahren und geraet zur phasenempfindlichen ermittlung | |
DE2601351C2 (de) | Verfahren zur Unterdrückung von Signalteilen mit zu kleiner Amplitude sowie Vorrichtung zur Durchführung des Verfahrens | |
EP0143111A1 (de) | Schaltungsanordnung eines Fensterkomparators mit Selbstkontrolle |