DE1772633A1 - Verfahren zur Spracherkennung - Google Patents

Verfahren zur Spracherkennung

Info

Publication number
DE1772633A1
DE1772633A1 DE19681772633 DE1772633A DE1772633A1 DE 1772633 A1 DE1772633 A1 DE 1772633A1 DE 19681772633 DE19681772633 DE 19681772633 DE 1772633 A DE1772633 A DE 1772633A DE 1772633 A1 DE1772633 A1 DE 1772633A1
Authority
DE
Germany
Prior art keywords
circuit
pulses
zero
circuits
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19681772633
Other languages
English (en)
Inventor
Wincenty Bezdel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STC PLC
Original Assignee
Standard Telephone and Cables PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Standard Telephone and Cables PLC filed Critical Standard Telephone and Cables PLC
Publication of DE1772633A1 publication Critical patent/DE1772633A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Description

Dipl.-Ing. Heinz Ciaessen
Patentanwalt 1772833
7 Stuttgart-Feuerbach
Kurze Straße 8
ISE/Reg. 3909
W.Bezdel -14 .
STANDARD TELEPHONES AND GABLES LIICETED, LONDON
Verfahren zur Spracherkennung
Die Priorität der Anmeldung Nr.29100/67 vom 23.6.1967 in Großbritannien wird in Anspruch genommen.
Die Erfindung betrifft ein Verfahren zur Spracherkennung,bei dem die Abstände der Nulldurchgänge der Sprachschwingung erfaßt und ausgewertet werden.
Solche Verfahren müssen so arbeiten, daß sie einen weiten. Bereich der kennzeichnenden Muster erfassen, beispielsweise unterschiedliche Stimmlagen und Akzente. Auch kann ein von derselben Person gesprochenes Wort '.in verschiedenem Kontext unterschiedlich klingen«
Verschiedene Verfahren zur Analyse komplexer Kurven sind bekannt. Die Untersuchung des frequenz3pektrums liefert beispielsweise wichtige charakteristische Muster der Sprache.Bei einem bekannten Verfahren wird die Information ermittelt, die in den Nulldurchgängen des Sprachsignals enthalten ist.Die Abstände zwischen aufeinanderfolgenden Nulldurchgängen oder die Anzahl der Nulldurchgänge in einer Zeiteinheit ist ein Maß für die Frequenz des Sprachsignale.zu diesem Zeitpunkt.
Die Laute der Sprache können in verschiedene Klassen eingeteilt wer den, z.B. Vokale, vokalähnliclie Laut© usw. Einige dieser Klassen sind bei der Spracherkennung- wichtiger als
109021/0681
BAD ORIGINAL
ISE/Eeg. 3909 - 2 -
andere. Mehrere Klassen können als Nulldurchgangsverteilungen in einen Frequenzbereich definiert werden. Beispielsweise können in einem Frequenzbereich von 200-1200 Hz die Vokale charakterisiert werden und die Nulldurchgangsverteilung in diesem Bereich zu ihrer Klassifizierung. Mit der Erfindung wii?d ein Verfahren zur Ermittlung solcher Lautklassen angegeben.
Die Erfindung ist dadurch gekennzeichnet, daß der dem möglichen Zeitbereich der Nulldurchgangsabstände entsprechende Frequenzbereich in zwei oder mehr den zu erkennenden Lautklassen zugeordnete Bereiche unterteilt wird, daß die aus diesen Bereichen gewonnenen Impulsfolgen je einem Digitalfilter zugeführt werden und daß deren Ausgangssignale ge auf Einrichtungen zur Messung der Differenzen der Wiederholungsfrequenz gegeben werden und daß aus diesen Differenzen mittels einer Extremwertschaltung die Nulldurcligangsverteilung und damit der Laut ermittelt wird.
10*821/0681
Die Erfindung wird Him. an Hand der Figuren beispielsweise näher erläutert. Es zeigen:
Fig. 1 ein Blockschaltbild einer Anordnung zur Identifizierung too zwei
Fig. 2 eine Schaltung zur Begrenzung eines Frequenzbereiches;
Pig. 3 ein digitales Filter für einen Frequenzbereich;
Fig. 4- eine Schaltung zur Messung der Bifferenzgeschwinäigkeit der Ausgänge von zwei digitalen Filtern nach Fig. 5| '
Fig. 5 eine Exbrenwertsehaltung ;
Fig. 6 eine Integrierschaltung für ein erkanntes Lautsignal;
Fig. 7 die relative gegenseitige Änderung der Grenzen zweier Frequenzbereiche ;
Fig. 8 eine Schaltung zum Ändern der Grenzwerte eines Frequenzbereiches aufgrund der Bedeutung der Information, die sich in diesem Bereich befindet;
Fig. 9 eine Schaltung zum relativen gegenseitigen Indern des Schwellwertes zweier Lautdetektoren.
Bei der zu beschreibenden Anordnung wird von dem bekannten Verfahren der Nulldurchgangsanalyse Gebrauch gemacht. Bei dieser können die Schaltkreise für digitale Signale ausgelegt werden. Die Identifizierung verschiedener Laute beruht auf einer Klassifizierung der Fulldurchgaagsintervalle, wobei
f SS 821/0681 ßÄD
die verschiedenen Klassen !Frequenzbereichen entsprechen. Beispielsweise sind Nulldurchgangsintervalle, die in den Bereich von 0,5 "bis 1,0 Millisekunden fallen, einer Frequenz von 1000 "bis 500 Hz äquivalent. Eine Schaltung, die nur einen Nulldurchgang in diesem Bereich auswählt, nennt man ein digitales Filter.
In der Anordnung nach Fig. 1 gelangt das ankommende Sprachsignal zunächst auf eine Anzahl Frequenzbereich-Auswahleinrichtungen oder Grenzfrequenzschaltungen 1, 2, 3· Die Aufgabe dieser Grenzfrequenzschaltungen 1, 2, 3 besteht darin, die Bereichsgrenzen festzulegen, innerhalb deren die nachgesehalteten Einrichtungen arbeiten. Ist z.B. die Einrichtung zum Identifizieren von zwei Lauten vorgesehen, von denen der eine in den Bereich von 200 bis 600 Hz und der andere in den Bereich von 600 bis 1200 Hz fällt, dann liegen die Grenzfrequenzen bei 200, 600 und 1200 Hz. Vergleicht man diese Grenzfrequenzen mit den Nulldurchgangsintervallen, dann sieht man, daß ein Nulldurchgang, der in das Intervall ti bis t2 fällt, im höheren Frequenzbereich liegt, während ein Nulldurchgang, der in das Intervall t2 bis t3 fällt, im niedrigeren Frequenzbereich liegt. Diese Zeitintervalle sind auf die Zeit tO bezogen, d.h. auf den vorhergehenden Nulldurchgang. Die Schaltung 1 in der Fig. 1 dient dazu, eine Grenze zur Zeit ti, die Schaltung 2 eine Grenze zur Zeit t2 und die Schaltung 3 eine Grenze zur Zeit t3 zu setzen. Die Nulldurchgänge, die innerhalb der Kanalgrenzen liegen, werden mittels der digitalen Filterschaltungen 4· und 5 erkannt und herausgesiebt. Die Ausgangssignale der Filter 4 und 5 sind Impulsfolgen, die die beiden Laute charakterisieren und diese Impulsfolgen werden auf Differenzintegratorstufen 6 und gegeben, die die gewichtete Differenz integriert über eine bestimmte Zeit zwischen den FiIterausgangen liefern.
Die gewichtetön Differenzen gelangen dann auf binäre Entscheidungsstufen 8 und 9, die das größte der differenzierten und integrierten Eingangssignale unter der Voraussetzung,
109821/0681
daß diese einen gegebenen minimalen Schwellwert "V. ^ überschreiten, ermitteln. -
Eine weitere Verarbeitung der Signale dient dazu, Unsicherheiten zu beseitigen, die dann auftreten, wenn die Ausgangssignale wäfeseael der Entscheidungsstufen 8 oder 9 unterbrochen werden, wodurch angezeigt wird, daß ein oder mehrere andere Laute erkannt wurden. Hierzu dienen gewichtete Integrationsnetzwerke 10,11, die den binären Entscheidungsstufen 8,9 nachgeschaltet sind.
Die im Blockschaltbild nach Pig. 1 verwendeten Schaltkreise werden nun im einzelnen beschrieben. Die G-renzschaliJungsn 1,2 und 3 sind untereinander gleich und, wie in Fig. 2 dargestellt, geschaltet. Das Sprachsignal durchläuft zunächst einen nicht dargestellten Kfulldurchgangsdetektor,der Triggerimpulse an den Fulldurchgangsintervallen liefert. Diese Impulse erhalt man zweckmäßigerweise durch Umwandeln des Analogsignales in ein Rechtecksignal,mit dem eine "bistabile Stufe angesteuert wird. Beide bistabilen Ausgangssignale werden verwendet und man benötigt eine Mischstufe, um Triggerimpulse der richtigen Polarität zu erhalten« Diese Triggerimpulse werden dann auf eine erste monostabile Kippschaltung gegeben, die Abtastimpulse erzeugt· Die Rückflanke des Abtastiapulses fällt mit der Zeit to zusammen. Die Dauer dieses Impulses ist sehr klein, verglichen mit dom kürzesten vorkommenden Nulldurchgangsintervall. Dine aweite monostabile Kippschaltung, die von der ersten gesteuert wird, erzeugt Rückstellimpulse.
Fig. 2 ist eine monostabile Kippschaltung, deren Zsitkonstantödurch ein HG-GKLied bestimmt ist. Die Abtastimpulos gelaagen zur Klemme 20» so daß der'Transistor 21 sum Keitpm&t %q abgeschaltet wird. W#rd©n keine *©ifc«r«ra ITuXl&uxe&gisjjge innerhalb der Periode t^ bis t^ Qi/kmmt t äaan tso&g&tet; der Transistor z-um Zeitpunkt -t.* wieder tist. Smtt ^©αοΦίι «is
anderer Nulldurchgang innerhalb der Periode t~ "bis t,» auf, dann wird das teilweise entladene RG-Glied wieder geladen und der Transistor 3 abgeschaltet. Auf diese Weise bewirkt jeder nach dem Zeitpunkt ty, auftretende Nulldurchgang, daß die Schaltung nach Fig. 2 ein Ausgangssignal zum Zeitpunkt t,, erzeugt. Die Schaltung nach Fig. 2 entspricht der Grenzschaltung nach Pig. 1. Die Grenzschaltungen 2 und 3 sind gleich aufgebaut wie die in Fig. 2 dargestellten, mit der Ausnahme, daß die Schaltung 2 eine Zeitkonstante tQ bis tp und die Schaltung eine Zeitkonstante tQ bis t-, hat.
Fig. 3 zeigt die digitalen Filter 4 und 5 nach Fig. 1. Jedes Filter hat zwei Eingänge 31 und 32, auf die die Ausgangssignale der Grenzschaltungen 1 und 2 gegeben werden» Auf die digitalen Filter gelangt außerdem der Nulldurchgangsabtastimpuls . über die Klemme 33· Die Schaltung ist eine torschaltung. Der Transistor 3^ wird durch die Vorspannungen bei keinem EingangsSignalen mit Klemmen 31» 32 und 33 i& Aus-Zustand gehalten. Abtastimpulse, die auf die Klemme 33 gleichzeitig mit einem Signal an der Klemme 31 gelangen, wenn das Intervall vom vorhergehenden Nulldurchgang größer als die Periode t^ ist5 bewirken, wenn gleichzeitig kein Signal an der Klemme vorhanden ist, daß der Transistor 5^- für die Dauer des NuIldurchgangsabtastimpulses einschaltet- Ist jedoch das Intervall größer als die Periode to» dann hat das Ausgangssignal von der Schaltung 1 aufgehört und es wird stattdessen einv Ausgangssignal von der Schaltung 2 an die Klemme 32 geliefert, wodurch verhindert isird, daß der Transistor einschaltet, wenn der Nulldurehgangsabtastimpuls auftritt. Am Ausgang der Schaltung nach Fig. 3 tritt sonit immer dann eine Impulsfolge auf, wenn ein Nulldurchgang in die Periode t^j bis tg» bezogen auf den vorhergehenden Nulldurchgang, fällt.
Die Schaltung 5 nach Fig. 1 ist ähnlich aufgebaut wie die Schaltung 4· mit der Ausnahme, daß ihre Eingangssignale von den Ausgängen der Schaltungen 2 und 3 herrühren. Am Ausgang
108821/0881 · bad obig.nal
-V-
?r Schaltung 5 tritt daher eine Impulsfolge auf, immer dann, wenn ein Nulldurchgang in die Periode tP bis t^ nach dem vorhergehenden Nulldurchgang fällt.
Die Ausgangs signale der Schaltungen 4 und 5 nach Fig. 1 zeigen das Vorhandensein einer besonderen Nulldurchgängsverteilung im Sprachsignal an.Ba das Sprachsignal jedoch eine komplexe Kurve ist, kann es sein4 daß keines der beiden Ausgangssignale allein auftritt. TJm festzustellen, ob es sich um einen bedeutungsvollen Ausgang handelt, ist es notwendig, axe Differenz der beiden Signale zu bilden. Dies geschieht mittels der Stufen 6 und- 7 nach, Fig. 1, die wie in Fig. gezeigt, aufgebaut sind. Das Äusgangssignäl der Schaltung 4, das das Vorhandensein von Nulldurchgängen in der Periode t,, bis to angibt, wird auf die Klemme 40 gegeben. Das Ausgangssignal der Schaltung 5i das das Vorhandensein von Nulldurchgängen in der Periode to " ^x angibt, soll vom Ausgangssignal der Schaltung 4 abgezogen werden. Das invertierte Ausgangssignal der Schaltung 5 wird daher auf die Klemme 41 gegeben. Die Geschwindigkeit der Ausgangsimpuisfolge der Schaltung 4, die ein bestimmtes Muster kennzeichnet, wird durch Laden eines RC-GlIedes gemessen. Das Eingangssignal (t> - to) von der Schaltung 4 lädt das EG-Glied und das Eingangssignal (t2 - ti) entlädt das Glied. Es wird darauf hingewigaen, daß das Glied nur dann merkbar geladen wird, weun das Eingangssignal (t- - ^). wesentlich größer ist als das Eingangssignal (to -~frz). Auf diese Weise wird erreicht, daß nur ein bedeutungsvolles Muster, das im Sprachsignal auftritt j ein Aus gangs signal erzeugt«, das größer ist als eine Bezugsspannung V , die einstellbar ist. Die Schaltung ist ähnlich wie die Schaltung 6, sie arbeitet jedoch mit den Eingangssignalen (t2 - t^} und (t^ -
Die Ausgangssignale der die Integrierte Differenz bildenden Schaltungen 6 und 7 gelangen daan auf binäre Entscheidüngsstufen δ und 9, die in Fig. 5 dargestellt sind. Diese geben
109821/0681
dann ein binäres Ausgangssignal ab, wenn das Eingangssignal einen vorgegebenen Schwellwert überschreitet, der für alle Entscheidungsstufen gleich sein kann. Auf Jede der Entscheidungsstufen gelangt an deren Eingangsklemme 50 die oben erwähnte' integrierte Differenz. Über den Transistor 51 sind alle Stufen mit einer gemeinsamen Bezugs spannung 7.-. verbunden. Die Eingangsklemme 50 ist die Basis des Transistors 52, der wiederum mit einer Emitterfolgerstufe, bestehend aus dem Transistor 53» verbunden ist. Steigt das Eingangssignal an der Klemme 50 über den Schwellwert, dann leitet der Transistor 53 wenn sein Eingangssignal das höchste aller Eingangssignale ist und er liefert ein binäres Ausgangssignal. Eine Inverterstufe die verstärkt, kann dem Ausgang der Schaltung nachgeschaltet werden, wenn es für die nachfolgenden Stufen erforderlich ist. Das binäre Ausgangssignal gibt an, ob oder ob nicht eine bestimmte Verteilung der Nulldurchgangsintervalle vorliegt. Fig. 5 zeigt auch, wie die anderen entsprechenden binären Entseheidungsschaltungen, wie z.B. 9 in Fig. 1, mit der gemeinsamen Bezugsspannung V. verbunden sind.
Um schließlich Unsicherheiten auszuschalten, wenn die Ausgangssignale der binären Entscheidungsschaltungen kurz unterbrochen werden und damit zu zeigen, daß andere Lautklassen erkannt wurden, werden diese Ausgangssignale integriert und das integrierte Ausgangssignal wird nochmals mit einem Schwellwert verglichen, um sicherzustellen, daß es sich um ein bedeutungsvolles Ausgangssignal handelt. Die notwendigen Schaltungen 10 und 11 nach Fig. 1 sind in Fig. 6 dargestellt. Alle integrierenden Stufen können wiederum den gleichen Schwellwert V\, haben, z.B. denselben wie in den Schaltungen 8 und 9· Bas binäre Entseheidungssignal gelangt an die Klemme £0 und lädt den Kondensator 61 über die Diode 62, wenn das fragliche Muster vorhanden ist und entlädt über die Diode 63, wenn das Muster nicht vorhanden ist. Die Spannung am Kondensator 61 steuert den Transistor 64,der einschaltet, wenn das integrierte Eingangssignal größer als V., ist. Die entsprechenden anderen
109821/0681
3909 - 9 -
integrierenden Schaltungen sind, wie durch die gestrichelte Linie angedeutet, angeschlossen. Das Ausgangssignal von der Integratorstufe ist ein Impuls, der das "bedeutungsvolle Auftreten einer besonderen NuIldurchgangsverteilung während einer bestimmten Zeit anzeigt.
Da die Erkennugg von Lautklassen aus dem Sprachsignai weitgehend von der Bedeutung der beobachteten Nulldurchgangsverteilungen abhängt (dargestellt durch die Spannung am Kondensator nach 51Ig. 4-), ist es wünschenswert, an der Einrichtung eine Einstellmöglichkeit vorzusehen, so daß die Discrimination sich mit der Bedeutung der Nulldurohgaiigs-Verteilungen ändert■» Steigt z.B, die Bedeutung einer bestimmten Verteilung, so ist es wünschenswert, Nimmt z.B* die Bedeutung einer bestimmten Verteilung au, dann ist es wünschenswerts die Grenzen des Frequenzbereiches,innerhalb der die Verteilung auftritt, zu erweitern. Umgekehrt sollten die Grenzen näher zusammengerückt werden, wenn die Bedeutung der Verteilung abnimmt. Im vorliegenden Falle wird dies erreicht, indem die Verzögerungsschaltungen, die die Kanalgrenzen t,,, tp und t, bestimmen, verändert werden» Fig. 7 zeigt, wie die Kanalgrenzen verschoben werden entsprechend dem Wechsel der Bedeutung der Nulldurchgangsverteilung. Nach Fig. 1 mögen die beiden Nulldurchgangsverteilungen, die erkannt werden sollen, s. und Sp sein. Sie fallen in die Frequenzbereiche f/.Ms fQ und fQ bis £^1 wobei fQ die gemeinsame Grenze ist, die die beiden Verteilungen trennt. Es kann nützlich sein, die ursprüngliche Erkennung von Sx. auf den Frequenzbereich f^, bis f~ zu beschränken. Nach einer bestimmten Zeit stellt man fest, daß s^. vorhanden ist. Danach ist es zweckmäßig, die Grenze f& zu verschieben, wobei der Frequenzbereich erhöht wird, innerhalb s,. auftreten kann. Der Grund, warum urpsrünglich der Bereich eingeschränkt wird, liegt darin, daß man die Möglichkeit einer Unsicherheit in deiiunmittelbaren Umgebung von fQ vermeiden will, indem man
109821/0681
strengere Forderungen an die Erkennung dieses besonderen Musters stellt. Wenn diese Verteilung einmal erkannt wurde, dann kann von dieser strengen Forderung abgegangen werden, und man erhält~dadurch mehr Information vom Frequenzbereich in der unmittelbaren Umgebung von fQ, die proportional dem Ausgangssignal ist, das die Verteilung kennzeichnet. Der Bereich ί-κ-ίρ » ^βΓ ^as Auster ®o enthält, wird ähnlich behandelt.
Die Schaltung zur Änderung der Frequenzgrenzen ist in Fig. φ gezeigt. Der erste Teil der Fig. 8 ist ähnlich der Schaltung nach Fig. 4- der integrierenden Differenzschaltung. Auf sie gelangen die gleichen Eingangssignale wie bei Fig. 4-, und zwar auf die Klemmen 80 und 81. Die Spannung am Kondensator 82 kennzeichnet die relativen Informationspegel in den beiden Frequenzbereichen f^-^a und f-w-fp* -0^830 Spannung wird über den rechten Teil der Schaltung zur Steuerung der Verschiebung der Grenze f verwendet. Die Spannung am Kondensator 82 wird mit dem Kondensator 84 integriert und die integrierte Spannung gelangt auf die Klemme 22 der Fig. 2. Die Veränderung der Spannung an der Klemmen 22 bewirkt eine entsprechende Veränderung der Zeitkonstanten der Frequenzgrenzenschaltung,d.h. die Zeit tp wird verändert. Die Polarität des Ausgangssignals der Fig. 8 ist so gewählt, daß eine steigende integrierte Spannung am Kondensator 84· die Zeitkonstante der Schaltung nach Fig. 2 verkleinert und umgekehrt. In der Anordnung nach Fig. 1 ist nur eine Frequenzgrenzenschaltung, die ^2 erzeugt, für beide Kanäle vorgesehen. Unter diesen Umständen ergibt Jedes Ansteigen in einem Frequenzbereich ein entsprechendes Absinken im anderen Frequenzbereich. Wenn für tp zwei Frequenzschaltungen vorgesehen sind (t und t, entsprechen f und f^), dann ist es möglich, jede Frequenzgrenze unabhängig von der anderen zu verschieben.
109821/0681
Es kann erforderlich sein, daß eine Frequenzgrenze nur in einer Richtung verschoben werden muß. In diesem Falle wird die Schaltung nach Fig. 8 durch eine Diode 85, die gestrichelt dargestellt ist, verändert. Die Durchlaßrichtung dieser Diode bestimmt, in welcher Richtung sich die Grenze nicht verschieben ' darf, indem die entsprechende Spannung 83-abge vom Kondensator abgehalten wird.
Ein anderer Vorteil der Schaltung nach Fig. 8 ist darin zu sehen, daß die Spannung, die an die Klemme 8? über den Widerstand 88 gegeben wird, eine Grundstellung für f ergibt.
el
Eine Änderung dieser Spannung ändert die Grundposition von f und auf diese Weise ergibt sich einfach die Möglichkeit, die Schaltung auf verschiedene Sprecher, ζ.B. männliche und weibliche, einzustellen. Diese Einstellung kann vom Sprecher selbst vorgenommen werden. Manchmal kann es vorkommen, daß bei Lautübergängen einer ein Signal mit niederer Amplitude,verglichen mit den anderen Lauten, ist und deshalb nicht erkannt wird. Wenn z.B. in der Folge β/., 3p und wieder s* , S2 eine niedere Amplitude verglichen mit Sx, hat, könnte Sp nicht erkannt werden. Diese Schwierigkeit kann umgangen werden, wenn man den Bezugspegel der integrierenden Differenzschaltungen 6,7 entsprechend dem Pegel der einzelnen erkannten Muster stetig einstellt. Wird beispielsweise ein Ausgangssignal mit hoher Amplitude im Bereich t^, - ^2 erkannt, dann wird der Bezugspegel der Schaltung 7 mittels der Schaltung 6 erhöht, wodurch es leichter ist, für das Ausgangssignal mit niederen Pegel im Bereich tp - t,, dass ein Ausgangssignal von der Schaltung 7 erzeugt wird. Die Schaltung hierzu ist in Fig. 9 gezeigt. Der Kondensator 41 entspricht dem Kondensator in der Schaltung nach Fig. 4 und der Kondensator 9I dem Kondensator der Schaltung 7 nach Fig». 1. Die beiden Kondensatoren 4-1 und 91 sind über einen Emitterfolger 92, eine Diode 93» eine Zenerdiode und einen Widerstand 95 verbunden. Ist die Amplitude des (t^.- t2) Ausgangssignals groß, dann wird die höhere Ladung am Kondensator 41 dazu benützt, die Ladung am Kondensator
109821/0681
ISE/Reg. 3909 - 12 -
zu erhöhen, wodurch die Bezugs spannung zur Schaltung 7 "beeinflußt wird. Jede weitere zusätzliche Ladung, die über die Eingangsklemmen der Schaltung 7 hinzugefügt wird, hat eine größere Ge samt ladung des Kondensators 91 zur !Folge. Eine ähnliche Anordnung wird zur Beeinflussung der Bezugsspannung der Schaltung 6 verwendet, wenn das (to-tO Ausgangssignal groß ist. Die Geschwindigkeit und das Maß der Beeinflussung wird über die Bauteile 93» 94·» 95 gesteuert.
S Patentansprüche 5 Bl.Zeichn.,9 Fig.
109821/0681

Claims (6)

Patentansprüche
1. Verfahren zur Spracherkennung, "bei dem die Abstände der Nulldurchgänge der Sprachschwingung erfaßt und ausgewertet werden, dadurch gekennzeichnet, daß der dem möglichen Zeitbereich der Nulldurchgangsabstände entsprechende Frequenzbereich in zwei oder mehr den zu erkennenden Lautklassen zugeordnete Bereiche unterteilt wird, g.gß die aus diesen Bereichen gewonnenen Impulsfolgen je ein/Digitalfilter zugeführt werden, und daß deren Ausgangssignale je auf Einrichtungen zur Messung der Differenzen der Wiederholungsfrequenz gegeben werden und daß aus diesen Differenzen mittels einer Extremwertschaltung die Nulldurchgangsverteilung und damit der Laut ermittelt wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Aufteilung des Frequenzbereichs mehrere Verzögerungsglieder mit verschiedenen Zeitkonstanten dienen, wobei Je zwei der Verzögerungsglieder die untere und obere Grenze einer Zeitperiode bilden, innerhalb der ein folgender ETulldurchgang auftreten kann,
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, t daß die Einrichtungen zur Messung der Differenzen der
Wiederholungsfrequenz diese gewichten.
4-. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Ausgangssignale der Einrichtung ■zur Messung der Differenzen der Wiederholungsfrequenz integriert werden.
Ne/Sd
5.6.68
109821/0681
5· Verfahren nach Anspruch 1-4, dadurch gekennzeichnet, daß die Grenzen der Frequenzbereiche entsprechend der Bedeutung der Information in dem Bereich geändert werden.
6. Verfahr en nach -Anspruch 1-5» dadurch gekennzeichnet, daß die Schwellwerte für die einzelnen Frequenzbereiche relativ zueinander verändert werden, um die Erkennung von Signalen mit kleiner Amplitude zu ermöglichen.
109821/0681
DE19681772633 1967-06-23 1968-06-14 Verfahren zur Spracherkennung Pending DE1772633A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB29100/67A GB1180288A (en) 1967-06-23 1967-06-23 Analysing Complex Signal Waveforms

Publications (1)

Publication Number Publication Date
DE1772633A1 true DE1772633A1 (de) 1971-05-19

Family

ID=10286148

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19681772633 Pending DE1772633A1 (de) 1967-06-23 1968-06-14 Verfahren zur Spracherkennung

Country Status (5)

Country Link
US (1) US3530243A (de)
BE (1) BE728044A (de)
DE (1) DE1772633A1 (de)
FR (1) FR1572699A (de)
GB (1) GB1180288A (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1282641A (en) * 1969-05-14 1972-07-19 Thomas Patterson Speech encoding and decoding
US3740476A (en) * 1971-07-09 1973-06-19 Bell Telephone Labor Inc Speech signal pitch detector using prediction error data
US3732405A (en) * 1971-08-11 1973-05-08 Nasa Apparatus for statistical time-series analysis of electrical signals
DE2228069C3 (de) * 1972-06-09 1979-07-26 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und Einrichtung zur Unterdrückung von Störungen bei frequenzmodulierten Signalen
US4388495A (en) * 1981-05-01 1983-06-14 Interstate Electronics Corporation Speech recognition microcomputer
US4761815A (en) * 1981-05-01 1988-08-02 Figgie International, Inc. Speech recognition system based on word state duration and/or weight

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3344233A (en) * 1967-09-26 Method and apparatus for segmenting speech into phonemes
US3162808A (en) * 1959-09-18 1964-12-22 Kurt H Haase Wave form analyzing method for establishing fourier coefficients
US3278685A (en) * 1962-12-31 1966-10-11 Ibm Wave analyzing system
SE301673B (de) * 1963-05-08 1968-06-17 G Fant
GB1101723A (en) * 1964-01-31 1968-01-31 Nat Res Dev Improvements in or relating to correlation circuits
GB1012765A (en) * 1964-03-06 1965-12-08 Standard Telephones Cables Ltd Apparatus for the analysis of waveforms
US3394309A (en) * 1965-04-26 1968-07-23 Rca Corp Transient signal analyzer circuit

Also Published As

Publication number Publication date
FR1572699A (fr) 1969-06-27
BE728044A (fr) 1969-08-07
US3530243A (en) 1970-09-22
GB1180288A (en) 1970-02-04

Similar Documents

Publication Publication Date Title
DE3105758C2 (de) Vorrichtung zum Unterscheiden zwischen zwei Signalwerten
DE1472038A1 (de) Verfahren zur Spracherkennung
DE3236000A1 (de) Verfahren zum klassifizieren von audiosignalen
DE2524804A1 (de) Verfahren und vorrichtung zur automatischen spracherkennung
DE2710877A1 (de) Einbruch-alarmsystem
WO2020188054A1 (de) Vorrichtung zur analyse von strömen in einem elektrischen verbraucher und verbraucher mit einer derartigen vorrichtung
DE2825651C2 (de)
DE2355517C3 (de) Verfahren und Einrichtung zum Feststellen des Auftretens einer erwarteten digitalen Signalfolgeart
DE1572516A1 (de) Schaltungsanordnung fuer die Spracherkennung
DE1772633A1 (de) Verfahren zur Spracherkennung
DE2431458C2 (de) Verfahren und Anordnung zur automatischen Sprechererkennung
DE4428658A1 (de) Verfahren zur Erkennung von Signalen mittels Fuzzy-Klassifikation
DE2526852B1 (de) Schaltung zur erfassung der steigung einer brennspannungskurve
DE2915834A1 (de) Vorrichtung zum ueberwachen des betriebsverhaltens eines senders
DE2144537C3 (de) Meldeanlage
DE1954136C3 (de) Schaltungsanordnung zur Überwachung einer periodischen elektrischen Meßspannung vorgegebener Frequenz
DE3204607C2 (de)
DE2158985C3 (de) Einrichtung zur Regelung des Verstärkungsgrades eines Wechselspannungsverstärkers
DE2547746A1 (de) Vorrichtung mit einer messwertgeber-einheit zur erzeugung einer folge von spannungswerten und einer mittelwertbildungs-einheit
DE1797314C3 (de) Elektrische Schaltungsanordnung zur Bestimmung von Formanten in Sprachsignalen '
DE2334459C3 (de) Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung
DE2062589A1 (de) Verfahren zur Ermittlung der Grundfrequenz eines wenigstens zeitweise periodischen signals
DE2912264A1 (de) Verfahren und geraet zur phasenempfindlichen ermittlung
DE2601351C2 (de) Verfahren zur Unterdrückung von Signalteilen mit zu kleiner Amplitude sowie Vorrichtung zur Durchführung des Verfahrens
EP0143111A1 (de) Schaltungsanordnung eines Fensterkomparators mit Selbstkontrolle