DE2460757A1

DE2460757A1 - Datenverarbeitungssystem zur korrektur von bei der maschinellen zeichenerkennung aufgetretenen fehldeutungen

Info

Publication number: DE2460757A1
Application number: DE19742460757
Authority: DE
Inventors: Geb Lyons Anne Marie Chaires; Geb Scheltes Jean Mari Ciconte; Allen Harold Ett; John Joseph Hilliard; Walter Steven Rosenbaum; Bollinger Geb Willis El Willis
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1974-04-10
Filing date: 1974-12-21
Publication date: 1975-10-23
Also published as: JPS50137037A; NL7503946A; IT1033223B; GB1454148A; FR2267590A1; JPS5521384B2; CA1062810A; BE824366A; DE2460757C2; FR2267590B1

Description

Aktenzeichen der Anmelderin: WA 973 006

Datenverarbeitungssystem zur Korrektur von bei der maschinellen Zeichenerkennung aufgetretenen Fehldeutungen.

Die bisher bekannten Zeichenerkennungsmaschinen haben typischerweise zwei Hauptarten von Fehldeutungen: Substitution und Segmentierung. Die Substution zeigt sich in zwei Weisen. Die erste ist eine Zeichensubstitution, in der die Erkennungseinheit die Videoinformation eines einzelnen Zeichens aufgenommen hat, die zur alphabetischen Bestimmung erforderlichen Merkmale jedoch als ein anderes Zeichen erkannt werden. Das kann natürlich passieren, wenn ein gewisser Grad von Ähnlichkeit in der Form der entsprechenden betroffenen alphabetischen Zeichen besteht, wie z.B. bei folgenden Zeichenkombinationen: B, D; D, 0; 0, C; 1, i usw. Die zweite Form !der Substitutionserkennung ist die Zeichenzurückweisung. Wie bei der Zeichensubstitution nimmt die Erkennungseinheit ein einzelnes Zeichen auf. Die Zurückweisung erfolgt jedoch, weil die Erkennungsilogik auf kein Zeichen Bezug nehmen kann oder weil mehr als ein Satz alphabetischer Bestimmungskriterien durch die isolierten jZeichenmerkmale erfüllt sind. Diese Bedingung wird ZeichenzurückT jweisung genannt. Bisher waren Geräte zur Auswahl der. richtigen Form eines durch eine optische Zeichenerkennungseinheit (OZE) falsch gelesenen verstümmelten Eingabewortes beschränkt auf die Korrektur von Fehlern bei Substitutions-Fehlerkennung. Zu* Verbesserung der Leistung eines optischen Zeichenlesers zeigt die Technik bisher die Verwendung bedingter Wahrscheinlichkeiten für die einfache Substitution eines Zeichens durch ein anderes oder eine Zeichenzurückweisung, zur Berechnung einer gesamten bedingten Wahrscheinlichkeit, daß das Eingabewort von der qptischen Zeichen-

5098U/0565

2480757

erkennungseinheit falsch gelesen wurde, vorausgesetzt, daß ein vorbestimmtes Wort aus dem Wörterbuch tatsächlich von der OZE abgefühlt wurde. Bisher befaßt sich die Technik jedoch nur mit der einfachen Substitution von Verwechselungspaaren, die die- : selbe entsprechende Stelle in dem von der OZE gelesenen Wort und

im Wörterbuchwort einnehmen. Das OZE-Wort und das Wörterbuchwort i
i müssen dieselbe Länge haben. Das Problem der Fehlerkennung durch

' falsche Segmentierung des optischen Zeichenlesers wurde bisher ■ nicht erkannt oder behandelt.

' Die Segmentierungs-Fehlerkennung unterscheidet sich von der einfa-I chen Substitution dadurch, daß ihre unabhängigen Ereignisse Gruppen von mindestens zwei Zeichen entsprechen. Nominell gibt es drei Arten von Segmentierungsfehlern: horizontale SpaltungsSegmentierung, Verkettüngs- oder Zusammenziehungs-Segmentierung und Hau- ; fungs-Segmentierung. Der zugrundeliegende mechanische Faktor, der allen oben genannten Segmentierungsarten gemeinsam ist, ist ihre Erzeugung durch die ungenaue Darstellung der Zeichenanfangs- und Endpunkte. Segmentierungsfehler treten sehr häufig in dem Ausgabedatenstrom der OZE auf und bilden ein wesentliches Hindernis bei ι der Genauigkeit der Textverarbeitung. :

Der Erfindung liegt die Aufgabe zugrunde, die Auswahl der richti- ! gen Form eines bei der maschinellen Zeichenerkennung verstümmelten Wortes aufgrund einer Analyse bedingter Wahrscheinlichkeits- ! werte zu verbessern, auch wenn die Anzahl der Zeilen des verstüm- j meIten Wortes aufgrund der Zeichenspaütung oder Zeichenzusammenziel hung sich gegenüber der richtigen Form verändert hat. !

Diese Aufgabe wird durch die in den Patentansprüchen definierte Erfindung gelöst.

Ausführungsbeispiele der Erfindung werden anschließend in Verbindung mit den Zeichnungen näher beschrieben, von denen zeigen:

· 1

das Grundschema der Segmentierungsbehandlung,

973 006 5 0 9 8 4 3 / 0 5 8 S

Fig. 2 eine Videoabtastung eines Zeichenpaares, die zu

einer Häufungs-Segmentierung führen kann, :

Fiq. 3 in einem detaillierten Blockschaltbild das Gerät I

• I zur Korrektur von OZE-Fehlern mit der größten

Wahrscheinlichkeit des regionalen Zusammenhanges,

Fig. 4 ein genaueres Blockschaltbild der Verschiebesteuerung 20 j

Fig. 5 ein genaueres Blockschaltbild des Multiplexers 94

Fig. 6 ein genaueres Blockschaltbild des Multiplexers

96

Fig. 7 ein genaueres Blockschaltbild des Multiplexer-

Taktgebers 108

Fig. 8 ein genaueres Blockschaltbild des Multiplexers

128 und

: Fig. 9 ein genaueres Blockschaltbild der Verschiebebefehls-Einheit 162.

! Theorie:

Die Fehlerkorrektur nach der Technik der größten Wahrscheinlichkeit für den regionalen Zusammenhang erfolgt durch eine Analyse der bedingten Wahrscheinlichkeit. Diese Lösung wertet die Wahrscheinlichkeit aus, daß jedes Glied einer vorgegebenen Klasse von berücksichtigten Referenzwörtern durch die Neigungen OZE zu Segmentierungsfehlern in die Reihe der verstümmelten Zeichen aufgenommen worden sein kann. Die Substanz der Wahrscheinlichkeitsanalyse bedeutet physikalisch die Berechnung eines analogen Ab- j Standes zwischen einem Bezugswort und den verstümmelten Daten, gej wichtet durch die a priori-Wahrscheinlichkeit, daß das Bezugswortj

973 006 509843/ΟΒδδ ' ■

in den von der OZE abgetasteten Alphafeldern aufgetreten ist. Mathematisch wird diese Analyse durch die folgende Aussage für die bedingte Wahrscheinlichkeit formuliert;

P (Referenzwort/verstümmelte Alphareihe) =

P(Referenζwort, verstümmelte Alphareihe) ,,» P (verstümmelte Alphareihe)

Der Nenner der obigen Gleichung (1) ist im wesentlichen ein Μαβί Stabsfaktor und hat denselben Wert für alle mit der verstümmelten ! Alphareihe verglichenen Eintragungen. Die relative Rangfolge j einer jeden Eintragung (d.h. die Wahrscheinlichkeit eines jeden j Bezugswortes in der verstümmelten Alphareihe) basiert somit auf ; dem in der Gleichung (2) sich ergebenden Zähler. Für den Rest der \ vorliegenden Fehlerkorrekturanalyse brauchen wir uns also nur da- ! mit zu befassen, was den Zähler sehr groß macht. Wendet man den ι Satz von Bayes an, kann der Zähler in Gleichung 1 neu formuliert ! werden als:

P(Referenzwort, verstümmelte Alphareihe) = P(verstümmelte Alphareihe Referenzwort). P(Referenzwort). (2)

Der Wahrscheinlichkeitsfaktor:

P(Referenzwort) wird die a priori-Wahrscheinlichkeit des Ereignisses genannt. In diesem Fall ist es die Wahrscheinlichkeit, daß, das mit der verstümmelten Zeichenreihe verglichene Referenzwort in den abgetasteten Textdaten erscheinen würde. Die a priori-Wahr-fscheinlichkeiten, bezogen auf das Auftreten eines Wortes in den abgefühlten Textdaten ist eine Funktion generischer Form des Gegenstandes, auf den sie sich bezieht. Obwohl diese a priori-Wahr* scheinlichkeiten empirisch bestimmt werden, wird ihr Wert für all gemeine Textverarbeitung als über allen Wörtern gleichmäßig für i eine erste Annäherung betrachtet. Für die allgemeine Textverarbeijtung wird also der a priori-Ausdruck in Gleichung 2 fallen gelas-| sen. Bei Anwendungen im Postdienst können die a priori-Wahr- j scheinlichkeiten, bezogen auf jede Eintragung im Verzeichnis, ] WA "973-006 509843/0585

■i — 5 ""

! ihre Erscheinungshäufigkeit im nationalen Postleitzahlverzeich-'nis sein. Eine genauere und richtige Berechnung würde erfolgen ! unter Verwendung einer Datenbasis, bei der die Erscheinungswahri scheinlichkeit des Referenzwortes abhängt vom tatsächlichen Um-

; fang der Poststücke.

Der Wahrscheinlichkeitsfaktor:

P(Verzeichniseintragung, verstümmelte Alphareihe) (3)

I wird die Wahrscheinlichkeit genannt. Der größere Rechenaufwand j des Fehlerkorrekturverfahrens nach der größten Wahrscheinlichkeit

im regionalen Zusammenhang zentriert sich um die Auswertung die-I ses Ausdruckes.

i Bei der Auswertung des Wahrscheinlichkeitsfaktors müssen in einer : Wahrscheinlichkeitsform Neigungen zum Falschlesen bei der OZE er- [ faßt werden. Das bedingte Format der Gleichung (3) setzt die ] Wahrscheinlichkeit als: "Wie groß ist bei einem gegebenen Refei renzwort die Wahrscheinlichkeit dafür, daß die Neigungen der OZE zum Falschlesen dieses Wort in die verstümmelte Alphareihe eingeordnet haben?". Da die OZE ein Alphafeld auf der Basis einzelner Zeichen liest, (d.h. sie erkennt nicht direkt Wörter als j einzelne Einheiten), ist die Gleichung 3 bereits das Produkt J. einer Reihe unabhängiger wahrscheinlicher Ereignisse. Unter die-I ser Perspektive gibt es jetzt zwei Kategorien von Fehlerkennungen, die angesprochen werden müssen, nämlich:

a) Substitution

b) Segmentierung.

Analyse der Substitution aufgrund der größten Wahrscheinlichkeit

Die Substitution bei der OZE zeigt sich in zwei Arten. Die erste Art ist Zeichensubstitution. Dazu gehört, daß die Erkennungseinheit das Videosignal eines einzelnen Zeichens erfaßt hat, die zur alphabetischen Bestimmung benötigten Merkmale werden jedoch als ein anderes Zeichen ausgelegt. Das kann logischerweise nur

973 006 5098 A3/0565

!auftreten, wenn es einen gewissen Grad der Ähnlichkeit in den Formen der entsprechenden alphabetischen Zeichen gibt. Beispiele solcher Buchstabenkombination sind:

IB, D; D, O; 0, C; 1, i; usw. Die zweite Form des Substitutions- !verfahrene ist die Zeichenzurückweisung. Wie bei der Zeichensubstijtution erfaßt die Erkennungseinheit ein einzelnes Zeichen. Es er-Ifolgt jedoch eine Zurückweisung, weil die Erkennungseinheit keine Beziehung zu irgendeinem Zeichen herstellen kann oder weil mehr als ein Bedingungssatz der Alphabestimmungslogik durch die isolierten Zeichenmerkmale erfüllt ist. Diese allgemeine Situation > bezeichnet man als Zeichenzurückweisung. In der vorliegenden Be- ;Schreibung sind alle Zurückweisungen mit einem Sternzeichen gekennzeichnet (*) .

Vom Standpunkt der Wahrscheinlichkeit aus können beide oben er- ; wähnten Fehlleseeffekte als einfache unabhängige bedingte Wahrscheinlichkeiten dargestellt werden. Zeichensubstitution und ! Zurückweisungssubstitution wurden daher in die Gleichung 3 eingehen als: j

L₁) W j

Sie stellen die Wahrscheinlichkeit dar, daß das Alphazeichen L. bei der OZE abgetastet wird und daß L. oder* ausgegeben würden. Diese Wahrscheinlichkeitsdaten werden aus einer Zeichenkonfusionsmatrix abgeleitet und in einem Speicher vorgespeichert, wobei keine Berechnungszeit benötigt wird. Die Zeichenkonfusionsstatistik kann für Großschrift- und Kleinschrift-Alphabetzeichen separat zusammengestellt werden.

Beispiel 1 zeigt, wie Gleichungen der Form 4 und 5 auf den in der Erfindung verwendeten Entscheidungsprozeß nach Bayes.angewandt werden können. Das verstümmelte Wort ist CDRNIiAKL und die Eingabe aus der vorbestimmten Klasse von Referenzwörtern, die geprüft wird, ist CORNWALL. Der Wahrscheinlichkeitsfaktor ist gegeben durch die Wahrscheinlichkeitsserie unabhängiger Ereignisse nach

973 006 509843/0585

Darstellung im Beispiel 1.

Der.Wahrscheinlichkeitsfaktor ist somit das Produkt einer Anzahl Von unabhängigen Zeichenkonfusionswahrscheinlichkeiten, das sich in einem relativen Wert ergibt, der mit dem Wert verglichen wer- · iden kann, der durch jedes der anderen geprüften Wörter erzeugt wird. Das Referenzwort, welches mit größter Wahrscheinlichkeit das Originalwort ist, wird gewählt unter der Voraussetzung, daß

^es bestimmte vernünftige Kriterien erfüllt. Beispiel 1:

verstümmeltes Wort = CDRNWL L
- Referenzwort = CORNWALL

: Wahrscheinlxchkeitsfaktor = P(CORNWALL CDRNWA L α ί P₀(ClC)P^ (DlO)P_n (R[R)P_n (NiN) P (*|l)P (LJL)

Analyse der größten Wahrscheinlichkeit der Segmentierung

Die Segmentierung unterscheidet sich von der Substitution da-,durch, daß ihre unabhängigen Ereignisse den Gruppierungen von min- :destens zwei Zeichen entsprechen. Nominal gibt es drei Arten ivon Segmentierungsfehlern, nämlich:

i a) Horizontale Spaltungs-Segmentierung

I b) Zusammenziehungs-Segmentierung ι c) Häufungs-Segmentierung

j Der zugrundeliegende mechanische Faktor, der allen erwähnten Sejgmentierungsarten gemeinsam ist, ist der Faktor, daß sie durch die falsche Entscheidung von Zeichenanfangs-· und Zeichenendpunkt erzeugt werden.

Horizontale Spaltungs-Segmentierung (HSS)

Die horizontale Spaltungssegmentierung (HSS) neigt dazu, bei brei-

973 006 509843/0B65

-δι

ten Großbuchstaben wie W, M, N, U, O und e aufzutreten. Der HSS-Effekt entsteht, wenn die Erkennungseinheit irregeführt wird und ; eines dieser Zeichen in zwei Teile teilt. Jeder Teil wird wieder- !

um durch die Erkennungslogik als legitimes Zeichen betrachtet. j Das führt zu verschiedenen Mustern von Zeichen und/oder Stern-Feh-j lerkennungen. Einige der gebräuchlichsten Formen sind in der nach-j folgenden Tabelle 1 aufgeführt.

TABELLE I

Horizontale Spaltungs-Segmentierung IH OD

PL OE

H PI OK

*I 0 OS

0*

ME OY MR

NN LI

N ü TI

M *C I*

M IW

IL NO NT

N R* RI TN *I

Vom Standpunkt der Wahrscheinlichkeit aus kann der vorstehende Lesefehlereffekt gelten als doppelter Fehlzuordnungseffekt, bedingt durch das Auftreten eines Satzes der oben angeführten

50984370565

— Q —

Großbuchstaben. Funktionell wird das wie folgt dargestellt:

j - ^Pc^(Lj^Lj₊ll^Li⁾ (5)

j Die Auswertung der Gleichung 1 wird offensichtlich komplizierter, wenn der HSS-Effekt berücksichtigt werden muß. Die Steuerlogik für die Berechnung muß drei mögliche Bedingungen berücksichtigen, j wenn eines der zur Segmentierung neigenden Zeichen -L₁ - auf-' tritt. Diese sind: ^seg

a) L. erzeugt einen einfachen Substitütionseffekt der FoIm?

seg

b)	^Li	seg ^wurde	(L,	falsch	seg	seg	segmentiert	und	erzeugt	den HSS-Ef
	fekt	der Form:	richtig
	^Pc	iVil^L	). seg				(8)
c)	^Li	wurde seg	erkannt und	wie	folgt	ausgegeben:
	^Pc	(Lj

Das Vorhandensein dieser letzten Möglichkeit richtig zu unterscheiden, ist besonders schwierig, da die häufigste Art der Zeichen HSS sich selbst und ein weiteres unechtes Zeichen wieder erzeugt.

Die analytischen Einzelheiten des Einschlusses der HSS in die Auswertung des Wahrscheinlichkeitsfaktors (Gleichung 3) verzögert, bis sie in Verbindung mit dem anschließend zu beschreibenden Zusammenziehungs-Segmentierungsfehler ausgearbeitet werden kann.

50984370565

. /0

Zusammenziehungssegmentierung (ZS)

Die Zusammenziehungssegmentierung kann als eine Art Spiegelbild der HSS angesehen werden. Sie tritt hauptsächlich bei dicht zusanH menstehenden Kleinschriftzeichen auf. Mechanisch zeigt sich ZS_f wenn die Erkennungseinheit beim Abtasten das Vorhandensein zweier einzelner Zeichen nicht unterscheiden kann. Daher verarbeitet die OZE-Erkennungslogik die Zeichen weiter in einer logisch zusammengezogenen Art und Weise.

Dieser Effekt ist hauptsächlich zu beobachten, wenn Adreßdaten stilisiert geschrieben werden oder wenn Schreibmaschinenanschläge j dicht nebeneinander liegen. Die Tabelle II enthält die gebräuchlichsten zu Zusammenziehungen neigenden Buchstabenkombinationen.

In einer Wahrscheinlichkeitsformel kann das ZS-Ereignis ausgedrückt werden als:

V*^Li^Li₊i>

TABELLE II

Zusammenziehungssegmentierung br do en fr gu la ok or rv sa tn fr ir la mr or ra rg ro rs sa el en er es ne ue

e ja sa ta

a ck ch ei

c el kl la

e kl ra rt

m io jo or

WA 973 oof 509843/0565

¹ ο

^:· mr ok

i ^k

; ne

■! η '

j ry

j ' ■ ■ Υ

re

! ν

• dy

i ^d

j em

i ■ . ρ ■

^;Das zuletzt genannte Ereignis (11) kann bei der Auswertung der !Gleichung (3) besonders schwierig zu isolieren sein. Dies folgt j daraus, daß L. selbst eine starke Neigung dazu besitzt, unter die j Zurückweisungszeichen (Sternzeichen) eingeordnet zu werden und daher eine einfache Substitution anstelle einer ZS naheliegt.

;Weitere Auswertung des Wahrscheinlichkeitsfaktors ! Um eine wirksame und brauchbare Auswertungsmethode für die Wahr-I scheinlichkeitsfaktorgleichung (3) aufzubauen, muß die Gemeinsamkeit ihrer möglichen Bestandteile betont werden. Im wesentlichen wird jeder der möglichen Fremderkennungseffekte, die oben beschrieben wurden, festgelegt als eine Konfusions- oder Verwirrungs Wahrscheinlichkeit. Der einzige in der Analyse noch anzupassende jweitere Faktor ist der Umstand, daß im Gegensatz zu der in dem j Beispiel 1 gezeigten Behandlung der einfachen Substitution eine I Eins-zu-Eins-^Entsprechung zwischen den Zeichen in einem Referenz-

wort und einem verstümmelten Datenfeld nicht mehr streng gilt.

Das ergibt sich natürlich daraus, daß das Auftreten eines HSS-I Fehlers in einem Zeichen eines Wörterbuchwortes zwei Zeichen in ί verstümmelter Darstellung erzeugt. Die direkte Umkehrung gilt

■ für ZS-Fehler. In jeder der oben genannten Segmentierungsmöglichkeiten ist die Forderung enthalten, den Rest des verstümmelten

973 006 S0984 370B6

Fehlerwortes neu auszurichten, um den Zeichenfehlausrichtungseffekt zu kompensieren, der durch den Segmentierungsfehler auftrat.

Um ein wirksames und zuverlässiges Verfahren und ein Gerät zu entwickeln, welches die vorstehenden Überlegungen hinsichtlich der Segmentierung berücksichtigt bei der Auswertung des Wahr^ scheinlichkeitsfaktors, werden die Verfahren bei der Auswertung der Gleichung (3) um drei Neuerungen ergänzt. Diese Neuerungen sind:

a) Ausnahmezeichen-Kennzeichnung und Zeichenpaarkennzeichnung.

b) Strukturierung der Wahrscheinlichkeitsauswertung von rechts

nach links.

c) Benutzung des regionalen Zusammenhanges.

Ausnahmezeichen- und Zeichenpaar-Kennzeichnung Es gibt ungefähr ein halbes Dutzend Zeichen, die zu HSS neigen, und etwa ein Dutzend Zeichenpaare, die zu ZS neigen. Diese Zeichen bilden an sich nur einen kleinen Teil des Alpha-Satzes der Klasse von Referenzwörtern. Wenn kein Kennzeichen auftritt, läuft die Analyse des Wahrscheinlichkeitsfaktors ab, als ob eine einfache Zeichensubstitution der einzige zu berücksichtigende Verstümmelungsfaktor wäre. Nur wenn ein Kennzeichen auftritt, werden die booleschen Verknüpfungen iur Behandlung möglicher Segmentierungs-Ereignisse aus.

Sonderzeichen können in jedes Wort eingesetzt werden, wo zu Segmentierungsfehlern neigende Zeichen oder Zeichenpaare auftreten. Das hat jedoch den Nachteil, daß die durchschnittliche Wortlänge erhöht und die Kompaktheit des Bezugswörterbuches zerstört wird, was für den E/A-Wirkungsgrad wichtig ist. Um die Kennzeichnung durchführen und die Speicherforderungen erfüllen zu können, wird somit eine besondere Alphazeichenspeicherung vereinbart. Jedes Alphazeichen wird mit nur fünf der normalerweise zum Speichern eines Zeichens benutzten 8 Bits gespeichert. Die verbleibenden

WA 973 006 509843/0565

♦ η*

drei Bits werden dann für die 8 Kombinationen eines Kennzeichencodes benutzt, wobei zwei dieser Bits entsprechend den HSS-Zeichenpaaren und ZS-Zeichenpaaren zugeordnet werden.

Bezeichnet man zur Illustration den HSS-Code mit "i" und den

ZS-Code mit "?"-, dann würde das Wort "Walston¹¹, welches sowohl HSS-Vorgänge als auch ZS-Vorgänge enthält, im Wörterbuch gespeichert als:

W! A L S T? O Ni

Strukturierung der Wahrscheinlichkeitsauswertung von rechts nach links '

Der Wahrscheinlichkeitsfaktor ist ein multiplikativer Ausdruck und somit assoziativ. Seine Auswertung kann von rechts nach links sowie von links nach rechts erfolgen. Im Beispiel 1 erfolgte das Vorrücken von links nach rechts, der Blickrichtung des menschlichen Lesers. Die OZE andererseits erkennt und verarbeitet Zeichen im allgemeinen von rechts nach links.

Es scheint, daß die Stabilität der Wahrscheinlichkeitsfaktoranalyse verbessert wird, wenn ihre Auswertung von rechts nach links erfolgt. Dadurch sollen andere Formate des Vorrückers längs des Wortes nicht ausgeschlossen, sondern nur eine Betriebsart ge zeigt werden, die bei den vorliegenden Anwendungen Vorteile verspricht. Das folgt daraus, daß sie die Darstellung der unabhängigen Ereignisse in derselben Reihenfolge der Analyse entwickeln läßt und eine Perspektive schafft, die zur Analyse von Reihen zur Segmentierung neigender Zeichen besser geeignet ist. Außerdem läßt sich eine genaue Anfangsausrichtung der verstümmelten Daten und der Wörterbucheintragungen leichter erreichen, wenn die Paarung von rechts beginnt und nach links weiterläuft. Der irreführende Effekt eines zusätzlichen Zeichens am Anfang des Adreßfeldes aufgrund starker linker Kanteneffekte eines Großschriftzeichens in der ersten Position wird umgangen. Dadurch wird die Möglichkeit vergrößert, solche unkontrolliert auftreten-

973 006 509843/0685

den Zeichen zu isolieren und ihre Fehlerkorrektur in einer ad hoc-Manier zu adressieren.
Benutzung regionalen Zusammenhanges

Der Vereinheitlichungsfaktor, der eine wirksame Anpassung von HSS und ZS an die Wahrscheinlichkeitsfaktorberechnung gestattet, ist der "regionale Zusammenhang".

Wenn ein Alphazeichen in einer Wörterbucheintragung nicht hinter einem Kennzeichen steht, wird angenommen, daß es in die Wahrscheinlichkeitsfaktoranalyse eingeht als ein Ereignis der Form P (L. |l.), worin i=j zu den Möglichkeiten gehört. Das bedeutet, daß nur die Möglichkeit der einfachen Substitution angenommen wird. Wenn in der Wörterbucheintragung ein Kennzeichen auftritt, dann muß die zum Wahrscheinlichkeitsfaktor gehörende Analyse außer der einfachen Substitution die Möglichkeit der Segmentierung adressieren oder ansprechen. Der regionale Zusammenhang geht jetzt wie folgt ein:

Angenommen, das Kennzeichen zeigt die Möglichkeit der HSS an. An diesem Punkt gibt es, wie bereits gesagt, drei Möglichkeiten. Diese sind:

(1 und 2): P (L.Il. ), worin j = i eingeschlossen ist. ^c ³ ^eg ^seg

Um mit der Auswertung des Wahrscheinlichkeitsfaktors fortzufahren, muß eine Entscheidung zwischen den Ereignissen 1 und 2 und dem bei 3 eingesetzten HSS-Ereignis getroffen werden. Der Entscheidungsmechanismus beruht auf der Anwendung des regionalen Zu sammenhanges .

Wenn die Bedingung 3 wahr ist, dann muß der Rest der verstümmelten Zeichenreihe um eine Position nach rechts ausgerichtet werden. Dadurch wird die existierende Entsprechungsbeziehung zwi

973 ooe ' S 0 S 8 4 3 / 0 5 8 8

sehen den Zeichen der verstümmelten Alphareihe und dem Referenzwort verändert.

Die Änderung oder Verschiebung im "benachbarten Zusammenhang" wird ausgedrückt in den Wahrscheinlichkeitsfaktor-Bestandteilen wie:

c · i+1 i c j+2' i+1

3 ^J seg

Wenn die Bedingung 1 oder 2 richtig ist, ist der "benachbarte Zusammenhang" nicht verteilt und die Wahrscheinlichkeitsfaktorbestandteile, die denen in Gleichung 12 entsprechen, sind:

TABiELLE III P (WA3/*CL*JWIALST?ON!)

Ausnahmelogik Wahrscheinlichkeitsfaktorauswertung

Entscheidung 1:

Bestimme, ob eine mögliche HSS

bei "N" auftrat.
A - P_c(l*|N)P_c(C|O)

gegen
B-P_CC*|N)P_C(1|O)

Nimm an, es gelte A,
(d.h. P (l|O) ist ein unmögliches Ereignis) P (1* |n)P (C|O)

Entscheidung 2:

Bestimme, ob eine mögliche
ZS auftrat bei "ST"
A - P. C* |ST)P (1|L)

gegen
B - P_c(

Nimm an, es gelte A,
(d.h. P (IIS) ist ein unmögliche» Ereignis P (F |N)P (C IO)P (*|ST)

WA 973 006 5098 43/0 565

Entscheidung 3:

Bestimme, ob eine mögliche HSS bei "W" auftrat
P (Leerschritt,w|w) ist ein un-

mögliches Ereignis

P_c (W |W) angenommen P_c(*|n)P_c(C |O)P_c(*|ST)

P_c(l|L)P_c(A|A)P_cW|W)

Die Entscheidung darüber, ob HSS vorliegt oder nicht, folgt dann durch diejenige Formulierung, Gleichung 12 oder 13, die den größeren Wahrscheinlichkeitswert ergibt.

Wenn ein Kennzeichen das Vorhandensein eines zu ZS neigenden Zeichenpaares anzeigt, dann würde in ähnlicher Weise durch:

(14)

zugehörige Bestandteile des Wahrscheinlichkeitsfaktors unter dieser Annahme festlegen. Dieser Ausdruck würde dann relativ ausgewertet zu:

VW · WiI¹W ⁽¹⁵⁾

welches das Fortschreiten der Auswertung des Wahrscheinlichkeitsfaktors ist, der vorliegt, wenn eine ZS-Fehllesung nicht vorhanden ist. Das Entscheidungskriterium basiert wie bei der HSS-Fehllesung auf den relativen Größen der entsprechenden Produkte in den Gleichungen 14 und 15.

Fig. 1 und Tabelle III zeigen weiter die Verwirklichung des "regionalen Zusammenhanges" bei der Korrektur von Segmentierungsfehlem. Fig. 1 zeigt schematisch den Grundmechanismus zur Behandlung der Spaltungssegmentierung für das Wort CORNWALL. Tabelle III zeigt die schrittweise Auswertung des Wahrscheinlichkeitsfaktors entsprechend der Wörterbucheintragung "Walston", wo das von der OZE verstümmelte Wort die Form hatte "WAl CI ".

WA 973 006 50984 3/056

Häufungs-Segmentierung

Die Häufungs-Segmentierung (HÄS) unterscheidet sich von den Fehlertypen HSS und ZS dadurch, daß sie die Wortlänge nicht beeinflußt. Die ursächlichen Faktoren für die H&S sind Zeichenabstand und Nebeneinanderstellung von Zeichen. Ein möglicher HfiS-Vorgang tritt auf, wenn die Erkennungseinheit zwei Zeichen isoliert, deren dichte Nachbarschaft die OZE zu einer Fehlzuordnung ihres Segmentierungspunktes veranlaßt. Dadurch werden effektiv Teile eines Zeichens in die Videodarstellung des anderen hineingemischt. Ein falsches Lesen ergibt sich, wenn die Hinzufügung eines benachbarten Zeichensegmentes:

a) eine Zusammensetzung schafft, die die Erkennungslogik eines anderen Zeichens ansprechen läßt,

b) sich mit der Erkennungsanalyse überschneidet und zu einer Zurückweisungausgabe (4) führt.

Die vorhergehende Entscheidung bezog sich auf die Videomechanik, die ein HÄS-Segmentierungsereignis herausbrachte. Der die rieh- " tige Erkennung außer Kraft setzende typographische Faktor hinter der HÄS ist die Zeichenform. Nur relativ wenige der 676 möglichen Diagramme neigen dazu, einen Druckhäufungseffekt zu einer Zeichenfehlerkennung der oben beschriebenen Art aufzubauschen. Ein Beispiel eines solchen Zeichenpaares und die Entwicklung eines HÄS-Ereignisses ist in Fig. 2 gezeigt, wo das "re"-Diagramm zu einer Kombination "n*" führt. Dabei ist zu beachten, daß sich das beobachtete Videosignal nicht ergeben hätte, wenn das vorliegende Diagramm "er" oder "ri" gewesen wäre.

Die auf die HÄS-Ereignisse bezogenen Konfusionsdaten können entsprechend quantifiziert werden in der Form;

Die Auswertung des Wahrscheinlichkeitsfaktors in der Gl@iehung

(3) folgt, indem zuerst die möglicherweise zu HlS κ·Ι,§·*&1@8β Buch-

WA 973 006 - - 509843/0585

stabendarstellungen in den Wörterbucheintragungen durch ein Sonderzeichen bezeichnet werden. Die weitere Auswertung berücksichtigt an diesem Punkt dann zwei Möglichkeiten:

^Pc<^Lj₊li^Lifl>^Pc^(Lj|^Li> gegen

Da im Gegenssatz zur HSS- und ZS-Auswertung keine Änderungen der Zeichenreihenlänge berücksichtigt werden müssen, folgt die Wahl der Behandlungs- und Einschlußart der Darstellung ^L4₊₁ ^Li ⁱⁿ der Wahrscheinlichkeitsberechnung aus einer Bestimmung, welche der Äusdrucksgleichungen (17) oder (18) die größere Wahrscheinlich|- keit ergibt.

Möglichkeiten zur Herabsetzung der Geräteforderungen

Das regionale Zusamraenhangsverfahren muß unter Echtzeitbeschränkungen durchgeführt werden. Eine weitere wesentliche Herabsetzung der Rechenforderungen ergibt sich durch Anhängen eines Wörterbuchkandidaten- iebprozesses an das Fehlerkorrektur-Grundverfahren

Das Paket logischer Abfrageprozesse umfaßt:

a) Gut/Schlecht-Schwellwertbildung

b) vorzeitiger Beendigungsschwellwert.

Gut/Schlecht-Schwellwertbi!dung

Die Gut/Schlecht-Schwellwer'tbildung erreicht eine wesentliche Reduzierung der durch die Fehlerkorrekturfunktion auszuführenden Berechnungen durch Beendigung der Berücksichtigung einer Wörterbucheintragung, sobald ihr Wahrscheinlichkeitsfaktor unter eine festgelegte Toleranz des größten in der Analyse erzielten Wahrscheinlichkeitsfaktors fällt. Der Wahrscheinlislikeitsfaktor in

!öl §73 036

der Gleichung (3) mißt bekanntlich das Ausmaß der Übereinstimmung oder Nichtübereinstimmung zwischen einem verstümmelten Wort und ; einer abgerufenen Wörterbucheintragung. Das Auswertungsformat der : Wahrscheinlichkeit neigt natürlicherweise von sich aus zu dieser : Art der Schwellwertbildung. Es wird ausgewertet als eine Reihe von j Multiplikationen von Konfusionswahrscheinlichkeiten (Werte zwi- ;sehen O und kleiner als 1).

j Wie bei jeder multiplikativen Reihe von Ausdrücken kleiner als

i 1 setzt jede folgende Multiplikation den Wert des existierenden iProduktes herunter.

; Der normale Toleranzpegel wird mit der größten Wahrscheinlichkeit j angenommen, die bis dahin in der Analyse errechnet wurde. Die Be-• nutzung dieses Schwellwertkriteriums setzt die Berechnungen nennenswert herab,

■ Es folgt ein praktisches Beispiel der Gut/Schlecht-Schwellwertbildung. Nimmt man an, daß sich bis dahin in der Analyse ein Wahrscheinlichkeitsfaktor von 80% ergeben hat, dann beträgt der Toleranzpegel 16%, wenn man einen 10-prozentigen Paktor annimmt. Damit die Fehlerkorrekturroutine weiterlaufen kann, muß die Berücksichtigung aller künftigen Eintragungen einen Wahrscheinlichkeitswert von mindestens 72% aufweisen. Die meisten Wörterbucheintragungen zeigen eine ausreichende Unverträglichkeit innerhalb eines von zwei Zeichen, um unter die Toleranzgrenze zu fallen und werden daher beendet.

Vorzeitige Beendigungsschwelle

Diese Schwellwertoperation ist bezogen auf die Gut/Schlecht-Schwelle, der Brennpunkt liegt jedoch auf dem anderen Ende des Wahrscheinlichkeitsspektrums, Die Operation gestattet das Beenden eines in Betracht gezogenen Wörterbuchwortes, sobald es unter ein« akzeptable Mindestschwelle für die Wahrscheinlichkeit fällt. Ihr Wert ergibt sich aus der Tatsche, daß ein Wahrscheinlichkeitsfaktor errechnet werden kann, ungeachtet dessen,wie unähnlich ein

^WA973006 609 8U/Ö567

verstümmeltes Wort und ein Wort aus dem Wörterbuch sind. Solch eine Wahrscheinlichkeitsberechnung läuft jedoch sehr schnell gegen null. Setzt man eine untere Grenze für den annehmbaren Wahrscheinlichkeitswert, kann der Vergleich Ausdruck für Ausdruck eines nur zufällig angezogenen Wortes aus dem Wörterbuch vorzeitig beendet werden, sobald das Vergleichsergebnis unter den Schwellenwert fällt.

Obwohl die Besprechung und Analyse bezogen auf die Auswertung des Wahrscheinlichkeitsfaktors in einer Reihe von Multiplikationsoperationen ausgedrückt wurden, können sie auch als Addition von vorgespeicherten ogarithmisehen Werten von Wahrscheinlichkeiten verwirklicht werden.

Es wird jetzt ein Datenverarbeitungssystem geschrieben zur Auswahl der richtigen Form eines verstümmelten Eingabewortes, das durch einen optischen Zeichenleser so falsch gelesen wurde, daß die Anzahl der Zeichen im Wort durch Spaltung oder Zusammenziehung von Zeichen verändert wurde. Wörterbuchwörter werden im System gespeichert und enthalten Zeichen, die für ihre Neigung zur Teilung oder Zusammenziehung durch falsches Lesen des optischen Zeichenerkennungsgerätes gekennzeichnet sind. Das OZE-Wort und ein Wörterbuchwort werden in zwei Schieberegister geladen, die ihre Buchstaben an einem Ende ausrichten. Die Zeichen des Wortes aus dem Wörterbuch werden dann auf Pehlerneigungskennzeichen hin untersucht. Wenn z.B. für ein Zeichen ein Kennzeichen für Spaltungsneigung gefunden wird, werden vom Speicher besondere Werte für bedingte Wahrscheinlichkeiten angesprochen und eine Berechnung der Wahrscheinlichkeit durchgeführt, daß das erste Zeichen des Wörterbuchwortes durch die OZE zu dem ersten und zweiten Zeichen des OZE-Wortes aufgespalten wurde. Diese Wahrscheinlichkeit für regionalen Zusammenhang wird verglichen mit der Wahrscheinlichkeit eine einfachen Substitutionsfehlers für die Zeichen. Wenn die Wahrscheinlichkeit für die Segmentierung größer ist, werden die OZE-Zeichen im ersten Schieberegister um eine Stelle relativ zu den Zeichen des Wörterbuchwortes im zweiten Schieberegister verschoben sodaß nachfolgende zu vergleichende Zeichenpaare nichtig

WA 973 006 5 0 9 8 4 3/0565

men. Die größere errechnete Wahrscheinlichkeit wird in einem laufenden Produkt kombiniert. Dasjenige Wörterbuchwort mit dem größten laufenden Produkt wird vom System als die höchstwahrscheinlich richtige Form des verstümmelten OZE-Eingabewortes ausgegeben.

Fig. 3 zeigt in einem genauen Blockdiagramm das Gerät zur Korrektur von bei der OZE entstandener Fbhler aufgrund der größten Wahrscheinlichkeit des regionalen Zusammenhanges. Eine optische Zeichenerkennungseinheit OZE gibt auf die Leitung 2 eine Folge von alphabetischen und numerischen Zeichenfeldern aus, die von einem Text abgetastet wurden. Die Leitung 2 bildet die OZE-Eingabe zu dem in Fig. 3 gezeigten erfindungsgemäßen Gerät. Die OZE-Eingabeleitung 2 gibt die Folge alphabetischer und numerischer Zeichenfelder in den Worterkennungsdetektor 4, der Trennungsmarkierungen zwischen den Zeichenfeldern erkennt und die Felder als alphabetische und numerische Felder kennzeichnet. Numerische Felder werden vom Worttrennungsdetektor 4 über die Leitung 6 an das alphanumerische Ausgangsregister 8 und dann auf die Systemausgabeleitung 10 ausgegeben. Alphabetische Zeichenfelder werden vom Worttrennungsdetektor 4 über die Leitung 12 in das QZE-Wort-Schieberegister 14 ausgegeben. Der Zeichenzähler 18, der an die Alphafeldausgabeleitung 12 angeschlossen ist, zählt die Anzahl von Zeicheneingaben zum OZE-Wort-Schieberegister 14 und überträgt die Zahl über die Leitung 19 an die Verschiebesteuerung 20. Diese Verschiebesteuerung 20 ist in Fig. 4 in einem detaillierten Blockschaltbild dargestellt. Das Wort-Schieberegister 14 speichert die Zeichen des OZE-Eingabewortes in einer Anordnung, die in der Reihenfolge des Empfangs der Zeichen über die Eingabeleitung 2 geordnet ist. Das OZE-Wort-Schieberegister 14 hat drei benachbarte Speicherzellen Kl, K2 und K3 und das Endzeichen des Eingabewortes wird zu Anfang in der Zelle Kl gespeichert.

In Fig. 3 ist ein Wörterbuchspeicher 28 gezeigt, der die vorgegebene Klasse von Referenzwörtern als Wörterbuch speichert. Für die Verarbeitung allgemeinen englischen Textes können im Wörterbuchspeicher 28 die Wörter gespeichert werden» die Jk. einem konventlo-

WA 973 006 509843/058

nellen Wörterbuch wie beispielsweise Webster's Third International erscheinen. Für die Verarbeitung von Spezialtexten können begrenztefe und spezialisiertere Vokabulare verwendet werden. Bei der
Verarbeitung von Post kann das nationale Straßennahmenverzeichnis verwendet werden. Ausgewählte Zeichen, die ausgewählte im Wörterbuchspeicher 28 gespeicherte Wörter bilden, sind mit einem Fehlerneigungskennzeichen versehen, um die Neigung der Zeichen durch das optische Zeichenerkennungsgerät falsch gelesen zu werden während eines Fehlerbetriebes angeben, der die Anzahl von Zeichen
im falsch gelesenen Wort verändert. Der Wörterbuchspeicher 28 ist über eine Steuereingangsleitung 46 mit einer Ausgabe des Worttrennungs detektors verbunden, um anzuzeigen, wenn ein neues alphabetisches Zeichenfeld von der OZE über die Leitung 2 empfangen wurde. Wenn die Analyse der höchstwahrscheinlich richtigen Form für das nächste vorher empfangene OZE-Wort abgeschlossen ist, veranlaßt der Empfang eines Signaies über die Leitung 46 den Wörterbuchspeicher zum Rückstellen seiner Liste von Wörtern, so daß die Analyse des neuen OZE-Eingabewortes beginnen kann. Der Wörterbuchspeicher 28 kann auf Wunsch einen Großraum-Eingangsspeicher 3 enthalten, der z.B. gewählte Kategorien von Referenzwörtern liefern kann, die höchstwahrscheinlich mit der speziellen Art vom OZE-Wort übereinstimmen, das auf der OZE-Eingabeleitung 2 empfangen wurde.

Ein Wörterbuchwort-Schieberegister 26 ist nach Darstellung in
Fig. 3 mit seinem Eingang mit dem Ausga.ng des Wörterbuchspeichers 28 verbunden. Das Schieberegister 26 speichert die Zeichen eines .Wörterbucheingabewortes vom Wörterbuchspeicher 28 in einer in der Reihenfolge des Zeichenempfanges angeordneten Anordnung. Das Wörter buchwort-Schieberegister 26 hat drei benachbarte Speicherzellen
Ll, L2 und L3 und das Endzeichen des in das Schieberegister 26
geladenen Wörterbuchwortes wird am Anfang in der Zelle Ll gespeichert. Das Zeichen in der Zelle Ll des Schieberegisters 26 sollte dem Zeichen in der Zelle Kl des Schieberegisters 14 entsprechen. Um Teilungs- oder Segmentierungs-Fehlleseneigungen für die Referenzwörter zu kennzeichnen, kann man eine besondere Alphazeichenepeicherung vereinbaren. Jedes Alphazeichen wird mit nur fünf der im «llgemein«n zur Darstellung eines Zeichens verwendeten 8 Bits.

ha 973 006 509843/0565

ι gespeichert. Die anderen drei Bits werden als Kennzeichencode be-

S nutzt. Es gibt daher acht Kennzeichencodekombinationen, von denen zwei der horizontalen SpaltungsSegmentierung eines Zeichens und der Zusammenziehungssegmentierung von Zeichenpaaren zugeord-' net werden. Um das Gerät nach dem Erfindungsgedanken jedoch kla- .

rer zu zeigen, stellt Fig. 3 eine andere Anordnung mit einem Kennzeichenbit-Schieberegister 34 dar, dessen Eingang mit dem Ausgang

j- des Wörterbuchspeichers 28 verbunden ist zur Speicherung der die

; OZE-Fehlleseneigung für ausgewählte im Wörterbuch-Schieberegister 26 gespeicherte Zeichen bezeichnenden Kennzeichenbits. Natürlich wäre ein vollständig separates Kennzeichenbit-Schieberegister 34, über eine Leitung 32 mit dem Wörterbuchspeicher 28 verbunden, das Kennzeichenbits getrennt von den im Wörterbüchwortschieberegister 26 gespeicherten alphabetischen Zeichen festhält, ein ebenso durchführbares Ausführungsbeispiel, wie das offenbarte bevorzugte. Die Verschiebesteuerung 20 steuert die Verschiebung des Inhaltes des OZE-Schieberegisters 14 über die Leitung 22 und die Verschiebung des Inhaltes des Wörterbuch-Schieberegisters 26 über die Leitung 24. Die Verschiebung des Inhaltes des Kennzeichenbit-Schieberegisters 34 wird ebenfalls über die Leitung 24 so gesteuert, daß Schiebeoperationen für das Wörterbuch-Schieberegister 26

i und das Kennzeichenbits-fiShieberegister 34 immer übereinstimmend erfolgen. Die Verschiebesteuerung 20 empfängt über die Leitung 24 vom Wörterbuchspeicher 28 die Länge des im Wörterbuch-Schieberegister 26 gespeicherten Wörterbuchwortes. Die Verschiebesteuerung 20 ist im einzelnen in Fig. 4 gezeigt.

Der Multiplexer 94ist mit drei Eingängen an das Wörterbuchwort-Schieberegister 26 angeschlossen, wobei die Leitung 88 mit der Zelle Ll, die Leitung 90 mit der Zelle L2 und die Leitung 92 mit der Zelle L3 verbunden ist. Der Multiplexer 96 ist in Fig. 6 im j einzelnen gezeigt.

! Der Kennzeichendecodierer 100 in Fig. 3 ist mit einem Eingang an I die letzte Zelle 35 im Kennzeichenbitseschieberegister. 34 entspre ! chend der Zelle Ll im Wörterbuchwort-Schieberegister 26 ange-

WA 973 006 509843/0565

schlossen. Der Kennzeichendecodierer hat vier Ausgangsleitungen, ^! von denen durch ein Signal auf der Leitung 102a eine wahrscheinli-, ehe einfache Substitution, durch ein Signal auf der Leitung 102b eine wahrscheinliche Zeichenspaltung, durch ein Signal auf der Leitung 102c eine wahrscheinliche Zeichenpaar-Zusammenziehung und durch ein Signal auf der Leitung 102d eine wahrscheinliche Zeichen}-paar-Anhäufung angezeigt werden. Die Ausgangsleitungen des Kenn- ! zeichendecodierers sind gemeinsam mit Leitung 102 bezeichnet.

Der Multiplextaktgeber 108 in Fig. 3 ist mit einer Eingangsleitung 102 an den Kennzeichendecodierer 100 und mit einer Ausgangsleitung 110 an die Multiplexer 94, 96 und 128 angeschlossen. Der Multiplextaktgeber 108 ist im einzelnen in Fig. 7 in einem Blockschaltbild gezeigt. Das Adreßregister 116 ist durch die Eingangsleitungen 112 und 114 mit dem Multiplexer 94 verbunden. Das Adreßregister 122 ist durch die Eingangsleitungen 118 und 120 mit dem Multiplexer 96 verbunden.

Die Speichermatrix für bedingte Wahrscheinlichkeit 124 ist über einen ersten und einen zweiten Eingang mit den Adreßregistern 116 bzw. 122 verbunden. Die Speichermatrix für bedingte Wahrscheinlichkeit speichert eine erste Art bedingter Wahrscheinlichkeit P(K /L ) dafür, daß das in der Zelle K des besagten ersten n' m η

Schieberegisters gespeicherte OZE-Wortzeichen durch die Zeichensubstitution falsch gelesen wurde unter der Voraussetzung, daß das in der Zelle L des besagten zweiten Schieberegisters gespeicherte Wörterbuchwortzeichen tatsächlich abgefühlt wurde für n=i, m=l; n=2, m=2; n=2, m=3; und n=3, m=2. Die Speichermatrix für bedingte Wahrscheinlichkeit speichert auch eine zweite Art bedingter Wahrscheinlichkeit P(K₁K₂JL₁) dafür, daß das in den Zellen K, und K₂ des OZE-Wort-Schieberegisters 14 gespeicherte OZE-Wortzeichen durch Zeichenteilung falsch gelesen wurde unter der Voraussetzung, daß das Wörterbuchwortzeichen, gespeichert in der Zelle L₁ besagten Wörterbuchwortschieberegister 26 tatsächlich abgetastet wurde. Die Speichermatrix für bedingte Wahrscheinlichkeit 124 speichert auch eine dritte Art bedingter Wahr-

WA 973 006 5 0 9 8 A 3 / 0 5 6 5

ischeinlichkeit P(K I L L₃) dafür, daß das in der Zelle K. des OZE-jWortschieberegisters 14'gespeicherte OZE-Wortzeichen durch die

IZeichenzusairanenziehung falsch gelesen wurde unter der Voraussetzung, daß das in den Zellen L und L₀ besagten Wörterbuchwort- !Schieberegisters 26 gespeicherte Wörterbuchwortzeichen tatsächlich !abgetastet wurde. Die Speichermatrix für bedingte Wahrscheinlichkeit 124 enthält noch eine vierte Art bedingter Wahrscheinlichkeit P(K₁K₀Il₁L₀) dafür, daß die in den Zellen K. und K„ des OZE-

ι Χ Δ X Δ Χ ί

!Wortschieberegisters 14 gespeicherten OZE-Wortzeichen durch Zeichenhäufung falsch gelesen wurden unter der Voraussetzung, daß die in den Zellen L. und L₀ des Wörterbuch-Schieberegisters 26 gespeicherten Wörterbuchwortzeichen tatsächlich abgetastet wurden.

Tabelle IV zeigt einige Beispielwerte für die in der Speichermatrix für bedingte Wahrscheinlichkeit 124 gespeicherten bedingten Wahrscheinlichkeiten der ersten, zweiten, dritten und vierten Art. Theoretisch könnten die Kombinationen von groß und klein geschriebenen Buchstaben erschöpft sein, wenn die bedingten Wahrscheinlichkeiten gespeichert sind für Ρ(Α_±|Α.) P(A₁AJAj^) P(A₁J A-A_k) und für Ρ(Α₁Α.^Α_]ζΑ₁) , wobei i, j, k und 1 alle möglichen Werte einnehmen. Viele dieser bedingten Wahrscheinlichkeiten erweisen sich jedoch als verschwindend klein und somit werden nur diejenigen Kombinationen in praktischen Anwendungen gespeichert, deren Wahrscheinlichkeit größer ist als ein ausgewählter Schwellwert. Dieser Schwellwert wird empirisch festgelegt und hängt von den jeweiligen charakterisierten OZE ab.

WA 973 006 509843/0565

Q

O
O

ο—-ο
O O

O

ο—
O

--O
O

σ

O
O

I

r—I
O

O

I

O

I

O

σ

O

I

,

I

H
O

I

H
O

σι
VO

H
O

O

I

O

O
•

O

I

O
*

O

O
•

I

O
•

I

-" -t

I

O

.-1

I

H

I

H

O

H

O

σ

O

CO
Γ "Λ

frj

O

CD^""
O

"—CD
O

CD
O

iUH(

M

H

in

H

O

ro

O

j j

O

■^CD
■

O

Eh

σ

O

H

O

I

H

O O

H

Ü ·

ο

O

O O

O

ο

O

co

O

σ

O

ο

O

HrIH HrH HOrHrH H H

ooo oo ochoo σ ο

OO O -O O O · O O O O

οσο οσ ο oo oo

OOO OO O OO O O HHH HH -O H H H H H

σοο σο σ>οσο ο σ

>Η OO Ο—Ο O · O O O -O O

οσσ οο οσο ο ο

σοσ οο οοο ο ο

I I I I I I I I I I I I M I I I I I I I I I I I

H HHHH H H -, wi—i ■—.——K^ O-——O O O O——O———O

r^ Pn σοο σο σοοο ο. ο

κ? σσοσσοοοοοο

ft] O'OOOOOOOOO

CQ ·

^ dOOHHHHHHHHO

EH OVOOOOOOOOOcv) W OO O ^O O O O O O O -O

σσο οο οοοο ο

Ο·Ο OO ΟΟΟΟ O

HHH r-i r-\ HHHH H H

οσο οσ οοοο ο ο

O O O O Ο—O O O O O O

ΟΟΟ OO ΟΟΟΟ O O

οσο οσ οοοο ο ο

HHfI τ-\ r-i HHHf- O O Oi O O O O O H

U οσ· σο σοοο
οο οο οοο»

OO OO ΟΟΟ

:J HOH HH HHHH H H

γϊ ο cn ο ο ο ο ο ο α___α_ ο

° W Ο·Ο OO ΟΟΟΟ O O

H O O OO ΟΟΟΟ O O

Ή ο ο οο οοοο ο ο

'•"3 COHH t-\ <-i HHHH H H

O cn ο ο ο ο ο ο ο α α ο

H <J ·ΟΟ OO ΟΟΟΟ O O

Γη O O O O O O O O O O

t-j OO OO ΟΟΟΟ O O

¹H * OO

ι *

Pi ΪΟ E-J W <! M U !3O fnMpciCj ςύ ρ

509843/0565

)—I J?j Ρ-ι £3 t"* ΓΙ." £ϋ ^ Pi ^! C-J Ε~· W P^ ΙΛ

Die oben erwähnten Wahrscheinlichkeiten werden durch die ΟΖΕΙ Wortbestandteil-Zeichen und die Wörterbuchwort-Zeichen angesproj chen, die wahlweise durch die Multiplexer 94 und 96 unter Steuerung des Kennzeichendecodierers 100 in die Adreßregister 116 bzw. 122 geschaltet werden. Die Arbeitsweise der Multiplexer-Taktgabe 108 ist in Tabelle V gezeigt. Die Arbeitsweise des Multiplexers 94 und 96 ist in Tabelle VI gezeigt.

TABELLE V

Multiplextaktgabe

Kennzeichen

Substitution Spaltung
Zusammenziehung Häufung

Anzahl von Impulsen

TABELLE VIa

Multiplex (94)
Multiplex (96)
Multiplex (128)

MuItiplexschaltung

Kennzeichenbit = Substitution

Taktimpuls (108) 12 3 4

K, KEINE KEINE KEINE

Leitung (164)

TABELLE IVb

Multiplexschaltung

Kennzeichenbit = Zeichenspaltung Taktimpuls 108

	(94)	1	2	3	4
Multiplex	(96)	^Kl	^K2	K₁K₂	^K3
Multiplex	(128)	^Ll	^L2	^Ll	^L2
Multiplex		Reg.	Reg.	Reg.	Reg.
		(130)	(132)	(134)	(136)
WA 973 006	509843/	0 565

TABELLE VIc Multiplexschaltung

Kennzeichenbit = Zeichenzusammenziehung Taktimpuls (108)

	(94)	1	2	3	4
Multiplex	(96)		K₉	K	K₀
Multiplex	(128)		^L2	^L1'^L2
Multiplex		Reg.	Reg.	Reg.	Reg.
		(130)	(132)	(134)	(136)
	TABELLE	VId

Multiplexschaltung Kennzeichenbit = Zeichenhäufung Taktimpuls 108

12 3 4

Multiplex (94) Κ_χ K₂ Κ_χ,K₂ offen

Multiplex (96) L₁ L₂ ^Lj/^L2 ^offen

Multiplex (128) Reg. Reg. Reg. laden I in Reg.

(130) (132) (134) (136)

Der Multiplexer 128 ist mit einem Dateneingang an die Wahrscheinlichkeits-Ausgangs leitung 126 von der Speichermatrix für bedingte Wahrscheinlichkeit 124 angeschlossen. Der Multiplexer 128 arbeitet unter Steuerung des Multiplextaktgebers 110 und des Kennzeichendecodierers 100 und verteilt sequentiell bedingte Wahrscheinlichkeiten, die von der Speichermatrix 124 angesprochen wurden, auf die Register 130, 132, 134, 136 oder auf die Leitung 164 gemäß der Beschreibung in der Multiplexschalttabelle VI. Eine genaue Darstellung der Schaltung für den Multiplexer findet sich in Fig. 8.

Ein erster Multiplizierer 138 ist mit einem Eingang an die Ausgabe des Registers 130 und des Registers 132 angeschlossen und

WA 973 006 5 0 9 8 A 37Ö 5 6'5

multipliziert eine erste empfangene bedingte Wahrscheinlichkeit mit einer zweiten empfangenen bedingten Wahrscheinlichkeit, die von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert wurde. Der Multiplizierer 138 gibt das erste Wahrscheinlich keitsprodukt auf die Leitung 142 aus zum Vergleicher 146.

j Der Multiplizierer 140 ist mit Eingängen an die Register 134 und 136 angeschlossen, um eine dritte empfangene bedingte Wahrscheinlichkeit mit einer vierten empfangenen bedingten Wahrscheinlichkeit zu multiplizieren, die von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert wurden. Das zweite dadurch berechnete Wahrscheinlichkeitsprodukt wird über die Leitung 144 an den Vergleicher 146 ausgegeben.

Der Vergleicher 146 vergleicht die relativen Größen des ersten Wahrscheinlichkeitsproduktes und des zweiten Wahrscheinlichkeitsproduktes, die auf die Leitungen 142 bzw. 144 ausgegeben wurden. Wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite, wird vom Vergleicher 146 ein Signal auf die Ausgabeleitung 158 an das Schaltglied 148 und die Verschiebe-Kommando-Einheit 162 gegeben. Wenn andererseits das zweite Wahrscheinlichkeitsprodukt größer ist als das erste, gibt der Vergleicher 146 ein Signal auf seiner Ausgabeleitung 160 zum Schaltglied 150 und an die Verschiebe-Kommando-Einheit 162.

Die Verschiebekommando-Einheit 162 hat eine an den Kennzeichendecodierer 100 angeschlossene Eingangsleitung 102 und eine an ■ die Verschiebesteuerung 20 angeschlossene Ausgangsleitung 80. Die Schiebekommando-Einheit 162 ist in Fig. 9 im einzelnen gezeigt und die Arbeitsweise der Schiebekommando-Einheit 162 und der Verschiebesteuerung 20 ist in Tabelle VII dargestellt. Die Ausgangsleitung 80 umfaßt vier Leitungen, die die Verschiebesteuerung 20 anweisen, den Inhalt der Register 14 und 26 wie folgt nach links zu verschieben: Leitung 80a je eine Zelle; Leitung 80b je zwei Zellen; Leitung 80c zwei Zellen bzw. eine Zelle; Leitung 8Od eine Zelle bzw. 2 Zellen.

WA 973 006 5 0 9 8 4 3/0565

	TABELLE VII	POSITIONEN VERSCHOBEN IM OZE-WORT S/R (14)	2460757
	Verschiebesteuerung	1
	GRÖSSERES PRODUKT (MULTIPLIZIERER)	1
KENNZEICHEN	(na)	1	POSITIONEN VERSCHOBEN . IM WÖRTER BUCH S/R(34)
Substitution	(138)	1 1	1
Segmentierung	(140)	1 2	1
Spaltung	(138) (140)	1
Zusammenziehung	(138) (140)	1 2
Häufung	1 2

Wenn der Kennzeichendecodierer 100 feststellt, daß das Fehlerneigungskennzeichen für das in der Zelle L des Wörterbuchwort-Schieberegisters 26 gespeicherte Zeichen eine Neigung zur einfachen Zeichensubstitution zeigt, verläuft die Operation gem. Tabelle VIa. Der Multiplexer 94 erhält über die Leitung 102a ein Signal vom Kennzeichendecodierer 100 und einen Taktimpuls über die Leitung 110 und schaltet den Inhalt der Zelle K des OZE-Wortschie beregisters 14 über die Leitung 114 in das Adreßregister 116. Gleichzeitig schaltet der Multiplexer 96, der über die Leitung 102a vom Kennzeichendecodierer 100 ein Signal erhält und der auch ein Taktsignal über die Leitung 110 empfängt, den Inhalt der Zelle L in dem Wörterbuchwort-Schieberegister 26 über die Leitung 88 und die Leitung 120 in das Adreßregister 122 durch. Dann wird von der Speichermatrix 124 die bedingte Wahrscheinlichkeit P(KJ L adressiert und über die Wahrscheinlichkeits-Ausgabeleitung 126 an den Multiplexer 128 ausgegeben. Der Multiplexer 128, der über die Leitung 102a vom Kennzeichendecodierer 100 ein Signal erhält, empfängt auch ein Taktsignal über die Leitung 110 und schaltet die bedingte Wahrscheinlichkeitseingabe erster Art über die Leitung 126 zur Ausgabeleitung 164 unter Umgehung des Vergleichers 146 durch.

WA 973 006

509843/0565

Wenn stattdessen das in Verbindung mit den in der Zelle L₁ des Wörterbuchwort-Schieberegisters 26 gespeicherte Fehlerneigungskennzeichen eine Neigung zur Zeichenspaltung anzeigt, verläuft die Operation gemäß Tabelle VIb. Der Multiplexer 94, der über die Leitung 102 ein Signal von den Kennzeichendecodierer 100 erhält und der auch vier Taktsignale über die Leitung 110 von dem Multiplextaktgeber 108 empfängt,, schaltet die Folge von vier Zeichen oder Zeichenkombinationen aus den Zellen K , K₂ und K_ des OZE-Wort-Schieberegisters 14 zum Adreßregister 116 durch. Gleichzeitig schaltet der Multiplexer 96 eine Folge von vier Zeichen oder Zeichenkombinationen aus den Zellen L₁, L₂ und L₃ zum Adreßregister 122 durch. Aufgrund des ersten Taktimpulses vom Multiplextaktgeber 104 ist das erste durch den Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K und das erste durch den Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle

j L . Die bedingte Wahrscheinlichkeit P(K ] L) wird von der Speicher ' 1 ix

matrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendecodierers 100 hat der Multiplexer 128 ein Signal auf der Eingabeleitung 102b, welches eine Spaltungs neigung anzeigt und aufgrund des ersten Taktimpulses von dem Multiplextaktgeber 108 schaltet die bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 130 durch zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund des zweiten Taktimpulses für den Multiplextaktgeber 108 ist das zweite durch den Multiplexer 94 geschaltete Zeichen der Inhalt der Zelle K und

2 das zweite vom Multiplexer 96 geschaltete Zeichen der Inhalt der Zelle L₉. Die bedingte Wahrscheinlichkeit P(K₉ |l_) wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert .und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Der Multiplexer 128 erhält unter Steuerung des Kennzeichendecodierers 100 ein Signal auf der Eingangsleitung 102b, welches eine Spaltungsneigung anzeigt, und schaltet aufgrund des zweiten Taktimpulses vom Multiplextaktgeber 108 die zweite bedingte Wahrscheinlichkeitseingabe auf der Leitung 126

973 006 5 09843 /QS8 5

zum Register 132 durch zur schließlichen Verarbeitung durch den ' Vergleicher 146. Aufgrund des dritten Taktimpulses vom Multi- j plextaktgeber 108 ist die dritte vom Multiplexer 94 durchgeschaltej te Zeichenkombination der Inhalt der Zelle K₁ und der Zelle K₂ und das dritte vom Multiplexer 96 geschaltete Zeichen der Inhalt der Zelle L₁- Die bedingte Wahrscheinlichkeit P(K₁K₃J L₁) wird von der Speichermatrix für beidingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 auf der Eingabeleitung 102b ein die Spaltungsneigung anzeigendes Signal und schaltet aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 die dritte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 134 durch zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund des vierten Taktimpulses des Multiplextaktgebers 108 ist das vierte vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K₃ und das vierte vom Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle L₃. Die bedingte Wahrscheinlichkeit P(K₃IL₂) wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Kennzeichendecodierer 100 ausgegeben., Dabei liegt ein die Spaltungsneigung anzeigendes Signal auf der Eingabeleitung 102b und aufgrund des vierten Taktimpulses von dem Multiplextaktgeber 108 wird die vierte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 136 durchgeschaltet zur schließlichen Verarbeitung durch den Vergleicher 146.

Wenn stattdessen das Fehlerneigungskennzeichen, das in Verbindung mit dem in der Zelle L₁ des Wörterbuchwort-Schieberegisters 26 gespeicherten Zeichen gespeichert wurde, eine Neigung zur Zeichenzusammenziehung anzeigt, verläuft die Operation nach Tabelle VIc. Der Multiplexer 94 empfängt über die Leitung 102c Signale vom Kennzeichendecodierer 100 und vier Taktsignale über die Leitung 110 vom Multiplextaktgeber 108 und schaltet dann die Folge von vier Zeichen oder Zeichenkombinationen aus den

973 006 509843/056S

Zellen K , K₂ und K. des. OZE-Wort-Schieberegisters 14 zum Adreßregister 116 durch* Gleichzeitig verschiebt.der Multiplexer 96 der ein Signal über die Leitung iO2c vom Kennzeichendecodierer 100 und vier Taktsignale über die Leitung 110 vom Multiplextaktgeber 108 empfängt, die Folge von vier Zeichen oder Zeichenkombinationen aus den Zellen L₁, L₂ und L₃ in das Adreßregister 122. Aufgrund des ersten Taktimpulses von dem Multiplextaktgeber 108 ist das erste vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K und das erste vom Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle L.. Der Wert für die bedingte Wahrscheinlichkeit P(K^ L₁) wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 123 ausgegeben. Der Multiplexer 128 erhält unter Steuerung des Kennzeichendecodierers ein Signal auf der Eingabeleitung 102c, welches eine Zusammenziehungsneigung anzeigt und aufgrund des ersten Taktimpulses vom Multiplextaktgeber 108 schaltet er die erste bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 durch zum Register 130 zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund des zweiten Taktimpulses vom Multiplextaktgeber 108 ist das zweite vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K_ und das zweite vom Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle L₃. Die zweite bedingte Wahrscheinlichkeit P(K₂ Il₂) wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitslei-■ tung 126 an den Multiplexer 128 ausgegeben. Der Multiplexer 128 erhält unter Steuerung des Kennzeichendecodierers 100 ein Signal auf der Eingangsleitung 102c, welches eine Zusammenziehungsneigunc anzeigt, und schaltet aufgrund des zweiten Taktimpulses vom Multiplextaktgeber 108 die zweite bedingte Wahrscheinlichkeitseingabc auf der Leitung 126 zum Register 132 durch zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 ist das dritte vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle L₁ und der Zelle L₃. Die bedingte Wahrscheinlichkeit P(K₁IL^L₃) wird von der

973 006 5-098.43/05-65

Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Der Multiplexer 128 erhält unter Steuerung des Kennzeichendecodierers 100 ein Signal auf der Eingangsleitung 102c, welches eine Zusammenziehungsneigung anzeigt, und schaltet aufgrund des dritten Taktimpulses für den Multiplextaktgeber 108 die dritte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 134 durch zur schließlichen Verarbeitung durch den Vergleicher 146. Eine Antwort auf den vierten Taktimpuls vom Multiplextaktgeber 108, das vierte durch den Multiplexer 94 durchgeschaltete Zeichen ist der Inhalt der-Zelle K₂ und das vierte vom Multiplexer 96 durchgeschaltete Zeichen ist der Inhalt der Zelle L₃. Die bedingte Wahrscheinlichkeit P(K₃IL₃) wird : von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung 102c, welches eine Zusammenziehungsneigung anzeigt, und aufgrund des vierten Taktimpulses von dem Multiplextaktgeber 108 wird die vierte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 136 durchgeschaltet zur schließlichen Verarbeitung durch den Vergleicher 146.

Wenn stattdessen die Fehlerneigungskennzeichen, die in Verbindung mit dem in der Zelle L₁ des Wörterbuchwort-Schieberegisters 26 gespeicherten Zeichen gespeichert sind, eine Neigung zur Zeilenhäufung anzeigen, dann verläuft die Operation gemäß Tabelle VId. Der Multiplexer 94 erhält über die Leitung 102d durch den Kennzeichendecodierer 100 Signale und empfängt vier Taktsignale über die Leitung 110 vom Multiplextaktgeber 108, schaltet die Folge von vier Zeichen oder Zeichenkombinationen aus den Zellen K. und K₂ des OZE-Schieberegisters 14 zum Adreßregister 116 durch. Gleichzeitig schältet der Multiplexer 96, der Signale über die Leitung 103d durch den Kennzeichendecodierer 100 und vier Taktsignale über die Leitung 110 vom Multiplextaktgeber 108 empfängt, eine Folge von vier Zeichen oder Zeichenkombinationen

WA 973 006 50 984 3/056 5

aus den Zeilen L₁ und L₂ zum Adreßregister 122 durch. Aufgrund des ersten Taktimpulses vom Multiplexertaktgeber 108 ist das zuerst durch den Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K und das zuerst vom Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle L.. Die bedingte Wahrscheinlichkeit P(K₁IL₂) wird adressiert von der Speichermatrix für bedingte Wahr scheinlichkeit 124 und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendec j dierers 100 erhält der Multiplexer 128 ein Signal auf der Eingangs leitung 102d, welches eine Häufungsneigung anzeigt und aufgrund des ersten Taktimpulses vom Multiplextaktgeber 108 wird die bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 130 zur schließlichen Verarbeitung durch den Vergleicher 146 durchgeschaltet. Aufgrund des zweiten Taktimpulses vom Multiplextaktgeber 108 ist das zweite vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K₂ und das zweite vom Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle L₂. Die bedingte Wahrscheinlichkeit P(IK₂Il₂) wird von der Speichermatrix fü bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrschein lichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter der Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung 102d, welches eine Häufungsneigung anzeigt und aufgrund des zweiten Taktimpulses vom Multiplextaktgeber 108 schaltet die zweite bedingte Wahrscheinlichkeits eingabe auf der Leitung 126 zum Register 132 durch zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108. ist die dritte vom Multiplexer 94 durchgeschaltete Zeichenkombination der Inhalt der Zelle K₁ und der Zelle K₂ und die vom Multiplexer 96 durchgeschaltete dr te Zeichenkombination der Inhalt der Zelle L₁ und der Zelle L,. Die bedingte Wahrscheinlichkeit P(K ,K₀ |>.L , L₀) wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 168 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendecodierers' 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung 102d_f das eine Häufungsneigung anzeigt, und schaltet aufgrund des dritten

WA 973 006 509843/0565

Taktimpulses vom Multiplextaktgeber 108 die dritte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 134 durc zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber 108 werden keine Zeichen durch den Multiplexer 94 und keine Zeichen durch den Multiplexer 96 durchgeschaltet. Unter Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung 102d, welches eine Häufungsneigung anzeigt und aufgrund des vierten Taktimpulses von dem Multiplextaktgeber 108 lädt der Multiplexer 128 den Wert 1, der im Speicherregister 324 gespeichert ist in das Register 136 zur schließlichen Verarbeitung durch den Vergleicher 146.

Der Inhalt des Registers 130 wird mit dem Inhalt des Registers 132 durch den Multiplizierer 138 multipliziert und das Produkt auf der Leitung 142 an den Vergleicher 146 ausgegeben. Der Inhalt des Registers 134 wird durch den Multiplizierer 140 mit dem Inhalt des Registers 136 multipliziert und auf der Leitung 144 an den Vergleicher 146 ausgegeben. Das durch den ersten Multiplizierer 138 ausgegebene Produkt ist das erste Wahrscheinlichkeitsprodukt und das durch den zweiten Multiplizierer 140 ausgegebene Produkt ist das zweite Wahrscheinlichkeitsprodukt. Die relativen Größen des ersten und zweiten Wahrscheinlichkeitsproduktes werden im Vergleicher 146 miteinander verglichen. Wenn das erste Wahrscheinlichkeitsprodukt auf der Leitung 142 größer ist als das zweite Wahrscheinlichkeitsprodukt auf der Leitung 144, gibt der Vergleicher 146 ein Durchschaltsignal auf der Leitung 158 aus, welches das Schaltglied 148 durchschaltet, so daß der Inhalt des Registers 130 über die Leitung 149 zur Leitung und dann zur Leitung 156 gelangt. Das Signal des Vergleichers auf der Leitung 158 ist die Eingabe zur Verschiebebevehls-Einheit 162. Wenn das zweite Wahrscheinlichkeitsprodukt auf der Leitung 144 größer ist als das erste Wahrscheinlichkeitsprodukt auf der Leitung 142, gibt der Vergleicher 146 ein Leitsignal auf der Leitung 160 aus, welches das Schaltglied 150 so ein-

WA 973 006 5 0 9 8 4 3/0565

!schaltet, daß der Inhalt des Registers 134 auf der Leitung 151 I zur Leitung 156 geleitet wird. Das Ausgangssignal des Vergleiichers auf der Leitung 160 ist die Eingabe zur Verschiebebefehls-'Einheit 162. Das erste Wahrscheinlichkeitsprodukt stellt die !Wahrscheinlichkeit dar, daß einfache Zeichensubstitutionen zwi-I sehen den in der Zelle L und der Zelle K und den in der Zelle IL₀ und der Zelle K₉ gespeicherten Zeichen auftreten. Das zweite Wahrscheinlichkeitsprodukt stellt die Wahrscheinlichkeit dar, daß ein Segmentierungsfehler durch Zeichenspaltung Zusammenziehung oder Häufung von Zeichen im Wörterbuchwort-Schieberegister 26 und dem OZE-Wort-Schieberegister 14 aufgetreten ist. Wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite, können das im OZE-Wort-Schieberegister 14 und das im Wörterbuchwort-Schieberegister 26 gespeicherte Wort gleichzeitig um denselben j Betrag verschoben werden bei der Verarbeitung des nächsten Satzes von Buchstaben darin. Wenn jedoch das zweite Wahrscheinlichkeitsprodukt größer ist als das erste, dann ist irgendeine Art von Zeichensegmentierung aufgetreten, die eine andere Verschiebung des im OZE-Wort-Schieberegister 14 gespeicherten Wortes als des im Wörterbuchwort-Schieberegjster 26 gespeicherten Wortes erfordern kann, bevor nachfolgende Buchstaben im Wort verarbeitet werden können. Diese unterschiedliche Verschiebungsentscheidung erfolgt durch die Verschiebebefehls-Einheit 162.

Diese Verschiebebefehls-Einheit 162, die im einzelnen in Fig. 9 gezeigt ist, empfängt Steuereingangssignale über die Leitung 102 vom Kennzeichendecodierer 100. Die Leitung 102a zeigt eine Substitutionsneigung an, die Leitung 102b eine Spaltungsneigung, die Leitung 102c eine Zusammenziehungsneigung und die Leitung 102d eine Häufungsneigung. Die Verschiebebefehls-Einheit 162 empfängt über die Leitung 158 ein Signal vom Vergleicher 146, welches anzeigt, daß das erste Wahrscheinlichkeitsprodukt größer ist oder sie empfängt über die Leitung 160 ein Signal vom Vergleicher 146, welches anzeigt, daß das zweite Wahrscheinlichkeitsprodukt größer ist. Nach Fig. 9 gibt die Verschiebebefehls-Einheit 162 ein Schiebebefehlssignal über die Leitung 80 an die Verschiebesteu-

WA 973 006 509843/0 565

erung 20 steuert das Verschieben des Inhaltes des OZE-Wort-Schieberegisters 14 über die Leitung 22 und die Verschiebung des Inhaltes des Wörterbuchwort-Schieberegisters 26 und des Kennzeichenbit-Schieberegisters 34 über die Leitung 24. Wenn der Kennzeichendecodierer 100 über die Leitung 102a anzeigt, daß das Zeichen in Zelle L eine Neigung zur einfachen Substitution hat, gibt die Verschiebebefehls-Einheit 162 auf der Leitung 80a ein Signal an die Verschiebesteuerung 20 zum Verschieben des Inhalt ' des OZE-Schieberegisters 14 als auch des Wörterbuchwort-Schieberegisters 26 um eine Zelle. Wenn der Kennzeichendecodierer 100 über die Leitung 102b anzeigt, daß das Zeichen in der Zelle L. eine Spaltungsneigung besitzt, gibt die Verschiebebefehls-Einheit 162 auf der Leitung 80a ein Signal an die Verschiebesteuerung 20 aus, um sowohl den Inhalt des Schieberegisters 14 als auch den des Schiej beregisters 26 um eine Zelle zu verschieben, wenn das erste Wahr- i scheinlichkeitsprodukt größer ist als das zweite. Wenn der Kenn- j zeichendecodierer 100 über die Leitung 102b anzeigt, daß das Zeichen in der Zelle L₁ eine Spaltungsneigung hat, gibt die Verschiebebefehls-Einheit 162 über die Leitung 80c ein Signal an die Verschiebesteuerung 20 aus, um den Inhalt des OZE-Wort-Schieberegisters 14 um zwei Zellen und das Wörterbuchwort-Schieberegister 26 um eine Zelle zu verschieben, wenn das zweite Wahrscheinlichkeitsprodukt größer ist als das erste. Wenn der Kennzeichendecodierer 100 über die Leitung 102c anzeigt, daß die in den Zellen L. und

gespeicherten Zeichenpaare eine Zusammenziehungsneigung haben, gibt die Verschiebebefehls-Einheit 162 ein Signal auf der Leitung 80a an die Verschiebesteuerung 20 aus, um den Inhalt des Schieberegisters 14 und das Schieberegister 26 um eine Zelle zu verschieben, wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite. Wenn der Kennzeichendecodierer 100 über die Leitung 102c signalisiert, daß das in den Zellen L. und L₂ gespeicherte Zeichenpaar eine Zusammenziehungsneigung hat, gibt

WA 973 006 509843/05^5

die Verschiebebefehls-Einheit 162 auf der Leitung 8Od ein Signal an die Verschiebesteuerung 20 aus, um den Inhalt des OZE-Wort-Sctiieberegisters 14 um eine Zelle und den des Wörterbuchwort-Schieberegisters 26 um zwei Zellen zu verschieben, wenn das zweite Wahrscheinlichkeitsprodukt größer als das erste ist. Wenn ι ' ■ ·

der Kennzeichendecodierer 100 über die Leitung 102d anzeigt, daß das Zeichenpaar in den Zellen L. und L, eine Häufungsneigung hat, gibt die Verschiebebefehls-Einheit 162 auf der Leitung 80a an die Verschiebesteuerung 20 ein Signal aus, welches den Inhalt des Schieberegisters 14 und des Schieberegisters 26 um jeweils eine Zelle verschiebt, wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite. Wenn der Kennzeichendecodierer 100 auf der Leitung 102d signalisiert, daß das in den Zellen L. und L₂ gespeicherte Zeichenpaar eine Häufungsneigung hat, gibt die Verschiebebefehls -Einheit 162 auf der Leitung 80b ein Kommando an die Verschiebesteuerung 20 aus, um sowohl den Inhalt des OZE-Wort-Schieberegisters 14 als auch den des Wörterbuchwort-Schieberegisters 26 um zwei Zellen zu verschieben, wenn das zweite Wahrscheinlichkeitsprodukt größer ist als das erste.

Die bedingte Wahrscheinlichkeit für eine einfache Substitution, . ausgegeben vom Multiplexer 128 auf die Leitung 164, und die vom Register 130 für eine einfache Substitution und die vom Register 134 für die Segmentierung ausgegebenen einfachen Wahrscheinlichkeiten werden über die Leitung 156 zu einer Berechnungseinheit für das laufende Produkt gegeben, die den Multiplizierer 58, das Produktregister 56, und die Lösch- und Speichereinheit 54 umfaßt.

Eine Aufgabe des in Fig. 3 gezeigten Systems besteht darin, dasjenige im Wörterbuch 28 gespeicherte Wörterbuchwort zu finden, welches das höchste laufende Produkt beim Vergleich mit dem im OZE-Wort-Schieberegsiter 14 gespeicherten OZE-Wort ergibt. Während jedes neue Wörterbuchwort vom Wörterbuchspeicher über die Leitung 30 an das Wörterbuchwort-Schieberegister 26 ausgegeben wird, sendet der Wörterbuchspeicher ein Signal über die Leitung 55 art die Lösch- und Speichereinheit 54, um den Inhalt des Pro-

WA 973 006 509843/0565

duktregisters A56 zu löschen und den Wert 1 dort zu speichern. Beim Empfang eines jeden bedingten Wahrscheinlichkeitswertes über die Leitung 156 im Multiplizierer 58, wird diese Wahrscheinlichkeit mit dem Inhalt des Produktregisters (A)56 multipliziert und das Produkt im Produktregister (A)56 gespeichert. Während das im Wörterbuchwort-Schieberegister 26 gespeicherte Wörterbuchwort also mit dem im OZE-Wort-Schieberegister 14 gespeicherten OZE-Wort verglichen wird, wird also ein laufendes Produkt der Wahrscheinlichkeiten dafür, daß das OZE-Wort falsch gelesen wurde, errechnet und im Produktregister 56 gespeichert unter der Voraussetzung, daß das Wörterbuchwort tatsächlich abgetastet wurde. Nachdem]

das im Wörterbuchwort-Schieberegister 26 gespeicherte Wörterbuchwort vollständig verarbeitet wurde, enthält der Inhalt des Produktregisters 56 das gesamte Wahrscheinlichkeitsprodukt ffür den Vergleich des Wörterbuchwortes mit dem OZE-Wort. Wenn das ganze im Register 56 gespeicherte Wahrscheinlichkeitsprodukt größer ist als diejenigen für die Gesamtwahrscheinlichkeitsprodukte, die vorher für Wörterbuchwörter errechnet wurden, die mit dem gegenwärtig im Schieberegister 14 stehenden OZE-Wort verglichen wurden, wird das Gesamtwahrscheinlichkeitsprodukt im Produktregister 56 über das Schaltglied 64 in das höchste Produktregister (B)66 übertragen.

Der Vergleicher 62 hält einen laufenden Vergleich der Größe des errechneten laufenden Produktes und des im Produktregister (A)56 gespeicherten Produkts mit dem höchsten Produktregister (B)66 bei. Die Größe des Inhaltes des Produktregisters (A)56 beginnt mit einem Wert von 1, der durch die Lösch- und Speichereinrichtung zu Beginn des Vergleiches für jedes Wörterbuchwort eingesetzt wird, das in das Schieberegister 26 geladen wird. Die Größe einer jeden über die Leitung 156 in den Multiplizierer 58 eingegeben Wahrscheinlichkeit ist kleiner als 1 und somit wird die Größe des errechneten und im Produktregister (A)56 gespeicherten laufenden Produktes monoton kleiner, während der Vergleich des Wörterbuchwortes mit dem OZE-Wort fortgeführt wird. Wenn der Vergleicher feststellt, daß die Größe des im Produktregister (A)56 gespeicher-

ten laufenden Produktes kleiner ist als der Inhalt des Registers j WA 972MÖÖ6 "5 Q 9 8 I 3/0 5 6 5

j - 43*"-

ί (B)66 für das höchste Produkt, gibt der Vergleicher 62 ein Signal !über die Leitung 78 an den Wörterbuchspeicher 28, um das nächste ,Wörterbuchwort vom Wörterbuchspeicher über die Leitung 30 in das Wörterbuchwort-Schieberegister 26 zu übertragen und dadurch den !Vergleich der vorliegenden Wörterbuchwörter mit dem OZE-Wort zu beenden. Das OZE-Wort-Schieberegister 14 erhält gleichzeitig Sijgnale, um das OZE-Wort in seine Anfangsposition zurücklaufen zu !lassen, so daß der nächste Vergleich beginnen kann. Während jedes I Wörterbuchwort vom Wörterbuchspeicher 28 über die Leitung 30 an j das Wörterbuchwort-Schieberegister 26 ausgegeben wird, wird das j Wörterbuchwort auch über die Leitung 40 zum Wortregister 38 übertragen. Der Vergleicher 62 hält ein Signal auf der Leitung 70 so lange.aufrecht, wie das im Produktregister (A)56 gespeicherte laufende Produkt größer bleibt als der Inhalt des Registers (B)66 für das höchste Produkt. Wenn der letzte Buchstabe in dem gespeicherten Wörterbuchwort im Wörterbuchwort-Schieberegister 26 mit dem entsprechenden Buchstaben in dem im OZE-Wort-Schieberegister 14 gespeicherten OZE-Wort verglichen wurde, gibt die Verschiebesteuerung 20 ein Wortendesignal auf die Leitung 74 aus, welches an das Schaltglied 72 übertragen wird. Wenn der Inhalt des Produktregisters (A)56 noch größer ist als der Inhalt des Registers (B)66 für das höchste Produkt, dann schaltet das Schaltglied 72 durch und das Signal vom Vergleicher 62 auf der Leitung 70 wird an das Schaltglied 64 übertragen und schaltet dieses durch. Das Schaltglied 64 sendet dann das ganze im Produktregister A(56) gespeicherte Wahrscheinlichkeitsprodukt an das Register (B)66. Gleichzeitig wird der Impuls vom Schaltglied 72 über die Leitung 76 zum Schaltglied 42 übertragen und schaltet dieses durch, wodurch das im Wortregister 38 gespeicherte Wörterbuchwort in das beste Register 44 für das beste Wort übertragen wird. Das Wortendsignal auf der Leitung 74 von der Verschiebesteuerung 20 wird ebenfalls an den Wörterbuchspeicher 28 übertragen und dieser dadurch veranlaßt, in das Wörterbuchwort-Schieberegister 26 das i nächste Wörterbuchwort zu übertragen. Nachdem die ganzen

WA 973 006 509843/0565

im Wörterbuchspeicher 28 gespeicherten Wörterbuchwörter mit dem OZE-Wort verglichen worden sind, das im OZE-Wort-Schieberegister ; 14 gespeichert ist, wird ein Signal für das Ende der Wörterbuchliste auf der Leitung 48 vom Wörterbuchspeicher 28 an das Schalt-; glied 50 ausgegeben und dadurch die übertragung des im Register 44 gespeicherten Wörterbuchwortes auf die Leitung 52 als das wahrscheinlichste Alphafeld ermöglicht. Dieses Alphafeld wird in das alphanumerische Ausgaberegister 8 zur Ausgabe auf die Ausgabe leitung IO eingegeben. Somit wird dasjenige im Wörterbuch-; speicher 28 gespeicherte Wörterbuchwort auf die Leitung 10 aus- | gegeben, welches höchstwahrscheinlich von der OZE als das im I OZE-Wort-Schieberegister 14 gespeicherte OZE-Wort falsch gelesen j wurde. i

Die genaue Darstellung der Verschiebesteuerung 20 in Fig. 4 zeigt den Modulo-4-Zähler 204 und den Modulo-4-Zähler 214, die ein Signal über eine der Leitungen 80a, 80b, 80c oder 8Od von der Verschiebefehls-Einheit 162 empfangen, die einen Begrenzungswert von 1 oder 2 in die Zähler 204 oder 214 setzt, um eine Ausgabe für die Rückstellung des Flipflop 206 bzw. 216 erzeugen zu können. Auf diese Weise kann der Zähler 204 so programmiert werden, daß der Inhalt des OZE-Wort-Schieberegisters i 14 um eine oder zwei Zellenpositionen verschoben wird und der j Zähler 214 kann so programmiert werden, daß der Inhalt des Wör- ₍ terbuchwort-Schieberegisters 26 um ein oder zwei Zellenpositio- ί nen verschoben wird. ί

Der Taktoszillator 200a und 200b kann ein Einzeloszillator sein, dessen Ausgangsimpulse durch die Zähler 204 und 214 gezählt werden. Ein Signal auf einer der Leitungen 80 von der Schiebebefehls-Einheit 162 setzt die Begrenzung für den Zähler 204 und durch das ODER-Glied 202 wird der Zähler 204 zurückgestellt und beginnt das Zählen der Ausgangsimpulse vom Taktoszillator 200a. Gleichzeitig wird das Flipflop 206 eingeschaltet und das Potential des Α-Ausgangs des Flipflop schaltet das UND-Glied 208 ein und überträgt dadurch den Spannungsverlauf vom Taktoszillator an den Abwärtszähler 210 und über die Ausgabeleitung 22 an das ha 973 006 5 0 9 8 A 3 / 0 5 6 5

OZE-Wort-Schieberegister 14. Der Abwärtszähler 210 wurde über die \ Leitung 19 mit dem Ergebnis der OZE-Zeichenzählung des ZeichenjZählers 18 geladen. Wenn im Betrieb beispielsweise die Verschiebe-Ibefehls-Einheit 162 ein Signal über die Leitung 80c an die Ver- !schiebesteuerung 20 ausgegeben hat, wird in den Zähler 204 ein j Grenzwert von 2 gesetzt. Zwei Taktimpulse vom Taktoszillator 200a jwerden somit durch das UND-Glied 208 an den Abwärtszähler 210 und !über die Leitung 22 an das OZE-Wort-Schieberegister 14 übertragen, iWenn der Zähler 204 den Grenzwert von 2 erreicht und einen Impuls zur Rückstellung des Flipflop 206 ausgibt, wird das UND-Glied abgeschaltet. Auf diese Weise wurde der Inhalt des OZE-Wort-Schieberegisters um zwei Positionen verschoben und der Abwärtszähler hat von der ursprünglichen Zeichenzahl des OZE-Wortes den Wert subtrahiert. Eine ähnliche Operation gilt für den Zähler 214, der j die Inhalte des Wörterbuchwort-Schieberegisters 26 und des Kenn-I zeichenbit-Schieberegister 34 verschiebt. Wenn der Inhalt der Ab-I wärtszähler 210 oder 220 auf 0 reduziert wurde und entweder das OZE-Wort oder das Wörterbuchwort vollständig verarbeitet wurde, wird auf die Leitung 74 ein Null-Ausgangssignal gegeben, welches dem Wörterbuchspeicher 28 und 72 entsprechende Anzeigen liefert.

Die detaillierte Darstellung des Multiplextaktgebers 108 in Fig. 7 zeigt den Modulo-4-Zähler 294, dessen Zählgrenze durch ein Signal über die Leitung 102a, 102b/ 102d vom Kennzeichendecodierer 100 gewählt wird. Wenn das Wörterbuchwort-Schieberegister 26 ein neues Zeichen in die Zelle L schiebt, wird das entsprechende im Kennzeichenbitschieberegister 35 gespeicherte Kennzeichenbit über die Leitung 98 an den Kennzeichendecodierer 100 ausgegeben. Wenn das Kennzeichenbit eine einfache Substitutionsneigung anzeigt, wird ein Signal vom Kennzeichendecodierer 100 über die Leitung 102a ausgegeben, welches einen Grenzwert von 1 in den Zähler 294 setzt. Wenn das an den Kennzeichendecodierer ausgegebene Kennzeichenbit eine Spaltungs-, Zusammenziehungsoder Häufungsneigung anzeigt, gibt der Kennzeichendecodierer 100 ein Signal über eine der Leitungen 102b, 102c oder

WA 973 006 5 0 9 8 A 3 / 0 5 6 5

102d aus und setzt einen Grenzwert von 4 in den Zähler 294. Der Zähler 294 wird rückgestellt und gestartet über ein ODER-Glied 292, welches den Grenzwert empfängt, und der Zähler beginnt die vom Oszillator 290 abgegebenen Taktimpulse zu zählen. Gleichzeitig setzt das Signal vom ODER-Glied 292 das Flipflop 296 und betätigt dadurch das UND-Glied 298, so daß die Taktimpulse vom Oszillator 290 auf die Leitung 110 ausgegeben werden als die Multiplextaktimpulse für die Multiplexer 94, 96 und 128. Wenn ein Signal über die Leitung 102b empfangen wurde, wird der Grenzwert 4 in den Zähler 294 gesetzt und das UND-Glied 298 läßt vier MuI-tiplextaktimpulse auf die Leitung 110 ausgeben, bevor der Zähler 294 den Grenzwert von 4 erreicht und das Flipflop 296 zurückstellt, wodurch das UND-Glied 298 abgeschaltet wird.

Die detaillierte Darstellung des Multiplexers 94 in Fig. 5 zeigt den Modulo-4-Zähler 230, der die Taktimpulse über die Leitung vom Multiplextaktgeber 108 empfängt. Der Zähler 230 hat vier Ausgangsleitungen, von denen die erste mit 1 beschriftet und an das UND-Glied 232 angeschlossen ist und ein Signal führt, wenn der Zähler den ersten Taktimpuls über die Leitung 110 zählt. Die zweite Ausgangsleitung vom Zähler 230 mit der Beschriftung 2 führt zum UND-Glied 236 und ist nur erregt, wenn der Zähler den zweiten Taktimpuls über die Leitung 110 zählt. Die dritte Ausgangsleitung mit der Beschriftung 3 ist an die UND-Glieder 238 und geführt und nur erregt, wenn der Zähler 230 den dritten Taktimpuls über die Leitung 110 zählt. Die vierte Ausgangsleitung mit der Beschriftung 4 zum UND-Glied 242 ist nur erregt, wenn der Zähler 230 den vierten Taktimpuls auf der Leitung 110 zählt. Wenn das dem in der Zelle L₁ des Wörterbuchschieberegisters 26 gespeicherten Kennzeichen entsprechende Fehlerneigungskennzeichen eine einfache Substitution anzeigt, gibt der Kennzeichendecodierer 100 auf die Leitung 102a ein Substitutionssignal aus, welches eine Eingabe für das UND-Glied 258 des Multiplexers 94 in Fig. 5 ist. Da ein Signal auf der Leitung 102a eine Eingabe zum Multiplextaktgeber 108 in Fig. 7 ist und den Grenzwert des

WA 973 006 509843/0565

Zählers 294 auf 1 setzt, läuft nur ein Taktimpuls über die Leitung 110 zum Modulo-4-Zähler 230 des Multiplexers 94 in Fig. 5. Der Zähler 230 zählt den Taktimpuls auf der Leitung 110 und erregt die zum UND-Glied 232 führende Ausgangsleitung mit der Beschriftung 1. Das UND-Glied 232 leitet dadurch den Inhalt der Zelle K auf der Leitung 82 vom OZE-Wort-Schieberegister 14 über die Leitung 114 zum Adreßregister 116. Die Ausgangsleitung mit der Beschriftung 1 des Zählers 230 ist auch an das Schaltglied 258 angeschlossen und ein Signal darauf bereitet das Schaltglied zusammen mit dem Substitutionssignal auf der Leitung 102 zur übertragung eines Signales über das Verzögerungsglied 234 zur Rückstellung des Zählers 230 vor. In der detaillierten Darstellung des Multiplexers 96 in Fig. 6 empfängt der Modulo-4-Zähler 260 gleichzeitig den ersten Taktimpuls über die Leitung 110 und schaltet die Ausgangsleitung mit der Beschriftung "1", die zum UND-Glied 262 führt, ein, wodurch der Inhalt der Zelle L₁ über die Leitung 88 vom Wörterbuchwort-Schieberegister 26 auf die Leitung 120 zum Adreßregister 122 geleitet wird. Die Ausgangsleitung 1 vom Zähler 260 ist auch mit dem UND-Glied 263 verbunden, welches dadurch vorbereitet wird zum Durchschalten des Sub stitutionssignales auf der Leitung 102a zum Verzögerungsglied zur Rückstellung des Zählers 260. Der Inhalt der Zelle K₁ des OZE-Wortschieberegisters 14 wird somit zum Inhalt des Adreßregisters 116 und der Inhalt der Zelle L₁ des Wörterbuchwort-Schieberegisters 26 wird zum Inhalt des Adreßregisters 122, um die bedingte Wahrscheinlichkeit für einfache Substitution P (K₁]L₁) zu adressieren. Die detaillierte Darstellung des Multiplexers 128 in Fig. 8 zeigt den Modulo-4-Zähler 302, der den Taktimpuls über die Leitung 110 vom Multiplextaktgeber 108 empfängt. Der Zähler 302 hat vier Ausgangsleitungen mit den Beschriftungen 1,2 3 und 4, von denen jede nur erregt ist, wenn der entsprechende Wert durch den Zähler 302 gezählt wird. Der Multiplexer 128 erregt bei Empfang des Substitutionssignales über die Leitung 102 das UND-Glied 308 und schaltet das UND-Glied 306 ab. Wenn der erste Taktimpuls über die Leitung 110 empfangen wird, wird das UND-Glied 304 erregt und leitet dadurch das bedingte

WA 973 006 50 9 8 4 3/0565

Wahrscheinlichkeitsprodukt P(K | L ), welches von der Speichermatrix für bedingte Wahrscheinlichkeit 124 und einem Eingangssignal j über die Leitung 126 adressiert wurde, durch das UND-Glied 304 und: das UND-Glied 308 auf die Leitung 164 zum Multiplizierer 58. Das
Ausgangssignal des UND-Gliedes 308 dient als Rückstellsignal, wel-: ches durch das Verzögerungsglied 309 verzögert wird und den Zähler \ 302 rückstellt. Zum Betrieb der Multiplexer 94, 96 und 128 gehört ; das sequentielle Laden der Register 130, 132, 134 und 136 mit den ι von der Speichermatrix 124 adressierten bedingten Wahrscheinlichkeiten, wenn das zu dem Zeichen in der Zelle L₁ gehörende Fehlerneigungskennzeichen eine Teilung, Zusammenziehung oder Häufung ! anzeigt. I

i Ohne vom Rahmen der Erfindung gemäß Darstellung in Fig. 3 abzu- j weichen, können der Wörterbuchspeicher 28 und die Speichermatrix

für bedingte Wahrscheinlichkeit 124 jeweils auch ein Teil dessel- ι

ι ben Speichers sein. Anstelle eines OZE-Wort-Schieberegisters 14

und des Multiplexers 94 in Verbindung mit dem Wörterbuchwort-Schieberegister 26 und dem Multiplexer 96 zur unterschiedlichen
Verschiebung der Zeichen in den entsprechenden darin befindlichen
Wörtern, wie sie beschrieben wurde, können auch das OZE-Wort und
das Wörterbuchwort entsprechend in zwei stationären Registern
gespeichert werden, von denen jede Zeichenposition mit einer
Schalteinrichtung zum Schalten der gewählten Kombination von
Zeichen auf die Adreßregister 116 und 122 verbunden ist. Zur
praktischen Durchführung einer solchen Schalteinrichtung würden
die Zeichen des OZE-Wortes in einem ersten stationären Register
gespeichert, wobei die Zeichen in der Reihenfolge des Empfanges
von der OZE angeordnet werden, und zwar das erste Zeichen an
einem gegebenen Ende des OZE-Wortes, wodurch eine erste Position
eines Fehlerwortursprunges definiert ist. Das würde der Zelle
K₁ im OZE-Wortschieberegister 14 entsprechen. Die Zeichen und
die Fehlerneigungskennzeichen des Wörterbuchwortes würden in
einem zweiten stationären Register gespeichert, wobei die Zeichen in einer Reihenfolge angeordnet sind, die.der Reihenfolge

WA 973 006

von Zeichen im ersten stationären Register entspricht. Ein erstes Zeichen im Wörterbuchwort würde so gesetzt, daß es dem ersten Zeichen im OZE-Wort entspricht und eine erste Position für einen Referenzwortursprung definiert. Das entspricht natürlich der !zelle L im Wörterbuchwort-Schieberegister 26. Wenn z.B. die Feh-

I 1

jlerneigungsanzeige für das am Referenzwortursprung im Referenz-Iwort stehende Zeichen eine Zeichenspaltungsneigung anzeigt, würden in der Schalteinrichtung folgende Vorgänge ablaufen. Eine erste 'bedingte Wahrscheinlichkeit einer einfachen Substitution, wobei vorausgesetzt wird, daß das am Referenzwortursprung stehende Zeichen im Referenzwort abgetastet wurde, und daß das OZE das Zeichen am Fehlerwortursprung im Fehlerwort ersetzte. Dieses würde der einfachen Substitutionswahrscheinlichkeit P(K.|L.) entsprechen, die oben beschrieben wurde. Dann schaltet die Schalteinrichtung das dem Zeichen am Referenzwortursprung am nächsten stehende Zeichen und das dem Zeichen am Fehlerwortursprung im Fehlerwort am nächsten stehende Zeichen durch zur Adressierung der zweiten bedingten Wahrscheinlichkeit entsprechend P(K, |L₂) gemäß obiger Beschreibung. Die Schalteinrichtung schaltet dann das j Zeichen am Referenzwortursprung im Referenzwort und das Zeichen am Fehlerwortursprung und das dem Zeichen am Fehlerwortursprung am Fehlerwort am nächsten stehende Zeichen durch, um eine dritte bedingte Wahrscheinlichkeit entsprechend P(K Kl|L ) gemäß obiger Beschreibung zu adressieren. Schließlich würde die Schalteinrichtung das dem Zeichen am Referenzwortursprung im Referenzjwort am nächsten stehende Zeichen und das zweitnächste Zeichen j nach dem Zeichen im Fehlerwortursprung des Fehlerwortes durchschal

iten, um so eine vierte bedingte Wahrscheinlichkeit entsprechend IP(K-jL₉) zu adressieren. Eine solche Schalteinrichtung-würde j aufeinanderfolgende Sätze entsprechender Zeichen im OZE-Wort wählen und das Wörterbuchwort zum Vergleich entsprechend den Schiebebefehlen von der Verschiebebefehls-Einheit 162. Unter Steuerung dieser Schiebebefehls-Einheit 162 würde die Schiebeeinrichtung die Lage sowohl des Fehlerwortursprungs als auch des Referenzwortursprunges um eine Zeichenposition ver-

973 006 80 9873/0E6S

schieben, wenn der Vergleicher anzeigt, daß eine einfache Substitution wahrscheinlicher ist als eine SpaltungsSegmentierung. Die Schalteinrichtung würde den Fehlerwortursprung um zwei Zeichenpositionen und den Referenzwortursprung um eine Zeichenposition verschieben, wenn die SpaltungsSegmentierung wahrscheinlicher erscheint als eine einfache Substitution analog der oben beschriebenen Schieberegisteroperation. Wo die Fehlerneigungsanzeige die Neigung zur Zeichenzusammenziehung anzeigte, verschiebt die Schalteinrichtung den Fehlerwortursprung und den Referenzwortursprung um eine Zeichenposition, wenn die Wahrscheinlichkeit der einfachen Substitution größer ist als die der Zusammenziehungs-Segmentierung. Die Schalteinrichtung würde den Fehlerwortursprung um eine Zeichenposition und den Referenzwortursprung um zwei Zeichenpositionen verschieben, wenn die Wahrscheinlichkeit der Zeichenzusammenziehung größer wäre als die Wahrscheinlichkeit der einfachen Substitution.

Es gibt etwa ein halbes Dutzend Zeichen, die zur horizontalen Spaltungssegmentierung neigen und in Tabelle I gezeigt sind. Etwa ein Dutzend Zeichenpaare, die in Tabelle II gezeigt sind, neigen zur Zusammenziehungs-Segmentierung. Von sich aus bilden sie nur einen kleinen Teil des Alphabet-Satzes der im Wörterbuchspeicher 28 gespeicherten Wörterbuchwörter. Im Ausführungsbeispieläuft die Analyse des Wahrscheinlichkeitsfaktors weiter, als wenn eine einfache Zeichensubstitution der einzige zu berücksichtigende Verstümmelungsfaktor wäre, wenn kein zu dem Zeichen oder Zeichenpaar gehörendes Kennzeichen auftritt. Nur wenn ein Kennzeichen auftritt, umfaßt die erfindungsgemäße Operation eine Analyse möglicher Segmentierungsvorgänge. Im Ausführungsbeispiel sind die Zeichen und Zeichenpaare in den Tabellen I und II speziell in der im Wörterbuchspeicher 28 gespeicherten Form codiert, so daß der Kennzeichencode Teil des Alpha-Zeichencodes ist. Jedes Alphazeichen wird mit nur fünf der normalerweise zum Speichern eines Zeichens verwendeten 8 Bits gespeichert. Die anderen drei Bits stehen dann zur Bezeichnung der Neigungen zur Zeichensegmentierung, zur Zeichenpaar-Zusammenziehung und zur Zeichenpaarhäu-

^⁹⁷³⁰⁰⁶ 5098(3/0585

-χ'- 24Q0757

fung zur Verfügung. Es kann jedoch auch ein anderes Ausführungsbeispiel verwendet werden, so daß man keine SpezialCodierung der Segmentierungsneigung der Zeichen im Wörterbuchspeicher 28 braucht. In diesem anderen Ausführungsbeispiel fiele das in Fig. 3 gezeigte Kennzeichenbit-Schieberegister 34 weg und würde ersetzt durch einen beschreibbaren Festwertspeicher mit einem ROS-Adreßregister, dessen Eingänge mit den Leitungen 88 und 90 für die Zellen L. und L des Wörterbuchwort-Schieberegisters 26 verbunden sind. Der bescnreibbare Festwertspeicher speist über seine Ausgangsleitung 98 den Kennzeichendecodierer 100. Dieser beschreibbare Festwertspeicher würde die Information über eine Spaltungssegmentierung nach Darstellung in Tabelle I und Information über die in Tabelle II gezeigte Zusammenziehungssegmentierung enthalten. Die im Wörterbuchspeicher 28 gespeicherten Wörterbuchwörter könnten dann auf konventionelle Weise codiert werden. Wenn ein Wörterbuchwort in das Wörterbuch-Schieberegister 26 geladen wird, empfinge der beschreibbare Festwertspeicher als Eingang den Inhalt der Zellen L. und L₂ und diese Kombination spricht ein Fehlerneigungsmerkmal an, welches anzeigt, ob die einfache Substitution, die Spaltung, die Zusammenziehung oder die Häufung eine Möglichkeit zur Verstümmelung der Zeichen ist. Das Fehlerneigungsmerkmal würde auf die Leitung 98 in ähnlicher Form ausgegeben wie durch die Zelle 35 im Kennzeichenbit-Schieberegister 34 des in Fig. 3 gezeigten Ausführungsbeispieles. Das ROS-Adreßregister und der beschreibbare Festwertspeicher bilden eine Einrichtung zur Erzeugung eines Fehlerneigungsmerkmales.

Die Arbeitsweise des in Fig. 3 gezeigten Gerätes wird gezeigt durch Verarbeitung des Wortes "Wreck", das von der OZE falsch gelesen wird als "IWn c". Das Sternzeichen bezeichnet bekanntlich ein zurückgewiesenes oder nicht erkanntes Zeichen. Drei im' Wörterbuchspeicher 28 gespeicherte Wörterbuchwörter, nämlich "Break", "Wreck" und "Freak" werden mit dem OZE-Eingabewort "IWn c" verglichen. Die Analyse für jedes dieser Wörter ist in

9?3 006 509843/0585

den Tabellen VIII, IX und X gezeigt.

Die Illustration der Arbeitsweise beginnt, nachdem das Gerät der Fig. 3 das Wörterbuchwort "Break" mit dem OZE-Eingabewort IWnI¹C verglichen hat. Bis zu diesem Punkt sei einmal angenommen, daß das Wörterbuchwort mit dem höchsten gesamten Produkt für die bedingte Wahrscheinlichkeit durch die OZE als OZE-Eingabewort IWn 4c falsch gelesen worden zu sein das Wort "Break" ist und daß daher das Wort "Break" im Register 44 für das beste Wort und seine gesamte bedingte Wahrscheinlichkeit von 4, 4 mal ίο"¹ nach Darstellung in Tabelle VIII im Register (B)66 für das höchste Produkt gespeichert werden. Das OZE-Eingabewort wird durch die Verschiebesteuerung 20 so verschoben, daß der erste zu prüfende Buchstabe, nämlich der Buchstabe c in die Zelle K. gesetzt wird. Gleichzeitig lädt der Wörterbuchspeicher 28 das Wort "Wreck" in das Wörterbuchwort-Schieberegister 26 so, daß der Buchstabe "k" in der Zelle L. steht. Gleichzeitig wird das zu dem Buchstaben k des Wörterbuchwortes, der in der Zelle L gespeichert ist, gehörende Kennzeichen durch den Wörterbuchspeicher 28 in die Zelle 35 des Kennzeichenbit-Schieberegisters 24 geladen. Tabelle IX zeigt die relative Position des OZE-Wortes, des Wörterbuchwortes und der Kennzeichenbits in dieser Stufe 1. Tabelle IX zeigt die Kennzeichenbits zur Zusammenziehung als Fragezeichen, zur Häufung als Nummernzeichen und zur Spaltung als Ausrufungszeichen. Aus Tabelle IX ist zu entnehmen, daB das Buchstabenpaar "ck" des Wortes "Wreck" zu einem Zusammenziehungsfehler neigt, was durch die Tabelle II bestätigt wird. Die Tabelle IX zeigt weiter, daß das Kennzeichenbit für Häufung zu dem Zeichenpaar "re" im Wort "Wreck" gehört, was ebenfalls aus Fig. 2 zu entnehmen ist. Tabelle IX zeigt, daß der Buchstabe "WJ¹ im Wort "Wreck" zur Spaltung neigt, wie auch aus der Tabelle I zu entnehmen ist.

In der ersten in Tabelle IX gezeigten Stufe gehört zum Kennzeichenbit für den ersten Buchstaben "k" des Wörterbuchwortes "Wreck" das Fehlerneigungskennzeichen "?", welches eine Zusammenziehungs- neigung bezeichnet. Das Kennzeichen für die Zusammensi^hungsnei-

573 006 509843/0565

gung steht in der Zelle 35 des Kennzeichenbit-Schieberegisters 34 j und wird über die Leitung 98 durch den Kennzeichenbit-Decodierer ι 100 abgefühlt, der ein Ausgangssignal auf der Leitung 102c erzeugt, das eine Zusammenziehungsneigung anzeigt. Das Signal auf ■ der Leitung 102c veranlaßt den in Fig. 7 gezeigten Multiplextaktgeber dazu, einen Grenzwert gleich vier für den Zähler 294 festzusetzen und stellt den Zähler 294 rück und startet ihn. Das Signal auf der Leitung 102c schaltet auch das Flip-Flop 296 um und schaltet dadurch das Schaltglied 298 ein, so daß die vom Taktoszillator 290 kommenden Impulse auf die Leitung 110 zur Multiplextaktierung ausgegeben werden können. Da der Grenzwert von 4 für den Zähler 294 festgesetzt wurde, werden vier aufeinanderfolgende Taktimpulse vom Multiplextaktgeber 8 abgegeben, bevor der Zähler 294 einen Rückstellimpuls an das Flip-Flop 296 ausgibt und dadurch das UND-Glied 298 abschaltet und die Abgabe von Taktimpulsen an die Leitung 110 beendet. Ausgewählte bedingte Wahrscheinlichkeiten werden von der Matrix 124 wie folgt adressiert. Das Signal auf der Leitung 102c in Verbindung mit dem ersten Taktimpuls vom Multiplextaktgeber 108 veranlaßt den Multiplexer 94 der Fig. 5 zur Verbindung der Leitung 82 von der Zelle K mit der Leitung 114 und auf diese Weise wird der Buchstabe "c" aus der Zelle K₁ in das Adreßregister 116 übertragen. Der erste Taktimpuls vom Multiplextaktgeber 108 veranlaßt den Multiplexer 96 der Fig. 6 zur Verbindung der Zelle L₁ über die Leitung 88 mit der Leitung 120, wodurch der Inhalt der Zelle L-, nämlich der Buchstabe "k" an das Adreßregister 122 übertragen wird. Die bedingte Wahrscheinlichkeit P(c/k), die gleich ist 6,7 mal 10 gemäß Darstellung in Tabelle IX wird somit von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer 128 ausgegeben. Der Multiplexer 128 der Fig. 8 läßt aufgrund dieses ersten Taktimpulses auf der Leitung 110 die erste bedingte Wahrscheinlichkeit über die Leitung 126, das UND-Glied 304 und das UND-Glied 306 in das Register 130 laden. Aufgrund des zweiten Taktimpulses vom Multiplextaktgeber 108 verbindet der Multiplexer 94 die Zelle K₂ über die Leitung 84 mit der Leitung 114 und lädt dadurch das Zu-

WA 973 006 509843/0565

*c-

rückweisungssymbol "+" vom OZE-Eingabewort "IDWn*tc" in das Adreßregister 116. Gleichzeitig wird durch den zweiten Taktimpuls vom Multiplexer 108 der Inhalt der Zelle L₃ über die Leitung 90 mit der Leitung 120 verbunden und dadurch der Buchstabe "c" vom Wörterbuchwort "Wreck" in das Adreßregister 122 übertragen. Dann wird die bedingte Wahrscheinlichkeit P(#/c), die gleich ist

— 2 i

2,4 mal 10 nach Darstellung in Tabelle IX von der Speichermatrix!

für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer 128 ausgegeben. Aufgrund des zweiten Taktimpulses über die Leitung 110 läßt der Multiplexer 128 die zweite bedingte Wahrscheinlichkeit über die Leitung 126 und das UND-Glied 312 in das Register 132 übertragen. Aufgrund des dritten Taktimpulses auf der Leitung 110 und des Zusammenziehungssignales auf der Leitung 102c verbindet der Multiplexer 94 den Inhalt der Zelle Κ_χ über die Leitung 82, das UND-Glied 248 und das UND-Glied 238 mit den Leitungen 114 und lädt dadurch den Buchstabeti "c" aus dem OZE-Wort in das Adreßregister 116. Gleichzeitig veranlaßt der dritte Taktimpuls vom Multiplextaktgeber 108 in Verbindung mit dem Signal zur Zusammenziehung auf der Leitung 102c das Laden des Inhaltes der Zelle L. über die Leitung 88, das UND-Glied 276 und das UND-Glied 270 auf die Leitung 118, wodurch der Inhalt der Zelle L₁, nämlich der Buchstabe "k" in das Adreßregister 122 übertragen wird. Gleichzeitig wird der Inhalt der Zelle L₂, nämlich der Buchstabe "c" aus dem Wörterbuchwort über die Leitung 90, das UND-Glied 278, das UND-Glied 268 und die Leitung 120 in das Adreßregister 122 übertragen. Die bedingte Wahrscheinlichkeit P (c/ck), die gleich 1,9 mal 10 gemäß Darstellung in Tabelle IX ist, wird somit von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und auf der Leitung 126 zum Multiplexer 128 ausgegeben. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 überträgt der Multiplexer 128 diese dritte Wahrscheinlichkeit über die Leitung 126 und das UND-Glied 314 zum Register 134. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber 108 und des Zusammenziehungssignales auf der Leitung 102c überträgt der Multiplexer 94 den Inhalt der Zelle K₃ über die Leitung 84, das UND-Glied 256 und das UND-Glied 242 auf die Leitung 1

WA 973 006 509843/056 5

-tr-

114, wodurch das * aus dem OZE-Wort "IWn*c", das im OZE-Schieberegister 14 gespeichert ist, in das Adreßregister 116 übertragen ! wird. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber 108 j und des Zusammenziehungssignales auf der Leitung 102c überträgt der Multiplexer 96 gleichzeitig den Inhalt der Zelle L₃ über die j Leitung 92 über das UND-Glied 286 und das UND-Glied 272 auf die j Leitung 120 und dadurch den Buchstaben "e" aus dem Wörterbuchwort j "Wreck" in das Adreßregister 122. Die bedingte Wahrscheinlichkeit P(+/e), die gleich ist 2,8 mal 10 nach Darstellung in Tabelle IX, wird somit von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer ! 128 übertragen. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber 108 überträgt der Multiplexer 128 die vierte Wahrscheinlichkeit auf der Leitung 226 über das UND-Glied 316 und das UND- -Glied 320 zum Register 36. Aus den bedingten Wahrscheinlichkeiten und dem Vergleich ihrer entsprechenden Größen werden jetzt die Wahrscheinlichkeitsprodukte errechnet. Der Multiplizierer 138 multipliziert den Inhalt des Registers 130 mit dem Inhalt des

-4 Registers 132 und erhält als erste Wahrscheinlichkeit 1,6 mal 10 Gleichzeitig multipliziert der Multiplizierer 140 den Inhalt des Registers 134 mit dem des Register 136 und erhält ein zweites

-4

Wahrscheinlichkeitsprodukt 5,3 mal 10 . Die durch die Multiplizierer 138 und 140 erzeugten Produkte werden durch den Vergleicher 146 verglichen, der feststellt, daß das Wahrscheinlichkeitsprodukt vom Multiplizierer 140 größer ist als das Produkt vom Multiplizierer 138. Das bedeutet, daß ein Zeichenzusammenziehungsfehler wahrscheinlicher ist als ein einfacher Substitutuionsfehler für die die Zellen K₁ und K₀ und die Zellen L₁, L₀ und L- belegenden Zeichen.

Die in dem größeren Wahrscheinlichkeitsprodukt enthaltene bedingte "Wahrscheinlichkeit wird jetzt im Wörterbuchwort multipliziert. Der Vergleicher erregt daher die Leitung 160 und schaltet das Schaltglied 150 durch, so daß der Inhalt P(c/ck) des Registers 134

973 006 509843/0565

über die Leitungen 151, 153 und 156 in den Multiplizierer 58 eingegeben wird. Diese bedingte Wahrscheinlichkeit P(c/ck) wird mit dem Inhalt des Produktregisters (A)56 multipliziert, der Eins ist,

-4
und das laufende Produkt 5,3 mal 10 wird im Produktregister 56 gespeichert. Der Vergleicher 62 vergleicht die Größe des Inhaltes des Produktregisters A mit dem Inhalt des Registers (B)66 für das höchste Produkt und stellt fest, daß A größer ist als B. Somit wird kein Signal auf die Leitung 78 gegeben. Die Leitung 70 ist vorbereitet, das Schaltglied 72 wird jedoch nicht durch die Verschiebesteuerung 20 über die Wortende-Leitung 74 durchgeschaltet und daher ist zu diesem Zeitpunkt das Schaltglied 64 gesperrt.

Ein Schiebebefehl wird abgegeben, um den Inhalt des OZE-Wort-Schieberegisters 14, des Wörterbuchwort-Schieberegisters 26 und des Kennzeichenbit-Schieberegisters 34 unterschiedlich zu verschieben. Der Vergleicher 146 erregt die Leitung 160 und veranlaßt die Verschiebebefehls-Einheit 162 der Fig. 9 zum Durchschallten des in Fig. 9 gezeigten UND-Gliedes 338 in Verbindung mit dem zusammenziehungssignal auf der Leitung 102c, um ein Signal auf der leitung 8Od zu erzeugen, welches der zur Verschiebesteuerung 20 übertragene Schiebebefehl ist. Die Verschiebesteuerung 20 wird angewiesen, den Inhalt des OZE-Wortschieberegisters 14 um eine Position und des Wörterbuchwortschieberegisters 26 und des Kennzeichenbit-tSchieberegisters 34 um zwei Positionen zu verschieben. Das Ergebnis dieser unterschiedlichen Verschiebung ist in der Stufe 2 der Tabelle IX gezeigt. Da vier Taktimpulse vom Multiplextaktgeber 108 abgegeben wurden, werden der Modulo-vier-Zähler 230 im Multiiplexer 94, der Modulo-vier-Zähler 260 im Multiplexer 96 und der Modulo-vier-Zähler 302 im Multiplexer 128 automatisch auf Null rückgestellt und sind für die Analyse des nächsten Zeichensatzs bereit.

In der zweiten Stufe der Analyse zum Vergleich des Wörterbuchwortes "Wreck" mit dem OZE-Wort "IWn^c" sind die Zeichen so aus-

973 006 509843/0565

.Sf-

gerichtet, daß der Buchstabe "e" des Wörterbuchwortes in der Zelle L. dem "+'·' des OZE-Wortes .in der Zelle K. entspricht und das Zeichen "r" des Wörterbuchwortes in der Zelle L₂ dem Zeichen "n" des OZE-Wortes in der Zelle K₂. Das Zeichpaar "re" des Wörterbuchwortes führt ein Häufungskennzeichen in der Zelle 35 des Kennzeichenbit-Schieberegisters mit sich. Dieses Kennzeichen zur Häufungsneigung wird über die Leitung 98 in den kennzeichendecodierer 100 übertragen, der ein Haufungssignal über die Leitung 102d abgibt. Aufgrund des Häufungssignales auf der Leitung 102d setzt der Mulitplextaktgeber 108 in Fig. 7 einen Grenzwert von vier in den Zähler 294 und stellt den Zähler 294 rück und startet ihn, und er schaltet das Flip-Flop 296 um und schaltet dadurch das UND-Glied 298 ein zur übertragung von Vier-Taktimpulssn vom Taktoszillator 290 über die Leitung 110.

Ausgewählte bedingte Wahrscheinlichkeiten werden wie folgt adressiert. Der erste und zweite Taktimpuls vom Mulitplextaktgeber lösen die selbe Folge von Vorgängen aus im Multiplexer 94, Multiplexer 96 und im Multiplexer 128, die für die Zusammeriziehungsoperation beschrieben wurde. Die bedingte Wahrscheinlichkeit P(+/e), die gleich ist ,2,8 mal 10 gemäß Darstellung in Tabelle II wird somit im Register 130 gespeichert und die bedingte Wahrscheinlichkeit P (n/r) , die gleich ist 5,9 mal 10 nach Darstellung in Tabelle IX wird im Register 132 gespeichert. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 und des Häufungssignales auf der Leitung 102d überträgt der Multiplexer 94 der Fig. 5 den Inhalt der Zelle Κ_χ über die Leitung 82, das UND-Glied 250 und das UND-Glied 240 auf die Leitung 212 zum Laden des Adreßregisters 116. Gleichzeitig überträgt der Multiplexer 94 den Inhalt der Zelle K₂ über die Leitung 84, das UND-Glied 252 und das UND-Glied 238 auf die Leitung 114 und lädt dadurch den Buchstaben "n" in das Adreßregister 116. Das Zeichenpaar "n+" steht jetzt im Adreßregister 116. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 und in Verbindung mit dem Häufungssignal auf der Leitung 102d überträgt der Multiplexer 96 der Fig. 6 den Inhalt der Zelle L₁ über die Leitung 88, die UND-Glieder 280 und 270 auf die

^{WA 973} °⁰⁶ 509843/0565

Leitung 118 und den Inhalt der Zelle L₂ über die Leitung 90, die UND-Glieder 282 und 268 auf die Leitung 120, wodurch die Zeichen r" und "e" von den Zellen L₂ und L in das Adreßregister 122

übertragen werden. Die bedingte Wahrscheinlichkeit P(n*/re), die

-4
gleich ist 5,6 mal IO nach Darstellung in Tabelle IX, wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer 128 ausgegeben. Aufgrund des dritten Taktimpulses auf der Leitung 110 überträgt der Multiplexer 128 der Fig. 8 die dritte Wahrscheinlichkeit auf der Leitung 126 über das UND-Glied 314 in das Register 134. Aufgrund des vierten Taktimpulses im Multiplextaktgeber 108 überträgt der Multiplexer 94 nichts vom OZE-Wort-Schieberegister, der Multiplexer 96 überträgt nichts vom Wörterbuchwort-Schieberegister 26. Der Multiplexer 128 der Fig. 8 lädt aufgrund des Häufungssignales auf der Leitung 102d den im Register 324 gespeicherten Wert Eins über das UND-Glied 322 und das UND-Glied 320 in das Register 136.

Wahrscheinlichkeitsprodukte werden jetzt errechnet und verglichen. Der Multiplizierer 128 multipliziert jetzt den Inhalt des Registers 130 mit dem Inhalt des Registers 132 und erzeugt das Produkt 1,6 mal 10 . Der Multiplizierer 140 mulitipliziert den Inhalt des Register 134 mit dem Inhalt des Register 136 und er-

-4
zeugt das Produkt 5,6 mal 10 . Der Vergleicher 146 vergleicht die relativen Größen dieser Produkte und stellt fest, daß der Inhalt des Multiplizierers 146 größer ist als der Inhalt des Multiplizierers 138. Das bedeutet, daß die Wahrscheinlichkeit, daß ein Zeichenhäufungsfehler aufgetreten ist, größer ist als die Wahrscheinlichkeit einer einfachen Substitution für die in den Zellen K₁ und K₂ bzw. L₁ und L₂ gespeicherten Zeichen.

Die im größeren Produkt enthaltene bedingte Wahrscheinlichkeit wird weitergeleitet. Der Vergleicher 146 erregt die Leitung 160 und schaltet dadurch das Schaltglied 150 durch so daß der Inhalt P (n*/re) des Registers 134 über die Leitungen 151 und 153 zur

WA 973 006 509843/0565

Leitung 156 und somit zum Multiplizierer 58 übertragen wird. Der Multiplizierer 58 multipliziert die bedingte Wahrscheinlichkeit P(n»/re) mit dem Inhalt des Produktregisters (2&56 und speichert den Inhalt im Produktregister (A)56. Das neue laufende Produkt hat die Größe 3,0 mal 10 , die der Vergleicher 62 immer noch als größer ermittelt, als der Inhalt des Registers 66 für das höchste Produkt, der 4,4 mal 10 ist, und daher wird die Leitung I78 nicht erregt. Obwohl die Leitung 70 erregt ist, bleibt das !Schaitglied 72 gesperrt, da die Verschiebesteuerung noch nicht zum !Ende des Wörterbuchwortes oder des OZE-Wortes gekommen ist, was durch ein Signal auf der Ausgäbeleitung 74 angezeigt würde. Sojmit werden die Schaltglieder 64 und 42 noch nicht durchgeschaltet.

Jetzt wird ein Verschiebebefehl gegeben. Der Vergleicher 146 erregt die Leitung 160 in Verbindung mit dem Häufungssignal auf jder Leitung 102d, wodurch die Verschiebebefehls-Einheit 162 der jFig. 9 ein Signal auf die Leitung 80b gibt. Das Signal auf der Leitung 80b ist der Verschiebebefehl für die Verschiebeteuerung 20, die daraufhin den Inhalt des OZE-Wort-Schieberegisters um zwei Zellen und des Wörterbuchwort-Schieberegisters sowie des Kennzeichenbit-Schieberegisters um zwei Zellen verschieb In der dritten Stufe der Analyse stimmt also nach Darstellung in Tabelle IX der Buchstabe "W" des Wörterbuchwortes mit dem Buchstaben "W" des OZE-Wortes überein.

etzt beginnt die dritte Stufe der vergleichenden Analyse des Wörberbuchwortes "Wreck" und des OZE-Wortes "IWn*c". Ein zu dem in ler Zelle L gespeicherten Buchstaben "W" gehörendes Fehlerneigungskennzeichen zeigt eine Spaltungsneigung an. Dieses Kennzeichen wird von der Zelle 35 des KennzeichenbitiSchieberegisters 34 über die Leitung 98 zum Kennzeichendecodierer 100 übertragen, der ein Ausgangssignal auf die Leitung 102b gibt. Ein Signal auf äer Leitung 102b zeigt eine Spaltungsneigung an und setzt den renzwert 4 in den Zähler 294 des Multiplextaktgebers 108 in Fig. 7, stellt den Zähler 294 rück und startet ihn und schaltet das

wx 9-73 006-" - -509843/0565

Flip-Flop 296 um, wodurch das UND-Glied 298 eingeschaltet wird, zurj übertragung von vier Taktimpulsen vom Taktoszillator 290 auf die \ Leitung 210.

Ausgewählte bedingte Wahrscheinlichkeiten werden wie folgt adres- ' siert. Der erste und zweite Taktimpuls vom Multiplextaktgeber j 108 veranlassen die konsekutive übertragung des Inhaltes der ! Zellen K₁ und L₁ sowie K₉ und L₉, wie man ihn aus der oben be- · ! schriebenen Zusammenziehungsanalyse erhielt. Die bedingte Wahrscheinlichkeit P(W/W), die gleich ist 0,90 nach Darstellung in j Tabelle IX, wird somit in das Register 130 geladen und die bedingte Wahrscheinlichkeit P(I/ ), die gleich ist 0,15 mal 10~³, wird in das Register 132 geladen. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 und des Spaltungssigriales auf der Leitung 102b überträgt der Multiplexer 194 der Fig. 5 den Inhalt der Zelle K. über die Leitung 82, die UND-Glieder 244 und 240 auf die Leitung 112 und den Inhalt der Zelle K₂ über die Leitung 84 die UND-Glieder 246 und 238 auf die Leitung 114. Die Zeichen "IW" werden somit in das Adreßregister 116 geladen. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 und des Spaltungssignales auf der Leitung 102b wird gleichzeitig der Inhalt der Zelle L durch den Multiplexer 96 der Fig. 6 über die Leitung 88 und die UND-Glieder 274 und 268 zur Leitung 120 übertragen und dadurch das Zeichen "W" in das Adreßregister 122 geladen. Aufgrund des dritten Taktimpulses über die Leitung 110 überträgt der Multiplexer 128 der Fig. 8 diese dritte Wahrscheinlichkeit von der Leitung 126 über das UND-Glied 314 an das Register 134. Aufgrund des vierten Taktimpulses und des Spaltungsfehlersignales auf der Leitung 102b überträgt der Multiplexer 94 den Inhalt der Zelle K₃ (die leer ist) über die Leitung 96, das UND-Glied 254 und das UND-Glied 244 an die Leitung 114. Aufgrund des vierten Taktimpulses und des Spaltungsfehlersignales auf der Leitung 102b überträgt der Multiplexer 96 den Inhalt der Zelle L₃ ( die leer ist ) durch die UND-Glieder 284 und 272 auf die Leitung 120. Diese Leerstellen werden in das Adreßregister 116 und das Adreßregister 122 geladen. Dann wird die bedingte Wahrscheilickeit P(-/-), die gleich

973 006 509843/0565

iO,99 ist gemäß Darstellung in Tabelle IX, von der Speichermatrix I für bedingte· Wahrscheinlichkeit 124 adressiert und über die Leijtung 126 an den Multiplexer 128 ausgegeben. Aufgrund des vierten jTaktsignales 110 überträgt der Multiplexer 128 diese vierte Wahrscheinlichkeit auf der Leitung 126 über die UND-Glieder 316 und 320 zum Register 136.

;Die Wahrscheinlichkeitsprodukte werden jetzt berechnet und ver-¹ glichen. Der Multiplizierer 138 multipliziert den Inhalt des Registers 130 mit dem Inhalt des Registers 132 und erhält ein Produkt 1,3 mal 10"³. Der Multiplizierer 140 mulitipliziert den Inhalt des Registers 134 mit dem Inhalt des Registers 136 und erhält das Produkt 3,5 mal 10~³. Der Vergleicher 146 stellt fest, Idaß der Inhalt des Multiplizierers 140 größer ist, was bedeutet, !daß die Wahrscheinlichkeit einer Spaltung des Zeichens "W" in idie Zeichen "I" und "W" größer ist als die Wahrscheinlichkeit der einfachen Substitution des Buchstabens "W" durch den Buchstaben "W" und des Leerzeichens durch das "I".

Die im größeren Produkt enthaltene Wahrscheinlichkeit wird weitergeleitet. Der Vergleicher 146 erregt somit die Leitung 160 und schaltet dadurch das Schaltglied 150 durch zur übertragung des Inhaltes P(IW/W) des Registers 134 über die Leitungen 151 und 153 zur Leitung 156 und somit zum Multiplizierer 158. Der Multipli zierer 58 multipliziert den Inhalt des Produktregisters (A)56 mit der bedingten Wahrscheinlichkeit P(IW/W), übertragen vom Register 134, und erhält ein neues laufendes Produkt der Größe 1,1 mal 10 . Der Vergleicher 62 stellt fest, daß der Inhalt des Produktregisters (A)56 größer ist als der Inhalt des höchsten Produktregisters (B) 66 für das höchste Produkt, der 4,4 mal 10*"¹³ beträgt, und somit wird kein Signal auf die Leitung 78 gegeben. Die Leitung 70 ist erregt.

Jetzt wird ein Verschiebebefehl gegeben. Der Vergleicher 146 hat die Leitung 160 zusammen mit dem Spaltungsfehlersignal auf der Leitung 102b erregt und das UND-Glied 336 der Verschiebebe-

^{WA 973} °⁰⁶ -50984370565

fehls-Einheit 162 eingeschaltet, wodurch ein Signal auf die Leitung 80c ausgegeben wird. Dieses befiehlt der Verschiebesteuerung 20 die unterschiedliche Verschiebung des OZE-Wort-Schieberegisters um zwei Positionen und des Wörterbuchwort-Schieberegisters sowie des Kennzeichenbit-Schieberegisters 34 um eine Position.

Ein neues "bestes Wort" wird erkannt. Das herunterzählen des Zählers 220 der Verschiebesteuerung 20 in Fig. 4 zeigt an, daß der letzte Buchstabe des Wörterbuchwortes erreicht ist und daher wird ein Signal auf die Leitung 74 ausgegeben, welches anzeigt, daß das Wortende erreicht wurde. Dieses Signal schaltet das Schaltglied 72 durch, und dadurch das Schaltglied 62 zur Übertragung des Inhaltes des Produktregisters (A)56 in das Register (B)66 für das höchste Produkt. Gleichzeitig schaltet das Schaltglied durch, wodurch der Inhalt des Wortregisters, nämlich das Wort "Wreck", Register 44 für das beste Wort übertragen wird.

Das System hat jetzt das neue beste Wort "Wreck" ermittelt, welches im Register 44 gespeichert ist und ein entsprechendes tota-

—9 les bedingtes Wahrscheinlichkeitsprodukt von 1,1 mal 10 hat, das im Register 66 gespeichert 1st. Da die VerschiebeSteuerung festgestellt hat, daß das Wortende erreicht wurde, wird das OZE-Wort "IWn+c" jetzt in die Anfangsposition rückverschoben, so daß das "c" jetzt die Zelle Κ_χ belegt. Gleichzeitig lädt der Wörterbuchspeicher das nächste Wort "Freak" in das Wörterbuchwort-Schieberegister 26 und die entsprechenden Kennzeichenbits in das Kennzeichenbitschieberegister nach Darstellung der Stufe 1 in Tabelle X.

Der Vergleich des Wortes "Freak" mit dem OZE-Wort "IWn+c" wird kurz beschrieben, um die Arbeitsweise des in Fig. 3 dargestellten Gerätes für die einfach Substitution zu zeigen. Das Kennzeichenbit für die einfache Substitution, in diesem Falle überhaupt kein Kennzeichenbit, wird in der Zelle 35 des Kennzeichenbitschieberegisters 34 gespeichert. Diese Anzeige des einfachen Substitutionsfehlers veranlaßt den Kennzeichendecodierer 100 zur Abgabe

WA 973 006 509843/0565

eines einfachen Substitutionssignales auf die Leitung 102a. Das einfache Substitutionssignal auf der Leitung «lG2a setzt einen Grenzwert von 1 in den Zähler 294 des Multiplexers 108 und somit wird nur ein Taktimpuls auf die Leitung 110 gegeben. Aufgrund dieses ersten Taktimpulses verbindet der Multiplexer 94 die Zelle K mit der Leitung 114 und lädt den Buchstaben "c" in das Adreßregister 116. Der Zähler 230 wird dann rückgestellt. Ähnlich verbindet der Multiplexer 96 den Inhalt der Zelle L mit der Leitung 120 und lädt dadurch ein "k" in das Adreßregister 122 und dann wird der Zähler 260 rückgestellt. Aufgrund des ersten Taktimpulses auf der Leitung 110 und des Substitutionssignales auf der Leitung 102a überträgt der Multiplexer 128 die bedingte Wahrscheinlichkeit P(c/k) gleich 6,7 mal 10 gemäß Darstellung in Tabelle X. von der Leitung 126 über die UND-Glieder 304 und 308 zur Leitung 164, die mit der Leitung 156 verbunden ist, wodurch direkt die Wahrscheinlichkeit unter Umgehung der Register 130 bis 136 in den Multiplizierer 58 eingeht. Die Berechnung des laufenden Produktes beginnt wie oben beschrieben. Bei Empfang des Substxtutionssignales auf der Leitung 102a gibt die Verschiebebefehls-Einheit 162 ein Signal auf die Leitung 80a, wodurch die Verschiebesteuerung 20 den Inhalt des OZE-Wort-Schieberegisters 14 und des Wörterbuchwort-Schieberegisters sowie des Kennzeichenbit-Schieberegisters um eine Zelle verschiebt. Der Vergleich des Wörterbuchwortes "Freak" mit dem OZE-Wort"IWn^c" läuft wieder nach Darstellung in Tabelle X und ergibt

—12 ein totales Wahrscheinlichkeitsprodukt von 1,5 mal 10 . Beim Vergleich im Vergleicher 62 mit dem Inhalt des Registers 66 für das höchste Produkt der 1,1 mal io"⁹ ist, löst dieses totale Produkt ein Ausgabesignal auf der Leitung 78 aus, welches die weitere Verarbeitung des Wörterbuchwortes "Freak" stoppt und das OZE-Wort-Schieberegister 14 rückstellt und das nächste Wort im Wörterbuchspeicher 28 in das Wörterbuchwortschieberegister 26 lädt.

Nachdem alle im Wörterbuchspeicher 28 gespeicherten Wörter mit dem OZE-Wort "IWn+c" verglichen worden sind, gibt der Wörterbuch-

509843/0565

speicher 28 ein das Ende der Wörterbuchliste anzeigendes Signal auf die Leitung 48, welches das Schaltglied 50 durchschaltet und dadurch den Inhalt des Registers 44 für das beste Wort mit der Ausgabeleitung 10 verbindet. Da das Wörterbuchwort "Wreck" als das beste Wort im Register 44 gespeichert wurde, gibt das System das Wort "Wreck" als beste Schätzung desjenigen Wortes aus, welches tatsächlich von der OZE abgetastet wurde, als sie das Wort "IWn+c" ausgab.

Das in Fig. 3 gezeigte Gerät zur Fehlerkorrektur aufgrund der größten Wahrscheinlichkeit des regionalen Zusammenhangs kann auch ; für die Nachverarbeitung von Lautzeichen von einem Sprachanalysator benutzt werden. Sprachanalysatoren, wie sie in der US Patentschrift 36 46 576 beschrieben sind, analysieren zusammenhängende menschliche Sprache zu Einheiten von Sprachzeichen, den Phonemen. Forscher berichten darüber, daß ein Problem bei der Erkennung zusammenhängender Sprache die genaue Segmentierung des Sprachsignales in Phonemen ist. Mit dem vorliegenden Gerät zur Fehlerkorrektur aufgrund der größten Wahrscheinlichkeit des regionalen Zusammenhangs können Segmentierungsfehler im ausgegebenen Phonem-Zeichenerkennungsstrom von einem Sprachanalysator korrigiert werden. In dem in Fig. 3 gezeigten System ist die Eingangsleitung 2 die Phoneme-Zeichen-Ausgabeleitung von einem Sprachanalysator, αί den Phonemzeichen-Erkennungsstrom führt. Der Wörterbuchspeicher 28 enthält ein Vokabular gültig gesprochener Wörter, von denen jedes aus seinen Phonemzeichen besteht. Die Segmentierungsfehler, die bei koventionellen Sprachanalysatoren auftreten, sind ähnlich wie die Segmentierungsfehler in optischen Zeichenerkennungsgeräten, nämlich Spaltung Zusammenziehung und Häufung. Die im Wörterbuchspeicher 28 gespeicherten gesprochenen Wörter haben ausgewählte Phonemzeichen, die für ihre vom Sprachanalysator falsch erkannte Neigung zur Segmentierung, Zusammenziehung oder Häufung gekennzeichnet sind. Die Speichermatrix für bedingte Wahrscheinlichkeit 124 enthält die bedingten Wahrscheinlichkeiten für Phonemzeichen-Kombinationen, die eine Neigung zu Spaltungs-, Zusammenziehungsoder Häufungssegmentierungsfehlern haben. Die Neigungen sind eine Charakteristik des Sprachanalysators. Bei der

^{WA 973} °°⁶ 509843/0565

; Nachverarbeitung eines Phonemzeichen-Erkennungsstromes von einem ■^: Sprachanalysator arbeitet ein erfindungsgemäßes Gerät ähnlich wie ; bei der optischen Zeichenerkennung. Die gesprochenen Wörter in dem vom Sprachanalysator ausgegebenen Erkennungsstrom sind die Eingabe über die Leitung 2, die in das Schieberegister 14 geladen j wird. Ein gesprochenes Wörterbuchwort wird in das Wörterbuchwort-Schieberegister 26 vom Wörterbuohspeicher 28 geladen. Die Phonemzeichen des Eingabewortes und des Wörterbuchwortes werden an einem Ende ausgerichtet. Wenn für ein Phonemzeichen beispielsweise eine Teilungsneigung im Wörterbuchwort angezeigt wird, werden von der Speiehermatrix für bedingte Wahrscheinlichkeit 125 bedingte Wahrscheinlichkeitswerte adressiert. Die Berechnung der Wahrscheinlichkeit, daß das erste Phonemzeichen des Wörterbuchwortes durch den Sprachanalysator in das erste und zweite Phonemzeichen des gesprochenen Wortes im ausgegebenen Erkennungsstrom aufgeteilt wurde, wird dann berechnet. Diese Wahrscheinlichkeit bezüglich des regionalen Zusammenhangs wird dann mit der Wahrscheinlichkeit eines einfachen Substitutionsfehlers für die Phonemzeichen verglichen. Wenn die Segmentierungswahrscheinlichkeit größer ist, werder die Phonemzeichen im Schieberegister 14 um einen Schritt gegenübei den Phonemzeichen im Wörterbuchwortschieberegister 26 verschoben, so daß nachfolgende zu vergleichende Phonemzeichenpaare richtig übereinstimmen. Die errechnete größere Wahrscheinlichkeit wird in einem laufenden Produkt im Register 56 kombiniert. Der gesprochene Ausdruck im Wörterbuchspeicher 28 mit dem größten laufenden Produkt wird durch das System über die Leitung 52 als die höchstwahrscheinlich richtige Form des verstümmelten Eingabewortes vom Sprachanalysator ausgegeben.

WA 973 006

509843/0565

Tabelle VIII "Break"

1) Einfache Substitution

OZE I Wn + c WÖRTERBUCH Break KENNZEICHEN „f P(c/k) = 6,7 χ 10

2) Einfache Substitution

OZE I W η + WÖRTERBUCH B r e a

P (+/a) = 1,1 x 10""²

Laufendes Produkt = 7,3 χ

~⁴

3) Häufung	I	X	W
OZE	B	X	r
WÖRTERBUCH	1,0		10
P (η / e)	2,0	10
P(W / r)

P(Wn / re) 3 χ ίο"⁵ X = 2 χ ίο"⁷

4) Einfache Substitution

OZE £

WÖRTERBUCH B

P (I/B) = 2,0 χ 10 *

Produkt = 4,4 χ

Totales Produkt = Laufend

-13

WA 973 006 509 84 3/0565

-

Zusammenziehung

I

W

jtrr
ψ (ρ

*_#

e

SS

,00

+

ίο"³

C

ι

X =

X ⁼⁼

χ = 1,
= 3,5

2460757

WA

OZE

W r

Tabelle IX "Wreck"

7 χ

c k

ΙΟ"²

χ · =

Laufendes

D

WÖRTERBUCH^ -

Ii ι Ii

4 χ

Ii "ρ ι

ίο"²
ίο;²

Laufendes

Produkt

KENNZEICHEN

=

6,

η

9 χ
8 χ

I W

= 1,1 χ

P(c/k)

SS

2,

η +

W

P-(+/C)

i~
S=

If
2,

r e

ιιη Ii

P(c/ck)
P(+/e)

W

=

1O₃"³
10 ^Λ X

W

ΙΟ"²

1,6 χ 1θ"⁴

Häufung

ι ■

■ρ Il

ίο"³

Totales

5,3 χ 1θ"⁴

OZE

8 χ

ίο"⁴

Produkt

Produkt = 5,3 χ 10~⁴

2)

WÖRTERBUCH

Il

9 χ

=

2,

6 χ

P(+/e)

5,

P(n/r)

=

5,

P(n+/re)

Teilung

1,6 χ 1θ"⁴

OZE

,90
,15 χ
35 χ

Produkt = 3,0 χ 1θ"

3)

WÖRTERBUCH

0

=
SS

P(W/W)
p (rw/w)

P( / )

3 χ ΙΟ³
χ 10~³

-

973 006

= Laufend

ίο"⁹

5098A3/0565

-

- %

I

is:

η

τ

W

η

Einfache Substitution

S=

7,0

χ IO"⁴

X "Freak"

Laufendes

2460757

1,5 χ IO¹²

Tabelle

F

r

e

F

r

e

OZE

D

Einfache Substitution

=

6,7 χ 10~³

=

1,1 χ IO"²

χ 10~³

WÖRTERBUCH

+ C

OZE

Einfache Substitution

χ 10~⁴

P<I/F>

a k

WÖRTERBUCH

OZE

io"⁵

P(c/k)

WÖRTERBUCH

I

W

2)

P(+/a)

F

r

+

X

SS

1,0

a

Laufendes

Häufung

=

2,0

OZE

3 χ

I

WÖRTERBUCH

F

Produkt = 7,3 χ 10~

3)

P(n/e)

P (W/r)

P(Wn/re)

2 χ IO"⁷

Produkt = 2,2 χ 10~

4)

Totales Produkt = Laufend

Produkt =

WA 973 006

509843/0565

Claims

PATENTANSPRÜCHE

JjQ Datenverarbeitungssystem zur Auswahl der richtigen Form ' eines fehlerhaften Eingabewortes, das bei der maschinel- • len Zeichenerkennung aufgrund einer Fehlerkennung verstümmelt wurde und dessen richtige Form Mitglied einer

vorgegebenen Klasse von aus mehreren Zeichen bestehenden ' Bezugswörtern ist, gekennzeichnet durch:

! a) einen Speicher (28, Fig. 3) für die vorgegebene Klas- \ se von Bezugswörtern, bei denen für ausgewählte Zeichen

j eine Anzeige für die Neigung des Zeichens gespeichert

! ist, aufgrund eines sogenannten Spaltungsfehlers falsch

j gelesen zu werden,

! welcher Speicher eine erste Art einer bedingten Wahr-

! scheinlichkeit dafür .speichert, daß ein erstes Zeichen j aufgrund der maschinellen Zeichenerkennung ausgegegeben

werden kann durch Zeichensubstitution, vorausgesetzt, dal ein zweites Zeichen tatsächlich abgetastet wurde, welcher Speicher eine zweite Art bedingter Wahrscheinlichkeit dafür speichert, daß ein Paar benachbarter Zeichen durch die maschinelle Zeichenerkennung ausgegeben werden kann infolge von Zeichenspaltung, vorausgesetzt, daß ein drittes Zeichen tatsächlich abgetastet wurde,

b) ein erstes mit einer Eingangsleitung verbundenes Schieberegister (I¹O zur seriellen Speicherung der Zeichen eines fehlerhaften Wortes, von denen ein erstes Zeichen an einem vorgegebenen Ende des fehlerhaften Wortes eine erste Stelle für den Anfang eines fehlerhaften Wortes definiert,

c) ein zweites, an den Speicher angeschlossenes Schieberegister (26) zur Speicherung der Zeichen einee ersten Bezugswortes aus der vorgegebenen Klasse im Speicher, welche Zeichen in einer der Reihenfolge der Zeichen im ersten Register entsprechenden Reihenfolge-angeordnet

WA 973 006 50984 3/0565

sind und ein erstes Zeichen des Bezugswortes dem ersten Zeichen in dem fehlerhaften Wert entspricht und eine erste Stelle für den Anfang eines Bezugswortes definiert, :

d) eine Decodierschaltung (100) zur Decodierung der An- j zeige für die Fehlerneigung des Zeichens, das sich am Anfang des Bezugswortes befindet,

e) eine Zugriffsvorrichtung für den Speicher, die, wenn J die decodierte Anzeige eine Neigung zur Zeicphenspaltung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das am Anfang des Bezugswortes befindliche Zeichen abgetastet wurde und daß die Zeichenerkennung das Zeichen am Anfang des Fehlerwortes substituierte ,

welche Zugriffsvorrichtung dem Speicher, wenn die decodierte Anzeige eine Neigung zur Zeichenspaltung anzeigt, einen zweiten Wert der bedingten Wahrscheinlichkeit erster Art entnimmt unter der Voraussetzung, daß das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet wurde und daß die Zeichenerkennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,

welche Zugriffsvorrichtung, wenn die decodierte Anzeige eine Neigung zur Zeichenspaltung anzeigt, einen Zugriff ausführt auf einen ersten Wert der bedingten Wahrscheinlichkeit zweiter Art, vorausgesetzt, daß das Zeichen am Anfang des Bezugswortes abgetastet wurde, daß die Zeichenerkennung es in das am Anfang des fehlerhafte^i Wortes befindliche Zeichen und das diesem benachbarte Zeichen spaltete,
welche Zugriffsvorrichtung bei Anzeige einer Neigung zur Zeichenspaltung einen Zugriff zu einem dritten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, voraus gesetzt, daß das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet jwurde und daß die Zeichen-

0Ö6 50ssTsToiei "■"

erkennung das dem ersten Zeichen des fehlerhaften Wortes zweitnächste Zeichen substituierte,

f) eine mit dem Speicher verbundene Multipliziereinrichtung (138, 140, Fig. 3A) zur Multiplikation des ersten und zweiten Wertes der bedingten Wahrscheinlichkeiten erster Art zur Bildung eines ersten Produktes,, welche Multipliziereinrichtung den ersten Wert der bedingten Wahrscheinlichkeit zweiter Art und den dritten Wert der Wahrscheinlichkeit erster Art als zweites Produkt bildet,

g) eine mit der Multipliziereinrichtung verbundene Vergleichsschaltung (146) zum Vergleich der relativen Größen des ersten und zweiten Produktes,

h) eine mit dem Speicher verbundene Rechenvorrichtung zur Multiplikation eines laufenden Produktes mit dem ersten Wert der bedingten Wahrscheinlichkeit erster Art, wenn das erste Produkt größer als das zweite ist oder mit dem ersten Wert der Wahrscheinlichkeit zweiter Art, wenn das zweite Produkt größer als das erste ist,

i) eine an die Vergleichsschaltung angeschlossene Schiebevorrichtung zur Verschiebung des ersten Zeichens sowohl des fehlerhaften als auch des Bezugswortes um eine Stelle, wenn das erste Produkt der Wahrscheinlichkeiten größer als das zweite ist, welche Schiebevorrichtung das erste Zeichen des fehlerhaften Wortes um zwei Stellen und das erste Zeichen des Bezugswortes um eine Stelle verschiebt, wenn das zweite Produkt der Wahrscheinlichkeiten größer ist als das erste, wodurch dasjenige gespeicherte Bezugswort, das die höchste bedingte Wahrscheinlichkeit dafür besitzt als das in dem ersten Register gespeicherte fehlerhafte Wort mißdeutet worden zu sein, bestimmt werden kann.

^{WA 973} °⁰⁶ 5Ö9843/056B

Datenverarbeitungssystem zur Auswahl der richtigen Form eines fehlerhaften Eingabewortes, das bei der maschinellen Zeichenerkennung aufgrund einer Fehlerkennung verstümmelt wurde und dessen richtige Form Mitglied einer vorgegebenen Klasse von aus mehreren Zeichen bestehenden Bezugswörtern -ist, gekennzeichnet durch:

a) einen Speicher (28, Fig. 3) für die vorgegebene Klasse von Bezugswörtern, bei denen für ausgewählte Zeichen eine· Anzeige für die Neigung des Zeichens gespeichert ist, aufgrund eines sogenannten Zusammenziehungsfehler falsch gelesen zu werden,

welcher Speicher eine erste Art bedingter Wahrscheinlichkeit dafür speichert, daß ein erstes Zeichen aufgrund der maschinellen Zeichenerkennung ausgegegeben werden kann durch Zeichensubstitution, vorausgesetzt, daß ein zweites Zeichen tatsächlich abgetastet wurde, welcher Speicher eine zweite Art bedingter Wahrscheinlichkeit dafür speichert, daß ein erstes Zeichen durch die maschinelle Zeichenerkennung ausgegeben werden kann infolge von Zeichenzusammenziehung, vorausgesetzt, daß ein Paar benachbarter Zeichen tatsächlich abgetastet wurde,

b) ein erstes mit einer Eingangsleitung verbundenes Schieberegister (14) zur seriellen Speicherung der Zeichen eines fehlerhaften Wortes, von denen ein erstes Zeichen an einem vorgegebenen Ende des fehlerhaften Wortes eine erste Stelle für den Anfang eines fehlerhaften Wortes definiert,

c) ein zweites, an den Speicher angeschlossenes Schieberegister (26) zur Speicherung der Zeichen eines ersten Bezugswortes aus der vorgegebenen Klasse im Speicher, welche Zeichen in einer der Reihenfolge der Zeichen im ersten Register entsprechenden Reihenfolge angeordnet

WA 973 006 509843/0565

sind und ein erstes Zeichen des Bezugswortes dem ersten Zeichen in dem fehlerhaften Wort entspricht und eine erste Stelle für den Anfang eines Bezugswortes definiert,

d) eine Decodierschaltung (100) zur Decodierung der Anzeige für die Fehlerneigung des Zeichens, das sich am Anfang des Bezugswortes befindet,

e) eine Zugriffsvorrichtung für den Speicher, die, wenn die decodierte Anzeige eine Neigung zur Zeichenzusammenziehung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das am Anfang des Bezugswortes befindliche Zeichen abgetastet wurde und daß die Zeichenerkennung das Zeichen am Anfang des Fehlerwortes substituierte ,

welche Zugriffsvorrichtung dem Speicher, wenn die decodierte Anzeige eine Neigung zur Zeichenzusammenziehung anzeigt, einen zweiten Wert der bedingten Wahrscheinlichkeit erster Art entnimmt unter der Voraussetzung, daß das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet wurde und daß die Zeichenerkennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,

welche Zugriffsvorrichtung, wenn die decodierte Anzeige eine Neigung zur Zeichenzusammenziehung anzeigt, einer Zugriff ausführt auf einen ersten Wert der bedingten Wahrscheinlichkeit zweiter Art, vorausgesetzt, daß das Zeichen am Anfang des Bezugswortes und das benachbarte Zeichen abgetastet wurden, daß die Zeichenerkennung sie zusammenzog zu dem am Anfang des fehlerhaften Wortes befindliche Zeichen,

welche Zugriffsvorrichtung bei Anzeige einer Neigung zur Zusammenziehung einen Zugriff zu einem dritten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das zum ersten Zeichen übernächste Zeichen des Bezugswortes abgetastet wurde und daß die Zeichener-

WA 973 006

5098A3/0565

M-

kennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,

f) eine mit dem Speicher verbundene Multipliziereinrichtung (138, 140, Fig. 3A) zur Multiplikation des ersten und zweiten Wertes der bedingten Wahrscheinlichkeiten erster Art zur Bildung eines ersten Produktes, welche Multipliziereinrichtung den ersten Wert der bedingten Wahrscheinlichkeit zweiter Art und den dritten Wert der Wahrscheinlichkeit erster Art als zweites Produkt bildet,

g) eine mit der Multipliziereinrichtung verbundene Vergleichsschaltung (146) zum Vergleich der relativen Größen des er sten und zweiten Produktes,

h) eine mit dem Speicher verbundene Rechenvorrichtung zur Multiplikation eines laufenden Produktes mit dem ersten Wert der bedingten Wahrscheinlichkeit erster Art, wenn das erste Produkt größer als das zweite ist oder mit dem ersten Wert der Wahrscheinlichkeit zweiter Art, wenn das zweite Produkt größer als das erste ist,

i) eine an die Vergleichsschaltung angeschlossene Schiebevorrichtung zur Verschiebung des ersten Zeichens sowohl des fehlerhaften als auch des Bezugswortes um eine Stelle, wenn das erste Produkt der Wahrscheinlichkeiten größer als das zweite ist, welche Schiebevorrichtung das erste Zeichen des fehlerhaften Wortes um eine Stelle und das erste Zeichen des Bezugswortes um zwei Stellen verschiebt, wenn das zweite Produkt der Wahrscheinlichkeiten größer ist als das erste, wodurch dasjenige gespeicherte Bezugswort, das die größte gesamte bedingte Wahrscheinlichkeit dafür besitzt als das in dem ersten Register gespeicherte fehlerhafte Wort mißdeutet worden zu sein, bestimmt werden kann.

509843/058S

ar-

te.

Datenverarbe;itungssystem zur Auswahl „d&r richtigen Form . eines fehlerhaften Eingabewortes, das bei der maschinellen Zeichenerkennung aufgrund einer Pehlerkennung verstümmelt wurde und dessen richtige Form Mitglied einer vorgegebenen Klasse von aus mehreren Zeichen bestehenden Bezugswörtern ist, gekennzeichnet durch:

a) einen Speicher (28, Fig. 3) für die vorgegebene Klasse von Bezugswörtern, bei denen für ausgewählte Zeichen eine Anzeige für die Neigung des Zeichens gespeichert ist, aufgrund eines sogenannten Häufungsfehlers falsch gelesen zu werden,

welcher Speicher eine erste Art einer bedingten Wahrscheinlichkeit dafür speichert, daß ein erstes Zeichen aufgrund der maschinellen Zeichenerkennung ausgegegeben werden kann durch Zeichensubstitution, vorausgesetzt, daf ein zweites Zeichen tatsächlich abgetastet wurde, welcher Speicher eine zweite Art bedingter Wahrscheinlichkeit dafür speichert, daß ein erstes Paar benachbarter Zeichen durch die maschinelle Zeichenerkennung ausgegeben werden kann infolge von Zeichenhäufung, vorausgesetzt, daß zweites Zeichenpaar tatsächlich abgetastet wurde,

b) ein erstes mit einer Eingangsleitung verbundenes Schieberegister (14) zur seriellen Speicherung der Zeichen eines fehlerhaften Wortes, von denen ein erstes Zeichen an einem vorgegebenen Ende des fehlerhaften Wortes eine erste Stelle für den Anfang eines fehlerhaften Wortes definiert,

c) ein zweites, an den Speicher angeschlossenes Schiebere-' gister (26) zur Speicherung der Zeichen und der Anzeige der Fehlerneigung eines ersten Bezugswortes aus der vorgegebenen Klasse im Speicher, welche Zeichen in einer der Reihenfolge der Zeichen im ersten Register entsprechenden Reihenfolge angeordnet sind und ein

006 50 9 8 A3/0 565

sind und ein erstes Zeichen des Bezugswortes dem ersten Zeichen in dem fehlerhaften Wort entspricht und eine erste Stelle für den Anfang eines Bezugswortes definiert,

d) eine Decodierschaltung (100) zur Decodierung der Anzeige für die Fehlerneigung des Zeichens, das sich am ' Anfang des Bezugswortes befindet,

e) eine Zugriffsvorrichtung für den Speicher, die, wenn die decodierte Anzeige eine Neigung zur Zeichenpaarhäufung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das am Anfang des Bezugswortes befindliehe Zeichen abgetastet wurde und daß die Zeichenerkennung das Zeichen am Anfang des Fehlerwortes substituierte,

welche Zugriffsvorrichtung dem Speicher, wenn die de- ! codierte Anzeige eine Neigung zur Zeichenpaarhäufung an-, zeigt, einen zweiten Wert der bedingten Wahrscheinlich- j keit erster Art entnimmt unter der Voraussetzung, daß | das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet wurde und daß die Zeichenerkennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,

welche Zugriff3vorrichtung, wenn die decodierte Anzeige eine Neigung zur Zeichenpaarhäufung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit zweiter Art dafür ausführt, daß das erste Zeichen und das diesem benachbarte Zeichen des Bezugswortes abgetastet wurde und daß die Zeichenerkennung einen Häufungsfehler machte und die beiden genannten Zeichen ausgab,

f) eine mit dem Speicher verbundene Multipliziereinrichtung (138, l40, Fig. 3A) zur Multiplikation des ersten

. und zweiten Wertes der bedingten Wahrscheinlichkeiten

^WA973006 509843/0565

erster Art zur Bildung eines ersten Produktes, welche Multipliziereinrichtung den ersten Wert der bedingten Wahrscheinlichkeit zweiter Art und den dritten Wert der Wahrscheinlichkeit erster Art als zweites Produkt bildet,

g) eine mit der Multipliziereinrichtung verbundene Vergleichsschaltung (146) zum Vergleich der relativen Größen des ersten und zweiten Produktes,

h) eine mit dem Speicher verbundene Rechenvorrichtung zur Multiplikation eines laufenden Produktes mit dem ersten Wert der bedingten Wahrscheinlichkeit erster Art, wenn das erste Produkt größer als das zweite ist oder mit dem ersten Wert der Wahrscheinlichkeit zweiter Art, wenn das zweite Produkt größer als das erste ist,

i) eine an die Vergleichsschaltung angeschlossene Schiebevorrichtung zur Verschiebung des ersten Zeichens sowohl des fehlerhaften als auch des Bezugswortes um eine Stelle, wenn das erste Produkt der Wahrscheinlichkeiten größer als das zweite ist, welche Schiebevorrichtung das erste Zeichen des fehlerhaften Wortes und des des Bezugswortes um zwei Stellen verschiebt, wenn das zweite Produkt der bedingten Wahrscheinlichkeiten größer ist als das erste, wodurch dasjenige gespeicherte Bezugswort, das die höchste bedingte Wahrscheinlichkeit dafür besitzt als das in dem ersten Register gespeicherte fehlerhafte Wort mißdeutet worden zu sein, bestimmt werden kann.

WA 973 006 5 0 9 8 A 3 / 0 5 6 5

4. Datenverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Anzeigen für die Fehlerneigung im Speicher in Verbindung mit dem ausgewählten Zeichen gespeichert sind, aus denen die Bezugswörter zusammengesetzt sind.

5. Datenverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Anzeigen für die Fehlerneigung in dem Speicher in Verbindung mit ausgewählten Zeichen in Tabellenform, getrennt von den Bezugswörtern gespeichert sind und daß die Decodiervorrichtung eine Datenverbindung zum Speicher besitzt, um Zugriff zu haben zu einer Anzeige für die Fehlerneigung, die dem Zeichen am Anfang des In dem zweiten Register gespeicherten Bezugswortes entspricht.

ViA .973 006

509843/0565

Leerseite