DE2460757A1 - Datenverarbeitungssystem zur korrektur von bei der maschinellen zeichenerkennung aufgetretenen fehldeutungen - Google Patents
Datenverarbeitungssystem zur korrektur von bei der maschinellen zeichenerkennung aufgetretenen fehldeutungenInfo
- Publication number
- DE2460757A1 DE2460757A1 DE19742460757 DE2460757A DE2460757A1 DE 2460757 A1 DE2460757 A1 DE 2460757A1 DE 19742460757 DE19742460757 DE 19742460757 DE 2460757 A DE2460757 A DE 2460757A DE 2460757 A1 DE2460757 A1 DE 2460757A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- word
- characters
- probability
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 29
- 238000012937 correction Methods 0.000 title description 11
- 238000006467 substitution reaction Methods 0.000 claims abstract description 70
- 230000015654 memory Effects 0.000 claims description 96
- 230000008602 contraction Effects 0.000 claims description 42
- 238000009825 accumulation Methods 0.000 claims description 25
- 238000003776 cleavage reaction Methods 0.000 claims description 8
- 230000007017 scission Effects 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 abstract description 64
- 239000011159 matrix material Substances 0.000 abstract description 35
- 238000000926 separation method Methods 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 23
- 230000035508 accumulation Effects 0.000 description 20
- 238000011156 evaluation Methods 0.000 description 19
- 238000000034 method Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 8
- 238000012015 optical character recognition Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000000556 factor analysis Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- RCZNYTXJVULKCR-UHFFFAOYSA-N I.I.I.I.I.I.I.I Chemical compound I.I.I.I.I.I.I.I RCZNYTXJVULKCR-UHFFFAOYSA-N 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- ADLSWZDEMJETGK-UHFFFAOYSA-N I.I.I.I.I.I.I.I.I.I.I Chemical compound I.I.I.I.I.I.I.I.I.I.I ADLSWZDEMJETGK-UHFFFAOYSA-N 0.000 description 1
- -1 O —— O ——— O Chemical class 0.000 description 1
- OZBZONOEYUBXTD-UHFFFAOYSA-N OOOOOOOOO Chemical compound OOOOOOOOO OZBZONOEYUBXTD-UHFFFAOYSA-N 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
Aktenzeichen der Anmelderin: WA 973 006
Datenverarbeitungssystem zur Korrektur von bei der maschinellen Zeichenerkennung aufgetretenen Fehldeutungen.
Die bisher bekannten Zeichenerkennungsmaschinen haben typischerweise
zwei Hauptarten von Fehldeutungen: Substitution und Segmentierung.
Die Substution zeigt sich in zwei Weisen. Die erste ist eine Zeichensubstitution, in der die Erkennungseinheit die Videoinformation
eines einzelnen Zeichens aufgenommen hat, die zur alphabetischen Bestimmung erforderlichen Merkmale jedoch als ein anderes
Zeichen erkannt werden. Das kann natürlich passieren, wenn ein gewisser Grad von Ähnlichkeit in der Form der entsprechenden betroffenen
alphabetischen Zeichen besteht, wie z.B. bei folgenden Zeichenkombinationen: B, D; D, 0; 0, C; 1, i usw. Die zweite Form
!der Substitutionserkennung ist die Zeichenzurückweisung. Wie bei der Zeichensubstitution nimmt die Erkennungseinheit ein einzelnes
Zeichen auf. Die Zurückweisung erfolgt jedoch, weil die Erkennungsilogik
auf kein Zeichen Bezug nehmen kann oder weil mehr als ein
Satz alphabetischer Bestimmungskriterien durch die isolierten jZeichenmerkmale erfüllt sind. Diese Bedingung wird ZeichenzurückT
jweisung genannt. Bisher waren Geräte zur Auswahl der. richtigen Form eines durch eine optische Zeichenerkennungseinheit (OZE)
falsch gelesenen verstümmelten Eingabewortes beschränkt auf die Korrektur von Fehlern bei Substitutions-Fehlerkennung. Zu*
Verbesserung der Leistung eines optischen Zeichenlesers zeigt die Technik bisher die Verwendung bedingter Wahrscheinlichkeiten für
die einfache Substitution eines Zeichens durch ein anderes oder eine Zeichenzurückweisung, zur Berechnung einer gesamten bedingten
Wahrscheinlichkeit, daß das Eingabewort von der qptischen Zeichen-
5098U/0565
2480757
erkennungseinheit falsch gelesen wurde, vorausgesetzt, daß ein vorbestimmtes Wort aus dem Wörterbuch tatsächlich von der
OZE abgefühlt wurde. Bisher befaßt sich die Technik jedoch nur mit der einfachen Substitution von Verwechselungspaaren, die die-
: selbe entsprechende Stelle in dem von der OZE gelesenen Wort und
im Wörterbuchwort einnehmen. Das OZE-Wort und das Wörterbuchwort
i
i müssen dieselbe Länge haben. Das Problem der Fehlerkennung durch
i müssen dieselbe Länge haben. Das Problem der Fehlerkennung durch
' falsche Segmentierung des optischen Zeichenlesers wurde bisher ■
nicht erkannt oder behandelt.
' Die Segmentierungs-Fehlerkennung unterscheidet sich von der einfa-I
chen Substitution dadurch, daß ihre unabhängigen Ereignisse Gruppen von mindestens zwei Zeichen entsprechen. Nominell gibt es drei
Arten von Segmentierungsfehlern: horizontale SpaltungsSegmentierung,
Verkettüngs- oder Zusammenziehungs-Segmentierung und Hau- ;
fungs-Segmentierung. Der zugrundeliegende mechanische Faktor, der allen oben genannten Segmentierungsarten gemeinsam ist, ist ihre
Erzeugung durch die ungenaue Darstellung der Zeichenanfangs- und Endpunkte. Segmentierungsfehler treten sehr häufig in dem Ausgabedatenstrom
der OZE auf und bilden ein wesentliches Hindernis bei ι der Genauigkeit der Textverarbeitung. :
Der Erfindung liegt die Aufgabe zugrunde, die Auswahl der richti- !
gen Form eines bei der maschinellen Zeichenerkennung verstümmelten Wortes aufgrund einer Analyse bedingter Wahrscheinlichkeits- !
werte zu verbessern, auch wenn die Anzahl der Zeilen des verstüm- j meIten Wortes aufgrund der Zeichenspaütung oder Zeichenzusammenziel
hung sich gegenüber der richtigen Form verändert hat. !
Diese Aufgabe wird durch die in den Patentansprüchen definierte Erfindung gelöst.
Ausführungsbeispiele der Erfindung werden anschließend in Verbindung
mit den Zeichnungen näher beschrieben, von denen zeigen:
· 1
das Grundschema der Segmentierungsbehandlung,
973 006 5 0 9 8 4 3 / 0 5 8 S
Fig. 2 eine Videoabtastung eines Zeichenpaares, die zu
einer Häufungs-Segmentierung führen kann, :
Fiq. 3 in einem detaillierten Blockschaltbild das Gerät I
• I zur Korrektur von OZE-Fehlern mit der größten
Wahrscheinlichkeit des regionalen Zusammenhanges,
Fig. 4 ein genaueres Blockschaltbild der Verschiebesteuerung
20 j
Fig. 5 ein genaueres Blockschaltbild des Multiplexers 94
Fig. 6 ein genaueres Blockschaltbild des Multiplexers
96
Fig. 7 ein genaueres Blockschaltbild des Multiplexer-
Taktgebers 108
Fig. 8 ein genaueres Blockschaltbild des Multiplexers
128 und
: Fig. 9 ein genaueres Blockschaltbild der Verschiebebefehls-Einheit
162.
! Theorie:
Die Fehlerkorrektur nach der Technik der größten Wahrscheinlichkeit
für den regionalen Zusammenhang erfolgt durch eine Analyse der bedingten Wahrscheinlichkeit. Diese Lösung wertet die Wahrscheinlichkeit
aus, daß jedes Glied einer vorgegebenen Klasse von berücksichtigten Referenzwörtern durch die Neigungen OZE zu Segmentierungsfehlern
in die Reihe der verstümmelten Zeichen aufgenommen worden sein kann. Die Substanz der Wahrscheinlichkeitsanalyse bedeutet physikalisch die Berechnung eines analogen Ab- j
Standes zwischen einem Bezugswort und den verstümmelten Daten, gej
wichtet durch die a priori-Wahrscheinlichkeit, daß das Bezugswortj
973 006 509843/ΟΒδδ ' ■
in den von der OZE abgetasteten Alphafeldern aufgetreten ist. Mathematisch wird diese Analyse durch die folgende Aussage für
die bedingte Wahrscheinlichkeit formuliert;
P (Referenzwort/verstümmelte Alphareihe) =
P(Referenζwort, verstümmelte Alphareihe) ,,»
P (verstümmelte Alphareihe)
Der Nenner der obigen Gleichung (1) ist im wesentlichen ein Μαβί
Stabsfaktor und hat denselben Wert für alle mit der verstümmelten !
Alphareihe verglichenen Eintragungen. Die relative Rangfolge j einer jeden Eintragung (d.h. die Wahrscheinlichkeit eines jeden j
Bezugswortes in der verstümmelten Alphareihe) basiert somit auf ; dem in der Gleichung (2) sich ergebenden Zähler. Für den Rest der \
vorliegenden Fehlerkorrekturanalyse brauchen wir uns also nur da- !
mit zu befassen, was den Zähler sehr groß macht. Wendet man den ι
Satz von Bayes an, kann der Zähler in Gleichung 1 neu formuliert ! werden als:
P(Referenzwort, verstümmelte Alphareihe) =
P(verstümmelte Alphareihe Referenzwort). P(Referenzwort). (2)
Der Wahrscheinlichkeitsfaktor:
P(Referenzwort) wird die a priori-Wahrscheinlichkeit des Ereignisses
genannt. In diesem Fall ist es die Wahrscheinlichkeit, daß,
das mit der verstümmelten Zeichenreihe verglichene Referenzwort in den abgetasteten Textdaten erscheinen würde. Die a priori-Wahr-fscheinlichkeiten,
bezogen auf das Auftreten eines Wortes in den abgefühlten Textdaten ist eine Funktion generischer Form des Gegenstandes, auf den sie sich bezieht. Obwohl diese a priori-Wahr*
scheinlichkeiten empirisch bestimmt werden, wird ihr Wert für all gemeine Textverarbeitung als über allen Wörtern gleichmäßig für i
eine erste Annäherung betrachtet. Für die allgemeine Textverarbeijtung
wird also der a priori-Ausdruck in Gleichung 2 fallen gelas-| sen. Bei Anwendungen im Postdienst können die a priori-Wahr- j
scheinlichkeiten, bezogen auf jede Eintragung im Verzeichnis, ] WA "973-006 509843/0585
■i — 5 ""
! ihre Erscheinungshäufigkeit im nationalen Postleitzahlverzeich-'nis
sein. Eine genauere und richtige Berechnung würde erfolgen ! unter Verwendung einer Datenbasis, bei der die Erscheinungswahri
scheinlichkeit des Referenzwortes abhängt vom tatsächlichen Um-
; fang der Poststücke.
Der Wahrscheinlichkeitsfaktor:
P(Verzeichniseintragung, verstümmelte Alphareihe) (3)
I wird die Wahrscheinlichkeit genannt. Der größere Rechenaufwand j des Fehlerkorrekturverfahrens nach der größten Wahrscheinlichkeit
im regionalen Zusammenhang zentriert sich um die Auswertung die-I ses Ausdruckes.
i Bei der Auswertung des Wahrscheinlichkeitsfaktors müssen in einer
: Wahrscheinlichkeitsform Neigungen zum Falschlesen bei der OZE er-
[ faßt werden. Das bedingte Format der Gleichung (3) setzt die
] Wahrscheinlichkeit als: "Wie groß ist bei einem gegebenen Refei renzwort die Wahrscheinlichkeit dafür, daß die Neigungen der OZE
zum Falschlesen dieses Wort in die verstümmelte Alphareihe eingeordnet haben?". Da die OZE ein Alphafeld auf der Basis einzelner
Zeichen liest, (d.h. sie erkennt nicht direkt Wörter als j einzelne Einheiten), ist die Gleichung 3 bereits das Produkt
J. einer Reihe unabhängiger wahrscheinlicher Ereignisse. Unter die-I
ser Perspektive gibt es jetzt zwei Kategorien von Fehlerkennungen, die angesprochen werden müssen, nämlich:
a) Substitution
b) Segmentierung.
Die Substitution bei der OZE zeigt sich in zwei Arten. Die erste Art ist Zeichensubstitution. Dazu gehört, daß die Erkennungseinheit
das Videosignal eines einzelnen Zeichens erfaßt hat, die
zur alphabetischen Bestimmung benötigten Merkmale werden jedoch als ein anderes Zeichen ausgelegt. Das kann logischerweise nur
973 006 5098 A3/0565
!auftreten, wenn es einen gewissen Grad der Ähnlichkeit in den
Formen der entsprechenden alphabetischen Zeichen gibt. Beispiele solcher Buchstabenkombination sind:
IB, D; D, O; 0, C; 1, i; usw. Die zweite Form des Substitutions-
!verfahrene ist die Zeichenzurückweisung. Wie bei der Zeichensubstijtution
erfaßt die Erkennungseinheit ein einzelnes Zeichen. Es er-Ifolgt
jedoch eine Zurückweisung, weil die Erkennungseinheit keine Beziehung zu irgendeinem Zeichen herstellen kann oder weil mehr
als ein Bedingungssatz der Alphabestimmungslogik durch die isolierten
Zeichenmerkmale erfüllt ist. Diese allgemeine Situation > bezeichnet man als Zeichenzurückweisung. In der vorliegenden Be-
;Schreibung sind alle Zurückweisungen mit einem Sternzeichen gekennzeichnet
(*) .
Vom Standpunkt der Wahrscheinlichkeit aus können beide oben er- ; wähnten Fehlleseeffekte als einfache unabhängige bedingte Wahrscheinlichkeiten
dargestellt werden. Zeichensubstitution und ! Zurückweisungssubstitution wurden daher in die Gleichung 3 eingehen
als: j
L1) W
j
Sie stellen die Wahrscheinlichkeit dar, daß das Alphazeichen L. bei der OZE abgetastet wird und daß L. oder* ausgegeben würden.
Diese Wahrscheinlichkeitsdaten werden aus einer Zeichenkonfusionsmatrix
abgeleitet und in einem Speicher vorgespeichert, wobei keine Berechnungszeit benötigt wird. Die Zeichenkonfusionsstatistik
kann für Großschrift- und Kleinschrift-Alphabetzeichen separat zusammengestellt werden.
Beispiel 1 zeigt, wie Gleichungen der Form 4 und 5 auf den in
der Erfindung verwendeten Entscheidungsprozeß nach Bayes.angewandt
werden können. Das verstümmelte Wort ist CDRNIiAKL und die Eingabe
aus der vorbestimmten Klasse von Referenzwörtern, die geprüft
wird, ist CORNWALL. Der Wahrscheinlichkeitsfaktor ist gegeben durch die Wahrscheinlichkeitsserie unabhängiger Ereignisse nach
973 006 509843/0585
Darstellung im Beispiel 1.
Der.Wahrscheinlichkeitsfaktor ist somit das Produkt einer Anzahl
Von unabhängigen Zeichenkonfusionswahrscheinlichkeiten, das sich in einem relativen Wert ergibt, der mit dem Wert verglichen wer- ·
iden kann, der durch jedes der anderen geprüften Wörter erzeugt wird. Das Referenzwort, welches mit größter Wahrscheinlichkeit
das Originalwort ist, wird gewählt unter der Voraussetzung, daß
^es bestimmte vernünftige Kriterien erfüllt.
Beispiel 1:
verstümmeltes Wort = CDRNWL L
- Referenzwort = CORNWALL
- Referenzwort = CORNWALL
: Wahrscheinlxchkeitsfaktor = P(CORNWALL CDRNWA L α
ί P0(ClC)P^ (DlO)Pn (R[R)Pn (NiN) P (*|l)P (LJL)
Analyse der größten Wahrscheinlichkeit der Segmentierung
Die Segmentierung unterscheidet sich von der Substitution da-,durch,
daß ihre unabhängigen Ereignisse den Gruppierungen von min- :destens zwei Zeichen entsprechen. Nominal gibt es drei Arten
ivon Segmentierungsfehlern, nämlich:
i a) Horizontale Spaltungs-Segmentierung
I b) Zusammenziehungs-Segmentierung ι c) Häufungs-Segmentierung
j Der zugrundeliegende mechanische Faktor, der allen erwähnten Sejgmentierungsarten
gemeinsam ist, ist der Faktor, daß sie durch die falsche Entscheidung von Zeichenanfangs-· und Zeichenendpunkt
erzeugt werden.
Die horizontale Spaltungssegmentierung (HSS) neigt dazu, bei brei-
973 006 509843/0B65
-δι
ten Großbuchstaben wie W, M, N, U, O und e aufzutreten. Der HSS-Effekt
entsteht, wenn die Erkennungseinheit irregeführt wird und ; eines dieser Zeichen in zwei Teile teilt. Jeder Teil wird wieder- !
um durch die Erkennungslogik als legitimes Zeichen betrachtet. j
Das führt zu verschiedenen Mustern von Zeichen und/oder Stern-Feh-j
lerkennungen. Einige der gebräuchlichsten Formen sind in der nach-j
folgenden Tabelle 1 aufgeführt.
Horizontale Spaltungs-Segmentierung IH OD
PL OE
H PI OK
*I 0 OS
0*
ME OY MR
NN LI
N ü TI
M *C I*
M IW
IL
NO
NT
N R*
RI
TN
*I
Vom Standpunkt der Wahrscheinlichkeit aus kann der vorstehende
Lesefehlereffekt gelten als doppelter Fehlzuordnungseffekt, bedingt durch das Auftreten eines Satzes der oben angeführten
50984370565
— Q —
Großbuchstaben. Funktionell wird das wie folgt dargestellt:
j - Pc(LjLj+llLi) (5)
j Die Auswertung der Gleichung 1 wird offensichtlich komplizierter,
wenn der HSS-Effekt berücksichtigt werden muß. Die Steuerlogik für die Berechnung muß drei mögliche Bedingungen berücksichtigen,
j wenn eines der zur Segmentierung neigenden Zeichen -L1 - auf-'
tritt. Diese sind: seg
a) L. erzeugt einen einfachen Substitütionseffekt der FoIm?
seg
b) | Li | seg wurde | (L, | falsch | seg | seg | segmentiert | und | erzeugt | den HSS-Ef |
fekt | der Form: | richtig | ||||||||
Pc | iVilL | ). seg |
(8) | |||||||
c) | Li | wurde seg |
erkannt und | wie | folgt | ausgegeben: | ||||
Pc | (Lj |
Das Vorhandensein dieser letzten Möglichkeit richtig zu unterscheiden,
ist besonders schwierig, da die häufigste Art der Zeichen HSS sich selbst und ein weiteres unechtes Zeichen wieder
erzeugt.
Die analytischen Einzelheiten des Einschlusses der HSS in die Auswertung des Wahrscheinlichkeitsfaktors (Gleichung 3) verzögert,
bis sie in Verbindung mit dem anschließend zu beschreibenden Zusammenziehungs-Segmentierungsfehler ausgearbeitet werden
kann.
50984370565
. /0
Die Zusammenziehungssegmentierung kann als eine Art Spiegelbild der HSS angesehen werden. Sie tritt hauptsächlich bei dicht zusanH
menstehenden Kleinschriftzeichen auf. Mechanisch zeigt sich ZSf
wenn die Erkennungseinheit beim Abtasten das Vorhandensein zweier
einzelner Zeichen nicht unterscheiden kann. Daher verarbeitet die OZE-Erkennungslogik die Zeichen weiter in einer logisch zusammengezogenen
Art und Weise.
Dieser Effekt ist hauptsächlich zu beobachten, wenn Adreßdaten
stilisiert geschrieben werden oder wenn Schreibmaschinenanschläge j dicht nebeneinander liegen. Die Tabelle II enthält die gebräuchlichsten
zu Zusammenziehungen neigenden Buchstabenkombinationen.
In einer Wahrscheinlichkeitsformel kann das ZS-Ereignis ausgedrückt
werden als:
V*LiLi+i>
Zusammenziehungssegmentierung br do en fr gu la ok or rv sa tn fr ir la mr or ra rg ro rs sa
el en er es ne ue
e ja sa ta
a ck ch ei
c el kl la
e kl ra rt
m io jo or
WA 973 oof 509843/0565
1 ο
:·
mr ok
i k
; ne
■! η '
j ry
j ' ■ ■ Υ
re
! ν
• dy
i d
j em
i ■ . ρ ■
;Das zuletzt genannte Ereignis (11) kann bei der Auswertung der
!Gleichung (3) besonders schwierig zu isolieren sein. Dies folgt j daraus, daß L. selbst eine starke Neigung dazu besitzt, unter die
j Zurückweisungszeichen (Sternzeichen) eingeordnet zu werden und daher eine einfache Substitution anstelle einer ZS naheliegt.
;Weitere Auswertung des Wahrscheinlichkeitsfaktors
! Um eine wirksame und brauchbare Auswertungsmethode für die Wahr-I
scheinlichkeitsfaktorgleichung (3) aufzubauen, muß die Gemeinsamkeit ihrer möglichen Bestandteile betont werden. Im wesentlichen
wird jeder der möglichen Fremderkennungseffekte, die oben beschrieben
wurden, festgelegt als eine Konfusions- oder Verwirrungs Wahrscheinlichkeit. Der einzige in der Analyse noch anzupassende
jweitere Faktor ist der Umstand, daß im Gegensatz zu der in dem
j Beispiel 1 gezeigten Behandlung der einfachen Substitution eine I Eins-zu-Eins-^Entsprechung zwischen den Zeichen in einem Referenz-
wort und einem verstümmelten Datenfeld nicht mehr streng gilt.
Das ergibt sich natürlich daraus, daß das Auftreten eines HSS-I
Fehlers in einem Zeichen eines Wörterbuchwortes zwei Zeichen in ί verstümmelter Darstellung erzeugt. Die direkte Umkehrung gilt
■ für ZS-Fehler. In jeder der oben genannten Segmentierungsmöglichkeiten
ist die Forderung enthalten, den Rest des verstümmelten
973 006 S0984 370B6
Fehlerwortes neu auszurichten, um den Zeichenfehlausrichtungseffekt
zu kompensieren, der durch den Segmentierungsfehler auftrat.
Um ein wirksames und zuverlässiges Verfahren und ein Gerät zu entwickeln, welches die vorstehenden Überlegungen hinsichtlich
der Segmentierung berücksichtigt bei der Auswertung des Wahr^ scheinlichkeitsfaktors, werden die Verfahren bei der Auswertung
der Gleichung (3) um drei Neuerungen ergänzt. Diese Neuerungen sind:
a) Ausnahmezeichen-Kennzeichnung und Zeichenpaarkennzeichnung.
b) Strukturierung der Wahrscheinlichkeitsauswertung von rechts
nach links.
c) Benutzung des regionalen Zusammenhanges.
Ausnahmezeichen- und Zeichenpaar-Kennzeichnung Es gibt ungefähr ein halbes Dutzend Zeichen, die zu HSS neigen,
und etwa ein Dutzend Zeichenpaare, die zu ZS neigen. Diese Zeichen bilden an sich nur einen kleinen Teil des Alpha-Satzes
der Klasse von Referenzwörtern. Wenn kein Kennzeichen auftritt, läuft die Analyse des Wahrscheinlichkeitsfaktors ab, als ob eine
einfache Zeichensubstitution der einzige zu berücksichtigende Verstümmelungsfaktor wäre. Nur wenn ein Kennzeichen auftritt,
werden die booleschen Verknüpfungen iur Behandlung möglicher Segmentierungs-Ereignisse aus.
Sonderzeichen können in jedes Wort eingesetzt werden, wo zu Segmentierungsfehlern
neigende Zeichen oder Zeichenpaare auftreten. Das hat jedoch den Nachteil, daß die durchschnittliche Wortlänge
erhöht und die Kompaktheit des Bezugswörterbuches zerstört wird, was für den E/A-Wirkungsgrad wichtig ist. Um die Kennzeichnung
durchführen und die Speicherforderungen erfüllen zu können, wird somit eine besondere Alphazeichenspeicherung vereinbart. Jedes
Alphazeichen wird mit nur fünf der normalerweise zum Speichern eines Zeichens benutzten 8 Bits gespeichert. Die verbleibenden
WA 973 006 509843/0565
♦ η*
drei Bits werden dann für die 8 Kombinationen eines Kennzeichencodes
benutzt, wobei zwei dieser Bits entsprechend den HSS-Zeichenpaaren
und ZS-Zeichenpaaren zugeordnet werden.
Bezeichnet man zur Illustration den HSS-Code mit "i" und den
ZS-Code mit "?"-, dann würde das Wort "Walston11, welches sowohl
HSS-Vorgänge als auch ZS-Vorgänge enthält, im Wörterbuch gespeichert
als:
W! A L S T? O Ni
Strukturierung der Wahrscheinlichkeitsauswertung von rechts nach links '
Der Wahrscheinlichkeitsfaktor ist ein multiplikativer Ausdruck und somit assoziativ. Seine Auswertung kann von rechts nach links
sowie von links nach rechts erfolgen. Im Beispiel 1 erfolgte das Vorrücken von links nach rechts, der Blickrichtung des menschlichen
Lesers. Die OZE andererseits erkennt und verarbeitet Zeichen im allgemeinen von rechts nach links.
Es scheint, daß die Stabilität der Wahrscheinlichkeitsfaktoranalyse
verbessert wird, wenn ihre Auswertung von rechts nach links erfolgt. Dadurch sollen andere Formate des Vorrückers längs
des Wortes nicht ausgeschlossen, sondern nur eine Betriebsart ge
zeigt werden, die bei den vorliegenden Anwendungen Vorteile verspricht.
Das folgt daraus, daß sie die Darstellung der unabhängigen Ereignisse in derselben Reihenfolge der Analyse entwickeln
läßt und eine Perspektive schafft, die zur Analyse von Reihen zur Segmentierung neigender Zeichen besser geeignet ist. Außerdem
läßt sich eine genaue Anfangsausrichtung der verstümmelten
Daten und der Wörterbucheintragungen leichter erreichen, wenn die Paarung von rechts beginnt und nach links weiterläuft. Der
irreführende Effekt eines zusätzlichen Zeichens am Anfang des Adreßfeldes aufgrund starker linker Kanteneffekte eines Großschriftzeichens
in der ersten Position wird umgangen. Dadurch wird die Möglichkeit vergrößert, solche unkontrolliert auftreten-
973 006 509843/0685
den Zeichen zu isolieren und ihre Fehlerkorrektur in einer ad hoc-Manier zu adressieren.
Benutzung regionalen Zusammenhanges
Benutzung regionalen Zusammenhanges
Der Vereinheitlichungsfaktor, der eine wirksame Anpassung von
HSS und ZS an die Wahrscheinlichkeitsfaktorberechnung gestattet, ist der "regionale Zusammenhang".
Wenn ein Alphazeichen in einer Wörterbucheintragung nicht hinter einem Kennzeichen steht, wird angenommen, daß es in die Wahrscheinlichkeitsfaktoranalyse
eingeht als ein Ereignis der Form P (L. |l.), worin i=j zu den Möglichkeiten gehört. Das bedeutet,
daß nur die Möglichkeit der einfachen Substitution angenommen wird. Wenn in der Wörterbucheintragung ein Kennzeichen auftritt,
dann muß die zum Wahrscheinlichkeitsfaktor gehörende Analyse außer der einfachen Substitution die Möglichkeit der Segmentierung
adressieren oder ansprechen. Der regionale Zusammenhang geht jetzt wie folgt ein:
Angenommen, das Kennzeichen zeigt die Möglichkeit der HSS an. An diesem Punkt gibt es, wie bereits gesagt, drei Möglichkeiten.
Diese sind:
(1 und 2): P (L.Il. ), worin j = i eingeschlossen ist.
c 3 ^eg seg
Um mit der Auswertung des Wahrscheinlichkeitsfaktors fortzufahren,
muß eine Entscheidung zwischen den Ereignissen 1 und 2 und dem bei 3 eingesetzten HSS-Ereignis getroffen werden. Der Entscheidungsmechanismus
beruht auf der Anwendung des regionalen Zu sammenhanges .
Wenn die Bedingung 3 wahr ist, dann muß der Rest der verstümmelten
Zeichenreihe um eine Position nach rechts ausgerichtet werden. Dadurch wird die existierende Entsprechungsbeziehung zwi
973 ooe ' S 0 S 8 4 3 / 0 5 8 8
sehen den Zeichen der verstümmelten Alphareihe und dem Referenzwort
verändert.
Die Änderung oder Verschiebung im "benachbarten Zusammenhang" wird ausgedrückt in den Wahrscheinlichkeitsfaktor-Bestandteilen
wie:
c · i+1 i c j+2' i+1
3 J seg
Wenn die Bedingung 1 oder 2 richtig ist, ist der "benachbarte Zusammenhang" nicht verteilt und die Wahrscheinlichkeitsfaktorbestandteile,
die denen in Gleichung 12 entsprechen, sind:
TABiELLE III P (WA3/*CL*JWIALST?ON!)
Ausnahmelogik Wahrscheinlichkeitsfaktorauswertung
Entscheidung 1:
Bestimme, ob eine mögliche HSS
bei "N" auftrat.
A - Pc(l*|N)Pc(C|O)
A - Pc(l*|N)Pc(C|O)
gegen
B-PCC*|N)PC(1|O)
B-PCC*|N)PC(1|O)
Nimm an, es gelte A,
(d.h. P (l|O) ist ein unmögliches Ereignis) P (1* |n)P (C|O)
(d.h. P (l|O) ist ein unmögliches Ereignis) P (1* |n)P (C|O)
Entscheidung 2:
Bestimme, ob eine mögliche
ZS auftrat bei "ST"
A - P. C* |ST)P (1|L)
ZS auftrat bei "ST"
A - P. C* |ST)P (1|L)
gegen
B - Pc(
B - Pc(
Nimm an, es gelte A,
(d.h. P (IIS) ist ein unmögliche» Ereignis P (F |N)P (C IO)P (*|ST)
(d.h. P (IIS) ist ein unmögliche» Ereignis P (F |N)P (C IO)P (*|ST)
WA 973 006 5098 43/0 565
Entscheidung 3:
Bestimme, ob eine mögliche HSS bei "W" auftrat
P (Leerschritt,w|w) ist ein un-
P (Leerschritt,w|w) ist ein un-
mögliches Ereignis
Pc (W |W) angenommen Pc(*|n)Pc(C |O)Pc(*|ST)
Pc(l|L)Pc(A|A)PcW|W)
Die Entscheidung darüber, ob HSS vorliegt oder nicht, folgt dann durch diejenige Formulierung, Gleichung 12 oder 13, die den größeren
Wahrscheinlichkeitswert ergibt.
Wenn ein Kennzeichen das Vorhandensein eines zu ZS neigenden Zeichenpaares
anzeigt, dann würde in ähnlicher Weise durch:
(14)
zugehörige Bestandteile des Wahrscheinlichkeitsfaktors unter dieser
Annahme festlegen. Dieser Ausdruck würde dann relativ ausgewertet zu:
VW · WiI1W (15)
welches das Fortschreiten der Auswertung des Wahrscheinlichkeitsfaktors ist, der vorliegt, wenn eine ZS-Fehllesung nicht vorhanden
ist. Das Entscheidungskriterium basiert wie bei der HSS-Fehllesung
auf den relativen Größen der entsprechenden Produkte in den Gleichungen 14 und 15.
Fig. 1 und Tabelle III zeigen weiter die Verwirklichung des "regionalen
Zusammenhanges" bei der Korrektur von Segmentierungsfehlem.
Fig. 1 zeigt schematisch den Grundmechanismus zur Behandlung der Spaltungssegmentierung für das Wort CORNWALL. Tabelle III
zeigt die schrittweise Auswertung des Wahrscheinlichkeitsfaktors
entsprechend der Wörterbucheintragung "Walston", wo das von der OZE verstümmelte Wort die Form hatte "WAl CI ".
WA 973 006 50984 3/056
Die Häufungs-Segmentierung (HÄS) unterscheidet sich von den Fehlertypen
HSS und ZS dadurch, daß sie die Wortlänge nicht beeinflußt. Die ursächlichen Faktoren für die H&S sind Zeichenabstand
und Nebeneinanderstellung von Zeichen. Ein möglicher HfiS-Vorgang tritt auf, wenn die Erkennungseinheit zwei Zeichen isoliert, deren
dichte Nachbarschaft die OZE zu einer Fehlzuordnung ihres Segmentierungspunktes
veranlaßt. Dadurch werden effektiv Teile eines Zeichens in die Videodarstellung des anderen hineingemischt. Ein
falsches Lesen ergibt sich, wenn die Hinzufügung eines benachbarten Zeichensegmentes:
a) eine Zusammensetzung schafft, die die Erkennungslogik eines anderen
Zeichens ansprechen läßt,
b) sich mit der Erkennungsanalyse überschneidet und zu einer
Zurückweisungausgabe (4) führt.
Die vorhergehende Entscheidung bezog sich auf die Videomechanik, die ein HÄS-Segmentierungsereignis herausbrachte. Der die rieh- "
tige Erkennung außer Kraft setzende typographische Faktor hinter der HÄS ist die Zeichenform. Nur relativ wenige der 676 möglichen
Diagramme neigen dazu, einen Druckhäufungseffekt zu einer Zeichenfehlerkennung
der oben beschriebenen Art aufzubauschen. Ein Beispiel eines solchen Zeichenpaares und die Entwicklung eines HÄS-Ereignisses
ist in Fig. 2 gezeigt, wo das "re"-Diagramm zu einer
Kombination "n*" führt. Dabei ist zu beachten, daß sich das beobachtete
Videosignal nicht ergeben hätte, wenn das vorliegende Diagramm "er" oder "ri" gewesen wäre.
Die auf die HÄS-Ereignisse bezogenen Konfusionsdaten können entsprechend
quantifiziert werden in der Form;
Die Auswertung des Wahrscheinlichkeitsfaktors in der Gl@iehung
(3) folgt, indem zuerst die möglicherweise zu HlS κ·Ι,§·*&1@8β Buch-
WA 973 006 - - 509843/0585
stabendarstellungen in den Wörterbucheintragungen durch ein Sonderzeichen
bezeichnet werden. Die weitere Auswertung berücksichtigt an diesem Punkt dann zwei Möglichkeiten:
Pc<Lj+liLifl>Pc(Lj|Li>
gegen
Da im Gegenssatz zur HSS- und ZS-Auswertung keine Änderungen
der Zeichenreihenlänge berücksichtigt werden müssen, folgt die Wahl der Behandlungs- und Einschlußart der Darstellung L4+1 Li in
der Wahrscheinlichkeitsberechnung aus einer Bestimmung, welche der Äusdrucksgleichungen (17) oder (18) die größere Wahrscheinlich|-
keit ergibt.
Das regionale Zusamraenhangsverfahren muß unter Echtzeitbeschränkungen
durchgeführt werden. Eine weitere wesentliche Herabsetzung der Rechenforderungen ergibt sich durch Anhängen eines Wörterbuchkandidaten-
iebprozesses an das Fehlerkorrektur-Grundverfahren
Das Paket logischer Abfrageprozesse umfaßt:
a) Gut/Schlecht-Schwellwertbildung
b) vorzeitiger Beendigungsschwellwert.
Die Gut/Schlecht-Schwellwer'tbildung erreicht eine wesentliche
Reduzierung der durch die Fehlerkorrekturfunktion auszuführenden
Berechnungen durch Beendigung der Berücksichtigung einer Wörterbucheintragung, sobald ihr Wahrscheinlichkeitsfaktor unter eine
festgelegte Toleranz des größten in der Analyse erzielten Wahrscheinlichkeitsfaktors
fällt. Der Wahrscheinlislikeitsfaktor in
!öl §73 036
der Gleichung (3) mißt bekanntlich das Ausmaß der Übereinstimmung
oder Nichtübereinstimmung zwischen einem verstümmelten Wort und ; einer abgerufenen Wörterbucheintragung. Das Auswertungsformat der
: Wahrscheinlichkeit neigt natürlicherweise von sich aus zu dieser
: Art der Schwellwertbildung. Es wird ausgewertet als eine Reihe von
j Multiplikationen von Konfusionswahrscheinlichkeiten (Werte zwi-
;sehen O und kleiner als 1).
j Wie bei jeder multiplikativen Reihe von Ausdrücken kleiner als
i 1 setzt jede folgende Multiplikation den Wert des existierenden
iProduktes herunter.
; Der normale Toleranzpegel wird mit der größten Wahrscheinlichkeit
j angenommen, die bis dahin in der Analyse errechnet wurde. Die Be-•
nutzung dieses Schwellwertkriteriums setzt die Berechnungen nennenswert herab,
■ Es folgt ein praktisches Beispiel der Gut/Schlecht-Schwellwertbildung.
Nimmt man an, daß sich bis dahin in der Analyse ein Wahrscheinlichkeitsfaktor
von 80% ergeben hat, dann beträgt der Toleranzpegel 16%, wenn man einen 10-prozentigen Paktor annimmt. Damit
die Fehlerkorrekturroutine weiterlaufen kann, muß die Berücksichtigung aller künftigen Eintragungen einen Wahrscheinlichkeitswert
von mindestens 72% aufweisen. Die meisten Wörterbucheintragungen zeigen eine ausreichende Unverträglichkeit innerhalb eines von
zwei Zeichen, um unter die Toleranzgrenze zu fallen und werden daher beendet.
Diese Schwellwertoperation ist bezogen auf die Gut/Schlecht-Schwelle,
der Brennpunkt liegt jedoch auf dem anderen Ende des Wahrscheinlichkeitsspektrums, Die Operation gestattet das Beenden
eines in Betracht gezogenen Wörterbuchwortes, sobald es unter ein«
akzeptable Mindestschwelle für die Wahrscheinlichkeit fällt. Ihr Wert ergibt sich aus der Tatsche, daß ein Wahrscheinlichkeitsfaktor
errechnet werden kann, ungeachtet dessen,wie unähnlich ein
WA973006 609 8U/Ö567
verstümmeltes Wort und ein Wort aus dem Wörterbuch sind. Solch
eine Wahrscheinlichkeitsberechnung läuft jedoch sehr schnell gegen null. Setzt man eine untere Grenze für den annehmbaren Wahrscheinlichkeitswert,
kann der Vergleich Ausdruck für Ausdruck eines nur zufällig angezogenen Wortes aus dem Wörterbuch vorzeitig beendet
werden, sobald das Vergleichsergebnis unter den Schwellenwert fällt.
Obwohl die Besprechung und Analyse bezogen auf die Auswertung des Wahrscheinlichkeitsfaktors in einer Reihe von Multiplikationsoperationen
ausgedrückt wurden, können sie auch als Addition von vorgespeicherten ogarithmisehen Werten von Wahrscheinlichkeiten
verwirklicht werden.
Es wird jetzt ein Datenverarbeitungssystem geschrieben zur Auswahl
der richtigen Form eines verstümmelten Eingabewortes, das durch einen optischen Zeichenleser so falsch gelesen wurde, daß die Anzahl
der Zeichen im Wort durch Spaltung oder Zusammenziehung von Zeichen verändert wurde. Wörterbuchwörter werden im System gespeichert
und enthalten Zeichen, die für ihre Neigung zur Teilung oder Zusammenziehung durch falsches Lesen des optischen Zeichenerkennungsgerätes
gekennzeichnet sind. Das OZE-Wort und ein Wörterbuchwort werden in zwei Schieberegister geladen, die ihre Buchstaben
an einem Ende ausrichten. Die Zeichen des Wortes aus dem Wörterbuch werden dann auf Pehlerneigungskennzeichen hin untersucht.
Wenn z.B. für ein Zeichen ein Kennzeichen für Spaltungsneigung gefunden wird, werden vom Speicher besondere Werte für bedingte
Wahrscheinlichkeiten angesprochen und eine Berechnung der Wahrscheinlichkeit durchgeführt, daß das erste Zeichen des Wörterbuchwortes
durch die OZE zu dem ersten und zweiten Zeichen des OZE-Wortes aufgespalten wurde. Diese Wahrscheinlichkeit für regionalen
Zusammenhang wird verglichen mit der Wahrscheinlichkeit eine einfachen Substitutionsfehlers für die Zeichen. Wenn die Wahrscheinlichkeit
für die Segmentierung größer ist, werden die OZE-Zeichen im ersten Schieberegister um eine Stelle relativ zu den
Zeichen des Wörterbuchwortes im zweiten Schieberegister verschoben sodaß nachfolgende zu vergleichende Zeichenpaare nichtig
WA 973 006 5 0 9 8 4 3/0565
men. Die größere errechnete Wahrscheinlichkeit wird in einem laufenden
Produkt kombiniert. Dasjenige Wörterbuchwort mit dem größten laufenden Produkt wird vom System als die höchstwahrscheinlich
richtige Form des verstümmelten OZE-Eingabewortes ausgegeben.
Fig. 3 zeigt in einem genauen Blockdiagramm das Gerät zur Korrektur
von bei der OZE entstandener Fbhler aufgrund der größten Wahrscheinlichkeit des regionalen Zusammenhanges. Eine optische
Zeichenerkennungseinheit OZE gibt auf die Leitung 2 eine Folge von alphabetischen und numerischen Zeichenfeldern aus, die von einem
Text abgetastet wurden. Die Leitung 2 bildet die OZE-Eingabe zu dem in Fig. 3 gezeigten erfindungsgemäßen Gerät. Die OZE-Eingabeleitung
2 gibt die Folge alphabetischer und numerischer Zeichenfelder in den Worterkennungsdetektor 4, der Trennungsmarkierungen
zwischen den Zeichenfeldern erkennt und die Felder als alphabetische und numerische Felder kennzeichnet. Numerische Felder werden
vom Worttrennungsdetektor 4 über die Leitung 6 an das alphanumerische Ausgangsregister 8 und dann auf die Systemausgabeleitung 10
ausgegeben. Alphabetische Zeichenfelder werden vom Worttrennungsdetektor 4 über die Leitung 12 in das QZE-Wort-Schieberegister 14
ausgegeben. Der Zeichenzähler 18, der an die Alphafeldausgabeleitung 12 angeschlossen ist, zählt die Anzahl von Zeicheneingaben
zum OZE-Wort-Schieberegister 14 und überträgt die Zahl über die Leitung 19 an die Verschiebesteuerung 20. Diese Verschiebesteuerung
20 ist in Fig. 4 in einem detaillierten Blockschaltbild dargestellt. Das Wort-Schieberegister 14 speichert die Zeichen des
OZE-Eingabewortes in einer Anordnung, die in der Reihenfolge des Empfangs der Zeichen über die Eingabeleitung 2 geordnet ist. Das
OZE-Wort-Schieberegister 14 hat drei benachbarte Speicherzellen Kl, K2 und K3 und das Endzeichen des Eingabewortes wird zu Anfang
in der Zelle Kl gespeichert.
In Fig. 3 ist ein Wörterbuchspeicher 28 gezeigt, der die vorgegebene
Klasse von Referenzwörtern als Wörterbuch speichert. Für die Verarbeitung allgemeinen englischen Textes können im Wörterbuchspeicher
28 die Wörter gespeichert werden» die Jk. einem konventlo-
WA 973 006 509843/058
nellen Wörterbuch wie beispielsweise Webster's Third International
erscheinen. Für die Verarbeitung von Spezialtexten können begrenztefe
und spezialisiertere Vokabulare verwendet werden. Bei der
Verarbeitung von Post kann das nationale Straßennahmenverzeichnis verwendet werden. Ausgewählte Zeichen, die ausgewählte im Wörterbuchspeicher 28 gespeicherte Wörter bilden, sind mit einem Fehlerneigungskennzeichen versehen, um die Neigung der Zeichen durch das optische Zeichenerkennungsgerät falsch gelesen zu werden während eines Fehlerbetriebes angeben, der die Anzahl von Zeichen
im falsch gelesenen Wort verändert. Der Wörterbuchspeicher 28 ist über eine Steuereingangsleitung 46 mit einer Ausgabe des Worttrennungs detektors verbunden, um anzuzeigen, wenn ein neues alphabetisches Zeichenfeld von der OZE über die Leitung 2 empfangen wurde. Wenn die Analyse der höchstwahrscheinlich richtigen Form für das nächste vorher empfangene OZE-Wort abgeschlossen ist, veranlaßt der Empfang eines Signaies über die Leitung 46 den Wörterbuchspeicher zum Rückstellen seiner Liste von Wörtern, so daß die Analyse des neuen OZE-Eingabewortes beginnen kann. Der Wörterbuchspeicher 28 kann auf Wunsch einen Großraum-Eingangsspeicher 3 enthalten, der z.B. gewählte Kategorien von Referenzwörtern liefern kann, die höchstwahrscheinlich mit der speziellen Art vom OZE-Wort übereinstimmen, das auf der OZE-Eingabeleitung 2 empfangen wurde.
Verarbeitung von Post kann das nationale Straßennahmenverzeichnis verwendet werden. Ausgewählte Zeichen, die ausgewählte im Wörterbuchspeicher 28 gespeicherte Wörter bilden, sind mit einem Fehlerneigungskennzeichen versehen, um die Neigung der Zeichen durch das optische Zeichenerkennungsgerät falsch gelesen zu werden während eines Fehlerbetriebes angeben, der die Anzahl von Zeichen
im falsch gelesenen Wort verändert. Der Wörterbuchspeicher 28 ist über eine Steuereingangsleitung 46 mit einer Ausgabe des Worttrennungs detektors verbunden, um anzuzeigen, wenn ein neues alphabetisches Zeichenfeld von der OZE über die Leitung 2 empfangen wurde. Wenn die Analyse der höchstwahrscheinlich richtigen Form für das nächste vorher empfangene OZE-Wort abgeschlossen ist, veranlaßt der Empfang eines Signaies über die Leitung 46 den Wörterbuchspeicher zum Rückstellen seiner Liste von Wörtern, so daß die Analyse des neuen OZE-Eingabewortes beginnen kann. Der Wörterbuchspeicher 28 kann auf Wunsch einen Großraum-Eingangsspeicher 3 enthalten, der z.B. gewählte Kategorien von Referenzwörtern liefern kann, die höchstwahrscheinlich mit der speziellen Art vom OZE-Wort übereinstimmen, das auf der OZE-Eingabeleitung 2 empfangen wurde.
Ein Wörterbuchwort-Schieberegister 26 ist nach Darstellung in
Fig. 3 mit seinem Eingang mit dem Ausga.ng des Wörterbuchspeichers 28 verbunden. Das Schieberegister 26 speichert die Zeichen eines .Wörterbucheingabewortes vom Wörterbuchspeicher 28 in einer in der Reihenfolge des Zeichenempfanges angeordneten Anordnung. Das Wörter buchwort-Schieberegister 26 hat drei benachbarte Speicherzellen
Ll, L2 und L3 und das Endzeichen des in das Schieberegister 26
geladenen Wörterbuchwortes wird am Anfang in der Zelle Ll gespeichert. Das Zeichen in der Zelle Ll des Schieberegisters 26 sollte dem Zeichen in der Zelle Kl des Schieberegisters 14 entsprechen. Um Teilungs- oder Segmentierungs-Fehlleseneigungen für die Referenzwörter zu kennzeichnen, kann man eine besondere Alphazeichenepeicherung vereinbaren. Jedes Alphazeichen wird mit nur fünf der im «llgemein«n zur Darstellung eines Zeichens verwendeten 8 Bits.
Fig. 3 mit seinem Eingang mit dem Ausga.ng des Wörterbuchspeichers 28 verbunden. Das Schieberegister 26 speichert die Zeichen eines .Wörterbucheingabewortes vom Wörterbuchspeicher 28 in einer in der Reihenfolge des Zeichenempfanges angeordneten Anordnung. Das Wörter buchwort-Schieberegister 26 hat drei benachbarte Speicherzellen
Ll, L2 und L3 und das Endzeichen des in das Schieberegister 26
geladenen Wörterbuchwortes wird am Anfang in der Zelle Ll gespeichert. Das Zeichen in der Zelle Ll des Schieberegisters 26 sollte dem Zeichen in der Zelle Kl des Schieberegisters 14 entsprechen. Um Teilungs- oder Segmentierungs-Fehlleseneigungen für die Referenzwörter zu kennzeichnen, kann man eine besondere Alphazeichenepeicherung vereinbaren. Jedes Alphazeichen wird mit nur fünf der im «llgemein«n zur Darstellung eines Zeichens verwendeten 8 Bits.
ha 973 006 509843/0565
ι gespeichert. Die anderen drei Bits werden als Kennzeichencode be-
S nutzt. Es gibt daher acht Kennzeichencodekombinationen, von denen
zwei der horizontalen SpaltungsSegmentierung eines Zeichens und der Zusammenziehungssegmentierung von Zeichenpaaren zugeord-'
net werden. Um das Gerät nach dem Erfindungsgedanken jedoch kla- .
rer zu zeigen, stellt Fig. 3 eine andere Anordnung mit einem Kennzeichenbit-Schieberegister
34 dar, dessen Eingang mit dem Ausgang
j- des Wörterbuchspeichers 28 verbunden ist zur Speicherung der die
; OZE-Fehlleseneigung für ausgewählte im Wörterbuch-Schieberegister
26 gespeicherte Zeichen bezeichnenden Kennzeichenbits. Natürlich wäre ein vollständig separates Kennzeichenbit-Schieberegister 34,
über eine Leitung 32 mit dem Wörterbuchspeicher 28 verbunden, das Kennzeichenbits getrennt von den im Wörterbüchwortschieberegister
26 gespeicherten alphabetischen Zeichen festhält, ein ebenso durchführbares Ausführungsbeispiel, wie das offenbarte bevorzugte.
Die Verschiebesteuerung 20 steuert die Verschiebung des Inhaltes des OZE-Schieberegisters 14 über die Leitung 22 und die
Verschiebung des Inhaltes des Wörterbuch-Schieberegisters 26 über die Leitung 24. Die Verschiebung des Inhaltes des Kennzeichenbit-Schieberegisters
34 wird ebenfalls über die Leitung 24 so gesteuert, daß Schiebeoperationen für das Wörterbuch-Schieberegister 26
i und das Kennzeichenbits-fiShieberegister 34 immer übereinstimmend
erfolgen. Die Verschiebesteuerung 20 empfängt über die Leitung 24 vom Wörterbuchspeicher 28 die Länge des im Wörterbuch-Schieberegister
26 gespeicherten Wörterbuchwortes. Die Verschiebesteuerung 20 ist im einzelnen in Fig. 4 gezeigt.
Der Multiplexer 94ist mit drei Eingängen an das Wörterbuchwort-Schieberegister
26 angeschlossen, wobei die Leitung 88 mit der Zelle Ll, die Leitung 90 mit der Zelle L2 und die Leitung 92 mit
der Zelle L3 verbunden ist. Der Multiplexer 96 ist in Fig. 6 im j einzelnen gezeigt.
! Der Kennzeichendecodierer 100 in Fig. 3 ist mit einem Eingang an
I die letzte Zelle 35 im Kennzeichenbitseschieberegister. 34 entspre
! chend der Zelle Ll im Wörterbuchwort-Schieberegister 26 ange-
WA 973 006 509843/0565
schlossen. Der Kennzeichendecodierer hat vier Ausgangsleitungen, !
von denen durch ein Signal auf der Leitung 102a eine wahrscheinli-,
ehe einfache Substitution, durch ein Signal auf der Leitung 102b eine wahrscheinliche Zeichenspaltung, durch ein Signal auf der
Leitung 102c eine wahrscheinliche Zeichenpaar-Zusammenziehung und durch ein Signal auf der Leitung 102d eine wahrscheinliche Zeichen}-paar-Anhäufung
angezeigt werden. Die Ausgangsleitungen des Kenn- ! zeichendecodierers sind gemeinsam mit Leitung 102 bezeichnet.
Der Multiplextaktgeber 108 in Fig. 3 ist mit einer Eingangsleitung
102 an den Kennzeichendecodierer 100 und mit einer Ausgangsleitung 110 an die Multiplexer 94, 96 und 128 angeschlossen. Der
Multiplextaktgeber 108 ist im einzelnen in Fig. 7 in einem Blockschaltbild gezeigt. Das Adreßregister 116 ist durch die Eingangsleitungen 112 und 114 mit dem Multiplexer 94 verbunden. Das Adreßregister
122 ist durch die Eingangsleitungen 118 und 120 mit dem Multiplexer 96 verbunden.
Die Speichermatrix für bedingte Wahrscheinlichkeit 124 ist über einen ersten und einen zweiten Eingang mit den Adreßregistern
116 bzw. 122 verbunden. Die Speichermatrix für bedingte Wahrscheinlichkeit
speichert eine erste Art bedingter Wahrscheinlichkeit P(K /L ) dafür, daß das in der Zelle K des besagten ersten
n' m η
Schieberegisters gespeicherte OZE-Wortzeichen durch die Zeichensubstitution
falsch gelesen wurde unter der Voraussetzung, daß das in der Zelle L des besagten zweiten Schieberegisters gespeicherte
Wörterbuchwortzeichen tatsächlich abgefühlt wurde für n=i, m=l; n=2, m=2; n=2, m=3; und n=3, m=2. Die Speichermatrix
für bedingte Wahrscheinlichkeit speichert auch eine zweite Art bedingter Wahrscheinlichkeit P(K1K2JL1) dafür, daß das in den
Zellen K, und K2 des OZE-Wort-Schieberegisters 14 gespeicherte
OZE-Wortzeichen durch Zeichenteilung falsch gelesen wurde unter der Voraussetzung, daß das Wörterbuchwortzeichen, gespeichert
in der Zelle L1 besagten Wörterbuchwortschieberegister 26 tatsächlich
abgetastet wurde. Die Speichermatrix für bedingte Wahrscheinlichkeit 124 speichert auch eine dritte Art bedingter Wahr-
WA 973 006 5 0 9 8 A 3 / 0 5 6 5
ischeinlichkeit P(K I L L3) dafür, daß das in der Zelle K. des OZE-jWortschieberegisters
14'gespeicherte OZE-Wortzeichen durch die
IZeichenzusairanenziehung falsch gelesen wurde unter der Voraussetzung,
daß das in den Zellen L und L0 besagten Wörterbuchwort-
!Schieberegisters 26 gespeicherte Wörterbuchwortzeichen tatsächlich !abgetastet wurde. Die Speichermatrix für bedingte Wahrscheinlichkeit
124 enthält noch eine vierte Art bedingter Wahrscheinlichkeit P(K1K0Il1L0) dafür, daß die in den Zellen K. und K„ des OZE-
ι Χ Δ X Δ Χ ί
!Wortschieberegisters 14 gespeicherten OZE-Wortzeichen durch Zeichenhäufung
falsch gelesen wurden unter der Voraussetzung, daß die in den Zellen L. und L0 des Wörterbuch-Schieberegisters 26
gespeicherten Wörterbuchwortzeichen tatsächlich abgetastet wurden.
Tabelle IV zeigt einige Beispielwerte für die in der Speichermatrix
für bedingte Wahrscheinlichkeit 124 gespeicherten bedingten Wahrscheinlichkeiten der ersten, zweiten, dritten und vierten Art.
Theoretisch könnten die Kombinationen von groß und klein geschriebenen Buchstaben erschöpft sein, wenn die bedingten Wahrscheinlichkeiten
gespeichert sind für Ρ(Α±|Α.) P(A1AJAj^) P(A1J A-Ak) und für
Ρ(Α1Α.^Α]ζΑ1) , wobei i, j, k und 1 alle möglichen Werte einnehmen.
Viele dieser bedingten Wahrscheinlichkeiten erweisen sich jedoch als verschwindend klein und somit werden nur diejenigen Kombinationen
in praktischen Anwendungen gespeichert, deren Wahrscheinlichkeit größer ist als ein ausgewählter Schwellwert. Dieser
Schwellwert wird empirisch festgelegt und hängt von den jeweiligen charakterisierten OZE ab.
WA 973 006 509843/0565
Q | O O |
O O |
ο—-ο O O |
O | O | ο— O |
--O O |
σ | O O |
I | I | I | I | |
r—I O |
O | O | O | O | O | O | O | O | O | I | I | I | I | |
O | O | O | I | O | O | O | σ | O | I | I | I | I | ||
I | I | I | I | I | , | I | ||||||||
I | I | I | I | I | I | |||||||||
I | I | I | H O |
I | I | I | ||||||||
H
O |
H
O |
H
O |
σι
VO |
H O |
H
O |
|||||||||
O | I | I | I | I | ||||||||||
O | O | O | O • |
O | O | O | I | I | I | I | ||||
O * |
O |
O
• |
I | O • |
O
• |
I | I | I | I | |||||
-" -t | I | I | I | I | I | I | I | |||||||
I | I | I | I | I | I | I | ||||||||
O | .-1 | I | I | I | H | I | I | I | ||||||
H | H | H | H | O | H | H | H | |||||||
O | σ | O | O | O | O | O | ||||||||
O | O | O | O | O | O | O | ||||||||
CO
Γ "Λ |
frj | O | O | O | CD^"" O |
"—CD O |
CD O |
|||||||
iUH( | M | H | H | in | H | H | H | |||||||
O | O | O | ro | O | O | O | ||||||||
j j | O | O | O |
■^CD
■ |
O | O | O | |||||||
Eh | σ | O | O | H | O | O | O | |||||||
I | H | H | O O | H | H | H | ||||||||
Ü · | ο | O | O | O O | O | |||||||||
ο | O | O | O | O | ||||||||||
co | O | σ | O | O | O | |||||||||
O | ο | O | O | |||||||||||
ooo oo ochoo σ ο
οσο οσ ο oo oo
σοο σο σ>οσο ο σ
>Η OO Ο—Ο O · O O O -O O
οσσ οο οσο ο ο
σοσ οο οοο ο ο
I I I I I I
I I I I I I
M I I I I I I I I I I I
H HHHH H H -, wi—i ■—.——K^ O-——O O O O——O———O
r^ Pn σοο σο σοοο ο. ο
κ? σσοσσοοοοοο
ft] O'OOOOOOOOO
CQ ·
^
dOOHHHHHHHHO
σσο οο οοοο ο
Ο·Ο OO ΟΟΟΟ O
οσο οσ οοοο ο ο
ΟΟΟ OO ΟΟΟΟ O O
οσο οσ οοοο ο ο
HHfI τ-\ r-i HHHf-
O O Oi O O O O O H
U οσ· σο σοοο
οο οο οοο»
οο οο οοο»
OO OO ΟΟΟ
:J HOH HH HHHH H H
γϊ ο cn ο ο ο ο ο ο α___α_ ο
° W Ο·Ο OO ΟΟΟΟ O O
Ή ο ο οο οοοο ο ο
'•"3 COHH t-\ <-i HHHH H H
O cn ο ο ο ο ο ο ο α α ο
H <J ·ΟΟ OO ΟΟΟΟ O O
Γη O O O O O O O O O O
t-j OO OO ΟΟΟΟ O O
1H * OO
ι *
Pi ΪΟ E-J W
<! M U !3O fnMpciCj ςύ ρ
509843/0565
)—I J?j Ρ-ι £3 t"* ΓΙ." £ϋ ^ Pi ^! C-J Ε~· W P^ ΙΛ
Die oben erwähnten Wahrscheinlichkeiten werden durch die ΟΖΕΙ
Wortbestandteil-Zeichen und die Wörterbuchwort-Zeichen angesproj
chen, die wahlweise durch die Multiplexer 94 und 96 unter Steuerung
des Kennzeichendecodierers 100 in die Adreßregister 116
bzw. 122 geschaltet werden. Die Arbeitsweise der Multiplexer-Taktgabe 108 ist in Tabelle V gezeigt. Die Arbeitsweise des
Multiplexers 94 und 96 ist in Tabelle VI gezeigt.
Multiplextaktgabe
Kennzeichen
Substitution Spaltung
Zusammenziehung Häufung
Zusammenziehung Häufung
Anzahl von Impulsen
Multiplex (94)
Multiplex (96)
Multiplex (128)
Multiplex (96)
Multiplex (128)
MuItiplexschaltung
Kennzeichenbit = Substitution
Taktimpuls (108) 12 3 4
K, KEINE KEINE KEINE
Leitung (164)
Multiplexschaltung
Kennzeichenbit = Zeichenspaltung Taktimpuls 108
(94) | 1 | 2 | 3 | 4 | |
Multiplex | (96) | Kl | K2 | K1K2 | K3 |
Multiplex | (128) | Ll | L2 | Ll | L2 |
Multiplex | Reg. | Reg. | Reg. | Reg. | |
(130) | (132) | (134) | (136) | ||
WA 973 006 | 509843/ | 0 565 | |||
TABELLE VIc Multiplexschaltung
Kennzeichenbit = Zeichenzusammenziehung Taktimpuls (108)
(94) | 1 | 2 | 3 | 4 | |
Multiplex | (96) | K9 | K | K0 | |
Multiplex | (128) | L2 | L1'L2 | ||
Multiplex | Reg. | Reg. | Reg. | Reg. | |
(130) | (132) | (134) | (136) | ||
TABELLE | VId | ||||
Multiplexschaltung Kennzeichenbit = Zeichenhäufung Taktimpuls 108
12 3 4
Multiplex (94) Κχ K2 Κχ,K2 offen
Multiplex (96) L1 L2 Lj/L2 offen
Multiplex (128) Reg. Reg. Reg. laden I in Reg.
(130) (132) (134) (136)
Der Multiplexer 128 ist mit einem Dateneingang an die Wahrscheinlichkeits-Ausgangs
leitung 126 von der Speichermatrix für bedingte Wahrscheinlichkeit 124 angeschlossen. Der Multiplexer
128 arbeitet unter Steuerung des Multiplextaktgebers 110 und des Kennzeichendecodierers 100 und verteilt sequentiell bedingte
Wahrscheinlichkeiten, die von der Speichermatrix 124 angesprochen wurden, auf die Register 130, 132, 134, 136 oder auf
die Leitung 164 gemäß der Beschreibung in der Multiplexschalttabelle
VI. Eine genaue Darstellung der Schaltung für den Multiplexer findet sich in Fig. 8.
Ein erster Multiplizierer 138 ist mit einem Eingang an die Ausgabe
des Registers 130 und des Registers 132 angeschlossen und
WA 973 006 5 0 9 8 A 37Ö 5 6'5
multipliziert eine erste empfangene bedingte Wahrscheinlichkeit mit einer zweiten empfangenen bedingten Wahrscheinlichkeit, die
von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert wurde. Der Multiplizierer 138 gibt das erste Wahrscheinlich
keitsprodukt auf die Leitung 142 aus zum Vergleicher 146.
j Der Multiplizierer 140 ist mit Eingängen an die Register 134 und
136 angeschlossen, um eine dritte empfangene bedingte Wahrscheinlichkeit
mit einer vierten empfangenen bedingten Wahrscheinlichkeit zu multiplizieren, die von der Speichermatrix für bedingte
Wahrscheinlichkeit 124 adressiert wurden. Das zweite dadurch berechnete Wahrscheinlichkeitsprodukt wird über die Leitung 144 an
den Vergleicher 146 ausgegeben.
Der Vergleicher 146 vergleicht die relativen Größen des ersten Wahrscheinlichkeitsproduktes und des zweiten Wahrscheinlichkeitsproduktes, die auf die Leitungen 142 bzw. 144 ausgegeben wurden.
Wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite, wird vom Vergleicher 146 ein Signal auf die Ausgabeleitung
158 an das Schaltglied 148 und die Verschiebe-Kommando-Einheit 162 gegeben. Wenn andererseits das zweite Wahrscheinlichkeitsprodukt
größer ist als das erste, gibt der Vergleicher 146 ein Signal auf seiner Ausgabeleitung 160 zum Schaltglied 150
und an die Verschiebe-Kommando-Einheit 162.
Die Verschiebekommando-Einheit 162 hat eine an den Kennzeichendecodierer
100 angeschlossene Eingangsleitung 102 und eine an ■ die Verschiebesteuerung 20 angeschlossene Ausgangsleitung 80. Die
Schiebekommando-Einheit 162 ist in Fig. 9 im einzelnen gezeigt und die Arbeitsweise der Schiebekommando-Einheit 162 und der Verschiebesteuerung
20 ist in Tabelle VII dargestellt. Die Ausgangsleitung 80 umfaßt vier Leitungen, die die Verschiebesteuerung 20
anweisen, den Inhalt der Register 14 und 26 wie folgt nach links zu verschieben: Leitung 80a je eine Zelle; Leitung 80b je zwei
Zellen; Leitung 80c zwei Zellen bzw. eine Zelle; Leitung 8Od eine Zelle bzw. 2 Zellen.
WA 973 006 5 0 9 8 4 3/0565
TABELLE VII | POSITIONEN VERSCHOBEN IM OZE-WORT S/R (14) |
2460757 | |
Verschiebesteuerung | 1 | ||
GRÖSSERES PRODUKT (MULTIPLIZIERER) |
1 | ||
KENNZEICHEN | (na) | 1 | POSITIONEN VERSCHOBEN . IM WÖRTER BUCH S/R(34) |
Substitution | (138) | 1 1 |
1 |
Segmentierung | (140) | 1 2 |
1 |
Spaltung | (138) (140) |
1 | |
Zusammenziehung | (138) (140) |
1 2 |
|
Häufung | 1 2 |
||
Wenn der Kennzeichendecodierer 100 feststellt, daß das Fehlerneigungskennzeichen
für das in der Zelle L des Wörterbuchwort-Schieberegisters 26 gespeicherte Zeichen eine Neigung zur einfachen
Zeichensubstitution zeigt, verläuft die Operation gem. Tabelle VIa. Der Multiplexer 94 erhält über die Leitung 102a ein
Signal vom Kennzeichendecodierer 100 und einen Taktimpuls über die Leitung 110 und schaltet den Inhalt der Zelle K des OZE-Wortschie
beregisters 14 über die Leitung 114 in das Adreßregister 116. Gleichzeitig schaltet der Multiplexer 96, der über die Leitung
102a vom Kennzeichendecodierer 100 ein Signal erhält und der auch ein Taktsignal über die Leitung 110 empfängt, den Inhalt der Zelle
L in dem Wörterbuchwort-Schieberegister 26 über die Leitung 88 und die Leitung 120 in das Adreßregister 122 durch. Dann wird
von der Speichermatrix 124 die bedingte Wahrscheinlichkeit P(KJ L adressiert und über die Wahrscheinlichkeits-Ausgabeleitung 126
an den Multiplexer 128 ausgegeben. Der Multiplexer 128, der über die Leitung 102a vom Kennzeichendecodierer 100 ein Signal
erhält, empfängt auch ein Taktsignal über die Leitung 110 und schaltet die bedingte Wahrscheinlichkeitseingabe erster Art über
die Leitung 126 zur Ausgabeleitung 164 unter Umgehung des Vergleichers 146 durch.
WA 973 006
509843/0565
Wenn stattdessen das in Verbindung mit den in der Zelle L1 des
Wörterbuchwort-Schieberegisters 26 gespeicherte Fehlerneigungskennzeichen eine Neigung zur Zeichenspaltung anzeigt, verläuft
die Operation gemäß Tabelle VIb. Der Multiplexer 94, der über die Leitung 102 ein Signal von den Kennzeichendecodierer 100 erhält
und der auch vier Taktsignale über die Leitung 110 von dem Multiplextaktgeber 108 empfängt,, schaltet die Folge von vier Zeichen
oder Zeichenkombinationen aus den Zellen K , K2 und K_ des
OZE-Wort-Schieberegisters 14 zum Adreßregister 116 durch. Gleichzeitig schaltet der Multiplexer 96 eine Folge von vier Zeichen
oder Zeichenkombinationen aus den Zellen L1, L2 und L3 zum Adreßregister
122 durch. Aufgrund des ersten Taktimpulses vom Multiplextaktgeber 104 ist das erste durch den Multiplexer 94 durchgeschaltete
Zeichen der Inhalt der Zelle K und das erste durch den Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle
j L . Die bedingte Wahrscheinlichkeit P(K ] L) wird von der Speicher
' 1 ix
matrix für bedingte Wahrscheinlichkeit 124 adressiert und über die
Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendecodierers 100 hat der Multiplexer
128 ein Signal auf der Eingabeleitung 102b, welches eine Spaltungs neigung anzeigt und aufgrund des ersten Taktimpulses von dem Multiplextaktgeber
108 schaltet die bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 130 durch zur schließlichen
Verarbeitung durch den Vergleicher 146. Aufgrund des zweiten Taktimpulses für den Multiplextaktgeber 108 ist das zweite durch den
Multiplexer 94 geschaltete Zeichen der Inhalt der Zelle K und
2 das zweite vom Multiplexer 96 geschaltete Zeichen der Inhalt der
Zelle L9. Die bedingte Wahrscheinlichkeit P(K9 |l_) wird von der
Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert .und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer
128 ausgegeben. Der Multiplexer 128 erhält unter Steuerung des Kennzeichendecodierers 100 ein Signal auf der Eingangsleitung
102b, welches eine Spaltungsneigung anzeigt, und schaltet aufgrund
des zweiten Taktimpulses vom Multiplextaktgeber 108 die zweite bedingte Wahrscheinlichkeitseingabe auf der Leitung 126
973 006 5 09843 /QS8 5
zum Register 132 durch zur schließlichen Verarbeitung durch den '
Vergleicher 146. Aufgrund des dritten Taktimpulses vom Multi- j plextaktgeber 108 ist die dritte vom Multiplexer 94 durchgeschaltej
te Zeichenkombination der Inhalt der Zelle K1 und der Zelle K2
und das dritte vom Multiplexer 96 geschaltete Zeichen der Inhalt der Zelle L1- Die bedingte Wahrscheinlichkeit P(K1K3J L1) wird
von der Speichermatrix für beidingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer
128 ausgegeben. Unter Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 auf der Eingabeleitung 102b
ein die Spaltungsneigung anzeigendes Signal und schaltet aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 die dritte bedingte
Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 134 durch zur schließlichen Verarbeitung durch den Vergleicher
146. Aufgrund des vierten Taktimpulses des Multiplextaktgebers 108 ist das vierte vom Multiplexer 94 durchgeschaltete Zeichen
der Inhalt der Zelle K3 und das vierte vom Multiplexer 96 durchgeschaltete
Zeichen der Inhalt der Zelle L3. Die bedingte Wahrscheinlichkeit
P(K3IL2) wird von der Speichermatrix für bedingte
Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Kennzeichendecodierer 100 ausgegeben.,
Dabei liegt ein die Spaltungsneigung anzeigendes Signal auf der Eingabeleitung 102b und aufgrund des vierten Taktimpulses von
dem Multiplextaktgeber 108 wird die vierte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 136 durchgeschaltet
zur schließlichen Verarbeitung durch den Vergleicher 146.
Wenn stattdessen das Fehlerneigungskennzeichen, das in Verbindung
mit dem in der Zelle L1 des Wörterbuchwort-Schieberegisters
26 gespeicherten Zeichen gespeichert wurde, eine Neigung zur Zeichenzusammenziehung anzeigt, verläuft die Operation nach
Tabelle VIc. Der Multiplexer 94 empfängt über die Leitung 102c Signale vom Kennzeichendecodierer 100 und vier Taktsignale über
die Leitung 110 vom Multiplextaktgeber 108 und schaltet dann die Folge von vier Zeichen oder Zeichenkombinationen aus den
973 006 509843/056S
Zellen K , K2 und K. des. OZE-Wort-Schieberegisters 14 zum Adreßregister
116 durch* Gleichzeitig verschiebt.der Multiplexer 96
der ein Signal über die Leitung iO2c vom Kennzeichendecodierer
100 und vier Taktsignale über die Leitung 110 vom Multiplextaktgeber 108 empfängt, die Folge von vier Zeichen oder Zeichenkombinationen
aus den Zellen L1, L2 und L3 in das Adreßregister 122.
Aufgrund des ersten Taktimpulses von dem Multiplextaktgeber 108 ist das erste vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt
der Zelle K und das erste vom Multiplexer 96 durchgeschaltete Zeichen der Inhalt der Zelle L.. Der Wert für die bedingte
Wahrscheinlichkeit P(K^ L1) wird von der Speichermatrix für bedingte
Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 123 ausgegeben. Der Multiplexer
128 erhält unter Steuerung des Kennzeichendecodierers
ein Signal auf der Eingabeleitung 102c, welches eine Zusammenziehungsneigung anzeigt und aufgrund des ersten Taktimpulses vom
Multiplextaktgeber 108 schaltet er die erste bedingte Wahrscheinlichkeitseingabe
auf der Leitung 126 durch zum Register 130 zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund
des zweiten Taktimpulses vom Multiplextaktgeber 108 ist das zweite
vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der
Zelle K_ und das zweite vom Multiplexer 96 durchgeschaltete Zeichen
der Inhalt der Zelle L3. Die zweite bedingte Wahrscheinlichkeit
P(K2 Il2) wird von der Speichermatrix für bedingte Wahrscheinlichkeit
124 adressiert und über die Wahrscheinlichkeitslei-■ tung 126 an den Multiplexer 128 ausgegeben. Der Multiplexer 128
erhält unter Steuerung des Kennzeichendecodierers 100 ein Signal auf der Eingangsleitung 102c, welches eine Zusammenziehungsneigunc
anzeigt, und schaltet aufgrund des zweiten Taktimpulses vom Multiplextaktgeber
108 die zweite bedingte Wahrscheinlichkeitseingabc auf der Leitung 126 zum Register 132 durch zur schließlichen Verarbeitung
durch den Vergleicher 146. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 ist das dritte vom Multiplexer
94 durchgeschaltete Zeichen der Inhalt der Zelle L1 und der Zelle
L3. Die bedingte Wahrscheinlichkeit P(K1IL^L3) wird von der
973 006 5-098.43/05-65
Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer
128 ausgegeben. Der Multiplexer 128 erhält unter Steuerung des Kennzeichendecodierers 100 ein Signal auf der Eingangsleitung
102c, welches eine Zusammenziehungsneigung anzeigt, und schaltet aufgrund des dritten Taktimpulses für den Multiplextaktgeber
108 die dritte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 134 durch zur schließlichen Verarbeitung
durch den Vergleicher 146. Eine Antwort auf den vierten Taktimpuls vom Multiplextaktgeber 108, das vierte durch den Multiplexer
94 durchgeschaltete Zeichen ist der Inhalt der-Zelle K2 und
das vierte vom Multiplexer 96 durchgeschaltete Zeichen ist der Inhalt der Zelle L3. Die bedingte Wahrscheinlichkeit P(K3IL3) wird :
von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert
und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer
128 ausgegeben. Unter Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung
102c, welches eine Zusammenziehungsneigung anzeigt, und aufgrund des vierten Taktimpulses von dem Multiplextaktgeber 108 wird
die vierte bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum Register 136 durchgeschaltet zur schließlichen Verarbeitung
durch den Vergleicher 146.
Wenn stattdessen die Fehlerneigungskennzeichen, die in Verbindung mit dem in der Zelle L1 des Wörterbuchwort-Schieberegisters
26 gespeicherten Zeichen gespeichert sind, eine Neigung zur Zeilenhäufung anzeigen, dann verläuft die Operation gemäß Tabelle
VId. Der Multiplexer 94 erhält über die Leitung 102d durch den Kennzeichendecodierer 100 Signale und empfängt vier Taktsignale
über die Leitung 110 vom Multiplextaktgeber 108, schaltet die Folge von vier Zeichen oder Zeichenkombinationen aus den Zellen
K. und K2 des OZE-Schieberegisters 14 zum Adreßregister
116 durch. Gleichzeitig schältet der Multiplexer 96, der Signale über die Leitung 103d durch den Kennzeichendecodierer 100 und vier
Taktsignale über die Leitung 110 vom Multiplextaktgeber 108 empfängt, eine Folge von vier Zeichen oder Zeichenkombinationen
WA 973 006 50 984 3/056 5
aus den Zeilen L1 und L2 zum Adreßregister 122 durch. Aufgrund des
ersten Taktimpulses vom Multiplexertaktgeber 108 ist das zuerst durch den Multiplexer 94 durchgeschaltete Zeichen der Inhalt der
Zelle K und das zuerst vom Multiplexer 96 durchgeschaltete Zeichen
der Inhalt der Zelle L.. Die bedingte Wahrscheinlichkeit
P(K1IL2) wird adressiert von der Speichermatrix für bedingte Wahr
scheinlichkeit 124 und über die Wahrscheinlichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter Steuerung des Kennzeichendec
j dierers 100 erhält der Multiplexer 128 ein Signal auf der Eingangs leitung 102d, welches eine Häufungsneigung anzeigt und aufgrund
des ersten Taktimpulses vom Multiplextaktgeber 108 wird die bedingte Wahrscheinlichkeitseingabe auf der Leitung 126 zum
Register 130 zur schließlichen Verarbeitung durch den Vergleicher 146 durchgeschaltet. Aufgrund des zweiten Taktimpulses vom Multiplextaktgeber
108 ist das zweite vom Multiplexer 94 durchgeschaltete Zeichen der Inhalt der Zelle K2 und das zweite vom Multiplexer
96 durchgeschaltete Zeichen der Inhalt der Zelle L2. Die bedingte
Wahrscheinlichkeit P(IK2Il2) wird von der Speichermatrix fü
bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrschein
lichkeitsleitung 126 an den Multiplexer 128 ausgegeben. Unter der Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer
128 ein Signal auf der Eingabeleitung 102d, welches eine Häufungsneigung anzeigt und aufgrund des zweiten Taktimpulses vom Multiplextaktgeber
108 schaltet die zweite bedingte Wahrscheinlichkeits eingabe auf der Leitung 126 zum Register 132 durch zur schließlichen
Verarbeitung durch den Vergleicher 146. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108. ist die dritte vom Multiplexer
94 durchgeschaltete Zeichenkombination der Inhalt der Zelle K1 und der Zelle K2 und die vom Multiplexer 96 durchgeschaltete dr
te Zeichenkombination der Inhalt der Zelle L1 und der Zelle L,.
Die bedingte Wahrscheinlichkeit P(K ,K0 |>.L , L0) wird von der
Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Wahrscheinlichkeitsleitung 168 an den Multiplexer
128 ausgegeben. Unter Steuerung des Kennzeichendecodierers' 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung 102df
das eine Häufungsneigung anzeigt, und schaltet aufgrund des dritten
WA 973 006 509843/0565
Taktimpulses vom Multiplextaktgeber 108 die dritte bedingte Wahrscheinlichkeitseingabe
auf der Leitung 126 zum Register 134 durc zur schließlichen Verarbeitung durch den Vergleicher 146. Aufgrund
des vierten Taktimpulses vom Multiplextaktgeber 108 werden keine Zeichen durch den Multiplexer 94 und keine Zeichen durch den Multiplexer
96 durchgeschaltet. Unter Steuerung des Kennzeichendecodierers 100 erhält der Multiplexer 128 ein Signal auf der Eingabeleitung
102d, welches eine Häufungsneigung anzeigt und aufgrund des vierten Taktimpulses von dem Multiplextaktgeber 108 lädt der Multiplexer
128 den Wert 1, der im Speicherregister 324 gespeichert ist in das Register 136 zur schließlichen Verarbeitung durch den Vergleicher
146.
Der Inhalt des Registers 130 wird mit dem Inhalt des Registers
132 durch den Multiplizierer 138 multipliziert und das Produkt auf der Leitung 142 an den Vergleicher 146 ausgegeben. Der Inhalt
des Registers 134 wird durch den Multiplizierer 140 mit dem Inhalt des Registers 136 multipliziert und auf der Leitung 144
an den Vergleicher 146 ausgegeben. Das durch den ersten Multiplizierer 138 ausgegebene Produkt ist das erste Wahrscheinlichkeitsprodukt
und das durch den zweiten Multiplizierer 140 ausgegebene Produkt ist das zweite Wahrscheinlichkeitsprodukt. Die
relativen Größen des ersten und zweiten Wahrscheinlichkeitsproduktes werden im Vergleicher 146 miteinander verglichen. Wenn
das erste Wahrscheinlichkeitsprodukt auf der Leitung 142 größer ist als das zweite Wahrscheinlichkeitsprodukt auf der Leitung
144, gibt der Vergleicher 146 ein Durchschaltsignal auf der Leitung 158 aus, welches das Schaltglied 148 durchschaltet, so daß
der Inhalt des Registers 130 über die Leitung 149 zur Leitung und dann zur Leitung 156 gelangt. Das Signal des Vergleichers
auf der Leitung 158 ist die Eingabe zur Verschiebebevehls-Einheit
162. Wenn das zweite Wahrscheinlichkeitsprodukt auf der Leitung 144 größer ist als das erste Wahrscheinlichkeitsprodukt
auf der Leitung 142, gibt der Vergleicher 146 ein Leitsignal auf der Leitung 160 aus, welches das Schaltglied 150 so ein-
WA 973 006 5 0 9 8 4 3/0565
!schaltet, daß der Inhalt des Registers 134 auf der Leitung 151
I zur Leitung 156 geleitet wird. Das Ausgangssignal des Vergleiichers
auf der Leitung 160 ist die Eingabe zur Verschiebebefehls-'Einheit
162. Das erste Wahrscheinlichkeitsprodukt stellt die !Wahrscheinlichkeit dar, daß einfache Zeichensubstitutionen zwi-I
sehen den in der Zelle L und der Zelle K und den in der Zelle
IL0 und der Zelle K9 gespeicherten Zeichen auftreten. Das zweite
Wahrscheinlichkeitsprodukt stellt die Wahrscheinlichkeit dar, daß ein Segmentierungsfehler durch Zeichenspaltung Zusammenziehung
oder Häufung von Zeichen im Wörterbuchwort-Schieberegister 26 und dem OZE-Wort-Schieberegister 14 aufgetreten ist. Wenn das
erste Wahrscheinlichkeitsprodukt größer ist als das zweite, können das im OZE-Wort-Schieberegister 14 und das im Wörterbuchwort-Schieberegister
26 gespeicherte Wort gleichzeitig um denselben j Betrag verschoben werden bei der Verarbeitung des nächsten Satzes
von Buchstaben darin. Wenn jedoch das zweite Wahrscheinlichkeitsprodukt größer ist als das erste, dann ist irgendeine Art von Zeichensegmentierung
aufgetreten, die eine andere Verschiebung des im OZE-Wort-Schieberegister 14 gespeicherten Wortes als des im
Wörterbuchwort-Schieberegjster 26 gespeicherten Wortes erfordern
kann, bevor nachfolgende Buchstaben im Wort verarbeitet werden können. Diese unterschiedliche Verschiebungsentscheidung erfolgt
durch die Verschiebebefehls-Einheit 162.
Diese Verschiebebefehls-Einheit 162, die im einzelnen in Fig. 9 gezeigt ist, empfängt Steuereingangssignale über die Leitung 102
vom Kennzeichendecodierer 100. Die Leitung 102a zeigt eine Substitutionsneigung an, die Leitung 102b eine Spaltungsneigung, die
Leitung 102c eine Zusammenziehungsneigung und die Leitung 102d eine Häufungsneigung. Die Verschiebebefehls-Einheit 162 empfängt
über die Leitung 158 ein Signal vom Vergleicher 146, welches anzeigt, daß das erste Wahrscheinlichkeitsprodukt größer ist
oder sie empfängt über die Leitung 160 ein Signal vom Vergleicher 146, welches anzeigt, daß das zweite Wahrscheinlichkeitsprodukt
größer ist. Nach Fig. 9 gibt die Verschiebebefehls-Einheit 162 ein Schiebebefehlssignal über die Leitung 80 an die Verschiebesteu-
WA 973 006 509843/0 565
erung 20 steuert das Verschieben des Inhaltes des OZE-Wort-Schieberegisters
14 über die Leitung 22 und die Verschiebung des Inhaltes des Wörterbuchwort-Schieberegisters 26 und des Kennzeichenbit-Schieberegisters
34 über die Leitung 24. Wenn der Kennzeichendecodierer 100 über die Leitung 102a anzeigt, daß das
Zeichen in Zelle L eine Neigung zur einfachen Substitution hat, gibt die Verschiebebefehls-Einheit 162 auf der Leitung 80a ein
Signal an die Verschiebesteuerung 20 zum Verschieben des Inhalt ' des OZE-Schieberegisters 14 als auch des Wörterbuchwort-Schieberegisters
26 um eine Zelle. Wenn der Kennzeichendecodierer 100 über die Leitung 102b anzeigt, daß das Zeichen in der Zelle L. eine
Spaltungsneigung besitzt, gibt die Verschiebebefehls-Einheit 162 auf der Leitung 80a ein Signal an die Verschiebesteuerung 20 aus,
um sowohl den Inhalt des Schieberegisters 14 als auch den des Schiej
beregisters 26 um eine Zelle zu verschieben, wenn das erste Wahr- i
scheinlichkeitsprodukt größer ist als das zweite. Wenn der Kenn- j zeichendecodierer 100 über die Leitung 102b anzeigt, daß das Zeichen
in der Zelle L1 eine Spaltungsneigung hat, gibt die Verschiebebefehls-Einheit
162 über die Leitung 80c ein Signal an die Verschiebesteuerung 20 aus, um den Inhalt des OZE-Wort-Schieberegisters
14 um zwei Zellen und das Wörterbuchwort-Schieberegister 26 um eine Zelle zu verschieben, wenn das zweite Wahrscheinlichkeitsprodukt größer ist als das erste. Wenn der Kennzeichendecodierer
100 über die Leitung 102c anzeigt, daß die in den Zellen L. und
gespeicherten Zeichenpaare eine Zusammenziehungsneigung haben, gibt die Verschiebebefehls-Einheit 162 ein Signal auf der Leitung
80a an die Verschiebesteuerung 20 aus, um den Inhalt des Schieberegisters 14 und das Schieberegister 26 um eine Zelle zu verschieben,
wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite. Wenn der Kennzeichendecodierer 100 über die
Leitung 102c signalisiert, daß das in den Zellen L. und L2 gespeicherte Zeichenpaar eine Zusammenziehungsneigung hat, gibt
WA 973 006 509843/05^5
die Verschiebebefehls-Einheit 162 auf der Leitung 8Od ein Signal an die Verschiebesteuerung 20 aus, um den Inhalt des OZE-Wort-Sctiieberegisters
14 um eine Zelle und den des Wörterbuchwort-Schieberegisters
26 um zwei Zellen zu verschieben, wenn das zweite Wahrscheinlichkeitsprodukt größer als das erste ist. Wenn
ι ' ■ ·
der Kennzeichendecodierer 100 über die Leitung 102d anzeigt, daß
das Zeichenpaar in den Zellen L. und L, eine Häufungsneigung hat,
gibt die Verschiebebefehls-Einheit 162 auf der Leitung 80a an die Verschiebesteuerung 20 ein Signal aus, welches den Inhalt des
Schieberegisters 14 und des Schieberegisters 26 um jeweils eine
Zelle verschiebt, wenn das erste Wahrscheinlichkeitsprodukt größer ist als das zweite. Wenn der Kennzeichendecodierer 100 auf der
Leitung 102d signalisiert, daß das in den Zellen L. und L2 gespeicherte
Zeichenpaar eine Häufungsneigung hat, gibt die Verschiebebefehls
-Einheit 162 auf der Leitung 80b ein Kommando an die Verschiebesteuerung
20 aus, um sowohl den Inhalt des OZE-Wort-Schieberegisters
14 als auch den des Wörterbuchwort-Schieberegisters 26 um zwei Zellen zu verschieben, wenn das zweite Wahrscheinlichkeitsprodukt
größer ist als das erste.
Die bedingte Wahrscheinlichkeit für eine einfache Substitution, . ausgegeben vom Multiplexer 128 auf die Leitung 164, und die vom
Register 130 für eine einfache Substitution und die vom Register 134 für die Segmentierung ausgegebenen einfachen Wahrscheinlichkeiten
werden über die Leitung 156 zu einer Berechnungseinheit für das laufende Produkt gegeben, die den Multiplizierer 58, das
Produktregister 56, und die Lösch- und Speichereinheit 54 umfaßt.
Eine Aufgabe des in Fig. 3 gezeigten Systems besteht darin, dasjenige
im Wörterbuch 28 gespeicherte Wörterbuchwort zu finden, welches das höchste laufende Produkt beim Vergleich mit dem im
OZE-Wort-Schieberegsiter 14 gespeicherten OZE-Wort ergibt. Während jedes neue Wörterbuchwort vom Wörterbuchspeicher über die
Leitung 30 an das Wörterbuchwort-Schieberegister 26 ausgegeben wird, sendet der Wörterbuchspeicher ein Signal über die Leitung
55 art die Lösch- und Speichereinheit 54, um den Inhalt des Pro-
WA 973 006 509843/0565
duktregisters A56 zu löschen und den Wert 1 dort zu speichern. Beim Empfang eines jeden bedingten Wahrscheinlichkeitswertes
über die Leitung 156 im Multiplizierer 58, wird diese Wahrscheinlichkeit mit dem Inhalt des Produktregisters (A)56 multipliziert
und das Produkt im Produktregister (A)56 gespeichert. Während das im Wörterbuchwort-Schieberegister 26 gespeicherte Wörterbuchwort
also mit dem im OZE-Wort-Schieberegister 14 gespeicherten OZE-Wort verglichen wird, wird also ein laufendes Produkt der Wahrscheinlichkeiten
dafür, daß das OZE-Wort falsch gelesen wurde, errechnet und im Produktregister 56 gespeichert unter der Voraussetzung,
daß das Wörterbuchwort tatsächlich abgetastet wurde. Nachdem]
das im Wörterbuchwort-Schieberegister 26 gespeicherte Wörterbuchwort
vollständig verarbeitet wurde, enthält der Inhalt des Produktregisters 56 das gesamte Wahrscheinlichkeitsprodukt ffür den
Vergleich des Wörterbuchwortes mit dem OZE-Wort. Wenn das ganze im Register 56 gespeicherte Wahrscheinlichkeitsprodukt größer
ist als diejenigen für die Gesamtwahrscheinlichkeitsprodukte, die vorher für Wörterbuchwörter errechnet wurden, die mit dem
gegenwärtig im Schieberegister 14 stehenden OZE-Wort verglichen wurden, wird das Gesamtwahrscheinlichkeitsprodukt im Produktregister
56 über das Schaltglied 64 in das höchste Produktregister (B)66 übertragen.
Der Vergleicher 62 hält einen laufenden Vergleich der Größe des errechneten laufenden Produktes und des im Produktregister (A)56
gespeicherten Produkts mit dem höchsten Produktregister (B)66 bei.
Die Größe des Inhaltes des Produktregisters (A)56 beginnt mit einem Wert von 1, der durch die Lösch- und Speichereinrichtung
zu Beginn des Vergleiches für jedes Wörterbuchwort eingesetzt wird, das in das Schieberegister 26 geladen wird. Die Größe einer
jeden über die Leitung 156 in den Multiplizierer 58 eingegeben Wahrscheinlichkeit ist kleiner als 1 und somit wird die Größe des
errechneten und im Produktregister (A)56 gespeicherten laufenden Produktes monoton kleiner, während der Vergleich des Wörterbuchwortes
mit dem OZE-Wort fortgeführt wird. Wenn der Vergleicher feststellt, daß die Größe des im Produktregister (A)56 gespeicher-
ten laufenden Produktes kleiner ist als der Inhalt des Registers j
WA 972MÖÖ6 "5 Q 9 8 I 3/0 5 6 5
j - 43*"-
ί (B)66 für das höchste Produkt, gibt der Vergleicher 62 ein Signal
!über die Leitung 78 an den Wörterbuchspeicher 28, um das nächste ,Wörterbuchwort vom Wörterbuchspeicher über die Leitung 30 in das
Wörterbuchwort-Schieberegister 26 zu übertragen und dadurch den !Vergleich der vorliegenden Wörterbuchwörter mit dem OZE-Wort zu
beenden. Das OZE-Wort-Schieberegister 14 erhält gleichzeitig Sijgnale,
um das OZE-Wort in seine Anfangsposition zurücklaufen zu
!lassen, so daß der nächste Vergleich beginnen kann. Während jedes I Wörterbuchwort vom Wörterbuchspeicher 28 über die Leitung 30 an
j das Wörterbuchwort-Schieberegister 26 ausgegeben wird, wird das j Wörterbuchwort auch über die Leitung 40 zum Wortregister 38 übertragen.
Der Vergleicher 62 hält ein Signal auf der Leitung 70 so
lange.aufrecht, wie das im Produktregister (A)56 gespeicherte
laufende Produkt größer bleibt als der Inhalt des Registers (B)66 für das höchste Produkt. Wenn der letzte Buchstabe in dem gespeicherten
Wörterbuchwort im Wörterbuchwort-Schieberegister 26 mit dem entsprechenden Buchstaben in dem im OZE-Wort-Schieberegister
14 gespeicherten OZE-Wort verglichen wurde, gibt die Verschiebesteuerung
20 ein Wortendesignal auf die Leitung 74 aus, welches an das Schaltglied 72 übertragen wird. Wenn der Inhalt des Produktregisters
(A)56 noch größer ist als der Inhalt des Registers (B)66 für das höchste Produkt, dann schaltet das Schaltglied 72
durch und das Signal vom Vergleicher 62 auf der Leitung 70 wird an das Schaltglied 64 übertragen und schaltet dieses durch. Das
Schaltglied 64 sendet dann das ganze im Produktregister A(56) gespeicherte
Wahrscheinlichkeitsprodukt an das Register (B)66. Gleichzeitig wird der Impuls vom Schaltglied 72 über die Leitung
76 zum Schaltglied 42 übertragen und schaltet dieses durch, wodurch das im Wortregister 38 gespeicherte Wörterbuchwort in das
beste Register 44 für das beste Wort übertragen wird. Das Wortendsignal
auf der Leitung 74 von der Verschiebesteuerung 20 wird ebenfalls an den Wörterbuchspeicher 28 übertragen und dieser
dadurch veranlaßt, in das Wörterbuchwort-Schieberegister 26 das i nächste Wörterbuchwort zu übertragen. Nachdem die ganzen
WA 973 006 509843/0565
im Wörterbuchspeicher 28 gespeicherten Wörterbuchwörter mit dem OZE-Wort verglichen worden sind, das im OZE-Wort-Schieberegister ;
14 gespeichert ist, wird ein Signal für das Ende der Wörterbuchliste
auf der Leitung 48 vom Wörterbuchspeicher 28 an das Schalt-; glied 50 ausgegeben und dadurch die übertragung des im Register
44 gespeicherten Wörterbuchwortes auf die Leitung 52 als das wahrscheinlichste Alphafeld ermöglicht. Dieses Alphafeld wird
in das alphanumerische Ausgaberegister 8 zur Ausgabe auf die Ausgabe leitung IO eingegeben. Somit wird dasjenige im Wörterbuch-;
speicher 28 gespeicherte Wörterbuchwort auf die Leitung 10 aus- |
gegeben, welches höchstwahrscheinlich von der OZE als das im I OZE-Wort-Schieberegister 14 gespeicherte OZE-Wort falsch gelesen j
wurde. i
Die genaue Darstellung der Verschiebesteuerung 20 in Fig. 4 zeigt den Modulo-4-Zähler 204 und den Modulo-4-Zähler 214, die
ein Signal über eine der Leitungen 80a, 80b, 80c oder 8Od von der Verschiebefehls-Einheit 162 empfangen, die einen Begrenzungswert
von 1 oder 2 in die Zähler 204 oder 214 setzt, um eine Ausgabe für die Rückstellung des Flipflop 206 bzw. 216
erzeugen zu können. Auf diese Weise kann der Zähler 204 so programmiert werden, daß der Inhalt des OZE-Wort-Schieberegisters i
14 um eine oder zwei Zellenpositionen verschoben wird und der j Zähler 214 kann so programmiert werden, daß der Inhalt des Wör- (
terbuchwort-Schieberegisters 26 um ein oder zwei Zellenpositio- ί nen verschoben wird. ί
Der Taktoszillator 200a und 200b kann ein Einzeloszillator sein, dessen Ausgangsimpulse durch die Zähler 204 und 214 gezählt werden.
Ein Signal auf einer der Leitungen 80 von der Schiebebefehls-Einheit
162 setzt die Begrenzung für den Zähler 204 und durch das ODER-Glied 202 wird der Zähler 204 zurückgestellt und
beginnt das Zählen der Ausgangsimpulse vom Taktoszillator 200a. Gleichzeitig wird das Flipflop 206 eingeschaltet und das Potential
des Α-Ausgangs des Flipflop schaltet das UND-Glied 208 ein und überträgt dadurch den Spannungsverlauf vom Taktoszillator
an den Abwärtszähler 210 und über die Ausgabeleitung 22 an das ha 973 006 5 0 9 8 A 3 / 0 5 6 5
OZE-Wort-Schieberegister 14. Der Abwärtszähler 210 wurde über die
\ Leitung 19 mit dem Ergebnis der OZE-Zeichenzählung des ZeichenjZählers
18 geladen. Wenn im Betrieb beispielsweise die Verschiebe-Ibefehls-Einheit
162 ein Signal über die Leitung 80c an die Ver- !schiebesteuerung 20 ausgegeben hat, wird in den Zähler 204 ein
j Grenzwert von 2 gesetzt. Zwei Taktimpulse vom Taktoszillator 200a jwerden somit durch das UND-Glied 208 an den Abwärtszähler 210 und
!über die Leitung 22 an das OZE-Wort-Schieberegister 14 übertragen,
iWenn der Zähler 204 den Grenzwert von 2 erreicht und einen Impuls
zur Rückstellung des Flipflop 206 ausgibt, wird das UND-Glied abgeschaltet. Auf diese Weise wurde der Inhalt des OZE-Wort-Schieberegisters
um zwei Positionen verschoben und der Abwärtszähler hat von der ursprünglichen Zeichenzahl des OZE-Wortes den Wert
subtrahiert. Eine ähnliche Operation gilt für den Zähler 214, der j die Inhalte des Wörterbuchwort-Schieberegisters 26 und des Kenn-I
zeichenbit-Schieberegister 34 verschiebt. Wenn der Inhalt der Ab-I
wärtszähler 210 oder 220 auf 0 reduziert wurde und entweder das OZE-Wort oder das Wörterbuchwort vollständig verarbeitet wurde,
wird auf die Leitung 74 ein Null-Ausgangssignal gegeben, welches dem Wörterbuchspeicher 28 und 72 entsprechende Anzeigen liefert.
Die detaillierte Darstellung des Multiplextaktgebers 108 in
Fig. 7 zeigt den Modulo-4-Zähler 294, dessen Zählgrenze durch
ein Signal über die Leitung 102a, 102b/ 102d vom Kennzeichendecodierer
100 gewählt wird. Wenn das Wörterbuchwort-Schieberegister
26 ein neues Zeichen in die Zelle L schiebt, wird das entsprechende
im Kennzeichenbitschieberegister 35 gespeicherte Kennzeichenbit über die Leitung 98 an den Kennzeichendecodierer
100 ausgegeben. Wenn das Kennzeichenbit eine einfache Substitutionsneigung anzeigt, wird ein Signal vom Kennzeichendecodierer
100 über die Leitung 102a ausgegeben, welches einen Grenzwert von 1 in den Zähler 294 setzt. Wenn das an den Kennzeichendecodierer
ausgegebene Kennzeichenbit eine Spaltungs-, Zusammenziehungsoder
Häufungsneigung anzeigt, gibt der Kennzeichendecodierer 100 ein Signal über eine der Leitungen 102b, 102c oder
WA 973 006 5 0 9 8 A 3 / 0 5 6 5
102d aus und setzt einen Grenzwert von 4 in den Zähler 294. Der Zähler 294 wird rückgestellt und gestartet über ein ODER-Glied
292, welches den Grenzwert empfängt, und der Zähler beginnt die vom Oszillator 290 abgegebenen Taktimpulse zu zählen. Gleichzeitig
setzt das Signal vom ODER-Glied 292 das Flipflop 296 und betätigt dadurch das UND-Glied 298, so daß die Taktimpulse vom Oszillator
290 auf die Leitung 110 ausgegeben werden als die Multiplextaktimpulse für die Multiplexer 94, 96 und 128. Wenn ein Signal
über die Leitung 102b empfangen wurde, wird der Grenzwert 4 in den Zähler 294 gesetzt und das UND-Glied 298 läßt vier MuI-tiplextaktimpulse
auf die Leitung 110 ausgeben, bevor der Zähler 294 den Grenzwert von 4 erreicht und das Flipflop 296 zurückstellt,
wodurch das UND-Glied 298 abgeschaltet wird.
Die detaillierte Darstellung des Multiplexers 94 in Fig. 5 zeigt den Modulo-4-Zähler 230, der die Taktimpulse über die Leitung
vom Multiplextaktgeber 108 empfängt. Der Zähler 230 hat vier Ausgangsleitungen, von denen die erste mit 1 beschriftet und an das
UND-Glied 232 angeschlossen ist und ein Signal führt, wenn der Zähler den ersten Taktimpuls über die Leitung 110 zählt. Die zweite
Ausgangsleitung vom Zähler 230 mit der Beschriftung 2 führt zum UND-Glied 236 und ist nur erregt, wenn der Zähler den zweiten
Taktimpuls über die Leitung 110 zählt. Die dritte Ausgangsleitung mit der Beschriftung 3 ist an die UND-Glieder 238 und
geführt und nur erregt, wenn der Zähler 230 den dritten Taktimpuls über die Leitung 110 zählt. Die vierte Ausgangsleitung mit
der Beschriftung 4 zum UND-Glied 242 ist nur erregt, wenn der Zähler 230 den vierten Taktimpuls auf der Leitung 110 zählt.
Wenn das dem in der Zelle L1 des Wörterbuchschieberegisters 26
gespeicherten Kennzeichen entsprechende Fehlerneigungskennzeichen eine einfache Substitution anzeigt, gibt der Kennzeichendecodierer
100 auf die Leitung 102a ein Substitutionssignal aus, welches eine Eingabe für das UND-Glied 258 des Multiplexers 94
in Fig. 5 ist. Da ein Signal auf der Leitung 102a eine Eingabe zum Multiplextaktgeber 108 in Fig. 7 ist und den Grenzwert des
WA 973 006 509843/0565
Zählers 294 auf 1 setzt, läuft nur ein Taktimpuls über die Leitung
110 zum Modulo-4-Zähler 230 des Multiplexers 94 in Fig. 5.
Der Zähler 230 zählt den Taktimpuls auf der Leitung 110 und erregt die zum UND-Glied 232 führende Ausgangsleitung mit der Beschriftung
1. Das UND-Glied 232 leitet dadurch den Inhalt der Zelle K auf der Leitung 82 vom OZE-Wort-Schieberegister 14 über die
Leitung 114 zum Adreßregister 116. Die Ausgangsleitung mit der Beschriftung 1 des Zählers 230 ist auch an das Schaltglied 258
angeschlossen und ein Signal darauf bereitet das Schaltglied zusammen mit dem Substitutionssignal auf der Leitung 102 zur
übertragung eines Signales über das Verzögerungsglied 234 zur Rückstellung
des Zählers 230 vor. In der detaillierten Darstellung des Multiplexers 96 in Fig. 6 empfängt der Modulo-4-Zähler 260
gleichzeitig den ersten Taktimpuls über die Leitung 110 und schaltet die Ausgangsleitung mit der Beschriftung "1", die zum
UND-Glied 262 führt, ein, wodurch der Inhalt der Zelle L1 über
die Leitung 88 vom Wörterbuchwort-Schieberegister 26 auf die Leitung 120 zum Adreßregister 122 geleitet wird. Die Ausgangsleitung
1 vom Zähler 260 ist auch mit dem UND-Glied 263 verbunden, welches dadurch vorbereitet wird zum Durchschalten des Sub
stitutionssignales auf der Leitung 102a zum Verzögerungsglied zur Rückstellung des Zählers 260. Der Inhalt der Zelle K1 des OZE-Wortschieberegisters
14 wird somit zum Inhalt des Adreßregisters 116 und der Inhalt der Zelle L1 des Wörterbuchwort-Schieberegisters
26 wird zum Inhalt des Adreßregisters 122, um die bedingte Wahrscheinlichkeit für einfache Substitution P (K1]L1) zu
adressieren. Die detaillierte Darstellung des Multiplexers 128 in Fig. 8 zeigt den Modulo-4-Zähler 302, der den Taktimpuls
über die Leitung 110 vom Multiplextaktgeber 108 empfängt. Der Zähler 302 hat vier Ausgangsleitungen mit den Beschriftungen
1,2 3 und 4, von denen jede nur erregt ist, wenn der entsprechende Wert durch den Zähler 302 gezählt wird. Der Multiplexer
128 erregt bei Empfang des Substitutionssignales über die Leitung 102 das UND-Glied 308 und schaltet das UND-Glied 306 ab.
Wenn der erste Taktimpuls über die Leitung 110 empfangen wird, wird das UND-Glied 304 erregt und leitet dadurch das bedingte
WA 973 006 50 9 8 4 3/0565
Wahrscheinlichkeitsprodukt P(K | L ), welches von der Speichermatrix
für bedingte Wahrscheinlichkeit 124 und einem Eingangssignal j über die Leitung 126 adressiert wurde, durch das UND-Glied 304 und:
das UND-Glied 308 auf die Leitung 164 zum Multiplizierer 58. Das
Ausgangssignal des UND-Gliedes 308 dient als Rückstellsignal, wel-: ches durch das Verzögerungsglied 309 verzögert wird und den Zähler \ 302 rückstellt. Zum Betrieb der Multiplexer 94, 96 und 128 gehört ; das sequentielle Laden der Register 130, 132, 134 und 136 mit den ι von der Speichermatrix 124 adressierten bedingten Wahrscheinlichkeiten, wenn das zu dem Zeichen in der Zelle L1 gehörende Fehlerneigungskennzeichen eine Teilung, Zusammenziehung oder Häufung ! anzeigt. I
Ausgangssignal des UND-Gliedes 308 dient als Rückstellsignal, wel-: ches durch das Verzögerungsglied 309 verzögert wird und den Zähler \ 302 rückstellt. Zum Betrieb der Multiplexer 94, 96 und 128 gehört ; das sequentielle Laden der Register 130, 132, 134 und 136 mit den ι von der Speichermatrix 124 adressierten bedingten Wahrscheinlichkeiten, wenn das zu dem Zeichen in der Zelle L1 gehörende Fehlerneigungskennzeichen eine Teilung, Zusammenziehung oder Häufung ! anzeigt. I
i Ohne vom Rahmen der Erfindung gemäß Darstellung in Fig. 3 abzu- j
weichen, können der Wörterbuchspeicher 28 und die Speichermatrix
für bedingte Wahrscheinlichkeit 124 jeweils auch ein Teil dessel- ι
ι ben Speichers sein. Anstelle eines OZE-Wort-Schieberegisters 14
und des Multiplexers 94 in Verbindung mit dem Wörterbuchwort-Schieberegister
26 und dem Multiplexer 96 zur unterschiedlichen
Verschiebung der Zeichen in den entsprechenden darin befindlichen
Wörtern, wie sie beschrieben wurde, können auch das OZE-Wort und
das Wörterbuchwort entsprechend in zwei stationären Registern
gespeichert werden, von denen jede Zeichenposition mit einer
Schalteinrichtung zum Schalten der gewählten Kombination von
Zeichen auf die Adreßregister 116 und 122 verbunden ist. Zur
praktischen Durchführung einer solchen Schalteinrichtung würden
die Zeichen des OZE-Wortes in einem ersten stationären Register
gespeichert, wobei die Zeichen in der Reihenfolge des Empfanges
von der OZE angeordnet werden, und zwar das erste Zeichen an
einem gegebenen Ende des OZE-Wortes, wodurch eine erste Position
eines Fehlerwortursprunges definiert ist. Das würde der Zelle
K1 im OZE-Wortschieberegister 14 entsprechen. Die Zeichen und
die Fehlerneigungskennzeichen des Wörterbuchwortes würden in
einem zweiten stationären Register gespeichert, wobei die Zeichen in einer Reihenfolge angeordnet sind, die.der Reihenfolge
Verschiebung der Zeichen in den entsprechenden darin befindlichen
Wörtern, wie sie beschrieben wurde, können auch das OZE-Wort und
das Wörterbuchwort entsprechend in zwei stationären Registern
gespeichert werden, von denen jede Zeichenposition mit einer
Schalteinrichtung zum Schalten der gewählten Kombination von
Zeichen auf die Adreßregister 116 und 122 verbunden ist. Zur
praktischen Durchführung einer solchen Schalteinrichtung würden
die Zeichen des OZE-Wortes in einem ersten stationären Register
gespeichert, wobei die Zeichen in der Reihenfolge des Empfanges
von der OZE angeordnet werden, und zwar das erste Zeichen an
einem gegebenen Ende des OZE-Wortes, wodurch eine erste Position
eines Fehlerwortursprunges definiert ist. Das würde der Zelle
K1 im OZE-Wortschieberegister 14 entsprechen. Die Zeichen und
die Fehlerneigungskennzeichen des Wörterbuchwortes würden in
einem zweiten stationären Register gespeichert, wobei die Zeichen in einer Reihenfolge angeordnet sind, die.der Reihenfolge
WA 973 006
von Zeichen im ersten stationären Register entspricht. Ein erstes Zeichen im Wörterbuchwort würde so gesetzt, daß es dem ersten
Zeichen im OZE-Wort entspricht und eine erste Position für einen Referenzwortursprung definiert. Das entspricht natürlich der
!zelle L im Wörterbuchwort-Schieberegister 26. Wenn z.B. die Feh-
I 1
jlerneigungsanzeige für das am Referenzwortursprung im Referenz-Iwort
stehende Zeichen eine Zeichenspaltungsneigung anzeigt, würden in der Schalteinrichtung folgende Vorgänge ablaufen. Eine erste
'bedingte Wahrscheinlichkeit einer einfachen Substitution, wobei vorausgesetzt wird, daß das am Referenzwortursprung stehende
Zeichen im Referenzwort abgetastet wurde, und daß das OZE das Zeichen am Fehlerwortursprung im Fehlerwort ersetzte. Dieses würde
der einfachen Substitutionswahrscheinlichkeit P(K.|L.) entsprechen,
die oben beschrieben wurde. Dann schaltet die Schalteinrichtung das dem Zeichen am Referenzwortursprung am nächsten
stehende Zeichen und das dem Zeichen am Fehlerwortursprung im Fehlerwort am nächsten stehende Zeichen durch zur Adressierung der
zweiten bedingten Wahrscheinlichkeit entsprechend P(K, |L2) gemäß
obiger Beschreibung. Die Schalteinrichtung schaltet dann das j Zeichen am Referenzwortursprung im Referenzwort und das Zeichen
am Fehlerwortursprung und das dem Zeichen am Fehlerwortursprung am Fehlerwort am nächsten stehende Zeichen durch, um eine dritte
bedingte Wahrscheinlichkeit entsprechend P(K Kl|L ) gemäß obiger Beschreibung zu adressieren. Schließlich würde die Schalteinrichtung
das dem Zeichen am Referenzwortursprung im Referenzjwort
am nächsten stehende Zeichen und das zweitnächste Zeichen j nach dem Zeichen im Fehlerwortursprung des Fehlerwortes durchschal
iten, um so eine vierte bedingte Wahrscheinlichkeit entsprechend
IP(K-jL9) zu adressieren. Eine solche Schalteinrichtung-würde
j aufeinanderfolgende Sätze entsprechender Zeichen im OZE-Wort
wählen und das Wörterbuchwort zum Vergleich entsprechend den Schiebebefehlen von der Verschiebebefehls-Einheit 162. Unter
Steuerung dieser Schiebebefehls-Einheit 162 würde die Schiebeeinrichtung die Lage sowohl des Fehlerwortursprungs als
auch des Referenzwortursprunges um eine Zeichenposition ver-
973 006 80 9873/0E6S
schieben, wenn der Vergleicher anzeigt, daß eine einfache Substitution
wahrscheinlicher ist als eine SpaltungsSegmentierung. Die
Schalteinrichtung würde den Fehlerwortursprung um zwei Zeichenpositionen und den Referenzwortursprung um eine Zeichenposition
verschieben, wenn die SpaltungsSegmentierung wahrscheinlicher erscheint
als eine einfache Substitution analog der oben beschriebenen Schieberegisteroperation. Wo die Fehlerneigungsanzeige die
Neigung zur Zeichenzusammenziehung anzeigte, verschiebt die Schalteinrichtung den Fehlerwortursprung und den Referenzwortursprung
um eine Zeichenposition, wenn die Wahrscheinlichkeit der einfachen Substitution größer ist als die der Zusammenziehungs-Segmentierung.
Die Schalteinrichtung würde den Fehlerwortursprung um eine Zeichenposition und den Referenzwortursprung um zwei Zeichenpositionen
verschieben, wenn die Wahrscheinlichkeit der Zeichenzusammenziehung größer wäre als die Wahrscheinlichkeit der
einfachen Substitution.
Es gibt etwa ein halbes Dutzend Zeichen, die zur horizontalen Spaltungssegmentierung neigen und in Tabelle I gezeigt sind. Etwa
ein Dutzend Zeichenpaare, die in Tabelle II gezeigt sind, neigen zur Zusammenziehungs-Segmentierung. Von sich aus bilden
sie nur einen kleinen Teil des Alphabet-Satzes der im Wörterbuchspeicher 28 gespeicherten Wörterbuchwörter. Im Ausführungsbeispieläuft
die Analyse des Wahrscheinlichkeitsfaktors weiter, als wenn eine einfache Zeichensubstitution der einzige zu berücksichtigende
Verstümmelungsfaktor wäre, wenn kein zu dem Zeichen oder Zeichenpaar gehörendes Kennzeichen auftritt. Nur wenn ein Kennzeichen
auftritt, umfaßt die erfindungsgemäße Operation eine Analyse möglicher Segmentierungsvorgänge. Im Ausführungsbeispiel sind
die Zeichen und Zeichenpaare in den Tabellen I und II speziell in der im Wörterbuchspeicher 28 gespeicherten Form codiert, so
daß der Kennzeichencode Teil des Alpha-Zeichencodes ist. Jedes Alphazeichen wird mit nur fünf der normalerweise zum Speichern
eines Zeichens verwendeten 8 Bits gespeichert. Die anderen drei Bits stehen dann zur Bezeichnung der Neigungen zur Zeichensegmentierung,
zur Zeichenpaar-Zusammenziehung und zur Zeichenpaarhäu-
^973006 5098(3/0585
-χ'- 24Q0757
fung zur Verfügung. Es kann jedoch auch ein anderes Ausführungsbeispiel verwendet werden, so daß man keine SpezialCodierung
der Segmentierungsneigung der Zeichen im Wörterbuchspeicher 28 braucht. In diesem anderen Ausführungsbeispiel fiele das in Fig. 3
gezeigte Kennzeichenbit-Schieberegister 34 weg und würde ersetzt durch einen beschreibbaren Festwertspeicher mit einem ROS-Adreßregister,
dessen Eingänge mit den Leitungen 88 und 90 für die Zellen L. und L des Wörterbuchwort-Schieberegisters 26 verbunden sind.
Der bescnreibbare Festwertspeicher speist über seine Ausgangsleitung 98 den Kennzeichendecodierer 100. Dieser beschreibbare Festwertspeicher
würde die Information über eine Spaltungssegmentierung nach Darstellung in Tabelle I und Information über die in
Tabelle II gezeigte Zusammenziehungssegmentierung enthalten. Die im Wörterbuchspeicher 28 gespeicherten Wörterbuchwörter könnten
dann auf konventionelle Weise codiert werden. Wenn ein Wörterbuchwort
in das Wörterbuch-Schieberegister 26 geladen wird, empfinge der beschreibbare Festwertspeicher als Eingang den Inhalt der
Zellen L. und L2 und diese Kombination spricht ein Fehlerneigungsmerkmal
an, welches anzeigt, ob die einfache Substitution, die Spaltung, die Zusammenziehung oder die Häufung eine Möglichkeit
zur Verstümmelung der Zeichen ist. Das Fehlerneigungsmerkmal würde auf die Leitung 98 in ähnlicher Form ausgegeben wie durch die Zelle
35 im Kennzeichenbit-Schieberegister 34 des in Fig. 3 gezeigten Ausführungsbeispieles. Das ROS-Adreßregister und der beschreibbare
Festwertspeicher bilden eine Einrichtung zur Erzeugung eines Fehlerneigungsmerkmales.
Die Arbeitsweise des in Fig. 3 gezeigten Gerätes wird gezeigt
durch Verarbeitung des Wortes "Wreck", das von der OZE falsch gelesen wird als "IWn c". Das Sternzeichen bezeichnet bekanntlich
ein zurückgewiesenes oder nicht erkanntes Zeichen. Drei im' Wörterbuchspeicher 28 gespeicherte Wörterbuchwörter, nämlich
"Break", "Wreck" und "Freak" werden mit dem OZE-Eingabewort
"IWn c" verglichen. Die Analyse für jedes dieser Wörter ist in
9?3 006 509843/0585
den Tabellen VIII, IX und X gezeigt.
Die Illustration der Arbeitsweise beginnt, nachdem das Gerät der Fig. 3 das Wörterbuchwort "Break" mit dem OZE-Eingabewort IWnI1C
verglichen hat. Bis zu diesem Punkt sei einmal angenommen, daß das Wörterbuchwort mit dem höchsten gesamten Produkt für die bedingte
Wahrscheinlichkeit durch die OZE als OZE-Eingabewort IWn 4c falsch gelesen worden zu sein das Wort "Break" ist und daß daher
das Wort "Break" im Register 44 für das beste Wort und seine gesamte bedingte Wahrscheinlichkeit von 4, 4 mal ίο"1 nach Darstellung
in Tabelle VIII im Register (B)66 für das höchste Produkt gespeichert
werden. Das OZE-Eingabewort wird durch die Verschiebesteuerung 20 so verschoben, daß der erste zu prüfende Buchstabe,
nämlich der Buchstabe c in die Zelle K. gesetzt wird. Gleichzeitig lädt der Wörterbuchspeicher 28 das Wort "Wreck" in das Wörterbuchwort-Schieberegister
26 so, daß der Buchstabe "k" in der Zelle L. steht. Gleichzeitig wird das zu dem Buchstaben k des Wörterbuchwortes,
der in der Zelle L gespeichert ist, gehörende Kennzeichen durch den Wörterbuchspeicher 28 in die Zelle 35 des Kennzeichenbit-Schieberegisters
24 geladen. Tabelle IX zeigt die relative Position des OZE-Wortes, des Wörterbuchwortes und der Kennzeichenbits
in dieser Stufe 1. Tabelle IX zeigt die Kennzeichenbits zur Zusammenziehung als Fragezeichen, zur Häufung als Nummernzeichen
und zur Spaltung als Ausrufungszeichen. Aus Tabelle IX
ist zu entnehmen, daB das Buchstabenpaar "ck" des Wortes "Wreck" zu einem Zusammenziehungsfehler neigt, was durch die Tabelle II
bestätigt wird. Die Tabelle IX zeigt weiter, daß das Kennzeichenbit für Häufung zu dem Zeichenpaar "re" im Wort "Wreck"
gehört, was ebenfalls aus Fig. 2 zu entnehmen ist. Tabelle IX zeigt, daß der Buchstabe "WJ1 im Wort "Wreck" zur Spaltung neigt,
wie auch aus der Tabelle I zu entnehmen ist.
In der ersten in Tabelle IX gezeigten Stufe gehört zum Kennzeichenbit
für den ersten Buchstaben "k" des Wörterbuchwortes "Wreck" das Fehlerneigungskennzeichen "?", welches eine Zusammenziehungs-
neigung bezeichnet. Das Kennzeichen für die Zusammensi^hungsnei-
573 006 509843/0565
gung steht in der Zelle 35 des Kennzeichenbit-Schieberegisters 34
j und wird über die Leitung 98 durch den Kennzeichenbit-Decodierer ι 100 abgefühlt, der ein Ausgangssignal auf der Leitung 102c erzeugt,
das eine Zusammenziehungsneigung anzeigt. Das Signal auf ■ der Leitung 102c veranlaßt den in Fig. 7 gezeigten Multiplextaktgeber
dazu, einen Grenzwert gleich vier für den Zähler 294 festzusetzen und stellt den Zähler 294 rück und startet ihn.
Das Signal auf der Leitung 102c schaltet auch das Flip-Flop 296 um und schaltet dadurch das Schaltglied 298 ein, so daß die vom
Taktoszillator 290 kommenden Impulse auf die Leitung 110 zur Multiplextaktierung ausgegeben werden können. Da der Grenzwert
von 4 für den Zähler 294 festgesetzt wurde, werden vier aufeinanderfolgende Taktimpulse vom Multiplextaktgeber 8 abgegeben,
bevor der Zähler 294 einen Rückstellimpuls an das Flip-Flop 296 ausgibt und dadurch das UND-Glied 298 abschaltet und die Abgabe
von Taktimpulsen an die Leitung 110 beendet. Ausgewählte bedingte Wahrscheinlichkeiten werden von der Matrix 124 wie folgt adressiert.
Das Signal auf der Leitung 102c in Verbindung mit dem ersten Taktimpuls vom Multiplextaktgeber 108 veranlaßt den Multiplexer
94 der Fig. 5 zur Verbindung der Leitung 82 von der Zelle K mit der Leitung 114 und auf diese Weise wird der Buchstabe
"c" aus der Zelle K1 in das Adreßregister 116 übertragen. Der
erste Taktimpuls vom Multiplextaktgeber 108 veranlaßt den Multiplexer 96 der Fig. 6 zur Verbindung der Zelle L1 über die Leitung
88 mit der Leitung 120, wodurch der Inhalt der Zelle L-, nämlich der Buchstabe "k" an das Adreßregister 122 übertragen
wird. Die bedingte Wahrscheinlichkeit P(c/k), die gleich ist 6,7 mal 10 gemäß Darstellung in Tabelle IX wird somit von der
Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer 128 ausgegeben. Der
Multiplexer 128 der Fig. 8 läßt aufgrund dieses ersten Taktimpulses auf der Leitung 110 die erste bedingte Wahrscheinlichkeit
über die Leitung 126, das UND-Glied 304 und das UND-Glied 306 in das Register 130 laden. Aufgrund des zweiten Taktimpulses vom
Multiplextaktgeber 108 verbindet der Multiplexer 94 die Zelle K2
über die Leitung 84 mit der Leitung 114 und lädt dadurch das Zu-
WA 973 006 509843/0565
*c-
rückweisungssymbol "+" vom OZE-Eingabewort "IDWn*tc" in das Adreßregister
116. Gleichzeitig wird durch den zweiten Taktimpuls vom Multiplexer 108 der Inhalt der Zelle L3 über die Leitung 90 mit
der Leitung 120 verbunden und dadurch der Buchstabe "c" vom Wörterbuchwort "Wreck" in das Adreßregister 122 übertragen. Dann
wird die bedingte Wahrscheinlichkeit P(#/c), die gleich ist
— 2 i
2,4 mal 10 nach Darstellung in Tabelle IX von der Speichermatrix!
für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung
126 an den Multiplexer 128 ausgegeben. Aufgrund des zweiten Taktimpulses über die Leitung 110 läßt der Multiplexer 128 die
zweite bedingte Wahrscheinlichkeit über die Leitung 126 und das UND-Glied 312 in das Register 132 übertragen. Aufgrund des dritten
Taktimpulses auf der Leitung 110 und des Zusammenziehungssignales auf der Leitung 102c verbindet der Multiplexer 94 den Inhalt
der Zelle Κχ über die Leitung 82, das UND-Glied 248 und das
UND-Glied 238 mit den Leitungen 114 und lädt dadurch den Buchstabeti
"c" aus dem OZE-Wort in das Adreßregister 116. Gleichzeitig veranlaßt der dritte Taktimpuls vom Multiplextaktgeber 108 in Verbindung
mit dem Signal zur Zusammenziehung auf der Leitung 102c das Laden des Inhaltes der Zelle L. über die Leitung 88, das UND-Glied
276 und das UND-Glied 270 auf die Leitung 118, wodurch der Inhalt der Zelle L1, nämlich der Buchstabe "k" in das Adreßregister 122
übertragen wird. Gleichzeitig wird der Inhalt der Zelle L2, nämlich
der Buchstabe "c" aus dem Wörterbuchwort über die Leitung 90, das UND-Glied 278, das UND-Glied 268 und die Leitung 120 in das
Adreßregister 122 übertragen. Die bedingte Wahrscheinlichkeit P (c/ck), die gleich 1,9 mal 10 gemäß Darstellung in Tabelle IX
ist, wird somit von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und auf der Leitung 126 zum Multiplexer
128 ausgegeben. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 überträgt der Multiplexer 128 diese dritte Wahrscheinlichkeit
über die Leitung 126 und das UND-Glied 314 zum Register 134. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber
108 und des Zusammenziehungssignales auf der Leitung 102c überträgt der Multiplexer 94 den Inhalt der Zelle K3 über die Leitung
84, das UND-Glied 256 und das UND-Glied 242 auf die Leitung 1
WA 973 006 509843/056 5
-tr-
114, wodurch das * aus dem OZE-Wort "IWn*c", das im OZE-Schieberegister
14 gespeichert ist, in das Adreßregister 116 übertragen ! wird. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber 108
j und des Zusammenziehungssignales auf der Leitung 102c überträgt der Multiplexer 96 gleichzeitig den Inhalt der Zelle L3 über die
j Leitung 92 über das UND-Glied 286 und das UND-Glied 272 auf die j Leitung 120 und dadurch den Buchstaben "e" aus dem Wörterbuchwort
j "Wreck" in das Adreßregister 122. Die bedingte Wahrscheinlichkeit P(+/e), die gleich ist 2,8 mal 10 nach Darstellung in Tabelle
IX, wird somit von der Speichermatrix für bedingte Wahrscheinlichkeit
124 adressiert und über die Leitung 126 an den Multiplexer ! 128 übertragen. Aufgrund des vierten Taktimpulses vom Multiplextaktgeber
108 überträgt der Multiplexer 128 die vierte Wahrscheinlichkeit auf der Leitung 226 über das UND-Glied 316 und das UND-
-Glied 320 zum Register 36. Aus den bedingten Wahrscheinlichkeiten
und dem Vergleich ihrer entsprechenden Größen werden jetzt die Wahrscheinlichkeitsprodukte errechnet. Der Multiplizierer 138
multipliziert den Inhalt des Registers 130 mit dem Inhalt des
-4 Registers 132 und erhält als erste Wahrscheinlichkeit 1,6 mal 10
Gleichzeitig multipliziert der Multiplizierer 140 den Inhalt des Registers 134 mit dem des Register 136 und erhält ein zweites
-4
Wahrscheinlichkeitsprodukt 5,3 mal 10 . Die durch die Multiplizierer
138 und 140 erzeugten Produkte werden durch den Vergleicher 146 verglichen, der feststellt, daß das Wahrscheinlichkeitsprodukt
vom Multiplizierer 140 größer ist als das Produkt vom Multiplizierer 138. Das bedeutet, daß ein Zeichenzusammenziehungsfehler
wahrscheinlicher ist als ein einfacher Substitutuionsfehler für die die Zellen K1 und K0 und die Zellen L1, L0
und L- belegenden Zeichen.
Die in dem größeren Wahrscheinlichkeitsprodukt enthaltene bedingte
"Wahrscheinlichkeit wird jetzt im Wörterbuchwort multipliziert. Der Vergleicher erregt daher die Leitung 160 und schaltet das
Schaltglied 150 durch, so daß der Inhalt P(c/ck) des Registers 134
973 006 509843/0565
über die Leitungen 151, 153 und 156 in den Multiplizierer 58 eingegeben
wird. Diese bedingte Wahrscheinlichkeit P(c/ck) wird mit dem Inhalt des Produktregisters (A)56 multipliziert, der Eins ist,
-4
und das laufende Produkt 5,3 mal 10 wird im Produktregister 56 gespeichert. Der Vergleicher 62 vergleicht die Größe des Inhaltes des Produktregisters A mit dem Inhalt des Registers (B)66 für das höchste Produkt und stellt fest, daß A größer ist als B. Somit wird kein Signal auf die Leitung 78 gegeben. Die Leitung 70 ist vorbereitet, das Schaltglied 72 wird jedoch nicht durch die Verschiebesteuerung 20 über die Wortende-Leitung 74 durchgeschaltet und daher ist zu diesem Zeitpunkt das Schaltglied 64 gesperrt.
und das laufende Produkt 5,3 mal 10 wird im Produktregister 56 gespeichert. Der Vergleicher 62 vergleicht die Größe des Inhaltes des Produktregisters A mit dem Inhalt des Registers (B)66 für das höchste Produkt und stellt fest, daß A größer ist als B. Somit wird kein Signal auf die Leitung 78 gegeben. Die Leitung 70 ist vorbereitet, das Schaltglied 72 wird jedoch nicht durch die Verschiebesteuerung 20 über die Wortende-Leitung 74 durchgeschaltet und daher ist zu diesem Zeitpunkt das Schaltglied 64 gesperrt.
Ein Schiebebefehl wird abgegeben, um den Inhalt des OZE-Wort-Schieberegisters
14, des Wörterbuchwort-Schieberegisters 26 und des Kennzeichenbit-Schieberegisters 34 unterschiedlich zu verschieben.
Der Vergleicher 146 erregt die Leitung 160 und veranlaßt die Verschiebebefehls-Einheit 162 der Fig. 9 zum Durchschallten
des in Fig. 9 gezeigten UND-Gliedes 338 in Verbindung mit dem zusammenziehungssignal auf der Leitung 102c, um ein Signal auf der
leitung 8Od zu erzeugen, welches der zur Verschiebesteuerung 20
übertragene Schiebebefehl ist. Die Verschiebesteuerung 20 wird angewiesen,
den Inhalt des OZE-Wortschieberegisters 14 um eine Position und des Wörterbuchwortschieberegisters 26 und des Kennzeichenbit-tSchieberegisters
34 um zwei Positionen zu verschieben. Das Ergebnis dieser unterschiedlichen Verschiebung ist in der Stufe 2
der Tabelle IX gezeigt. Da vier Taktimpulse vom Multiplextaktgeber 108 abgegeben wurden, werden der Modulo-vier-Zähler 230 im Multiiplexer
94, der Modulo-vier-Zähler 260 im Multiplexer 96 und der
Modulo-vier-Zähler 302 im Multiplexer 128 automatisch auf Null rückgestellt
und sind für die Analyse des nächsten Zeichensatzs bereit.
In der zweiten Stufe der Analyse zum Vergleich des Wörterbuchwortes
"Wreck" mit dem OZE-Wort "IWn^c" sind die Zeichen so aus-
973 006 509843/0565
.Sf-
gerichtet, daß der Buchstabe "e" des Wörterbuchwortes in der Zelle
L. dem "+'·' des OZE-Wortes .in der Zelle K. entspricht und das
Zeichen "r" des Wörterbuchwortes in der Zelle L2 dem Zeichen "n"
des OZE-Wortes in der Zelle K2. Das Zeichpaar "re" des Wörterbuchwortes
führt ein Häufungskennzeichen in der Zelle 35 des Kennzeichenbit-Schieberegisters mit sich. Dieses Kennzeichen zur
Häufungsneigung wird über die Leitung 98 in den kennzeichendecodierer
100 übertragen, der ein Haufungssignal über die Leitung
102d abgibt. Aufgrund des Häufungssignales auf der Leitung 102d setzt der Mulitplextaktgeber 108 in Fig. 7 einen Grenzwert von
vier in den Zähler 294 und stellt den Zähler 294 rück und startet ihn, und er schaltet das Flip-Flop 296 um und schaltet dadurch
das UND-Glied 298 ein zur übertragung von Vier-Taktimpulssn vom
Taktoszillator 290 über die Leitung 110.
Ausgewählte bedingte Wahrscheinlichkeiten werden wie folgt adressiert.
Der erste und zweite Taktimpuls vom Mulitplextaktgeber lösen die selbe Folge von Vorgängen aus im Multiplexer 94, Multiplexer
96 und im Multiplexer 128, die für die Zusammeriziehungsoperation beschrieben wurde. Die bedingte Wahrscheinlichkeit
P(+/e), die gleich ist ,2,8 mal 10 gemäß Darstellung in Tabelle II wird somit im Register 130 gespeichert und die bedingte Wahrscheinlichkeit
P (n/r) , die gleich ist 5,9 mal 10 nach Darstellung in Tabelle IX wird im Register 132 gespeichert. Aufgrund
des dritten Taktimpulses vom Multiplextaktgeber 108 und des Häufungssignales auf der Leitung 102d überträgt der Multiplexer 94
der Fig. 5 den Inhalt der Zelle Κχ über die Leitung 82, das UND-Glied
250 und das UND-Glied 240 auf die Leitung 212 zum Laden des
Adreßregisters 116. Gleichzeitig überträgt der Multiplexer 94 den
Inhalt der Zelle K2 über die Leitung 84, das UND-Glied 252 und das
UND-Glied 238 auf die Leitung 114 und lädt dadurch den Buchstaben "n" in das Adreßregister 116. Das Zeichenpaar "n+" steht jetzt im
Adreßregister 116. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 und in Verbindung mit dem Häufungssignal auf der Leitung
102d überträgt der Multiplexer 96 der Fig. 6 den Inhalt der Zelle L1 über die Leitung 88, die UND-Glieder 280 und 270 auf die
WA 973 °06 509843/0565
Leitung 118 und den Inhalt der Zelle L2 über die Leitung 90, die
UND-Glieder 282 und 268 auf die Leitung 120, wodurch die Zeichen r" und "e" von den Zellen L2 und L in das Adreßregister 122
übertragen werden. Die bedingte Wahrscheinlichkeit P(n*/re), die
-4
gleich ist 5,6 mal IO nach Darstellung in Tabelle IX, wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer 128 ausgegeben. Aufgrund des dritten Taktimpulses auf der Leitung 110 überträgt der Multiplexer 128 der Fig. 8 die dritte Wahrscheinlichkeit auf der Leitung 126 über das UND-Glied 314 in das Register 134. Aufgrund des vierten Taktimpulses im Multiplextaktgeber 108 überträgt der Multiplexer 94 nichts vom OZE-Wort-Schieberegister, der Multiplexer 96 überträgt nichts vom Wörterbuchwort-Schieberegister 26. Der Multiplexer 128 der Fig. 8 lädt aufgrund des Häufungssignales auf der Leitung 102d den im Register 324 gespeicherten Wert Eins über das UND-Glied 322 und das UND-Glied 320 in das Register 136.
gleich ist 5,6 mal IO nach Darstellung in Tabelle IX, wird von der Speichermatrix für bedingte Wahrscheinlichkeit 124 adressiert und über die Leitung 126 an den Multiplexer 128 ausgegeben. Aufgrund des dritten Taktimpulses auf der Leitung 110 überträgt der Multiplexer 128 der Fig. 8 die dritte Wahrscheinlichkeit auf der Leitung 126 über das UND-Glied 314 in das Register 134. Aufgrund des vierten Taktimpulses im Multiplextaktgeber 108 überträgt der Multiplexer 94 nichts vom OZE-Wort-Schieberegister, der Multiplexer 96 überträgt nichts vom Wörterbuchwort-Schieberegister 26. Der Multiplexer 128 der Fig. 8 lädt aufgrund des Häufungssignales auf der Leitung 102d den im Register 324 gespeicherten Wert Eins über das UND-Glied 322 und das UND-Glied 320 in das Register 136.
Wahrscheinlichkeitsprodukte werden jetzt errechnet und verglichen.
Der Multiplizierer 128 multipliziert jetzt den Inhalt des Registers 130 mit dem Inhalt des Registers 132 und erzeugt das Produkt
1,6 mal 10 . Der Multiplizierer 140 mulitipliziert den Inhalt des Register 134 mit dem Inhalt des Register 136 und er-
-4
zeugt das Produkt 5,6 mal 10 . Der Vergleicher 146 vergleicht die relativen Größen dieser Produkte und stellt fest, daß der Inhalt des Multiplizierers 146 größer ist als der Inhalt des Multiplizierers 138. Das bedeutet, daß die Wahrscheinlichkeit, daß ein Zeichenhäufungsfehler aufgetreten ist, größer ist als die Wahrscheinlichkeit einer einfachen Substitution für die in den Zellen K1 und K2 bzw. L1 und L2 gespeicherten Zeichen.
zeugt das Produkt 5,6 mal 10 . Der Vergleicher 146 vergleicht die relativen Größen dieser Produkte und stellt fest, daß der Inhalt des Multiplizierers 146 größer ist als der Inhalt des Multiplizierers 138. Das bedeutet, daß die Wahrscheinlichkeit, daß ein Zeichenhäufungsfehler aufgetreten ist, größer ist als die Wahrscheinlichkeit einer einfachen Substitution für die in den Zellen K1 und K2 bzw. L1 und L2 gespeicherten Zeichen.
Die im größeren Produkt enthaltene bedingte Wahrscheinlichkeit wird weitergeleitet. Der Vergleicher 146 erregt die Leitung 160
und schaltet dadurch das Schaltglied 150 durch so daß der Inhalt P (n*/re) des Registers 134 über die Leitungen 151 und 153 zur
WA 973 006 509843/0565
Leitung 156 und somit zum Multiplizierer 58 übertragen wird. Der Multiplizierer 58 multipliziert die bedingte Wahrscheinlichkeit
P(n»/re) mit dem Inhalt des Produktregisters (2&56 und speichert
den Inhalt im Produktregister (A)56. Das neue laufende Produkt hat die Größe 3,0 mal 10 , die der Vergleicher 62 immer
noch als größer ermittelt, als der Inhalt des Registers 66 für das höchste Produkt, der 4,4 mal 10 ist, und daher wird die Leitung
I78 nicht erregt. Obwohl die Leitung 70 erregt ist, bleibt das
!Schaitglied 72 gesperrt, da die Verschiebesteuerung noch nicht zum
!Ende des Wörterbuchwortes oder des OZE-Wortes gekommen ist, was durch ein Signal auf der Ausgäbeleitung 74 angezeigt würde. Sojmit
werden die Schaltglieder 64 und 42 noch nicht durchgeschaltet.
Jetzt wird ein Verschiebebefehl gegeben. Der Vergleicher 146 erregt die Leitung 160 in Verbindung mit dem Häufungssignal auf
jder Leitung 102d, wodurch die Verschiebebefehls-Einheit 162 der jFig. 9 ein Signal auf die Leitung 80b gibt. Das Signal auf
der Leitung 80b ist der Verschiebebefehl für die Verschiebeteuerung
20, die daraufhin den Inhalt des OZE-Wort-Schieberegisters um zwei Zellen und des Wörterbuchwort-Schieberegisters
sowie des Kennzeichenbit-Schieberegisters um zwei Zellen verschieb
In der dritten Stufe der Analyse stimmt also nach Darstellung in Tabelle IX der Buchstabe "W" des Wörterbuchwortes mit dem
Buchstaben "W" des OZE-Wortes überein.
etzt beginnt die dritte Stufe der vergleichenden Analyse des Wörberbuchwortes
"Wreck" und des OZE-Wortes "IWn*c". Ein zu dem in ler Zelle L gespeicherten Buchstaben "W" gehörendes Fehlerneigungskennzeichen zeigt eine Spaltungsneigung an. Dieses Kennzeichen
wird von der Zelle 35 des KennzeichenbitiSchieberegisters 34 über die Leitung 98 zum Kennzeichendecodierer 100 übertragen,
der ein Ausgangssignal auf die Leitung 102b gibt. Ein Signal auf äer Leitung 102b zeigt eine Spaltungsneigung an und setzt den
renzwert 4 in den Zähler 294 des Multiplextaktgebers 108 in Fig.
7, stellt den Zähler 294 rück und startet ihn und schaltet das
wx 9-73 006-" - -509843/0565
Flip-Flop 296 um, wodurch das UND-Glied 298 eingeschaltet wird, zurj
übertragung von vier Taktimpulsen vom Taktoszillator 290 auf die \
Leitung 210.
Ausgewählte bedingte Wahrscheinlichkeiten werden wie folgt adres- '
siert. Der erste und zweite Taktimpuls vom Multiplextaktgeber j 108 veranlassen die konsekutive übertragung des Inhaltes der !
Zellen K1 und L1 sowie K9 und L9, wie man ihn aus der oben be- · !
schriebenen Zusammenziehungsanalyse erhielt. Die bedingte Wahrscheinlichkeit P(W/W), die gleich ist 0,90 nach Darstellung in j
Tabelle IX, wird somit in das Register 130 geladen und die bedingte Wahrscheinlichkeit P(I/ ), die gleich ist 0,15 mal 10~3,
wird in das Register 132 geladen. Aufgrund des dritten Taktimpulses vom Multiplextaktgeber 108 und des Spaltungssigriales auf der
Leitung 102b überträgt der Multiplexer 194 der Fig. 5 den Inhalt der Zelle K. über die Leitung 82, die UND-Glieder 244 und 240 auf
die Leitung 112 und den Inhalt der Zelle K2 über die Leitung 84
die UND-Glieder 246 und 238 auf die Leitung 114. Die Zeichen "IW" werden somit in das Adreßregister 116 geladen. Aufgrund des dritten
Taktimpulses vom Multiplextaktgeber 108 und des Spaltungssignales auf der Leitung 102b wird gleichzeitig der Inhalt der Zelle
L durch den Multiplexer 96 der Fig. 6 über die Leitung 88 und die UND-Glieder 274 und 268 zur Leitung 120 übertragen und
dadurch das Zeichen "W" in das Adreßregister 122 geladen. Aufgrund des dritten Taktimpulses über die Leitung 110 überträgt der Multiplexer
128 der Fig. 8 diese dritte Wahrscheinlichkeit von der Leitung 126 über das UND-Glied 314 an das Register 134. Aufgrund des
vierten Taktimpulses und des Spaltungsfehlersignales auf der Leitung
102b überträgt der Multiplexer 94 den Inhalt der Zelle K3
(die leer ist) über die Leitung 96, das UND-Glied 254 und das UND-Glied 244 an die Leitung 114. Aufgrund des vierten Taktimpulses
und des Spaltungsfehlersignales auf der Leitung 102b überträgt der Multiplexer 96 den Inhalt der Zelle L3 ( die leer ist ) durch
die UND-Glieder 284 und 272 auf die Leitung 120. Diese Leerstellen werden in das Adreßregister 116 und das Adreßregister 122 geladen.
Dann wird die bedingte Wahrscheilickeit P(-/-), die gleich
973 006 509843/0565
iO,99 ist gemäß Darstellung in Tabelle IX, von der Speichermatrix
I für bedingte· Wahrscheinlichkeit 124 adressiert und über die Leijtung
126 an den Multiplexer 128 ausgegeben. Aufgrund des vierten jTaktsignales 110 überträgt der Multiplexer 128 diese vierte Wahrscheinlichkeit
auf der Leitung 126 über die UND-Glieder 316 und 320 zum Register 136.
;Die Wahrscheinlichkeitsprodukte werden jetzt berechnet und ver-1
glichen. Der Multiplizierer 138 multipliziert den Inhalt des Registers 130 mit dem Inhalt des Registers 132 und erhält ein Produkt
1,3 mal 10"3. Der Multiplizierer 140 mulitipliziert den
Inhalt des Registers 134 mit dem Inhalt des Registers 136 und erhält das Produkt 3,5 mal 10~3. Der Vergleicher 146 stellt fest,
Idaß der Inhalt des Multiplizierers 140 größer ist, was bedeutet, !daß die Wahrscheinlichkeit einer Spaltung des Zeichens "W" in
idie Zeichen "I" und "W" größer ist als die Wahrscheinlichkeit der einfachen Substitution des Buchstabens "W" durch den Buchstaben
"W" und des Leerzeichens durch das "I".
Die im größeren Produkt enthaltene Wahrscheinlichkeit wird weitergeleitet.
Der Vergleicher 146 erregt somit die Leitung 160 und schaltet dadurch das Schaltglied 150 durch zur übertragung
des Inhaltes P(IW/W) des Registers 134 über die Leitungen 151 und 153 zur Leitung 156 und somit zum Multiplizierer 158. Der Multipli
zierer 58 multipliziert den Inhalt des Produktregisters (A)56 mit der bedingten Wahrscheinlichkeit P(IW/W), übertragen vom
Register 134, und erhält ein neues laufendes Produkt der Größe
1,1 mal 10 . Der Vergleicher 62 stellt fest, daß der Inhalt des Produktregisters (A)56 größer ist als der Inhalt des höchsten
Produktregisters (B) 66 für das höchste Produkt, der 4,4 mal 10*"13
beträgt, und somit wird kein Signal auf die Leitung 78 gegeben. Die Leitung 70 ist erregt.
Jetzt wird ein Verschiebebefehl gegeben. Der Vergleicher 146
hat die Leitung 160 zusammen mit dem Spaltungsfehlersignal auf der Leitung 102b erregt und das UND-Glied 336 der Verschiebebe-
WA 973 °06 -50984370565
fehls-Einheit 162 eingeschaltet, wodurch ein Signal auf die Leitung
80c ausgegeben wird. Dieses befiehlt der Verschiebesteuerung 20 die unterschiedliche Verschiebung des OZE-Wort-Schieberegisters
um zwei Positionen und des Wörterbuchwort-Schieberegisters sowie des Kennzeichenbit-Schieberegisters 34 um eine Position.
Ein neues "bestes Wort" wird erkannt. Das herunterzählen des
Zählers 220 der Verschiebesteuerung 20 in Fig. 4 zeigt an, daß der letzte Buchstabe des Wörterbuchwortes erreicht ist und daher
wird ein Signal auf die Leitung 74 ausgegeben, welches anzeigt, daß das Wortende erreicht wurde. Dieses Signal schaltet das
Schaltglied 72 durch, und dadurch das Schaltglied 62 zur Übertragung des Inhaltes des Produktregisters (A)56 in das Register (B)66
für das höchste Produkt. Gleichzeitig schaltet das Schaltglied durch, wodurch der Inhalt des Wortregisters, nämlich das Wort
"Wreck", Register 44 für das beste Wort übertragen wird.
Das System hat jetzt das neue beste Wort "Wreck" ermittelt, welches
im Register 44 gespeichert ist und ein entsprechendes tota-
—9 les bedingtes Wahrscheinlichkeitsprodukt von 1,1 mal 10 hat,
das im Register 66 gespeichert 1st. Da die VerschiebeSteuerung
festgestellt hat, daß das Wortende erreicht wurde, wird das OZE-Wort "IWn+c" jetzt in die Anfangsposition rückverschoben, so daß
das "c" jetzt die Zelle Κχ belegt. Gleichzeitig lädt der Wörterbuchspeicher
das nächste Wort "Freak" in das Wörterbuchwort-Schieberegister 26 und die entsprechenden Kennzeichenbits in das
Kennzeichenbitschieberegister nach Darstellung der Stufe 1 in Tabelle X.
Der Vergleich des Wortes "Freak" mit dem OZE-Wort "IWn+c" wird kurz beschrieben, um die Arbeitsweise des in Fig. 3 dargestellten
Gerätes für die einfach Substitution zu zeigen. Das Kennzeichenbit für die einfache Substitution, in diesem Falle überhaupt kein
Kennzeichenbit, wird in der Zelle 35 des Kennzeichenbitschieberegisters 34 gespeichert. Diese Anzeige des einfachen Substitutionsfehlers
veranlaßt den Kennzeichendecodierer 100 zur Abgabe
WA 973 006 509843/0565
eines einfachen Substitutionssignales auf die Leitung 102a. Das einfache Substitutionssignal auf der Leitung «lG2a setzt einen
Grenzwert von 1 in den Zähler 294 des Multiplexers 108 und somit wird nur ein Taktimpuls auf die Leitung 110 gegeben. Aufgrund
dieses ersten Taktimpulses verbindet der Multiplexer 94 die Zelle K mit der Leitung 114 und lädt den Buchstaben "c" in das Adreßregister
116. Der Zähler 230 wird dann rückgestellt. Ähnlich verbindet der Multiplexer 96 den Inhalt der Zelle L mit der
Leitung 120 und lädt dadurch ein "k" in das Adreßregister 122 und dann wird der Zähler 260 rückgestellt. Aufgrund des ersten
Taktimpulses auf der Leitung 110 und des Substitutionssignales auf der Leitung 102a überträgt der Multiplexer 128 die bedingte
Wahrscheinlichkeit P(c/k) gleich 6,7 mal 10 gemäß Darstellung in Tabelle X. von der Leitung 126 über die UND-Glieder 304
und 308 zur Leitung 164, die mit der Leitung 156 verbunden ist, wodurch direkt die Wahrscheinlichkeit unter Umgehung der
Register 130 bis 136 in den Multiplizierer 58 eingeht. Die Berechnung
des laufenden Produktes beginnt wie oben beschrieben. Bei Empfang des Substxtutionssignales auf der Leitung 102a gibt
die Verschiebebefehls-Einheit 162 ein Signal auf die Leitung 80a, wodurch die Verschiebesteuerung 20 den Inhalt des OZE-Wort-Schieberegisters
14 und des Wörterbuchwort-Schieberegisters sowie des
Kennzeichenbit-Schieberegisters um eine Zelle verschiebt. Der Vergleich des Wörterbuchwortes "Freak" mit dem OZE-Wort"IWn^c"
läuft wieder nach Darstellung in Tabelle X und ergibt
—12 ein totales Wahrscheinlichkeitsprodukt von 1,5 mal 10 . Beim
Vergleich im Vergleicher 62 mit dem Inhalt des Registers 66 für das höchste Produkt der 1,1 mal io"9 ist, löst dieses totale Produkt ein Ausgabesignal auf der Leitung 78 aus, welches die weitere
Verarbeitung des Wörterbuchwortes "Freak" stoppt und das OZE-Wort-Schieberegister
14 rückstellt und das nächste Wort im Wörterbuchspeicher 28 in das Wörterbuchwortschieberegister 26
lädt.
Nachdem alle im Wörterbuchspeicher 28 gespeicherten Wörter mit dem OZE-Wort "IWn+c" verglichen worden sind, gibt der Wörterbuch-
509843/0565
speicher 28 ein das Ende der Wörterbuchliste anzeigendes Signal auf die Leitung 48, welches das Schaltglied 50 durchschaltet und
dadurch den Inhalt des Registers 44 für das beste Wort mit der Ausgabeleitung 10 verbindet. Da das Wörterbuchwort "Wreck" als
das beste Wort im Register 44 gespeichert wurde, gibt das System das Wort "Wreck" als beste Schätzung desjenigen Wortes aus, welches
tatsächlich von der OZE abgetastet wurde, als sie das Wort "IWn+c" ausgab.
Das in Fig. 3 gezeigte Gerät zur Fehlerkorrektur aufgrund der größten Wahrscheinlichkeit des regionalen Zusammenhangs kann auch ;
für die Nachverarbeitung von Lautzeichen von einem Sprachanalysator
benutzt werden. Sprachanalysatoren, wie sie in der US Patentschrift 36 46 576 beschrieben sind, analysieren zusammenhängende
menschliche Sprache zu Einheiten von Sprachzeichen, den Phonemen. Forscher berichten darüber, daß ein Problem bei der Erkennung
zusammenhängender Sprache die genaue Segmentierung des Sprachsignales in Phonemen ist. Mit dem vorliegenden Gerät zur Fehlerkorrektur
aufgrund der größten Wahrscheinlichkeit des regionalen Zusammenhangs können Segmentierungsfehler im ausgegebenen Phonem-Zeichenerkennungsstrom
von einem Sprachanalysator korrigiert werden. In dem in Fig. 3 gezeigten System ist die Eingangsleitung 2
die Phoneme-Zeichen-Ausgabeleitung von einem Sprachanalysator, αί
den Phonemzeichen-Erkennungsstrom führt. Der Wörterbuchspeicher
28 enthält ein Vokabular gültig gesprochener Wörter, von denen jedes aus seinen Phonemzeichen besteht. Die Segmentierungsfehler,
die bei koventionellen Sprachanalysatoren auftreten, sind ähnlich wie die Segmentierungsfehler in optischen Zeichenerkennungsgeräten,
nämlich Spaltung Zusammenziehung und Häufung. Die im Wörterbuchspeicher
28 gespeicherten gesprochenen Wörter haben ausgewählte Phonemzeichen, die für ihre vom Sprachanalysator falsch
erkannte Neigung zur Segmentierung, Zusammenziehung oder Häufung gekennzeichnet sind. Die Speichermatrix für bedingte Wahrscheinlichkeit
124 enthält die bedingten Wahrscheinlichkeiten für Phonemzeichen-Kombinationen, die eine Neigung zu Spaltungs-, Zusammenziehungsoder
Häufungssegmentierungsfehlern haben. Die Neigungen sind eine Charakteristik des Sprachanalysators. Bei der
WA 973 °°6 509843/0565
; Nachverarbeitung eines Phonemzeichen-Erkennungsstromes von einem
■: Sprachanalysator arbeitet ein erfindungsgemäßes Gerät ähnlich wie
; bei der optischen Zeichenerkennung. Die gesprochenen Wörter in dem vom Sprachanalysator ausgegebenen Erkennungsstrom sind die
Eingabe über die Leitung 2, die in das Schieberegister 14 geladen
j wird. Ein gesprochenes Wörterbuchwort wird in das Wörterbuchwort-Schieberegister
26 vom Wörterbuohspeicher 28 geladen. Die Phonemzeichen des Eingabewortes und des Wörterbuchwortes werden an einem
Ende ausgerichtet. Wenn für ein Phonemzeichen beispielsweise eine Teilungsneigung im Wörterbuchwort angezeigt wird, werden von der
Speiehermatrix für bedingte Wahrscheinlichkeit 125 bedingte Wahrscheinlichkeitswerte
adressiert. Die Berechnung der Wahrscheinlichkeit, daß das erste Phonemzeichen des Wörterbuchwortes durch
den Sprachanalysator in das erste und zweite Phonemzeichen des gesprochenen Wortes im ausgegebenen Erkennungsstrom aufgeteilt
wurde, wird dann berechnet. Diese Wahrscheinlichkeit bezüglich des regionalen Zusammenhangs wird dann mit der Wahrscheinlichkeit
eines einfachen Substitutionsfehlers für die Phonemzeichen verglichen.
Wenn die Segmentierungswahrscheinlichkeit größer ist, werder die Phonemzeichen im Schieberegister 14 um einen Schritt gegenübei
den Phonemzeichen im Wörterbuchwortschieberegister 26 verschoben, so daß nachfolgende zu vergleichende Phonemzeichenpaare richtig
übereinstimmen. Die errechnete größere Wahrscheinlichkeit wird in einem laufenden Produkt im Register 56 kombiniert. Der gesprochene
Ausdruck im Wörterbuchspeicher 28 mit dem größten laufenden Produkt wird durch das System über die Leitung 52 als
die höchstwahrscheinlich richtige Form des verstümmelten Eingabewortes vom Sprachanalysator ausgegeben.
WA 973 006
509843/0565
Tabelle VIII "Break"
1) Einfache Substitution
OZE I Wn + c WÖRTERBUCH Break
KENNZEICHEN „f P(c/k) = 6,7 χ 10
2) Einfache Substitution
OZE I W η + WÖRTERBUCH B r e a
P (+/a) = 1,1 x 10""2
Laufendes Produkt = 7,3 χ
~4
3) Häufung | I | X | W |
OZE | B | X | r |
WÖRTERBUCH | 1,0 | 10 | |
P (η / e) | 2,0 | 10 | |
P(W / r) | |||
P(Wn / re) 3 χ ίο"5 X = 2 χ ίο"7
4) Einfache Substitution
OZE £
WÖRTERBUCH B
P (I/B) = 2,0 χ 10 *
Produkt = 4,4 χ
Totales Produkt = Laufend
-13
WA 973 006 509 84 3/0565
- | Zusammenziehung | I | W | jtrr ψ (ρ |
*# | e | SS | ,00 | + | ίο"3 | C | ι | X = | X == | χ = 1, = 3,5 |
2460757 | |
WA | OZE | W r | Tabelle IX "Wreck" | 7 χ | c k | ΙΟ"2 | χ · = | Laufendes | |||||||||
D | WÖRTERBUCH^ - | Ii ι Ii | 4 χ | Ii "ρ ι | ίο"2 ίο;2 |
Laufendes | Produkt | ||||||||||
KENNZEICHEN | = | 6, | η |
9 χ
8 χ |
I W | = 1,1 χ | |||||||||||
P(c/k) | SS | 2, | η + | W | |||||||||||||
P-(+/C) | i~ S= |
If 2, |
r e | ιιη Ii | |||||||||||||
P(c/ck) P(+/e) |
W | = | 1O3"3 10 Λ X |
||||||||||||||
W | ΙΟ"2 | 1,6 χ 1θ"4 | |||||||||||||||
Häufung | ι ■ | ■ρ Il | ίο"3 | Totales | 5,3 χ 1θ"4 | ||||||||||||
OZE | 8 χ | ίο"4 | Produkt | Produkt = 5,3 χ 10~4 | |||||||||||||
2) | WÖRTERBUCH | Il | 9 χ | ||||||||||||||
= | 2, | 6 χ | |||||||||||||||
P(+/e) | 5, | ||||||||||||||||
P(n/r) | = | 5, | |||||||||||||||
P(n+/re) | |||||||||||||||||
Teilung | 1,6 χ 1θ"4 | ||||||||||||||||
OZE | ,90 ,15 χ 35 χ |
Produkt = 3,0 χ 1θ" | |||||||||||||||
3) | WÖRTERBUCH | 0 | |||||||||||||||
= SS |
|||||||||||||||||
P(W/W) p (rw/w) |
|||||||||||||||||
P( / ) | |||||||||||||||||
3 χ ΙΟ3 χ 10~3 |
|||||||||||||||||
- | |||||||||||||||||
973 006 | = Laufend | ||||||||||||||||
ίο"9 | |||||||||||||||||
5098A3/0565
- | - % | I | is: | η | τ | W | η | η | Einfache Substitution | S= | 7,0 | χ IO"4 | X "Freak" | Laufendes | 2460757 | 1,5 χ IO12 | |
Tabelle | F | r | e | F | r | e | e | OZE | |||||||||
D | Einfache Substitution | = | 6,7 χ 10~3 | = | 1,1 χ IO"2 | χ 10~3 | WÖRTERBUCH | + C | |||||||||
OZE | Einfache Substitution | χ 10~4 | P<I/F> | a k | |||||||||||||
WÖRTERBUCH | OZE | io"5 | |||||||||||||||
P(c/k) | WÖRTERBUCH | I | W | ||||||||||||||
2) | P(+/a) | F | r | + | X | ||||||||||||
SS | 1,0 | a | Laufendes | ||||||||||||||
Häufung | = | 2,0 | |||||||||||||||
OZE | 3 χ | I | |||||||||||||||
WÖRTERBUCH | F | Produkt = 7,3 χ 10~ | |||||||||||||||
3) | P(n/e) | ||||||||||||||||
P (W/r) | |||||||||||||||||
P(Wn/re) | |||||||||||||||||
2 χ IO"7 | |||||||||||||||||
Produkt = 2,2 χ 10~ | |||||||||||||||||
4) | |||||||||||||||||
Totales Produkt = Laufend | |||||||||||||||||
Produkt = |
WA 973 006
509843/0565
Claims (1)
- PATENTANSPRÜCHEJjQ Datenverarbeitungssystem zur Auswahl der richtigen Form ' eines fehlerhaften Eingabewortes, das bei der maschinel- • len Zeichenerkennung aufgrund einer Fehlerkennung verstümmelt wurde und dessen richtige Form Mitglied einervorgegebenen Klasse von aus mehreren Zeichen bestehenden ' Bezugswörtern ist, gekennzeichnet durch:! a) einen Speicher (28, Fig. 3) für die vorgegebene Klas- \ se von Bezugswörtern, bei denen für ausgewählte Zeichenj eine Anzeige für die Neigung des Zeichens gespeichert! ist, aufgrund eines sogenannten Spaltungsfehlers falschj gelesen zu werden,! welcher Speicher eine erste Art einer bedingten Wahr-! scheinlichkeit dafür .speichert, daß ein erstes Zeichen j aufgrund der maschinellen Zeichenerkennung ausgegegebenwerden kann durch Zeichensubstitution, vorausgesetzt, dal ein zweites Zeichen tatsächlich abgetastet wurde, welcher Speicher eine zweite Art bedingter Wahrscheinlichkeit dafür speichert, daß ein Paar benachbarter Zeichen durch die maschinelle Zeichenerkennung ausgegeben werden kann infolge von Zeichenspaltung, vorausgesetzt, daß ein drittes Zeichen tatsächlich abgetastet wurde,b) ein erstes mit einer Eingangsleitung verbundenes Schieberegister (I1O zur seriellen Speicherung der Zeichen eines fehlerhaften Wortes, von denen ein erstes Zeichen an einem vorgegebenen Ende des fehlerhaften Wortes eine erste Stelle für den Anfang eines fehlerhaften Wortes definiert,c) ein zweites, an den Speicher angeschlossenes Schieberegister (26) zur Speicherung der Zeichen einee ersten Bezugswortes aus der vorgegebenen Klasse im Speicher, welche Zeichen in einer der Reihenfolge der Zeichen im ersten Register entsprechenden Reihenfolge-angeordnetWA 973 006 50984 3/0565sind und ein erstes Zeichen des Bezugswortes dem ersten Zeichen in dem fehlerhaften Wert entspricht und eine erste Stelle für den Anfang eines Bezugswortes definiert, :d) eine Decodierschaltung (100) zur Decodierung der An- j zeige für die Fehlerneigung des Zeichens, das sich am Anfang des Bezugswortes befindet,e) eine Zugriffsvorrichtung für den Speicher, die, wenn J die decodierte Anzeige eine Neigung zur Zeicphenspaltung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das am Anfang des Bezugswortes befindliche Zeichen abgetastet wurde und daß die Zeichenerkennung das Zeichen am Anfang des Fehlerwortes substituierte ,welche Zugriffsvorrichtung dem Speicher, wenn die decodierte Anzeige eine Neigung zur Zeichenspaltung anzeigt, einen zweiten Wert der bedingten Wahrscheinlichkeit erster Art entnimmt unter der Voraussetzung, daß das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet wurde und daß die Zeichenerkennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,welche Zugriffsvorrichtung, wenn die decodierte Anzeige eine Neigung zur Zeichenspaltung anzeigt, einen Zugriff ausführt auf einen ersten Wert der bedingten Wahrscheinlichkeit zweiter Art, vorausgesetzt, daß das Zeichen am Anfang des Bezugswortes abgetastet wurde, daß die Zeichenerkennung es in das am Anfang des fehlerhafte^i Wortes befindliche Zeichen und das diesem benachbarte Zeichen spaltete,
welche Zugriffsvorrichtung bei Anzeige einer Neigung zur Zeichenspaltung einen Zugriff zu einem dritten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, voraus gesetzt, daß das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet jwurde und daß die Zeichen-0Ö6 50ssTsToiei "■"erkennung das dem ersten Zeichen des fehlerhaften Wortes zweitnächste Zeichen substituierte,f) eine mit dem Speicher verbundene Multipliziereinrichtung (138, 140, Fig. 3A) zur Multiplikation des ersten und zweiten Wertes der bedingten Wahrscheinlichkeiten erster Art zur Bildung eines ersten Produktes,, welche Multipliziereinrichtung den ersten Wert der bedingten Wahrscheinlichkeit zweiter Art und den dritten Wert der Wahrscheinlichkeit erster Art als zweites Produkt bildet,g) eine mit der Multipliziereinrichtung verbundene Vergleichsschaltung (146) zum Vergleich der relativen Größen des ersten und zweiten Produktes,h) eine mit dem Speicher verbundene Rechenvorrichtung zur Multiplikation eines laufenden Produktes mit dem ersten Wert der bedingten Wahrscheinlichkeit erster Art, wenn das erste Produkt größer als das zweite ist oder mit dem ersten Wert der Wahrscheinlichkeit zweiter Art, wenn das zweite Produkt größer als das erste ist,i) eine an die Vergleichsschaltung angeschlossene Schiebevorrichtung zur Verschiebung des ersten Zeichens sowohl des fehlerhaften als auch des Bezugswortes um eine Stelle, wenn das erste Produkt der Wahrscheinlichkeiten größer als das zweite ist, welche Schiebevorrichtung das erste Zeichen des fehlerhaften Wortes um zwei Stellen und das erste Zeichen des Bezugswortes um eine Stelle verschiebt, wenn das zweite Produkt der Wahrscheinlichkeiten größer ist als das erste, wodurch dasjenige gespeicherte Bezugswort, das die höchste bedingte Wahrscheinlichkeit dafür besitzt als das in dem ersten Register gespeicherte fehlerhafte Wort mißdeutet worden zu sein, bestimmt werden kann.WA 973 °06 5Ö9843/056BDatenverarbeitungssystem zur Auswahl der richtigen Form eines fehlerhaften Eingabewortes, das bei der maschinellen Zeichenerkennung aufgrund einer Fehlerkennung verstümmelt wurde und dessen richtige Form Mitglied einer vorgegebenen Klasse von aus mehreren Zeichen bestehenden Bezugswörtern -ist, gekennzeichnet durch:a) einen Speicher (28, Fig. 3) für die vorgegebene Klasse von Bezugswörtern, bei denen für ausgewählte Zeichen eine· Anzeige für die Neigung des Zeichens gespeichert ist, aufgrund eines sogenannten Zusammenziehungsfehler falsch gelesen zu werden,welcher Speicher eine erste Art bedingter Wahrscheinlichkeit dafür speichert, daß ein erstes Zeichen aufgrund der maschinellen Zeichenerkennung ausgegegeben werden kann durch Zeichensubstitution, vorausgesetzt, daß ein zweites Zeichen tatsächlich abgetastet wurde, welcher Speicher eine zweite Art bedingter Wahrscheinlichkeit dafür speichert, daß ein erstes Zeichen durch die maschinelle Zeichenerkennung ausgegeben werden kann infolge von Zeichenzusammenziehung, vorausgesetzt, daß ein Paar benachbarter Zeichen tatsächlich abgetastet wurde,b) ein erstes mit einer Eingangsleitung verbundenes Schieberegister (14) zur seriellen Speicherung der Zeichen eines fehlerhaften Wortes, von denen ein erstes Zeichen an einem vorgegebenen Ende des fehlerhaften Wortes eine erste Stelle für den Anfang eines fehlerhaften Wortes definiert,c) ein zweites, an den Speicher angeschlossenes Schieberegister (26) zur Speicherung der Zeichen eines ersten Bezugswortes aus der vorgegebenen Klasse im Speicher, welche Zeichen in einer der Reihenfolge der Zeichen im ersten Register entsprechenden Reihenfolge angeordnetWA 973 006 509843/0565sind und ein erstes Zeichen des Bezugswortes dem ersten Zeichen in dem fehlerhaften Wort entspricht und eine erste Stelle für den Anfang eines Bezugswortes definiert,d) eine Decodierschaltung (100) zur Decodierung der Anzeige für die Fehlerneigung des Zeichens, das sich am Anfang des Bezugswortes befindet,e) eine Zugriffsvorrichtung für den Speicher, die, wenn die decodierte Anzeige eine Neigung zur Zeichenzusammenziehung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das am Anfang des Bezugswortes befindliche Zeichen abgetastet wurde und daß die Zeichenerkennung das Zeichen am Anfang des Fehlerwortes substituierte ,welche Zugriffsvorrichtung dem Speicher, wenn die decodierte Anzeige eine Neigung zur Zeichenzusammenziehung anzeigt, einen zweiten Wert der bedingten Wahrscheinlichkeit erster Art entnimmt unter der Voraussetzung, daß das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet wurde und daß die Zeichenerkennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,welche Zugriffsvorrichtung, wenn die decodierte Anzeige eine Neigung zur Zeichenzusammenziehung anzeigt, einer Zugriff ausführt auf einen ersten Wert der bedingten Wahrscheinlichkeit zweiter Art, vorausgesetzt, daß das Zeichen am Anfang des Bezugswortes und das benachbarte Zeichen abgetastet wurden, daß die Zeichenerkennung sie zusammenzog zu dem am Anfang des fehlerhaften Wortes befindliche Zeichen,welche Zugriffsvorrichtung bei Anzeige einer Neigung zur Zusammenziehung einen Zugriff zu einem dritten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das zum ersten Zeichen übernächste Zeichen des Bezugswortes abgetastet wurde und daß die Zeichener-WA 973 0065098A3/0565M-kennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,f) eine mit dem Speicher verbundene Multipliziereinrichtung (138, 140, Fig. 3A) zur Multiplikation des ersten und zweiten Wertes der bedingten Wahrscheinlichkeiten erster Art zur Bildung eines ersten Produktes, welche Multipliziereinrichtung den ersten Wert der bedingten Wahrscheinlichkeit zweiter Art und den dritten Wert der Wahrscheinlichkeit erster Art als zweites Produkt bildet,g) eine mit der Multipliziereinrichtung verbundene Vergleichsschaltung (146) zum Vergleich der relativen Größen des er sten und zweiten Produktes,h) eine mit dem Speicher verbundene Rechenvorrichtung zur Multiplikation eines laufenden Produktes mit dem ersten Wert der bedingten Wahrscheinlichkeit erster Art, wenn das erste Produkt größer als das zweite ist oder mit dem ersten Wert der Wahrscheinlichkeit zweiter Art, wenn das zweite Produkt größer als das erste ist,i) eine an die Vergleichsschaltung angeschlossene Schiebevorrichtung zur Verschiebung des ersten Zeichens sowohl des fehlerhaften als auch des Bezugswortes um eine Stelle, wenn das erste Produkt der Wahrscheinlichkeiten größer als das zweite ist, welche Schiebevorrichtung das erste Zeichen des fehlerhaften Wortes um eine Stelle und das erste Zeichen des Bezugswortes um zwei Stellen verschiebt, wenn das zweite Produkt der Wahrscheinlichkeiten größer ist als das erste, wodurch dasjenige gespeicherte Bezugswort, das die größte gesamte bedingte Wahrscheinlichkeit dafür besitzt als das in dem ersten Register gespeicherte fehlerhafte Wort mißdeutet worden zu sein, bestimmt werden kann.509843/058Sar-te.Datenverarbe;itungssystem zur Auswahl „d&r richtigen Form . eines fehlerhaften Eingabewortes, das bei der maschinellen Zeichenerkennung aufgrund einer Pehlerkennung verstümmelt wurde und dessen richtige Form Mitglied einer vorgegebenen Klasse von aus mehreren Zeichen bestehenden Bezugswörtern ist, gekennzeichnet durch:a) einen Speicher (28, Fig. 3) für die vorgegebene Klasse von Bezugswörtern, bei denen für ausgewählte Zeichen eine Anzeige für die Neigung des Zeichens gespeichert ist, aufgrund eines sogenannten Häufungsfehlers falsch gelesen zu werden,welcher Speicher eine erste Art einer bedingten Wahrscheinlichkeit dafür speichert, daß ein erstes Zeichen aufgrund der maschinellen Zeichenerkennung ausgegegeben werden kann durch Zeichensubstitution, vorausgesetzt, daf ein zweites Zeichen tatsächlich abgetastet wurde, welcher Speicher eine zweite Art bedingter Wahrscheinlichkeit dafür speichert, daß ein erstes Paar benachbarter Zeichen durch die maschinelle Zeichenerkennung ausgegeben werden kann infolge von Zeichenhäufung, vorausgesetzt, daß zweites Zeichenpaar tatsächlich abgetastet wurde,b) ein erstes mit einer Eingangsleitung verbundenes Schieberegister (14) zur seriellen Speicherung der Zeichen eines fehlerhaften Wortes, von denen ein erstes Zeichen an einem vorgegebenen Ende des fehlerhaften Wortes eine erste Stelle für den Anfang eines fehlerhaften Wortes definiert,c) ein zweites, an den Speicher angeschlossenes Schiebere-' gister (26) zur Speicherung der Zeichen und der Anzeige der Fehlerneigung eines ersten Bezugswortes aus der vorgegebenen Klasse im Speicher, welche Zeichen in einer der Reihenfolge der Zeichen im ersten Register entsprechenden Reihenfolge angeordnet sind und ein006 50 9 8 A3/0 565sind und ein erstes Zeichen des Bezugswortes dem ersten Zeichen in dem fehlerhaften Wort entspricht und eine erste Stelle für den Anfang eines Bezugswortes definiert,d) eine Decodierschaltung (100) zur Decodierung der Anzeige für die Fehlerneigung des Zeichens, das sich am ' Anfang des Bezugswortes befindet,e) eine Zugriffsvorrichtung für den Speicher, die, wenn die decodierte Anzeige eine Neigung zur Zeichenpaarhäufung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit erster Art ausführt, vorausgesetzt, daß das am Anfang des Bezugswortes befindliehe Zeichen abgetastet wurde und daß die Zeichenerkennung das Zeichen am Anfang des Fehlerwortes substituierte,welche Zugriffsvorrichtung dem Speicher, wenn die de- ! codierte Anzeige eine Neigung zur Zeichenpaarhäufung an-, zeigt, einen zweiten Wert der bedingten Wahrscheinlich- j keit erster Art entnimmt unter der Voraussetzung, daß | das dem ersten Zeichen des Bezugswortes benachbarte Zeichen abgetastet wurde und daß die Zeichenerkennung das dem ersten Zeichen des fehlerhaften Wortes benachbarte Zeichen substituierte,welche Zugriff3vorrichtung, wenn die decodierte Anzeige eine Neigung zur Zeichenpaarhäufung anzeigt, einen Zugriff zu einem ersten Wert der bedingten Wahrscheinlichkeit zweiter Art dafür ausführt, daß das erste Zeichen und das diesem benachbarte Zeichen des Bezugswortes abgetastet wurde und daß die Zeichenerkennung einen Häufungsfehler machte und die beiden genannten Zeichen ausgab,f) eine mit dem Speicher verbundene Multipliziereinrichtung (138, l40, Fig. 3A) zur Multiplikation des ersten. und zweiten Wertes der bedingten WahrscheinlichkeitenWA973006 509843/0565erster Art zur Bildung eines ersten Produktes, welche Multipliziereinrichtung den ersten Wert der bedingten Wahrscheinlichkeit zweiter Art und den dritten Wert der Wahrscheinlichkeit erster Art als zweites Produkt bildet,g) eine mit der Multipliziereinrichtung verbundene Vergleichsschaltung (146) zum Vergleich der relativen Größen des ersten und zweiten Produktes,h) eine mit dem Speicher verbundene Rechenvorrichtung zur Multiplikation eines laufenden Produktes mit dem ersten Wert der bedingten Wahrscheinlichkeit erster Art, wenn das erste Produkt größer als das zweite ist oder mit dem ersten Wert der Wahrscheinlichkeit zweiter Art, wenn das zweite Produkt größer als das erste ist,i) eine an die Vergleichsschaltung angeschlossene Schiebevorrichtung zur Verschiebung des ersten Zeichens sowohl des fehlerhaften als auch des Bezugswortes um eine Stelle, wenn das erste Produkt der Wahrscheinlichkeiten größer als das zweite ist, welche Schiebevorrichtung das erste Zeichen des fehlerhaften Wortes und des des Bezugswortes um zwei Stellen verschiebt, wenn das zweite Produkt der bedingten Wahrscheinlichkeiten größer ist als das erste, wodurch dasjenige gespeicherte Bezugswort, das die höchste bedingte Wahrscheinlichkeit dafür besitzt als das in dem ersten Register gespeicherte fehlerhafte Wort mißdeutet worden zu sein, bestimmt werden kann.WA 973 006 5 0 9 8 A 3 / 0 5 6 54. Datenverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Anzeigen für die Fehlerneigung im Speicher in Verbindung mit dem ausgewählten Zeichen gespeichert sind, aus denen die Bezugswörter zusammengesetzt sind.5. Datenverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Anzeigen für die Fehlerneigung in dem Speicher in Verbindung mit ausgewählten Zeichen in Tabellenform, getrennt von den Bezugswörtern gespeichert sind und daß die Decodiervorrichtung eine Datenverbindung zum Speicher besitzt, um Zugriff zu haben zu einer Anzeige für die Fehlerneigung, die dem Zeichen am Anfang des In dem zweiten Register gespeicherten Bezugswortes entspricht.ViA .973 006509843/0565Leerseite
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US45982074A | 1974-04-10 | 1974-04-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2460757A1 true DE2460757A1 (de) | 1975-10-23 |
DE2460757C2 DE2460757C2 (de) | 1983-08-18 |
Family
ID=23826267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2460757A Expired DE2460757C2 (de) | 1974-04-10 | 1974-12-21 | Einrichtung zur Auswahl der richtigen Form eines bei der maschinellen Zeichenerkennung verstümmtelten Wortes |
Country Status (8)
Country | Link |
---|---|
JP (1) | JPS5521384B2 (de) |
BE (1) | BE824366A (de) |
CA (1) | CA1062810A (de) |
DE (1) | DE2460757C2 (de) |
FR (1) | FR2267590B1 (de) |
GB (1) | GB1454148A (de) |
IT (1) | IT1033223B (de) |
NL (1) | NL7503946A (de) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4201881A (en) * | 1979-03-28 | 1980-05-06 | Wisconsin Alumni Research Foundation | 24,24-Difluoro-1α,25-dihydroxycholecalciferol |
JPS6055866B2 (ja) * | 1983-05-09 | 1985-12-06 | 株式会社日立製作所 | 文字認識装置 |
JPS6274181A (ja) * | 1985-09-27 | 1987-04-04 | Sony Corp | 文字認識装置 |
JPS6297081A (ja) * | 1986-10-08 | 1987-05-06 | Hitachi Ltd | 文字認識装置 |
JPH01167469U (de) * | 1988-05-14 | 1989-11-24 | ||
JPH01176171U (de) * | 1988-06-03 | 1989-12-15 | ||
GB2289969A (en) * | 1994-05-24 | 1995-12-06 | Ibm | Character segmentation |
-
1974
- 1974-12-05 FR FR7441665A patent/FR2267590B1/fr not_active Expired
- 1974-12-16 GB GB5420074A patent/GB1454148A/en not_active Expired
- 1974-12-21 DE DE2460757A patent/DE2460757C2/de not_active Expired
- 1974-12-27 JP JP14913674A patent/JPS5521384B2/ja not_active Expired
-
1975
- 1975-01-14 BE BE152362A patent/BE824366A/xx not_active IP Right Cessation
- 1975-02-27 IT IT20692/75A patent/IT1033223B/it active
- 1975-03-10 CA CA221,755A patent/CA1062810A/en not_active Expired
- 1975-04-03 NL NL7503946A patent/NL7503946A/xx not_active Application Discontinuation
Non-Patent Citations (1)
Title |
---|
NICHTS-ERMITTELT * |
Also Published As
Publication number | Publication date |
---|---|
JPS50137037A (de) | 1975-10-30 |
NL7503946A (nl) | 1975-10-14 |
IT1033223B (it) | 1979-07-10 |
GB1454148A (en) | 1976-10-27 |
FR2267590A1 (de) | 1975-11-07 |
JPS5521384B2 (de) | 1980-06-09 |
CA1062810A (en) | 1979-09-18 |
BE824366A (fr) | 1975-05-02 |
DE2460757C2 (de) | 1983-08-18 |
FR2267590B1 (de) | 1977-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2541204C3 (de) | Einrichtung zur Fehlerkorrektur | |
DE19547812C2 (de) | Lesegerät für Schriftzeichenketten | |
DE10342594B4 (de) | Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten | |
EP0980293B1 (de) | Verfahren und anordnung zum erkennen von verteilinformationen | |
DE69129163T2 (de) | Verfahren und Vorrichtung zur Texteingabe | |
DE2946857C2 (de) | Wortspeichergerät | |
DE3851867T2 (de) | Zeichenerkennungsgerät. | |
DE69423254T2 (de) | Verfahren und Gerät zur automatischen Spracherkennung von Dokumenten | |
DE69329330T2 (de) | Texterkennung | |
DE60204005T2 (de) | Verfahren und einrichtung zur erkennung eines handschriftlichen musters | |
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE4130632A1 (de) | Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal | |
DE112010005297T5 (de) | Suchvorrichtung und Suchprogramm | |
DE2435889B2 (de) | Verfahren und einrichtung zur unterscheidung von zeichengruppen | |
DE2460757A1 (de) | Datenverarbeitungssystem zur korrektur von bei der maschinellen zeichenerkennung aufgetretenen fehldeutungen | |
DE2654815A1 (de) | Verfahren zur unterscheidung von gross- und kleinbuchstaben | |
DE19933984C2 (de) | Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen | |
EP0813734B1 (de) | Verfahren zur erkennung mindestens eines definierten, durch hidden-markov-modelle modellierten musters in einem zeitvarianten messignal, welches von mindestens einem störsignal überlagert wird | |
DE69331035T2 (de) | Zeichenerkennungssystem | |
EP2034472A1 (de) | Spracherkennungsverfahren und Spracherkennungsvorrichtung | |
DE69329789T2 (de) | Texterkennung | |
DE4309362A1 (de) | Informations-Rückgewinnungsvorrichtung | |
DE102019122223A1 (de) | System und Verfahren zur Identifizierung und/oder Extrahierung von für eine Angebotsabgabe relevanter Information aus einem eine Ausschreibung oder eine Anfrage betreffenden Dokument | |
DE102016125162A1 (de) | Verfahren und Vorrichtung zum maschinellen Verarbeiten von Texten | |
DE3825582A1 (de) | Verfahren und anordnung zum erkennen von zeichen und/oder objekten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8125 | Change of the main classification |
Ipc: G06K 9/62 |
|
8126 | Change of the secondary classification |
Ipc: G06K 9/03 |
|
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |