DE2640537A1

DE2640537A1 - Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen

Info

Publication number: DE2640537A1
Application number: DE19762640537
Authority: DE
Inventors: Philip Joseph Mullan; Walter Steven Rosenbaum
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1975-10-24
Filing date: 1976-09-09
Publication date: 1977-04-28
Also published as: FR2329023A1; GB1554884A; JPS5711473B2; CH604277A5; CA1061000A; US3988715A; JPS5253634A; IT1075853B; FR2329023B1

Description

Verfahren und Vorrichtung zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen.

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen, die in einem von einem Zeichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen. Dabei soll jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmen.

Optische Zeichenerkennungsvorrichtungen dienen zum Erkennen von in schriftlicher z.B. gedruckter oder handgeschriebender Form vorliegenden Daten und zum Einlesen dieser Daten in binär codierter Form in eine datenverarbeitende Anlage. Bei

7Q9817/067&

Zeichensymbolen, die aus Ziffern, Buchstaben und sonstigen Zeichen gemischt sind, ist es ausserordentlich wichtig, dass deren Bedeutung klar erkannt wird. Dazu gehört zunächst die Unterscheidung, welchem der Alphabete, für die der Zcichenleser eingerichtet ist, ein abgetastetes Zeichen angehört. Aus dem Schweizer Patent 578.216 und dem USA Patent 3.842.402 sind ein Verfahren und eine Vorrichtung zum Unterscheiden zwischen Zahlzeichen und Buchstaben bekannt, wobei eine Zeichenerkennungsvorrichtung mit zwei Kanälen verwendet wird. In dem einen Kanal wird jedes optisch gelesene Zeichen als ein zu erkennendes alphabetisches Zeichen betrachtet, während im anderen Kanal jedes gelesene Zeichen als ein numerisches Zeichen betrachtet wird. Die daraus resultierenden Datenströme werden parallel verarbeitet, wobei ihre vertikale Redundanz nach wahrscheinlichkeitstheoretischen Methoden ermittelt wird. Nach Bayes kann die bedingte Wahrscheinlichkeit von Ereignissen bestimmt werden, welche sich paarweise gegenseitig ausschliessen, wie z.B. das Lesen eines Zeichens als Ziffer oder als Buchstabe.

Verfahren und Vorrichtungen, die eine Unterscheidung zwischen zu mehr als zwei Alphabeten gehörenden Zeichen gestatten (N>2) sind bisher nicht bekannt geworden. Zweck der vorliegenden Erfindung ist daher, hier Abhilfe zu schaffen. Demnach betrifft

WA9-75-001 - 2 -

709817/0670

die vorliepende Erfindung ein Verfahren zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen, die in einem von einem Zcichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen, wobei jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmt. Das Verfahren ist gekennzeichnet durch die Vorfahrensschritte:

Speichern eines Wertes der bedingten Wahrscheinlichkeit, dass ein bestimmtes Zeichen eines Alphabets'vom Zeichenleser angegeben wurde, wenn aber Zeichen eines anderen Alphabets abgetastet wurden, in jedem von mit den N-Ausgabeleitungen verbundenen N Speichern, Abrufen aus den N Speichern von N Werten von bedingten Wahrscheinlichkeiten, dass jedes auf einer Ausgabeleitung angegebene Zeichen eines Alphabets durch den Zeichenlcser falsch erkannt und daher fälschlich auf einer der anderen Ausgabeleitungen angegeben worden ist, Multiplizieren aller abgerufenen N Werte der bedingten Wahrscheinlichkeiten gesondert für jedes der vom Zeichenleser über die N Ausgabeleitungen angegebenen Alphabete, um Produkte der entsprechenden bedingten Wahrscheinlichkeiten zu entwickeln, und

WA9-75- 01 - 3 -

709817/067$

ι-

Vergleichen in einem Verglcicher der Grossen jeder der N Produkte der bedingten Wahrscheinlichkeiten, um das zutreffende der vom Zeichenleser angegebenen Zeichen mit demjenigen der Produkte der bedingten Wahrscheinlichkeiten zu korrelieren, welches den grössten Wert aufweist.

Ferner betrifft die Erfindung eine Vorrichtung zum Ausführen des vorgenannten Verfahrens, mit einem ein Zeichenfeld abtastenden optischen Zeichenleser mit N>2 Ausgabcleitungen, die je einem von N>2 Alphabeten zugeordnet sind, mit N von N Adressregistern ansteuerbaren Speichern für Tafclwerte bedingter Wahrscheinlichkeiten, mit N>2 Multipliziereinrichtungen, die mit den Speichern verbunden sind und mit einem an die Ausgänge der Multipliziereinrichtungen angeschlossenen •Vergleicher, welche Vorrichtung dadurch gekennzeichnet ist, dass die N Speicher je einen ersten N-dimensionalen Speichersektor, einen zweiten (N-I)-dimensionalen Speichersektor usw, bis einen letzten (N-n=l)-dimensionalen Speichersektor umfassen, wobei jeweils der Speichersektor mit der niedrigeren Dimension an den Speichersektor der nächsthöheren Dimension sowie an ein Adressregister angeschlossen ist, mit dem die Speichersektoren der höheren Dimensionen des gleichen Speichers nicht verbunden sind, dass die 1-dimensionalen Speichersektoren über Ausgaberegister mit den Multiplikatoren verbunden

WA9-75-001 - 4 -

70981 7/067S

sind, und dass alle Speichersektoren als Festwertspeicher ausgebildet sind, in denen Tabellenwerte bedingter Wahrscheinlichkeiten in Form von Matrizen fest gespeichert sind, deren Dimension durch die Dimension des· betreffenden Speichersektors bestimmt ist.

Die Vorteile der Erfindung sind in ihrer Fähigkeit zu sehen, zwischen drei und mehr Zeichensätze unterscheiden zu können.

Einzelheiten des erfindungsgemässen Verfahrens und eines Ausführungsbeispiels einer Vorrichtung zum Ausführen des Verfahrens werden nachstehend anhand der Zeichnungen erläutert. In den Zeichnungen zeigen:

Fig. 1 Paare und Triaden von miteinander verwechslungsfähigen Zeichen verschiedener Alphabete;

Fig. 2 schematisch Speichermatrizen mit bedingten Wahrscheinlichkeitswerten für einen dreikanaligen Diskriminator, der für die Unterscheidung zwischen lateinischen, kyrillischen und numerischen Zeichen eingerichtet ist;

Fig. 3 ein Blockschaltbild eines dreikanaligen Zeichenlesers,

Fig. 4+5 zusammengesetzt ein Blockschaltbild eines dreikanaligen Diskriminators.

WA9-75-001 - 5 -

709817/0670

Die alphabetischen Symbole, die für die Schreibung der meisten europäischen Sprachen angewandt werden, haben sich aus einer geschriebenen Repräsentation von Sprachlauten entwickc]t, die auf die Griechen zurückgeht, während die in allen europäischen Sprachen benutzte Schreibung der Zahlzeichen von den Arabern erfunden worden ist. Mit wenigen Ausnahmen erfolgte die Entwicklung der Zeichen des Alphabets und der Zahlzeichen unabhängig voneinander. Das hat dazu geführt,-dass für alphabetische und numerische Zeichen identische oder sehr ähnliche Symbole verwendet werden. In ähnlicher Weise haben sich beispielsweise auch die alphabetischen Zeichen der russischenkyrillischen Schrift bzw. des japanischen Kanji-Alphabets unabhängig entwickelt und benutzen einige Zeichen, die denen der lateinischen Schrift ähnlich sind. Beispiele für derartige geometrische Aehnlichkeiten können jeder Konkordanztabelle von Alphabeten entnommen werden.

Vergleichbare Verhältnisse liegen vor bei der Aehnlichkeit im Aussehen von korrespondierenden Zeichen in verschiedenen Schriftarten wie beispielsweise "A" in der Schriftart "Advocate" im Vergleich mit dem Zeichen "A" der Schriftart "Script". (Einzelheiten dieser Schriftarten sind in diesem Zusammenhang ohne Belang, es genügt, dass sie unterschiedlich sind.) Wenn der Benutzer (d.h. Leser) der Zeichensymbole ein Mensch ist,

WA9-75-001 . - 6 -

709817/067^

kann er bei der Analyse des Zusammenhangs und der alphabetischen Form, in welcher das betreffende Zeichen erscheint, seinen Scharfsinn anwenden und dabei die Wahrscheinlichkeit reduzieren, dass'die vom Schreiber beabsichtigte Bedeutung beeinträchtigt wird. Mit der Einführung von maschinellen optischen Zeichenlesern für das Lesen von Daten von gedruckten, mit der Schreibmaschine geschriebenen oder handgeschriebenen Dokumenten wird die verwirrende Aehnlichkeit zwischen Zeichen verschiedener Alphabete, Schriftarten und numerischer Symbole besonders kritisch.

In der Fig. 1 ist der Fall eines drei Kanäle aufiveisenden optischen Zeichenlesers gezeigt, der ein Beispiel von gemischten lateinischen, kyrillischen und numerischen Zeichen zu lesen hat, die verschiedene Kategorien von alphanumerischen Problempaaren und -triaden darstellen. Es ist einleuchtend, dass die Unterschiede zwischen den einzelnen Kategorien nicht immer klar hervortreten. Obwohl Verwechslungsmöglichkeiten, wie die in der Figur dargestellten, nicht dauernd auftreten, kommen sie doch oft genug vor, um die Zurückführung eines gedruckten, maschinengeschriebenen oder handgeschriebenen Textes auf eine computerbezogene Datenbasis ernsthaft zu behindern. Die Fig. 1 zeigt Verwechslungsmöglichkeiten zwischen dem Zahlzeichen "0" und dem Buchstaben "O^M, dem Zahl-

WA9-75-001 - 7 -

10 9 8 1 7 / 0 6 7 $

zeichen "1" und dem Buchstaben "1", die in einer Umgebung, in der viele verschiedene Schriftarten vorkommen, gewöhnlich nicht unterscheidbar sind. Das gleiche gilt für die Zeichenpaare "5" und den Buchstaben "S", das Zahlzeichen "2" und den Buchstaben "Z", das lateinische "!?" und den kyrillischen Buchstaben "III", sowie die Buchstaben "Y" und "q", die topologisch ähnlich und daher nur durch die Schärfe der Ecken unterscheidbar sind, was jedoch eines der Merkmale ist, die als erste verschwinden, wenn die Druckqualität nachlässt. Aehnliches gilt für die Zeichentriaden mit dem Zahlzeichen "6" und den Buchstaben ¹¹G" und "L· ", dem Zahlzeichen "8" und den Buchstaben "B" und "3", dem Zahlzeichen "9" und den Buchstaben "g" und "H", die ebenfalls nur in sehr untergeordneten topologischen Merkmalen voneinander abweichen, die bereits bei leichtem Nachlassen der Druckqualität verschwinden. Entsprechendes gilt für die Triaden mit dem Zahlzeichen "4" (oben offen) und den Buchstaben "H" und "H", dem Zahlzeichen "4" (oben geschlossen) und den Buchstaben "A" und "A", dem Zahlzeichen "7" und den Buchstaben "Y" und " <I ", dem Zahlzeichen "8" und den Buchstaben "S" und "b", und dem Zahlzeichen "8" und den Buchstaben "e" und "E", die sich zwar etwas besser unterscheiden, als aus der Fig. 1 hervorgeht, die jedoch bei der in maschinengeschriebenem Text üblichen Qualität gelegentlich verwechselt werden. Schliess-

WA9-75-a01 ' - 8 -

709817/067S

lieh sind in der Fig. 1 noch weitere vier Triaden angegeben, die das Zahlzeichen "7" und die Buchstaben "T" und "Γ", das Zahlzeichen "0" und die Buchstaben "N" und "Φ", das Zahlzeichen "0" und die Buchstaben "C" und "C", das Zahlzeichen "9" und die Buchstaben "U" und "Jl" umfassen, die sich, durch Merkmale unterscheiden, die bei schlanken Schriftarten wenig ausgeprägt sind, oder weil die Vorrichtung zum Trennen der Zeichen im Zeichenleser nicht einwandfrei funktioniert.

Der Schlüssel zur zuverlässigen Textverarbeitung ist die Fähigkeit, leicht und sicher in der Voranalyse der Ausgabe des Zeichenlesers Felder von zu verschiedenen Alphabeten gehörenden Zeichen gegeneinander abzugrenzen. Die zuverlässige Unterscheidung zwischen Feldern von zu verschiedenen Alphabeten gehörenden Zeichen in einer Umgebung, in der tatsächlich verschiedene Alphabete vorkommen, ist ein sehr komplizierter Vorgang, was darauf zurückzuführen ist, dass die meisten modernen Schriftarten unabhängig voneinander entwickelt worden sind, wobei kein Versuch gemacht wurde, die gegenseitige Verwechselbarkeit auszuschliessen. Daher kommen in vielen verschiedenen Alphabeten die gleichen fundamentalen geometrischen Formen vor. Daher kann es vorkommen, dass bei einem dreikanaligen Zeichenleser viele geläufige alphabetische Wörter, die aus dem lateinischen Alphabet

WA9-75-001 - 9 -

709817/067$

gebildet sind, teilweise oder ganz als numerische oder kyrillische Felder verkannt werden. Beispiele derartiger Verkennungen sind "South" in "80478", "804TH" oder "bOUTH", "Third" in. "781rd", und "BEJlH¹¹ in "BEAN" oder "88th". Das Problem bei der Unterscheidung von Zeichenfeldern beruht insbesondere darauf, dass reale oder vorgebliche Ketten von Zeichen sich nicht für die Methoden der direkten Analyse des Textzusammenhangs anbieten. Beispielsweise ist ein numerisches Feld vollkommen nicht-redundant, da jeder Satz von numerischen Zeichen einen sinnvollen Datensatz darstellen kann.

In bekannten zweikanaligen Zeichenlesesystemen, ausgenommen die in den USA-Patenten 3,839,702 und 3,842,402 beschriebenen, wird die endgültige Unterscheidung alphabetisch/numerisch jedes Zeichenfeldes durch einen Ausschliessungsprozess erreicht Dieser verlangt, dass ein alphabetischer Erkennungsstrom, der jedem Feld oder Unterfeld entspricht, auf Uebereinstimmung mit einem gespeicherten Wörterbuch von zulässigen empfangenen Daten geprüft wird, die im voraus bekannt sind. Alle Felder oder Ünterfelder, die keine Uebereinstimmung ergeben, werden als numerisch bezeichnet. Bei einer Anwendung, wie beispielsweise der Verarbeitung von Postsendungen oder bei der Textverarbeitung, ist dieses Vorgehen nicht möglich, da das Wörterbuch von zulässigen empfangenen Daten exzessiv gross

WA9-75-001 - 10 -

709817/067$

sein müsste und die für die vielen erforderlichen Zugriffe zu dem Wörterbuch nötige Zeit prohibitiv lang wäre. Daher ist dieses Vorgehen auch nicht geeignet für ein Vielkanalsystem, d.h. ein System mit mehr als zwei Kanälen.

Der hier benutzte Begriff "Alphabet" soll verstanden werden als ein in vereinbarter Reihenfolge geordneter Zeichenvorrat, beispielsweise die Buchstaben des lateinischen Alphabets oder die Zahlzeichen, sowie jeden von den anderen verschiedenen Satz von Buchstabenzeichen einer Schriftart oder Schriftgrösse.

Der zu beschreibende Vielkanal-Zeichenerkennungs-Diskriminator führt einen Alphabet-Entscheidungsprozess zwischen drei oder mehr Ketten von Zeichen aus, die von einem optischen Zcichenleser ausgegeben werden. Er gehört zu einem System, das einen optischen Zeichenleser umfasst, der eine Kette von Zeichen in einem Zeichenfeld abtastet, Mittel für die Ausgabe auf einer einem ersten Alphabet (z.B. lateinisches Alphabet) zugeordneten Leitung, auf der Zeichen ausgegeben werden, die möglichst genau dem ersten Zeichenalphabet entsprechen, entsprechende Mittel für die Ausgabe auf einer zweiten Ausgabeleitung, die einem zweiten Alphabet (z.B. kyrillisches Alphabet) zugeordnet sind und Mittel für die Ausgabe auf einer dritten Ausgabe-

WA9-75-001 - 11 -

709817/067$

2640S37

leitung, die einem weiteren Alphabet zugeordnet ist, usw., bis zu Mitteln für die Ausgabe auf einer η-ten Ausgabeleitung, die einem numerischen Zeichenvorrat zugeordnet ist.

Ein erstes Speicher-Adressregister ist mit der ersten Ausgabeleitung verbunden und speichert sequentiell jedes alphabetische Zeichen des Zeichenfeldes, das auf der ersten Ausgabeleitung erscheint. Entsprechend sind weitere Speicher-Adressregister den übrigen Ausgabeleitungen zugeordnet, bis hin zur n-ten Ausgabeleitung für die numerischen Zeichen, die auf der n-ten Ausgabeleitung ausgegeben werden.

Weiter sind Speicher vorgesehen, die mit jedem der erwähnten Speicher-Adressregister verbunden sind, und in denen ein Satz von N-dimensionalen Matrizen von zusammengesetzten bedingten Wahrscheinlichkeiten, die eine quantisierte Aussage darüber liefern, dass, wenn der Zeichenleser ein Zeichen dem ersten Alphabet zugeordnet hat, gewisse damit im Zusammenhang aufgetretene Zeichen für alle Kombinationen, in denen sie mit Zeichen anderer Alphabete aufgetreten sind, falsch erkannt wurden. Entsprechende zusammengesetzte bedingte Wahrscheinlichkeiten sind für jedes Alphabet in dem Speicher gespeichert, zu dem Zugriff möglich ist mittels einer N-dimensionalen Adresse, die eindeutig durch den Inhalt der aufeinanderfolgen-

WA9-75-001 - 12 -

709817/067$

den Speicher-Adressregister gebildet wird, um die zusammengesetzte bedingte Wahrscheinlichkeit zu ergeben, dass das im ersten Speicher-Adressregister gespeicherte Zeichen des ersten Alphabets vom Zeichenleser als das spezifische Zeichen des zweiten Alphabets \'erlesen worden Ist, das im zweiten Speicher-Adressregister gespeichert ist und als das spezifische Zeichen des dritten Alphabets, welches im dritten Speicher-Adressregister gespeichert ist, usw., je nach Anzahl .der dem System zugänglichen Alphabete.

Der Zugriff zum Speicher liefert für jedes im ersten Adressregister stehende Zeichen über einen Multiplikator das Produkt der zusammengesetzten bedingten Wahrscheinlichkeiten für das erste Alphabet. Entsprechend werden die Produkte der zusammengesetzten bedingten Wahrscheinlichkeiten für die in den übrigen Adressregistern stehenden Zeichen für die übrigen Alphabete entwickelt. Mit dem Multiplikator ist ein Vergleicher verbunden, der die Grossen der Produkte der Wahrscheinlichkeiten miteinander vergleicht. Das Ausgangssignal des Vergleichers schaltet diejenige Ausgangsleitung des Zeichenlesers durch, für die das grösste Produkt ermittelt x^orden ist, wodurch das korrekte Alphabet für den Zweck der Datenübertragung ausgewählt wird.

WA9-75-001 - 13 -

709817/067S

Auf diese Weise ist der zu beschreibende Vielkanal-Diskriminator imstande, zwischen einer Vielzahl von alphabetischen und numerischen Zeichenfeldern zu unterscheiden, die von einem Zeichenleser abgetastet worden sind, ohne dass der Diskriminator von einem gespeicherten Wörterbuch zulässiger, im voraus bekannter empfangener Daten Gebrauch machen muss. Dementsprechend kann die Alphabetunterscheidung nach Stil, Form oder Schriftart in wesentlich kürzerer Zeit erfolgen, als das bisher möglich war.

Zum besseren Verständnis des Verfahrens der Diskrimination zwischen verschiedenen Alphabeten sind einige theoretische Ueberlegungen erforderlich. Das Verfahren der Vielkanal-Erkennungs-Diskrimination sucht die Unterscheidung zwischen den Alphabeten durch Zuordnung einer gewissen Form von Quasi-Redundanz zu einem Zeichenfeld zu erreichen. Redundanz im Sinne des Textzusammhangs bedeutet, dass zwischen dem Vorhandensein eines Zeichens und einem anderen eine Abhängigkeit besteht. Normalerweise wird Text-Redundanz in horizontaler Richtung zwischen den Zeichen auf einer Zeile und innerhalb eines Wortes angenommen. Ein Beispiel für dieses Konzept ist die Digramm-Statistik. Diese Wahrscheinlichkeiten der Nebeneinanderstellung von Zeichen erlaubt die Vorhersage von wahrscheinlich folgenden Zeichen aufgrund der Kenntnis der

WA9-75-001 - 14 -

709817/0676

vorhergehenden Zeichen. Daher würde in der Buchstabenfolge "SPRI-G" wahrscheinlich "N" beispielsweise gegenüber "Z" bevorzugt, um die freie Position zu füllen. Dieser Sachverhalt ist begrifflich und mathematisch in den bereits erwähnten USA-Patenten 3,839,702 und 3,842,402 erläutert.

Obwohl für numerische Zeichenfelder eine horizontale Redundanz nicht gegeben ist, existiert eine Redundanz von einer speziellen vertikalen Natur. Beispielsweise kann beim Abtasten eines Artikels über "President Gerald Ford 1600 Pennsylvania ..." in einer russischen Zeitung mittels eines dreikanaligen Zeichenlesers das folgende Ergebnis erhalten werden, wobei "*" bedeutet, dass eine Erkennung nicht möglich war:

1. alphabetischer Kanal: PRESI*ENT GE*ALD FORD 1*00

2. alphabetischer Kanal: ΡΒΕΒ*ΓΕΜΓ CEPA*fl *O** *bOO numerischer Kanal: 4*840*457 68*4*0 *0*0 1600

Hier ist ein Konzept der vertikalen Redundanz entwickelt worden, das einen Zusammenhang herstellt zwischen der Erkennung eines Zeichens in einem Kanal mit einem Satz von möglichen Verkennungen in den anderen Kanälen. Die fundamentale Grosse, auf welcher die Diskrimination beruht, ist die so-

WA9-75-001 - 15 -

709817/067S

genannte Vielkanal-Verwechslungs-Wahrscheinlichkeit Ρ»«_Γρ· Die allgemeine Form der Verwechslungs-Wahrscheinlichkeit

worin α,β,ψ, usw die verschiedenen Alphabete oder Schriftarten bedeuten, über die der Vielkanal-Zeichenleser eine Erkennung durchführt. Die Indizes i, j, k, usw. repräsentieren die zulässigen Zeichenerkennungen in jedem der entsprechenden Alphabete, wobei natürlich vorausgesetzt ist, dass für jedes zugelassene Alphabet ein unabhängiger Erkennungskanal und die zugehörige Logik vorhanden sind. Gleichung (1) drückt die Wahrscheinlichkeit der Beobachtung einer gleichzeitigen Erkennung von ou im α-Kanal, ß. im ß-Kanal, ... und ir, im TT-Kanal aus, wobei angenommen ist, dass ein Feld im γ-Alphabet tatsächlich abgetastet wurde und γ durch die zugeordnete Erkennungslogik erkannt wurde. Mit anderen Worten kann unter der Bedingung, dass γ aufgetreten ist, die Gleichung (1) über alle Zeichen in den α-, β-, γ-, .··, und π-Alphabeten ausgewertet werden. Das ergibt eine N-dimensionale Matrix von Wahrscheinlichkeitsfaktoren für die Möglichkeit, dass jedes Zeichen eines Alphabets durch die anderen N-I Erkennungskanäle als eine Kombination der ihnen zugeordneten Zeichen verkannt worden ist.

WA9-75-001 - 16 -

709817/067$

Das probabilistische Verhältnis, das in der Form der Gleichung (1) ausgedrückt ist, weicht mathematisch von den einen einzelnen Faktor umfassenden bedingten Wahrscheinlichkeiten ab, die in den Ausführungsbcispielen der USA-Patente 3,839,702 und 3,842,402 für Zweikanal-(a/numferisch)-Unterscheidung gezeigt sind und im allgemeinen Γ(α|γ) bezeichnet sind. Mit M.G. Kendall: "The Advance Theory of Statistics - Volume T", Charles Griffin & Co., Seite 301, und Tung Au:."Fundamentals of Systems Engineering Probabilistic Model", Addision Wesley, Seite 276, kann man zeigen, dass Ρ(α|γ) sich auf ein Regrcssions-Modell der Form:

α = E(a+by) (2)

bezieht, worin E für den erwarteten Wert steht und a und b Konstanten sind, die mittels Regressionsflächen mit minimiertem quadratischem Abstand lösbar sind. Beispielsweise bezieht sich der Ausdruck der zusammengesetzten bedingten Wahrscheinlichkeit PCa, B|y) auf:

Ρ(α, β|γ) ° Ρ(α|γ) · P(ß|a, γ) = E(a + by) · E(c + da + 1γ)

Vergleicht man die Elemente der Gleichungen (2) und (3), so ergibt sich, dass keine Kombination von einfachen bedingten Wahrscheinlichkeitsfaktoren einen Ausdruck liefern kann, der

WA9-75-001 - 17 -

709817/0676

* 2540537

die Entscheidungseigenschaften einer zusammengesetzten bedingten Wahrscheinlichkeit aufweist. Daher kann weder die in den genannten Patenten offenbarte Lehre noch die Benutzung der darin beschriebenen Mechanismen das gewünschte Resultat ergeben, das unter Benutzung des ii/eiter unten zu beschrciben-'den Ausführungsbeispiels einer Diskriminatorschaltung erzielt werden kann.

Für einen optischen Zeichenleser mit N Kanälen gibt es N-I zusätzliche zusammengesetzte bedingte Wahrscheinlichkeiten, die als Gegenstücke zur Gleichung (1) für die anderen Erkennungskanäle dienen. Jeder Ausdruck einer zusammengesetzten bedingten Wahrscheinlichkeit ist von dem zulässigen Erkennungs Alphabet eines anderen Kanals abhängig. Die entsprechenden Wahrscheinlichkeitsfaktoren werden für jeden Kanal als N-dimensionale Matrix gespeichert, deren Elemente die Erkennung in einem Alphabet in Beziehung setzen zur Möglichkeit, dass sein Video-Bild durch die anderen Erkennungskanäle verkannt wird. Dies ist graphisch in Fig. 2 dargestellt, worin die Konfiguration eines Wahrscheinlichkeitsfaktor-Speichers die Matrix Anordnungen für einen Diskriminator mit drei Kanälen zeigt.

WA9-75-001 . - 18 -

709817/0676

•In Fig. 2 ist die mit α bezeichnete Achse der Ausgabeleitung für das lateinische Alphabet zugeordnet, die mit β bezeichnete Achse ist der Ausgabeleitung für das kyrillische Alphabet zugeordnet und die mit γ bezeichnete Achse entsprechend der Ausgabcleitung für die numerischen Zeichen. Im oberen Teil der Fig. 2 ist gezeigt, dass ein vom Zeichenleser angebotener Buchstäbe des lateinischen Alphabets, der über die Ausgabeleitung α läuft, entsprechend vorgegebenen, Zusammengesetz ten bedingten Wahrscheinlichkeiten für alle Kombinationen von kyrillischen und numerischen Zeichen \^rerkannt worden sein kann. Wenn beispielsweise der lateinische Buchstaben "G" vom Zeichenleser angeboten wird, stehen die zweidimensionalen Wahrscheinlichkeitswerte der Matrix 1 zur Verfügung. Wird über die Leitung β ein kyrillisches Zeichen "b" und über die Leitung γ ein Zahlzeichen "6" angeboten, wird der Wert der zusammengesetzten bedingten Wahrscheinlichkeit am Schnittpunkt β-γ abgefragt. Liefert der Zeichenleser auf der a-Ausgabeleitung eine "8", wird die zusammengesetzte bedingte Wahrscheinlichkeit am Schnittpunkt β = L/γδ abgefragt.

In ähnlicher Weise [mittleres Teilbild der Fig. 2) führt ein kyrillisches Zeichen " b" auf der ß-Leitung, ein lateinisches Zeichen "G" auf der α-Leitung und eine "6" auf der γ-Leitung zum Zugriff zur zusammengesetzten bedingten Wahrscheinlichkeit

WA9-75-001 - 19 -

709817/067$

am Schnittpunkt α-γ. Schliesslich führt eine "6" auf der γ-Leitung (unteres Teilbild der Fig. 2), ein lateinischer Buchstabe "G" auf der α-Leitung und ein kyrillischer Buchstabe ".£> " auf der ß-Leitung zum Zugriff zur zusammengesetzten bedingten Wahrscheinlichkeit am Schnittpunkt ß-ot.

Wenn ein Zeichenfeld abgetastet worden ist und wenigstens zwei Kanäle ein Ausgangssignal mit einer Erkennungsqualität liefern, die die Zugehörigkeit des Zeichenfeldes zu einem Alphabet zweifelhaft macht, wird der Diskriminator in Anspruch genommen und die P .,„,,-Matrizen abgefragt. Für jeden Kanal, bezüglich dessen die Zugehörigkeit des Zeichenfeldcs zweifelhaft ist, wird unter Benutzung der P._)rr-Faktoren ein Produkt entwickelt, das vom Ausgangssignals dieses Kanals abhängt und die entsprechenden Ausgangssignale der anderen Kanäle berücksichtigt. Die Entscheidung bezüglich der Zugehörigkeit des Zeichenfeldes zu einem Alphabet wird getroffen zugunsten desjenigen Kanals, auf den das P_Mp -Produkt mit der höchsten Wahrscheinlichkeit entfiel.

Die vorstehende Diskussion des Vielkanal-Erkennungs-Diskrimi-

nators im Zusammenhang mit einem N-Kanal-Zeichenleser ist

die allgemeinste Form, die sich denken lässt. Der Diskriminator

kann auch Anwendung finden im Zusammenhang mit einem japanischen

WA9-75-001 ' - 20 -

709817/0676

optischen Zeichenleser, der sowohl^vdas Katakana-Alphabet wie auch das Romnji-Alphabet lesen kann. Da das Romnji-Alphabet auch die römischen und arabischen Zahlen enthält, verlangt der japanische Zeichenleser drei unabhängige Erkennungs-Kanäle. Dem Fachmann ist bekannt, dass Zeichenleser für Katakana- und Romnji-Zeichen bereits zum Stande der Technik gehören. Wenn die Erkennung im Mehrkanal-Betrieb erfolgt, lassen sich die zwischen den-Kanälen auftretenden Zeichenverwechslungen durch drei P. „-Gleichungen beschreiben. Wenn "K" das Katakana-Alphabet bedeutet und "R." und "R_n" den alphabetischen bzw. numerischen Teil des Romnji-Alphabets, lauten die P -Gleichungen wie folgt:

C j

^PMCC

^PMCC ⁽V = ^p(% » K₁ I R^) (5)

^PMCC <V ^{= P(K}1' \

worin j, i und 1 Variable sind, die sich ändern über die zulässigen Zeichenidentifikationen der Erkennungsalphabete, zu denen sie gehören.

Die Gleichungen (4) bis (6) werden wie folgt angewandt, wenn ein Video-Bild- vorhanden ist: 1. ein Katakana-Symbol (hier mit "K" bezeichnet), 2. das Romnji-Zahlzeichen "7"

WA9-75-001 - 21 -

709817/067$

und 3. der Romnji-Buchstabe "T". Somit ^PMCC ^{(K) = P(T>
7}I ^K>

^PMCG ⁽V = P (7, K| T) (8)

^PMCC⁽V ⁼

Gleichung (7) drückt beispielsweise die Wahrscheinlichkeit aus, dass beim Abtasten eines Katakana-Feldes*und Erkennen eines Video-Bildes als ¹¹K", das Video-Bild ein "T" in der R.-Logik und eine "7" in der R^-Logik ergeben würde- Die Gleichungen (8) und (9) beziehen sich auf ähnliche Wahrscheinlichkeits-Aussagen, vtfobei die Annahme bezüglich Gleichung (8) die ist, dass das Feld dem Romnji-Alphabet zugehört und nach Gleichung (9) ein Romnji-Zahlzeichen ist.

Wenn die Gleichungen (4) bis (6) für alle in den zugeordneten Erkennungs-Alphabeten vorkommenden Zeichen ausgewertet sind, liefert jede von ihnen eine separate, dreidimensionale Matrix. Eine Zeichenmatrix von der Grosse 30 χ 11 χ 150 ist erforderlich, um die Wahrscheinlichkeit zu speichern, auf die Zugriff besteht gemäss den Gleichungen (7) bis (9).

Der Diskriminator wird herangezogen, wenn ein Feld abgetastet wird, dessen Erkennungs-Ausgangssignal zweifelhaft ist, wie

WA9-75-001 - 22 -

709817/067$

im folgenden Beispiel 1, weil alle drei Kanäle einen möglichen Kandidaten liefern:

Beispiel 1 Katakana-Kanal: K1-K2-K3

Romnji-Buchstaben-Kanal: C-A-T Romnji numerischer Kanal: 0-4-7

Das Gleiche gilt, wenn nur der Katakana-Kanal· und der Ronin j i-Buchstaben-Kanal mögliche Kandidaten liefern, wie im folgenden Beispiel 2:

Beispiel 2 Katakana-Kanal: K4-K5-K6

Romnj i-Buchstaben-Kanal: C-A-T Romnji numerischer Kanal: *-4_*

Es sei darauf hingewiesen, dass die Notationen "K", "Kl", "K2" usw. verschiedene Katakana-Symbole bedeuten, die eine gewisse optische Aehnlichkeit mit den entsprechenden Romnji-Zeichen aufweisen, und dass sie hier so bezeichnet sind, um die Schreibung zu erleichtern.

Der Diskriminator muss beim Beispiel 1 zwischen drei Möglichkeiten entscheiden und beim Beispiel 2 zwischen zwei Möglichkeiten. Die Entscheidung des Diskriminators erfolgt aufgrund

WA9-75-001 - 23 -

709 817/0 676

der Untersuchung der Kanäle auf den P„ „-Wert, den sie aufweisen. Wenn "L" das Produkt der P.,- -Wahrscheinlichkeiten je Zeichen bedeutet, ergibt sich für:
In Beispiel 1:

L (Katakana) = P(C,0| Kl) *P(A,4| K2) -P(T, 7|K3) L (Romnji alpha)= P(O, Kl|C)-P(4, K2|A)*P(7, K3|T) L (Romnji numer.) = P(Kl, C|0)-P(K2, A|4)-P(K3, Ti 7)

in Beispiel 2:

L (Katakana) = P(C, *|Κ4)·Ρ(Α, 4|K5)-P(T, *|K6) L (Romnji alpha)= P(*, K4|C)-P(4, K5|A)*P(*. K6|T)

Die Entscheidung für die Zugehörigkeit des abgetasteten Feldes zu einem Alphabet ergibt sich aufgrund des grössten Wertes von L. Analog der Benutzung des Diskriminators für die Unterscheidung zwischen mehreren Alphabeten ist er auch für die Unterscheidung zwischen verschiedenen Schriftarten des gleichen Alphabets anwendbar. Ein geeigneter Vielkanal-Zeichenlcser hätte eine Gruppe von parallelen Erkennungsschaltungen aufzuweisen, deren jede für die Zeichenform und die Besonderheiten der Zeichentrennung einer speziellen Schriftart optimiert sein müsste. Eine mögliche Konfiguration für einen derartigen Zeichenleser könnte beispielsweise einen Kanal für die Schrift OCR-A, einen Kanal für die Schrift OCR-B sowie je einen Kanal für die Schriftarten "Advocate", "Orator" und "Script" auf-

WA9-75-001 - 24 -

709817/0676

weisen. Die verschiedenen Zeichenformen der genannten Schriftarten sind mit weiteren Beispielen in dem von der Anmelderin herausgegebenen Heft "IBM 'Selectric' Typewriter Type Styles" abgebildet.

Es sei jedoch darauf hingewiesen, dass weder die Namen noch die speziellen Merkmale dieser Schriftarten für die vorliegende Beschreibung irgend eine einschränkende Bedeutung haben sollen.

Wie erwähnt, ist die Erkennungs-Logik jedes der verschiedenen Kanäle an die* ihm zugeordnete Schriftart angepasst. Mit dem Diskriminator ist also aufgrund der Ausgangssignale von den verschiedenen Erkennungskanälen zu entscheiden, welche Schriftart von den betreffenden Kanälen gerade abgetastet wird. Aufgrund der Entscheidung des Diskriminators wird das Ausgangssignal des betreffenden Erkennungskanals als die zuverlässigste Erkennung der abgetasteten Daten weiterverarbeitet. Die Entscheidung des Diskriminators wird normalerweise auf der Basis eines Unterfeldes gefällt.

Beim Abtasten der Zeichen "A" und "B" der Schriftart "Script" können die verschiedenen Kanäle z.B. folgendes Ergebnis liefern (wobei ein Sternchen "*" eine Rückweisung bedeutet):

WA9-75-001 - 25 -

70981770678

A3

OCR-A-Kanal	N*
OCR-B-Kanal	AS
Advocate-Kanal	VS
Orator-Kanal	XB
Script-Kanal	AB

Der Diskriminator untersucht die zusammengesetzte bedingte Wahrscheinlichkeit der Ereignisse unter Benutzting empirisch entwickelter und gespeicherter P.pp-Wahrscheinlichkeitsfaktoren, die auf die entsprechenden Schriftarten abgestimmt sind. Für das angeführte Beispiel ergibt sich:

L(OCR-A) - P (A_0CR__B> ^VAdvocate' Orator· ^AScript I ^HOCR-A> ⁵^ (⁵OCR-B' ^SAdvocate' ^B0rator' ^BScript ' OCR-A L(OCR-B) = P(N_0CR__A, V_AdvocateS Xorator' ^AScript ' ^AOCR-B⁾

^xP ^OCRA' ^SAdvocate' ^BOrator' ^BScript ' ^SOCR-B

^SAdvocate' ^BOrator' ^BScript ' ^SOCR-B L(Advocate) = P(^N ₀CR-A' ^AOCR-B' ^XOrator» ^AScript ' ^VAdvocate^

^xP^*0CR-A» ^SOCR-B' ^BOrator' ^BScript ' L(Orator) = P(N_0CR__A> A_QCR__B> V^^^, ^A _Script ' ^XOrator⁾

^xP^OCR-A' ^SOCR-B' ^SAdvocate' Script Orator

L(Script) = P(N_0CR__A» ^AOCR-B' ^VAdvocate'· ^X0rator ' ^AScript⁾ ⁽*OCR-A' ^SOCR-B' ^SAdvocate' ^BOrator ' ³

WA9-75-001 - 26 -

709817/067$

Die Entscheidung des Systems bezüglich der Schriftart bzw. des Kanals gibt dann die höchste Wahrscheinlichkeit wieder, welche die oben aufgeführten Ausdrücke liefern, und für das Beispiel der Buchstaben "A" und "B" der Schriftart "Script" wäre das "L(Script)".

Es wird nun die Schaltung des Diskriminators beschrieben. Fig. 4 zeigt den Vielkanal-Zeichenleser 2, der im Zusammenhang mit dem Vielkanal-Erkennungs-Diskriminator verwendet werden kann. Bei der Textverarbeitung wird die auf dem Dokument 3 erscheinende Information einer Suchoperation unterworfen, bei der ein Sucher 4 eine Vorabtastungs- und Formatverarbeitungs-Funktion ausführt. Die Vorabtastung besteht aus dem Sammeln digitaler Information von den optischen Abtastpfaden des Suchers 4 und Uebertragen der Information in einen Format-Prozessor 5. Der Format-Prozessor ermittelt aus den digitalen Daten eine Zeileninformation; bei der Bearbeitung von Postsendungen würde er beispielsweise, das Auffinden der Adresse übernehmen. Bei der Zeilensuchoperation werden die horizontalen und vertikalen Koordinaten aller potentiellen Textzeilen ermittelt und die geometrischen Koordinaten erzeugt, die der Prozessor benötigt, um den Ort und die Verdrehung des Textes zu berechnen. Bei der Postverarbeitung ermittelt die Adressensuchoperation den besten Adressenblock

WA9-75-001 - 27 -

70981770676

auf dem Poststück und liefert die horizontalen und vertikalen Startpositionen und die Verdrehungsdaten für die Leseoperation. Das Ausgangssignal des Lesers 6 ist digitalisiert und wird für jede vorgeschriebene Distanz des Dokumententransports (z.B. 0,1 mm) dem Video-Prozessor 7 zugeführt. Der Video-Prozessor hat drei Hauptaufgaben: Blockverarbeitung, Zeichentrennung und Zeichennormalisierung. Die Blockverarbeitung folgt der Druckzeile und speichert die Video-Information für die Zeile. Sie berechnet die Zeichenbreite für jede Video-Zeile und überträgt sie in den Zeichentrenner und Normalisierer'8. Der Normalisierer gleicht die Höhe der einzelnen Zeichen an, indem er horizontale Reihen der gelesenen Video-Information weglässt oder kombiniert. Er reduziert die Breite der Zeichen durch Weglassung oder Kombination vertikaler Abtastungen. Das resultierende Digitalsignal wird dann an den Merkmal-Detektor 9 übertragen.

Die Zeichenerkennung erfolgt anhand der Video-Daten durch einen Messwert-Extraktionsprozess im Merkmaldetektor 9, auf den eine Entscheidungsphase folgt. In der Messwert-Extraktionsphase werden die wichtigen Unterscheidungsmerkmale des Zeichens aus dem Inhalt eines im Video-Prozessor 7 vorgesehenen Schieberegisters ermittelt. Jeder Messwert (z.B. ein horizontaler Serif links unten, ein offener Kopf, oder ein horizontaler

WA9-75-001 - 28 -

709817/0670

Μι

Ballten in der Mitte), auch als Messwert-Vektor bezeichnet, wird an einer bestimmten Stelle in einem Register gespeichert und vom Merkmal-Detektor 9 an einen Merkmal-Vergleicher (latein.) 10, einen Merkmal-Vergleicher · (kyrill..) 11 und einen Merkmal-Vergleicher (numer.) 12 ausgegeben. Der Merkmal-Vergleicher 10 vergleicht den Messwert-Vektor des untersuchten Zeichens mit einem Messwert-Vektor für alphabetische Zeichen, deren Merkmale in einem dem lateinischen Alphabet zugeordneten Merkmal-Speicher 13 gespeichert sind. Die Zeichen des lateinischen Alphabets, deren Merkmale mit denen des abgetasteten Zeichens am ßesten übereinstimmen, werden auf einer Ausgabeleitung 14 ausgegeben. Auf die gleiche Weise vergleicht der Merkmal-Vergleicher 11 den Messwert-Vektor vom Merkmal-Detektor 9 mit den Zeichen des kyrillischen Alphabets, die in einem Merkmal-Speicher 15 gespeichert sind. Und auf einer Ausgabeleitung 16 werden die kyrillischen Buchstaben ausgegeben, deren Merkmale mit denen des abgetasteten Zeichens am besten übereinstimmen. Dieser Prozess wird für jeden weiteren vorhandenen Kanal wiederholt,·im gewählten Beispiel schliesslich für den numerischen Kanal, in dem der Merkmal-Verglcicher 12 den Vergleich mit den in einem Merkmal-Speicher 17 gespeicherten Merkmalen der numerischen Zeichen vergleicht und das Zeichen mit der besten Uebereinstimmung auf der Ausgabeleitung 18 ausgibt. Falls in einem der Merkmal-Vergleicher keine einen

WA9-75-001 - 29 -

709817/067Ö

Minimalwert überschreitende Uebereinstimmunj? für den betreffenden Kanal ermittelt wird, erscheint auf der zugeordneten Ausgabeleitung ein Rückweisungssymbol. Die Fig. 3 zeigt Zeichenfelder 19, 20 und 21, die aufgrund der einlaufenden Video-Daten von den einzelnen Merkmal-Verglcichern 10, 11, 12 auf die Leitungen 14, 16 und 18 gegeben worden sein können

Der in Fig. 3 gezeigte Zeichenleser 2 mit seinen Ausgangsleitungen 14, 16 und 18 ist auch in Fig. 4 dargestellt. Die Leitungen 14, 16 und 18 sind an einen Pufferspeicher 22 angeschlossen, von dem das lateinische Zeichenfeld über eine Leitung 23 zu einem Schieberegister 24 und zu einem Speicher-Adressregister 25 übertragen wird. Das kyrillische Zeichenfeld läuft über eine Leitung 26 zu einem Schieberegister 27 und einem Adressregister 28, und das numerische Zeichenfeld schliesslich läuft über eine Leitung 29 zu einem Schieberegister 30 und einem Adressregister 31. Von der Eingangszelle 32 des Schieberegisters 24 führt eine Leitung zu einem Felddetektor 33. Der Zweck dieser Verbindung ist die Prüfung auf Vorhandensein einer Leerstelle oder eines Worttrennzeichens. Wenn eine Leerstelle erkannt ist, wird durch eine Steuereinheit 34 der Entscheidungsp-rozess eingeleitet.

WA9-75-001 - 30 -

709817/067$

Wenn also in der Eingangszelle 32 des Schieberegisters 24 eine Leerstelle auftritt, veranlasst die Steuereinheit 34 die zeichenweise Einspeisung des lateinischen Zeichenfeldes in das Schieberegister 24 in Synchronismus mit der Einspeisung des kyrillischen Zeichenfeldes in das Schieberegister 27 und der Einspeisung des numerischen Zeichenfeldes in das Schieberegister 30. Gleichzeitig erfolgt auch die sequentielle Ladung der Adressregister 25, 28 und 31 mit den ihnen zugeordneten Zeichenfeldern. Das lateinische Zeichen im Adressregister 25, das kyrillische Zeichen im Adressregister 28 und das numerische Zeichen im Adressregister 31 bilden gemeinsam die Speicheradressen für die drei geeigneten zusammengesetzten bedingten Wahrscheinlichkeiten (P „ ), die aus Speichern 35, 36 und 37 abgerufen werden können.

Der Zugriff zu diesen Speichern 35, 36 und 37 ist vieldimensional (z.B. dreidimensional). Er benutzt die in den entsprechenden Adressregistern 25, 28 und 31 gespeicherten Zeichendaten, um sukzessive die Anzahl der Dimensionen des Zugriffs zu reduzieren, bis der Wahrscheinlichkeitsfaktor Ρ_ΜΓΓ durch eine einfache, d.h. eindimensionale Nachschlageoperation erhältlich gemacht werden kann. Bei'einem System, das zwischen N Alphabeten unterscheiden muss, wird dieser Zugriffsprozess N-mal durchgeführt. Die drei logisch separaten P_Mr„-Spei eher

WA9-75-001 - 31 -

7098177 0678

der Fig. 2 sind in den Speichern 35 bis 37 der Fig. 4 enthalten. Sie unterscheiden sich organisatorisch durch die Achse (d.h. Alphabet), von der ihre Ρ.,ρρ-Faktoren abhängen, indem nämlich die Achse α dem Speicher 35,, die Achse β dem Speicher 36 und die Achse γ dem Speicher 37. zugeordnet ist. Der Betriebsablauf der Anordnung nach Fig. 4 sieht vor, dass die Adressregister 25, 28 und 31 derjenigen Kanäle, auf denen die beste Uebereinstimmung festgestellt worden ist, die ihnen zugeordneten Speicher 35, 36 und 37 adressieren und auf diese Weise eine Speichergruppe der Dimension N-I bilden. Darauf wird eines der verbliebenen Adressregister 25, 28, 31 ausgewählt, die Achse seines nun logisch reduzierten Speichers abzufragen, bis eine Uebereinstimmung erzielt ist und die Dimension des betreffenden P „„-Speichers Aveiter logisch um eine Dimension zu reduzieren. Dieser Prozess wird rekursiv für jedes der Adressregister durchgeführt. Bei jeder Uebereinstimmung wird die Dimension des zugeordneten P „-Speichers um einen Grad ernierdrigt. Das ergibt sich mit Fig. 2 als die Zurückführung von einem Würfel (dreidimensionaler Speicher) auf eine Fläche (zweidimensionaler Speicher), und von einer Fläche auf eine Linie (eindimensionaler Speicher). Das letzte Adressregister führt eine einfache eindimensionale Nachschlagoperation durch, die mit der Ausgabe des betreffenden P_Mrr~ Wertes endet. Im Sinne des geschilderten geometrischen Vergleichs

WA9-75-001 - 32 -

70981 7/067S

entspricht dies der Wahl eines Punktes auf einer Linie.

Die P.,„„-Faktoren sind in einem dreidimensionalen Speicher MCC ^r

35 bis 37 gespeichert. Die Wahrscheinlichkeitswerte im Speicher 35 entsprechen dem kyrillischen Zeichen R. und dem numerischen Zeichen N„, die von ihren entsprechenden Kanälen verkannt worden sind, vorausgesetzt, dass ein lateinischer Buchstabe E. tatsächlich abgetastet worden ist (oberes Teilbild der Fig. 2). Der P -Wert bezüglich der zusammengesetzten bedingten Wahrscheinlichkeit, dass ein numerisches Zeichen N und ein lateinisches Zeichen E. durch ihre entsprechende Kanäle verkannt worden sind, wenn ein kyrillisches Zeichen R. tatsächlich abgetastet wurde, ist im Speicher gespeichert (mittleres Teilbild der Fig. 2). Entsprechend enthält der Speicher 37 die Werte, die sich auf die zusammengesetzte bedingte Wahrscheinlichkeit beziehen, dass ein kyrillisches Zeichen R. und ein lateinisches Zeichen E. durch ihre entsprechenden Kanäle verkannt worden sind, wobei vorausgesetzt ist, dass tatsächlich ein'numerisches Zeichen N„ abgetastet worden ist (unteres Teilbild der Fig. 2) .

Die im Speicherausgaberegister 38 sequentiell gespeicherten Werte der zusammengesetzten bedingten Wahrscheinlichkeiten P werden sequentiell in einem Multiplikator 39 multipliziert

WA9-75-001 - 33 -

709817/0676

Der Multiplikationsprozess läuft kontinuierlich ab, bis die Produkte aller dem lateinischen Alphabet zugeordneten zusammengesetzten bedingten Wahrscheinlichkeiten für das im Schieberegister 24 stehende lateinische Zeichenfeld berechnet worden sind. Das Ende der Multiplikation wird durch Prüfung der Eingangszelle 32 des Schieberegisters 24 auf eine Leerstelle festgestellt. In gleicher Weise wird für jedes der übrigen Zeichenfelder und die ihnen zugeordneten Wahrscheinlichkeiten in den Ausgaberegistern 40 und 41 das Produkt der zusammengesetzten bedingten Wahrscheinlichkeiten Ρι«ρ_Γ durch die Multiplikatoren 42 und 43 sequentiell berechnet und in Speichern 44 und 45 gespeichert. Das Ende eines jeden Feldes wird von der Eingangszelle 32 des Schieberegisters 24 festgestellt. Das Produkt der bedingten Wahrscheinlichkeiten für das lateinische Alphabet, das im Speicher 46 gespeichert ist, wird auf das Register 47 übertragen und die Produkte der übrigen Wahrscheinlichkeiten, die in den Speichern 44 und 45 gespeichert sind, werden in die Register 48 und 49 übertragen. Der Inhalt der Register 47, 48 und 49 wird mittels eines Vergleichers 50, der N = 3 Kanäle aufweist, auf relative Grosse verglichen.

Falls beispielsweise die bedingte Wahrscheinlichkeit des lateinischen Zeichens grösserist, bedeutet das, dass die numerischen

WA9-75-001 - 34 -

709817/0676

Zeichen auf der Leitung 39 und die kyrillischen Zeichen auf der Leitung 37 besser verträglich sind mit der Annahme, dass ein lateinisches Zeichen (Leitung 14) abgetastet und als numerisch bzw. kyrillisch verkannt worden ist, als umgekehrt. Mit anderen Worten sind die lateinischen Zeichen besser verträglich mit der Annahme, dass numerische oder kyrillische Zeichen abgetastet und als lateinische Zeichen verkannt wurden Wenn die Wahrscheinlichkeit grosser ist, dass das abgetastete Wort dem im Schieberegister 24 gespeicherten lateinischen Zeichenfeld entspricht, wird der Vergleicher 50 einen Schalter 51 betätigen, so dass das lateinische Zeichenfeld aus dem Schieberegister 24 in das Ausgangsregister 52 übertragen und auf der Ausgangsleitung 53 für die Weiterverarbeitung zur Verfugung gestellt wird. In den Ausgangsdatenstrom kann über die Leitung 54 ein Kennzeichen für das lateinische Alphabet eingefügt werden.

Wenn das Produkt der den numerischen Zeichen zugeordneten zusammengesetzten bedingten Wahrscheinlichkeiten im Register

49 grosser ist als das Produkt der in den Registern 47 und gespeicherten Wahrscheinlichkeiten, betätigt der Vergleicher

50 einen Schalter 55, wodurch das im Register 30 gespeicherte numerische Zeichenfeld über das Ausgangsregister 52 auf die Ausgangsleitung 53 zur Uebertragung und Weiterverarbeitung

WA9-75-001 - 35 -

709817/0676

ausgegeben wird. Ein Kennzeichen für das numerische Alphabet kann dabei von einem Kennzeichengenerator 56 über die Leitung 54 in den Ausgangsstrom auf der Leitung 53 eingefügt werden.

Falls die dem kyrillischen Alphabet zugeordnete, im Register 48 gespeicherte Wahrscheinlichkeit grosser ist als das Produkt der Wahrscheinlichkeiten für die numerischen und lateinischen Alphabete in den Registern 47 und 49, schaltet der \fergleicher 50 den Schalter 57, wodurch das kyrillische Zeichenfeld aus dem Register 27 auf das Ausgangsregister 52 und die· Ausgangsleitung 53 geschaltet wird.

Der bisher beschriebene Diskriminator kann ohne Abweichung vom Erfindungsgedanken modifiziert werden, um die gleiche Art der Unterscheidung beispielsweise zwischen verschiedenen Schriftarten der gleichen Kategorie oder zwischen handgeschriebenen und maschinengeschriebenen Zeichen auszuführen. Gemäss den Fig. 2 und 4 ist die Arbeitsweise des Diskriminators im allgemeinen derart, dass für ein lateinisches Zeichen "G" auf der α-Achse (Leitung 14), das kyrillische Zeichen auf der ß-Achse (Leitung 16) ein " fl" und das Zahlzeichen auf der γ-Achse (Leitung 18) eine "4" ist, die Speicher 35, 36 und 37 die Matrizen 1, 58 und 59 der zusammengesetzten Wahrscheinlichkeiten in die zugeordneten zweidimen-

WA9-75-001 - 36 -

709817/0678

2640S37

sionalen Arbeitsspeicher 60, 61 und 62 übertragen. Dann veranlasst der Arbeitsspeicher 60, dem über die Leitung 63 das 3 = Ά -Zeichen zugeführt wird, den Zugriff zu einer Spalte von Wahrscheinlichkeitswerten in der Matrix 1 und deren Uebertragung in den eindimensionalen Arbeitsspeicher 64. Entsprechend wird das y=4-Zeichen auf der Leitung 65 den Wahrscheinlichkeitswert in der Matrix 1 aus dem Speicher 64 abrufen und zum Ausgaberegister 38 übertragen. Diese singuläre Wahrscheinlichkeit ist in der Matrix 1 am Schnittpunkt der ß- und γ-Achsen für die entsprechenden Werte " Ά" und "4" gespeichert. In gleicher Weise erfolgt der Zugriff zu den zweidimensionalen Speichern 61 und 62 durch die α- und γ-Zeichen über die Leitungen 66 und 67, um einen Satz eindimensionaler Wahrscheinlichkeitswerte aus den Matrizen 58 und 59 abzurufen und in die eindimensionalen Arbeitsspeicher 68 und 69 zu übertragen. Die γ- und α-Zeichen auf den Leitungen 70 und 71 veranlassen die Uebertragung der singulären Wahrscheinlichkeitswerte von den Matrizen 58 und in die Register 40 und 41. Wie bereits erwähnt, werden die Werte P_Mrr der zusammengesetzten bedingten Wahrscheinlichkeiten, die sequentiell in den Registern 38, 40 und 41 gespeichert sind, sequentiell in den ihnen zugeordneten Multiplikatoren 39, 42 und 43 multipliziert. Der Multiplikationsprozess läuft kontinuierlich, bis das Produkt aller bedingten Wahrscheinlichkeiten für die in den Schieberegistern 24, 27 und 30 gespeicherten

WA9-75-001 - 37 -

7098177 0676

lateinischen, kyrillischen und numerischen Felder berechnet ist. Der Vergleicher 50 ermittelt dann, welches der Produkte das grösste ist und betätigt einen der Schalter 51, 57 oder 55, um die Uebertragung der Zeichen des korrekten Zeichenfeldes an das Ausgangsregister 52 zu gestatten. Die Rückstellung aller Speicher erfolgt durch einen Rückstellkreis

WA9-75-001 - 38 -

709817/0676

Claims

PATENTANSPRÜCHE

Verfahren zum Unterscheiden zwischen N>2 Alphabeten angehörende Zeichen, die in einem von einem Zeichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen, wobei jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmt, gekennzeichnet durch die Verfahrensschrittc: Speichern eines Wertes der bedingten Wahrscheinlichkeit, dass ein bestimmtes Zeichen eines Alphabets vom Zeichenleser angegeben wurde, wenn aber Zeichen eines anderen Alphabets abgetastet wurden, in jedem von mit den N Ausgabeleitungen \rerbundenen N Speichern, Abrufen aus den N Speichern von N Werten von bedingten Wahrscheinlichkeiten, dass jedes auf einer Ausgabeleitung angegebene Zeichen eines Alphabets durch den Zeichenleser falsch erkannt und daher fälschlich auf einer der anderen Ausgabeleitungen angegeben worden ist, Multiplizieren aller abgerufenen N Werte der bedingten Wahrscheinlichkeiten gesondert für jedes der vom Zeichenleser über die N Ausgabeleitungen angegebenen Alphabete, um Produkte der entsprechenden bedingten Wahrscheinlichkeiten zu entwickeln, und

Vergleichen in einem Vergleicher der Grossen jedes der N Produkte der bedingten Wahrscheinlichkeiten, um das möglicherweise zutreffende der vom Zeichenleser ange-

WA 975 001 - 39 -

709817/0678

ORiQiNAL INSPECTED

gebenen Zeichen mit demjenigen Produkt der bedingten Wahrscheinlichkeiten zu korrelieren, welches den grössten Wert aufweist.
2. Verfahren nach Patentanspruch 1, zum Unterscheiden zwischen zu zwei Buchstabenalphabeten und zu einem Zahlzeichenalphabet gehörenden Zeichen eines Zeichenfeldes, wobei über eine erste Ausgabeleitung mit dem ersten Buchstabenalphabet bestmöglich übereinstimmende Zeichen ausgegeben werden, über eine zweite Ausgabeleitung mit dem zweiten Buchstabenalphabet bestmöglich übereinstimmende Zeichen und über eine dritte Ausgabeleitung mit dem Zahlzeichenalphabet bestmöglich übereinstimmende Zeichen ausgegeben werden, dadurch gekennzeichnet, dass in den drei Ausgabeleitungen zugeordneten Speichern den Zeichen ihrer Alphabete entsprechende bedingte Wahrschein]ichkeitswerte gespeichert werden, die für jedes vom Zeichenleser über eine Ausgabeleitung gelieferte Zeichen eines Alphabets angeben, mit welcher Wahrscheinlichkeit gleichzeitig die möglichen Kombina-

tionen der Zeichen der beiden anderen Alphabete über die diesen zugeordneten Ausgabeleitungen geliefert werden, wenn tatsächlich ein zu diesen anderen Alphabeten gehörendes Zeichen abgetastet wurde,

Abrufen der gespeicherten bedingten Wahrscheinlichkeitswerte aus den drei Speichern durch eine je einem abgetasteten Zeichen

WA 975 001 - 40 -

709817/0670

entsprechende Zeichentriade schrittweise für alle Zeichen des Zeichenfeldes,

iteratives Multiplizieren aller einem Alphabet zugeordneten, abgerufenen bedingten Wahrscheinlichkeitswerte miteinander getrennt für alle drei Alphabete, zum Ermitteln eines Wertes der bedingten Gesamtwahrscheinlichkeit, dass alle dem einen der Alphabete zugeordneten Zeichen falsch erkannt worden sind als den jeweils anderen Alphabeten zuzuordnende Zeichen, und Vergleichen der ermittelten Werte der drei Gesamtwahrscheinlichkeiten und Durchschalten derjenigen Ausgabeleitung, über welche die Zeichen ausgegeben werden, denen jeweils der grösste Wert der Gesamtwahrscheinlichkeit zugeordnet ist.
3. Vorrichtung zur Durchführung der Verfahren nach Anspruch 1 und/oder 2, dadurch gekennzeichnet, dass die N Speicher je einen ersten N-dimensionalen Speichersektor (35, 36, 37) einen zweiten (N-i)-dimensionalen Speichersektor (60, 61, 62), usw., bis einen letzten (N-n=1)-dimensionalen Speichersektor (64, 68, 69) umfassen, wobei jeweils der Speichersektor mit der niedrigeren Dimension an den Speichersektor der nächsthöheren Dimension sowie an ein Adressregister (25, 28, 31) angeschlossen ist, mit dem die Speichersektoren der höheren Dimensionen des gleichen Speichers nicht verbunden sind, dass die 1-dimensionalen Speichersektoren (64, 68, 69) über Ausgaberegister (38, 40, 41) mit den Multiplikatoren (39, 42, 43) verbunden sind, und dass alle Speichersektoren (35, 36, 37; 60, 61, 62; 64, 68, 69) als Festwertspeicher ausgebildet sind, in denen Tabellenwerte bedingter Wahrscheinlichkeiten in Form von Matrizen gespeichert sind, deren Dimension durch die Dimension des betreffenden Speichersektors bestimmt ist.

' · WA 975 001 - 41 -