DE2640537A1 - Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen - Google Patents

Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen

Info

Publication number
DE2640537A1
DE2640537A1 DE19762640537 DE2640537A DE2640537A1 DE 2640537 A1 DE2640537 A1 DE 2640537A1 DE 19762640537 DE19762640537 DE 19762640537 DE 2640537 A DE2640537 A DE 2640537A DE 2640537 A1 DE2640537 A1 DE 2640537A1
Authority
DE
Germany
Prior art keywords
character
characters
alphabet
alphabets
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19762640537
Other languages
English (en)
Inventor
Philip Joseph Mullan
Walter Steven Rosenbaum
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE2640537A1 publication Critical patent/DE2640537A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

Verfahren und Vorrichtung zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen.
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen, die in einem von einem Zeichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen. Dabei soll jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmen.
Optische Zeichenerkennungsvorrichtungen dienen zum Erkennen von in schriftlicher z.B. gedruckter oder handgeschriebender Form vorliegenden Daten und zum Einlesen dieser Daten in binär codierter Form in eine datenverarbeitende Anlage. Bei
7Q9817/067&
Zeichensymbolen, die aus Ziffern, Buchstaben und sonstigen Zeichen gemischt sind, ist es ausserordentlich wichtig, dass deren Bedeutung klar erkannt wird. Dazu gehört zunächst die Unterscheidung, welchem der Alphabete, für die der Zcichenleser eingerichtet ist, ein abgetastetes Zeichen angehört. Aus dem Schweizer Patent 578.216 und dem USA Patent 3.842.402 sind ein Verfahren und eine Vorrichtung zum Unterscheiden zwischen Zahlzeichen und Buchstaben bekannt, wobei eine Zeichenerkennungsvorrichtung mit zwei Kanälen verwendet wird. In dem einen Kanal wird jedes optisch gelesene Zeichen als ein zu erkennendes alphabetisches Zeichen betrachtet, während im anderen Kanal jedes gelesene Zeichen als ein numerisches Zeichen betrachtet wird. Die daraus resultierenden Datenströme werden parallel verarbeitet, wobei ihre vertikale Redundanz nach wahrscheinlichkeitstheoretischen Methoden ermittelt wird. Nach Bayes kann die bedingte Wahrscheinlichkeit von Ereignissen bestimmt werden, welche sich paarweise gegenseitig ausschliessen, wie z.B. das Lesen eines Zeichens als Ziffer oder als Buchstabe.
Verfahren und Vorrichtungen, die eine Unterscheidung zwischen zu mehr als zwei Alphabeten gehörenden Zeichen gestatten (N>2) sind bisher nicht bekannt geworden. Zweck der vorliegenden Erfindung ist daher, hier Abhilfe zu schaffen. Demnach betrifft
WA9-75-001 - 2 -
709817/0670
die vorliepende Erfindung ein Verfahren zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen, die in einem von einem Zcichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen, wobei jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmt. Das Verfahren ist gekennzeichnet durch die Vorfahrensschritte:
Speichern eines Wertes der bedingten Wahrscheinlichkeit, dass ein bestimmtes Zeichen eines Alphabets'vom Zeichenleser angegeben wurde, wenn aber Zeichen eines anderen Alphabets abgetastet wurden, in jedem von mit den N-Ausgabeleitungen verbundenen N Speichern, Abrufen aus den N Speichern von N Werten von bedingten Wahrscheinlichkeiten, dass jedes auf einer Ausgabeleitung angegebene Zeichen eines Alphabets durch den Zeichenlcser falsch erkannt und daher fälschlich auf einer der anderen Ausgabeleitungen angegeben worden ist, Multiplizieren aller abgerufenen N Werte der bedingten Wahrscheinlichkeiten gesondert für jedes der vom Zeichenleser über die N Ausgabeleitungen angegebenen Alphabete, um Produkte der entsprechenden bedingten Wahrscheinlichkeiten zu entwickeln, und
WA9-75- 01 - 3 -
709817/067$
ι-
Vergleichen in einem Verglcicher der Grossen jeder der N Produkte der bedingten Wahrscheinlichkeiten, um das zutreffende der vom Zeichenleser angegebenen Zeichen mit demjenigen der Produkte der bedingten Wahrscheinlichkeiten zu korrelieren, welches den grössten Wert aufweist.
Ferner betrifft die Erfindung eine Vorrichtung zum Ausführen des vorgenannten Verfahrens, mit einem ein Zeichenfeld abtastenden optischen Zeichenleser mit N>2 Ausgabcleitungen, die je einem von N>2 Alphabeten zugeordnet sind, mit N von N Adressregistern ansteuerbaren Speichern für Tafclwerte bedingter Wahrscheinlichkeiten, mit N>2 Multipliziereinrichtungen, die mit den Speichern verbunden sind und mit einem an die Ausgänge der Multipliziereinrichtungen angeschlossenen •Vergleicher, welche Vorrichtung dadurch gekennzeichnet ist, dass die N Speicher je einen ersten N-dimensionalen Speichersektor, einen zweiten (N-I)-dimensionalen Speichersektor usw, bis einen letzten (N-n=l)-dimensionalen Speichersektor umfassen, wobei jeweils der Speichersektor mit der niedrigeren Dimension an den Speichersektor der nächsthöheren Dimension sowie an ein Adressregister angeschlossen ist, mit dem die Speichersektoren der höheren Dimensionen des gleichen Speichers nicht verbunden sind, dass die 1-dimensionalen Speichersektoren über Ausgaberegister mit den Multiplikatoren verbunden
WA9-75-001 - 4 -
70981 7/067S
sind, und dass alle Speichersektoren als Festwertspeicher ausgebildet sind, in denen Tabellenwerte bedingter Wahrscheinlichkeiten in Form von Matrizen fest gespeichert sind, deren Dimension durch die Dimension des· betreffenden Speichersektors bestimmt ist.
Die Vorteile der Erfindung sind in ihrer Fähigkeit zu sehen, zwischen drei und mehr Zeichensätze unterscheiden zu können.
Einzelheiten des erfindungsgemässen Verfahrens und eines Ausführungsbeispiels einer Vorrichtung zum Ausführen des Verfahrens werden nachstehend anhand der Zeichnungen erläutert. In den Zeichnungen zeigen:
Fig. 1 Paare und Triaden von miteinander verwechslungsfähigen Zeichen verschiedener Alphabete;
Fig. 2 schematisch Speichermatrizen mit bedingten Wahrscheinlichkeitswerten für einen dreikanaligen Diskriminator, der für die Unterscheidung zwischen lateinischen, kyrillischen und numerischen Zeichen eingerichtet ist;
Fig. 3 ein Blockschaltbild eines dreikanaligen Zeichenlesers,
Fig. 4+5 zusammengesetzt ein Blockschaltbild eines dreikanaligen Diskriminators.
WA9-75-001 - 5 -
709817/0670
Die alphabetischen Symbole, die für die Schreibung der meisten europäischen Sprachen angewandt werden, haben sich aus einer geschriebenen Repräsentation von Sprachlauten entwickc]t, die auf die Griechen zurückgeht, während die in allen europäischen Sprachen benutzte Schreibung der Zahlzeichen von den Arabern erfunden worden ist. Mit wenigen Ausnahmen erfolgte die Entwicklung der Zeichen des Alphabets und der Zahlzeichen unabhängig voneinander. Das hat dazu geführt,-dass für alphabetische und numerische Zeichen identische oder sehr ähnliche Symbole verwendet werden. In ähnlicher Weise haben sich beispielsweise auch die alphabetischen Zeichen der russischenkyrillischen Schrift bzw. des japanischen Kanji-Alphabets unabhängig entwickelt und benutzen einige Zeichen, die denen der lateinischen Schrift ähnlich sind. Beispiele für derartige geometrische Aehnlichkeiten können jeder Konkordanztabelle von Alphabeten entnommen werden.
Vergleichbare Verhältnisse liegen vor bei der Aehnlichkeit im Aussehen von korrespondierenden Zeichen in verschiedenen Schriftarten wie beispielsweise "A" in der Schriftart "Advocate" im Vergleich mit dem Zeichen "A" der Schriftart "Script". (Einzelheiten dieser Schriftarten sind in diesem Zusammenhang ohne Belang, es genügt, dass sie unterschiedlich sind.) Wenn der Benutzer (d.h. Leser) der Zeichensymbole ein Mensch ist,
WA9-75-001 . - 6 -
709817/067^
kann er bei der Analyse des Zusammenhangs und der alphabetischen Form, in welcher das betreffende Zeichen erscheint, seinen Scharfsinn anwenden und dabei die Wahrscheinlichkeit reduzieren, dass'die vom Schreiber beabsichtigte Bedeutung beeinträchtigt wird. Mit der Einführung von maschinellen optischen Zeichenlesern für das Lesen von Daten von gedruckten, mit der Schreibmaschine geschriebenen oder handgeschriebenen Dokumenten wird die verwirrende Aehnlichkeit zwischen Zeichen verschiedener Alphabete, Schriftarten und numerischer Symbole besonders kritisch.
In der Fig. 1 ist der Fall eines drei Kanäle aufiveisenden optischen Zeichenlesers gezeigt, der ein Beispiel von gemischten lateinischen, kyrillischen und numerischen Zeichen zu lesen hat, die verschiedene Kategorien von alphanumerischen Problempaaren und -triaden darstellen. Es ist einleuchtend, dass die Unterschiede zwischen den einzelnen Kategorien nicht immer klar hervortreten. Obwohl Verwechslungsmöglichkeiten, wie die in der Figur dargestellten, nicht dauernd auftreten, kommen sie doch oft genug vor, um die Zurückführung eines gedruckten, maschinengeschriebenen oder handgeschriebenen Textes auf eine computerbezogene Datenbasis ernsthaft zu behindern. Die Fig. 1 zeigt Verwechslungsmöglichkeiten zwischen dem Zahlzeichen "0" und dem Buchstaben "OM, dem Zahl-
WA9-75-001 - 7 -
10 9 8 1 7 / 0 6 7 $
zeichen "1" und dem Buchstaben "1", die in einer Umgebung, in der viele verschiedene Schriftarten vorkommen, gewöhnlich nicht unterscheidbar sind. Das gleiche gilt für die Zeichenpaare "5" und den Buchstaben "S", das Zahlzeichen "2" und den Buchstaben "Z", das lateinische "!?" und den kyrillischen Buchstaben "III", sowie die Buchstaben "Y" und "q", die topologisch ähnlich und daher nur durch die Schärfe der Ecken unterscheidbar sind, was jedoch eines der Merkmale ist, die als erste verschwinden, wenn die Druckqualität nachlässt. Aehnliches gilt für die Zeichentriaden mit dem Zahlzeichen "6" und den Buchstaben 11G" und "L· ", dem Zahlzeichen "8" und den Buchstaben "B" und "3", dem Zahlzeichen "9" und den Buchstaben "g" und "H", die ebenfalls nur in sehr untergeordneten topologischen Merkmalen voneinander abweichen, die bereits bei leichtem Nachlassen der Druckqualität verschwinden. Entsprechendes gilt für die Triaden mit dem Zahlzeichen "4" (oben offen) und den Buchstaben "H" und "H", dem Zahlzeichen "4" (oben geschlossen) und den Buchstaben "A" und "A", dem Zahlzeichen "7" und den Buchstaben "Y" und " <I ", dem Zahlzeichen "8" und den Buchstaben "S" und "b", und dem Zahlzeichen "8" und den Buchstaben "e" und "E", die sich zwar etwas besser unterscheiden, als aus der Fig. 1 hervorgeht, die jedoch bei der in maschinengeschriebenem Text üblichen Qualität gelegentlich verwechselt werden. Schliess-
WA9-75-a01 ' - 8 -
709817/067S
lieh sind in der Fig. 1 noch weitere vier Triaden angegeben, die das Zahlzeichen "7" und die Buchstaben "T" und "Γ", das Zahlzeichen "0" und die Buchstaben "N" und "Φ", das Zahlzeichen "0" und die Buchstaben "C" und "C", das Zahlzeichen "9" und die Buchstaben "U" und "Jl" umfassen, die sich, durch Merkmale unterscheiden, die bei schlanken Schriftarten wenig ausgeprägt sind, oder weil die Vorrichtung zum Trennen der Zeichen im Zeichenleser nicht einwandfrei funktioniert.
Der Schlüssel zur zuverlässigen Textverarbeitung ist die Fähigkeit, leicht und sicher in der Voranalyse der Ausgabe des Zeichenlesers Felder von zu verschiedenen Alphabeten gehörenden Zeichen gegeneinander abzugrenzen. Die zuverlässige Unterscheidung zwischen Feldern von zu verschiedenen Alphabeten gehörenden Zeichen in einer Umgebung, in der tatsächlich verschiedene Alphabete vorkommen, ist ein sehr komplizierter Vorgang, was darauf zurückzuführen ist, dass die meisten modernen Schriftarten unabhängig voneinander entwickelt worden sind, wobei kein Versuch gemacht wurde, die gegenseitige Verwechselbarkeit auszuschliessen. Daher kommen in vielen verschiedenen Alphabeten die gleichen fundamentalen geometrischen Formen vor. Daher kann es vorkommen, dass bei einem dreikanaligen Zeichenleser viele geläufige alphabetische Wörter, die aus dem lateinischen Alphabet
WA9-75-001 - 9 -
709817/067$
gebildet sind, teilweise oder ganz als numerische oder kyrillische Felder verkannt werden. Beispiele derartiger Verkennungen sind "South" in "80478", "804TH" oder "bOUTH", "Third" in. "781rd", und "BEJlH11 in "BEAN" oder "88th". Das Problem bei der Unterscheidung von Zeichenfeldern beruht insbesondere darauf, dass reale oder vorgebliche Ketten von Zeichen sich nicht für die Methoden der direkten Analyse des Textzusammenhangs anbieten. Beispielsweise ist ein numerisches Feld vollkommen nicht-redundant, da jeder Satz von numerischen Zeichen einen sinnvollen Datensatz darstellen kann.
In bekannten zweikanaligen Zeichenlesesystemen, ausgenommen die in den USA-Patenten 3,839,702 und 3,842,402 beschriebenen, wird die endgültige Unterscheidung alphabetisch/numerisch jedes Zeichenfeldes durch einen Ausschliessungsprozess erreicht Dieser verlangt, dass ein alphabetischer Erkennungsstrom, der jedem Feld oder Unterfeld entspricht, auf Uebereinstimmung mit einem gespeicherten Wörterbuch von zulässigen empfangenen Daten geprüft wird, die im voraus bekannt sind. Alle Felder oder Ünterfelder, die keine Uebereinstimmung ergeben, werden als numerisch bezeichnet. Bei einer Anwendung, wie beispielsweise der Verarbeitung von Postsendungen oder bei der Textverarbeitung, ist dieses Vorgehen nicht möglich, da das Wörterbuch von zulässigen empfangenen Daten exzessiv gross
WA9-75-001 - 10 -
709817/067$
sein müsste und die für die vielen erforderlichen Zugriffe zu dem Wörterbuch nötige Zeit prohibitiv lang wäre. Daher ist dieses Vorgehen auch nicht geeignet für ein Vielkanalsystem, d.h. ein System mit mehr als zwei Kanälen.
Der hier benutzte Begriff "Alphabet" soll verstanden werden als ein in vereinbarter Reihenfolge geordneter Zeichenvorrat, beispielsweise die Buchstaben des lateinischen Alphabets oder die Zahlzeichen, sowie jeden von den anderen verschiedenen Satz von Buchstabenzeichen einer Schriftart oder Schriftgrösse.
Der zu beschreibende Vielkanal-Zeichenerkennungs-Diskriminator führt einen Alphabet-Entscheidungsprozess zwischen drei oder mehr Ketten von Zeichen aus, die von einem optischen Zcichenleser ausgegeben werden. Er gehört zu einem System, das einen optischen Zeichenleser umfasst, der eine Kette von Zeichen in einem Zeichenfeld abtastet, Mittel für die Ausgabe auf einer einem ersten Alphabet (z.B. lateinisches Alphabet) zugeordneten Leitung, auf der Zeichen ausgegeben werden, die möglichst genau dem ersten Zeichenalphabet entsprechen, entsprechende Mittel für die Ausgabe auf einer zweiten Ausgabeleitung, die einem zweiten Alphabet (z.B. kyrillisches Alphabet) zugeordnet sind und Mittel für die Ausgabe auf einer dritten Ausgabe-
WA9-75-001 - 11 -
709817/067$
2640S37
leitung, die einem weiteren Alphabet zugeordnet ist, usw., bis zu Mitteln für die Ausgabe auf einer η-ten Ausgabeleitung, die einem numerischen Zeichenvorrat zugeordnet ist.
Ein erstes Speicher-Adressregister ist mit der ersten Ausgabeleitung verbunden und speichert sequentiell jedes alphabetische Zeichen des Zeichenfeldes, das auf der ersten Ausgabeleitung erscheint. Entsprechend sind weitere Speicher-Adressregister den übrigen Ausgabeleitungen zugeordnet, bis hin zur n-ten Ausgabeleitung für die numerischen Zeichen, die auf der n-ten Ausgabeleitung ausgegeben werden.
Weiter sind Speicher vorgesehen, die mit jedem der erwähnten Speicher-Adressregister verbunden sind, und in denen ein Satz von N-dimensionalen Matrizen von zusammengesetzten bedingten Wahrscheinlichkeiten, die eine quantisierte Aussage darüber liefern, dass, wenn der Zeichenleser ein Zeichen dem ersten Alphabet zugeordnet hat, gewisse damit im Zusammenhang aufgetretene Zeichen für alle Kombinationen, in denen sie mit Zeichen anderer Alphabete aufgetreten sind, falsch erkannt wurden. Entsprechende zusammengesetzte bedingte Wahrscheinlichkeiten sind für jedes Alphabet in dem Speicher gespeichert, zu dem Zugriff möglich ist mittels einer N-dimensionalen Adresse, die eindeutig durch den Inhalt der aufeinanderfolgen-
WA9-75-001 - 12 -
709817/067$
den Speicher-Adressregister gebildet wird, um die zusammengesetzte bedingte Wahrscheinlichkeit zu ergeben, dass das im ersten Speicher-Adressregister gespeicherte Zeichen des ersten Alphabets vom Zeichenleser als das spezifische Zeichen des zweiten Alphabets \'erlesen worden Ist, das im zweiten Speicher-Adressregister gespeichert ist und als das spezifische Zeichen des dritten Alphabets, welches im dritten Speicher-Adressregister gespeichert ist, usw., je nach Anzahl .der dem System zugänglichen Alphabete.
Der Zugriff zum Speicher liefert für jedes im ersten Adressregister stehende Zeichen über einen Multiplikator das Produkt der zusammengesetzten bedingten Wahrscheinlichkeiten für das erste Alphabet. Entsprechend werden die Produkte der zusammengesetzten bedingten Wahrscheinlichkeiten für die in den übrigen Adressregistern stehenden Zeichen für die übrigen Alphabete entwickelt. Mit dem Multiplikator ist ein Vergleicher verbunden, der die Grossen der Produkte der Wahrscheinlichkeiten miteinander vergleicht. Das Ausgangssignal des Vergleichers schaltet diejenige Ausgangsleitung des Zeichenlesers durch, für die das grösste Produkt ermittelt x^orden ist, wodurch das korrekte Alphabet für den Zweck der Datenübertragung ausgewählt wird.
WA9-75-001 - 13 -
709817/067S
Auf diese Weise ist der zu beschreibende Vielkanal-Diskriminator imstande, zwischen einer Vielzahl von alphabetischen und numerischen Zeichenfeldern zu unterscheiden, die von einem Zeichenleser abgetastet worden sind, ohne dass der Diskriminator von einem gespeicherten Wörterbuch zulässiger, im voraus bekannter empfangener Daten Gebrauch machen muss. Dementsprechend kann die Alphabetunterscheidung nach Stil, Form oder Schriftart in wesentlich kürzerer Zeit erfolgen, als das bisher möglich war.
Zum besseren Verständnis des Verfahrens der Diskrimination zwischen verschiedenen Alphabeten sind einige theoretische Ueberlegungen erforderlich. Das Verfahren der Vielkanal-Erkennungs-Diskrimination sucht die Unterscheidung zwischen den Alphabeten durch Zuordnung einer gewissen Form von Quasi-Redundanz zu einem Zeichenfeld zu erreichen. Redundanz im Sinne des Textzusammhangs bedeutet, dass zwischen dem Vorhandensein eines Zeichens und einem anderen eine Abhängigkeit besteht. Normalerweise wird Text-Redundanz in horizontaler Richtung zwischen den Zeichen auf einer Zeile und innerhalb eines Wortes angenommen. Ein Beispiel für dieses Konzept ist die Digramm-Statistik. Diese Wahrscheinlichkeiten der Nebeneinanderstellung von Zeichen erlaubt die Vorhersage von wahrscheinlich folgenden Zeichen aufgrund der Kenntnis der
WA9-75-001 - 14 -
709817/0676
vorhergehenden Zeichen. Daher würde in der Buchstabenfolge "SPRI-G" wahrscheinlich "N" beispielsweise gegenüber "Z" bevorzugt, um die freie Position zu füllen. Dieser Sachverhalt ist begrifflich und mathematisch in den bereits erwähnten USA-Patenten 3,839,702 und 3,842,402 erläutert.
Obwohl für numerische Zeichenfelder eine horizontale Redundanz nicht gegeben ist, existiert eine Redundanz von einer speziellen vertikalen Natur. Beispielsweise kann beim Abtasten eines Artikels über "President Gerald Ford 1600 Pennsylvania ..." in einer russischen Zeitung mittels eines dreikanaligen Zeichenlesers das folgende Ergebnis erhalten werden, wobei "*" bedeutet, dass eine Erkennung nicht möglich war:
1. alphabetischer Kanal: PRESI*ENT GE*ALD FORD 1*00
2. alphabetischer Kanal: ΡΒΕΒ*ΓΕΜΓ CEPA*fl *O** *bOO numerischer Kanal: 4*840*457 68*4*0 *0*0 1600
Hier ist ein Konzept der vertikalen Redundanz entwickelt worden, das einen Zusammenhang herstellt zwischen der Erkennung eines Zeichens in einem Kanal mit einem Satz von möglichen Verkennungen in den anderen Kanälen. Die fundamentale Grosse, auf welcher die Diskrimination beruht, ist die so-
WA9-75-001 - 15 -
709817/067S
genannte Vielkanal-Verwechslungs-Wahrscheinlichkeit Ρ»«Γρ· Die allgemeine Form der Verwechslungs-Wahrscheinlichkeit
worin α,β,ψ, usw die verschiedenen Alphabete oder Schriftarten bedeuten, über die der Vielkanal-Zeichenleser eine Erkennung durchführt. Die Indizes i, j, k, usw. repräsentieren die zulässigen Zeichenerkennungen in jedem der entsprechenden Alphabete, wobei natürlich vorausgesetzt ist, dass für jedes zugelassene Alphabet ein unabhängiger Erkennungskanal und die zugehörige Logik vorhanden sind. Gleichung (1) drückt die Wahrscheinlichkeit der Beobachtung einer gleichzeitigen Erkennung von ou im α-Kanal, ß. im ß-Kanal, ... und ir, im TT-Kanal aus, wobei angenommen ist, dass ein Feld im γ-Alphabet tatsächlich abgetastet wurde und γ durch die zugeordnete Erkennungslogik erkannt wurde. Mit anderen Worten kann unter der Bedingung, dass γ aufgetreten ist, die Gleichung (1) über alle Zeichen in den α-, β-, γ-, .··, und π-Alphabeten ausgewertet werden. Das ergibt eine N-dimensionale Matrix von Wahrscheinlichkeitsfaktoren für die Möglichkeit, dass jedes Zeichen eines Alphabets durch die anderen N-I Erkennungskanäle als eine Kombination der ihnen zugeordneten Zeichen verkannt worden ist.
WA9-75-001 - 16 -
709817/067$
Das probabilistische Verhältnis, das in der Form der Gleichung (1) ausgedrückt ist, weicht mathematisch von den einen einzelnen Faktor umfassenden bedingten Wahrscheinlichkeiten ab, die in den Ausführungsbcispielen der USA-Patente 3,839,702 und 3,842,402 für Zweikanal-(a/numferisch)-Unterscheidung gezeigt sind und im allgemeinen Γ(α|γ) bezeichnet sind. Mit M.G. Kendall: "The Advance Theory of Statistics - Volume T", Charles Griffin & Co., Seite 301, und Tung Au:."Fundamentals of Systems Engineering Probabilistic Model", Addision Wesley, Seite 276, kann man zeigen, dass Ρ(α|γ) sich auf ein Regrcssions-Modell der Form:
α = E(a+by) (2)
bezieht, worin E für den erwarteten Wert steht und a und b Konstanten sind, die mittels Regressionsflächen mit minimiertem quadratischem Abstand lösbar sind. Beispielsweise bezieht sich der Ausdruck der zusammengesetzten bedingten Wahrscheinlichkeit PCa, B|y) auf:
Ρ(α, β|γ) ° Ρ(α|γ) · P(ß|a, γ) = E(a + by) · E(c + da + 1γ)
Vergleicht man die Elemente der Gleichungen (2) und (3), so ergibt sich, dass keine Kombination von einfachen bedingten Wahrscheinlichkeitsfaktoren einen Ausdruck liefern kann, der
WA9-75-001 - 17 -
709817/0676
* 2540537
die Entscheidungseigenschaften einer zusammengesetzten bedingten Wahrscheinlichkeit aufweist. Daher kann weder die in den genannten Patenten offenbarte Lehre noch die Benutzung der darin beschriebenen Mechanismen das gewünschte Resultat ergeben, das unter Benutzung des ii/eiter unten zu beschrciben-'den Ausführungsbeispiels einer Diskriminatorschaltung erzielt werden kann.
Für einen optischen Zeichenleser mit N Kanälen gibt es N-I zusätzliche zusammengesetzte bedingte Wahrscheinlichkeiten, die als Gegenstücke zur Gleichung (1) für die anderen Erkennungskanäle dienen. Jeder Ausdruck einer zusammengesetzten bedingten Wahrscheinlichkeit ist von dem zulässigen Erkennungs Alphabet eines anderen Kanals abhängig. Die entsprechenden Wahrscheinlichkeitsfaktoren werden für jeden Kanal als N-dimensionale Matrix gespeichert, deren Elemente die Erkennung in einem Alphabet in Beziehung setzen zur Möglichkeit, dass sein Video-Bild durch die anderen Erkennungskanäle verkannt wird. Dies ist graphisch in Fig. 2 dargestellt, worin die Konfiguration eines Wahrscheinlichkeitsfaktor-Speichers die Matrix Anordnungen für einen Diskriminator mit drei Kanälen zeigt.
WA9-75-001 . - 18 -
709817/0676
•In Fig. 2 ist die mit α bezeichnete Achse der Ausgabeleitung für das lateinische Alphabet zugeordnet, die mit β bezeichnete Achse ist der Ausgabeleitung für das kyrillische Alphabet zugeordnet und die mit γ bezeichnete Achse entsprechend der Ausgabcleitung für die numerischen Zeichen. Im oberen Teil der Fig. 2 ist gezeigt, dass ein vom Zeichenleser angebotener Buchstäbe des lateinischen Alphabets, der über die Ausgabeleitung α läuft, entsprechend vorgegebenen, Zusammengesetz ten bedingten Wahrscheinlichkeiten für alle Kombinationen von kyrillischen und numerischen Zeichen \rerkannt worden sein kann. Wenn beispielsweise der lateinische Buchstaben "G" vom Zeichenleser angeboten wird, stehen die zweidimensionalen Wahrscheinlichkeitswerte der Matrix 1 zur Verfügung. Wird über die Leitung β ein kyrillisches Zeichen "b" und über die Leitung γ ein Zahlzeichen "6" angeboten, wird der Wert der zusammengesetzten bedingten Wahrscheinlichkeit am Schnittpunkt β-γ abgefragt. Liefert der Zeichenleser auf der a-Ausgabeleitung eine "8", wird die zusammengesetzte bedingte Wahrscheinlichkeit am Schnittpunkt β = L/γδ abgefragt.
In ähnlicher Weise [mittleres Teilbild der Fig. 2) führt ein kyrillisches Zeichen " b" auf der ß-Leitung, ein lateinisches Zeichen "G" auf der α-Leitung und eine "6" auf der γ-Leitung zum Zugriff zur zusammengesetzten bedingten Wahrscheinlichkeit
WA9-75-001 - 19 -
709817/067$
am Schnittpunkt α-γ. Schliesslich führt eine "6" auf der γ-Leitung (unteres Teilbild der Fig. 2), ein lateinischer Buchstabe "G" auf der α-Leitung und ein kyrillischer Buchstabe ".£> " auf der ß-Leitung zum Zugriff zur zusammengesetzten bedingten Wahrscheinlichkeit am Schnittpunkt ß-ot.
Wenn ein Zeichenfeld abgetastet worden ist und wenigstens zwei Kanäle ein Ausgangssignal mit einer Erkennungsqualität liefern, die die Zugehörigkeit des Zeichenfeldes zu einem Alphabet zweifelhaft macht, wird der Diskriminator in Anspruch genommen und die P .,„,,-Matrizen abgefragt. Für jeden Kanal, bezüglich dessen die Zugehörigkeit des Zeichenfeldcs zweifelhaft ist, wird unter Benutzung der P.)rr-Faktoren ein Produkt entwickelt, das vom Ausgangssignals dieses Kanals abhängt und die entsprechenden Ausgangssignale der anderen Kanäle berücksichtigt. Die Entscheidung bezüglich der Zugehörigkeit des Zeichenfeldes zu einem Alphabet wird getroffen zugunsten desjenigen Kanals, auf den das PMp -Produkt mit der höchsten Wahrscheinlichkeit entfiel.
Die vorstehende Diskussion des Vielkanal-Erkennungs-Diskrimi-
nators im Zusammenhang mit einem N-Kanal-Zeichenleser ist
die allgemeinste Form, die sich denken lässt. Der Diskriminator
kann auch Anwendung finden im Zusammenhang mit einem japanischen
WA9-75-001 ' - 20 -
709817/0676
optischen Zeichenleser, der sowohlvdas Katakana-Alphabet wie auch das Romnji-Alphabet lesen kann. Da das Romnji-Alphabet auch die römischen und arabischen Zahlen enthält, verlangt der japanische Zeichenleser drei unabhängige Erkennungs-Kanäle. Dem Fachmann ist bekannt, dass Zeichenleser für Katakana- und Romnji-Zeichen bereits zum Stande der Technik gehören. Wenn die Erkennung im Mehrkanal-Betrieb erfolgt, lassen sich die zwischen den-Kanälen auftretenden Zeichenverwechslungen durch drei P. „-Gleichungen beschreiben. Wenn "K" das Katakana-Alphabet bedeutet und "R." und "Rn" den alphabetischen bzw. numerischen Teil des Romnji-Alphabets, lauten die P -Gleichungen wie folgt:
C j
PMCC
PMCC (V = p(% » K1 I R^) (5)
PMCC <V = P(K1' \
worin j, i und 1 Variable sind, die sich ändern über die zulässigen Zeichenidentifikationen der Erkennungsalphabete, zu denen sie gehören.
Die Gleichungen (4) bis (6) werden wie folgt angewandt, wenn ein Video-Bild- vorhanden ist: 1. ein Katakana-Symbol (hier mit "K" bezeichnet), 2. das Romnji-Zahlzeichen "7"
WA9-75-001 - 21 -
709817/067$
und 3. der Romnji-Buchstabe "T". Somit PMCC (K) = P(T> 7I K>
PMCG (V = P (7, K| T) (8)
PMCC(V =
Gleichung (7) drückt beispielsweise die Wahrscheinlichkeit aus, dass beim Abtasten eines Katakana-Feldes*und Erkennen eines Video-Bildes als 11K", das Video-Bild ein "T" in der R.-Logik und eine "7" in der R^-Logik ergeben würde- Die Gleichungen (8) und (9) beziehen sich auf ähnliche Wahrscheinlichkeits-Aussagen, vtfobei die Annahme bezüglich Gleichung (8) die ist, dass das Feld dem Romnji-Alphabet zugehört und nach Gleichung (9) ein Romnji-Zahlzeichen ist.
Wenn die Gleichungen (4) bis (6) für alle in den zugeordneten Erkennungs-Alphabeten vorkommenden Zeichen ausgewertet sind, liefert jede von ihnen eine separate, dreidimensionale Matrix. Eine Zeichenmatrix von der Grosse 30 χ 11 χ 150 ist erforderlich, um die Wahrscheinlichkeit zu speichern, auf die Zugriff besteht gemäss den Gleichungen (7) bis (9).
Der Diskriminator wird herangezogen, wenn ein Feld abgetastet wird, dessen Erkennungs-Ausgangssignal zweifelhaft ist, wie
WA9-75-001 - 22 -
709817/067$
im folgenden Beispiel 1, weil alle drei Kanäle einen möglichen Kandidaten liefern:
Beispiel 1 Katakana-Kanal: K1-K2-K3
Romnji-Buchstaben-Kanal: C-A-T Romnji numerischer Kanal: 0-4-7
Das Gleiche gilt, wenn nur der Katakana-Kanal· und der Ronin j i-Buchstaben-Kanal mögliche Kandidaten liefern, wie im folgenden Beispiel 2:
Beispiel 2 Katakana-Kanal: K4-K5-K6
Romnj i-Buchstaben-Kanal: C-A-T Romnji numerischer Kanal: *-4_*
Es sei darauf hingewiesen, dass die Notationen "K", "Kl", "K2" usw. verschiedene Katakana-Symbole bedeuten, die eine gewisse optische Aehnlichkeit mit den entsprechenden Romnji-Zeichen aufweisen, und dass sie hier so bezeichnet sind, um die Schreibung zu erleichtern.
Der Diskriminator muss beim Beispiel 1 zwischen drei Möglichkeiten entscheiden und beim Beispiel 2 zwischen zwei Möglichkeiten. Die Entscheidung des Diskriminators erfolgt aufgrund
WA9-75-001 - 23 -
709 817/0 676
der Untersuchung der Kanäle auf den P„ „-Wert, den sie aufweisen. Wenn "L" das Produkt der P.,- -Wahrscheinlichkeiten je Zeichen bedeutet, ergibt sich für:
In Beispiel 1:
L (Katakana) = P(C,0| Kl) *P(A,4| K2) -P(T, 7|K3) L (Romnji alpha)= P(O, Kl|C)-P(4, K2|A)*P(7, K3|T) L (Romnji numer.) = P(Kl, C|0)-P(K2, A|4)-P(K3, Ti 7)
in Beispiel 2:
L (Katakana) = P(C, *|Κ4)·Ρ(Α, 4|K5)-P(T, *|K6) L (Romnji alpha)= P(*, K4|C)-P(4, K5|A)*P(*. K6|T)
Die Entscheidung für die Zugehörigkeit des abgetasteten Feldes zu einem Alphabet ergibt sich aufgrund des grössten Wertes von L. Analog der Benutzung des Diskriminators für die Unterscheidung zwischen mehreren Alphabeten ist er auch für die Unterscheidung zwischen verschiedenen Schriftarten des gleichen Alphabets anwendbar. Ein geeigneter Vielkanal-Zeichenlcser hätte eine Gruppe von parallelen Erkennungsschaltungen aufzuweisen, deren jede für die Zeichenform und die Besonderheiten der Zeichentrennung einer speziellen Schriftart optimiert sein müsste. Eine mögliche Konfiguration für einen derartigen Zeichenleser könnte beispielsweise einen Kanal für die Schrift OCR-A, einen Kanal für die Schrift OCR-B sowie je einen Kanal für die Schriftarten "Advocate", "Orator" und "Script" auf-
WA9-75-001 - 24 -
709817/0676
weisen. Die verschiedenen Zeichenformen der genannten Schriftarten sind mit weiteren Beispielen in dem von der Anmelderin herausgegebenen Heft "IBM 'Selectric' Typewriter Type Styles" abgebildet.
Es sei jedoch darauf hingewiesen, dass weder die Namen noch die speziellen Merkmale dieser Schriftarten für die vorliegende Beschreibung irgend eine einschränkende Bedeutung haben sollen.
Wie erwähnt, ist die Erkennungs-Logik jedes der verschiedenen Kanäle an die* ihm zugeordnete Schriftart angepasst. Mit dem Diskriminator ist also aufgrund der Ausgangssignale von den verschiedenen Erkennungskanälen zu entscheiden, welche Schriftart von den betreffenden Kanälen gerade abgetastet wird. Aufgrund der Entscheidung des Diskriminators wird das Ausgangssignal des betreffenden Erkennungskanals als die zuverlässigste Erkennung der abgetasteten Daten weiterverarbeitet. Die Entscheidung des Diskriminators wird normalerweise auf der Basis eines Unterfeldes gefällt.
Beim Abtasten der Zeichen "A" und "B" der Schriftart "Script" können die verschiedenen Kanäle z.B. folgendes Ergebnis liefern (wobei ein Sternchen "*" eine Rückweisung bedeutet):
WA9-75-001 - 25 -
70981770678
A3
OCR-A-Kanal N*
OCR-B-Kanal AS
Advocate-Kanal VS
Orator-Kanal XB
Script-Kanal AB
Der Diskriminator untersucht die zusammengesetzte bedingte Wahrscheinlichkeit der Ereignisse unter Benutzting empirisch entwickelter und gespeicherter P.pp-Wahrscheinlichkeitsfaktoren, die auf die entsprechenden Schriftarten abgestimmt sind. Für das angeführte Beispiel ergibt sich:
L(OCR-A) - P (A0CR_B> VAdvocate' Orator· AScript I HOCR-A> 5^ (5OCR-B' SAdvocate' B0rator' BScript ' OCR-A L(OCR-B) = P(N0CR_A, VAdvocateS Xorator' AScript ' AOCR-B)
xP ^OCRA' SAdvocate' BOrator' BScript ' SOCR-B
SAdvocate' BOrator' BScript ' SOCR-B L(Advocate) = P(N 0CR-A' AOCR-B' XOrator» AScript ' VAdvocate^
xP^*0CR-A» SOCR-B' BOrator' BScript ' L(Orator) = P(N0CR_A> AQCR_B> V^^^, A Script ' XOrator)
xP^OCR-A' SOCR-B' SAdvocate' Script Orator
L(Script) = P(N0CR_A» AOCR-B' VAdvocate'· X0rator ' AScript) (*OCR-A' SOCR-B' SAdvocate' BOrator ' 3
WA9-75-001 - 26 -
709817/067$
Die Entscheidung des Systems bezüglich der Schriftart bzw. des Kanals gibt dann die höchste Wahrscheinlichkeit wieder, welche die oben aufgeführten Ausdrücke liefern, und für das Beispiel der Buchstaben "A" und "B" der Schriftart "Script" wäre das "L(Script)".
Es wird nun die Schaltung des Diskriminators beschrieben. Fig. 4 zeigt den Vielkanal-Zeichenleser 2, der im Zusammenhang mit dem Vielkanal-Erkennungs-Diskriminator verwendet werden kann. Bei der Textverarbeitung wird die auf dem Dokument 3 erscheinende Information einer Suchoperation unterworfen, bei der ein Sucher 4 eine Vorabtastungs- und Formatverarbeitungs-Funktion ausführt. Die Vorabtastung besteht aus dem Sammeln digitaler Information von den optischen Abtastpfaden des Suchers 4 und Uebertragen der Information in einen Format-Prozessor 5. Der Format-Prozessor ermittelt aus den digitalen Daten eine Zeileninformation; bei der Bearbeitung von Postsendungen würde er beispielsweise, das Auffinden der Adresse übernehmen. Bei der Zeilensuchoperation werden die horizontalen und vertikalen Koordinaten aller potentiellen Textzeilen ermittelt und die geometrischen Koordinaten erzeugt, die der Prozessor benötigt, um den Ort und die Verdrehung des Textes zu berechnen. Bei der Postverarbeitung ermittelt die Adressensuchoperation den besten Adressenblock
WA9-75-001 - 27 -
70981770676
auf dem Poststück und liefert die horizontalen und vertikalen Startpositionen und die Verdrehungsdaten für die Leseoperation. Das Ausgangssignal des Lesers 6 ist digitalisiert und wird für jede vorgeschriebene Distanz des Dokumententransports (z.B. 0,1 mm) dem Video-Prozessor 7 zugeführt. Der Video-Prozessor hat drei Hauptaufgaben: Blockverarbeitung, Zeichentrennung und Zeichennormalisierung. Die Blockverarbeitung folgt der Druckzeile und speichert die Video-Information für die Zeile. Sie berechnet die Zeichenbreite für jede Video-Zeile und überträgt sie in den Zeichentrenner und Normalisierer'8. Der Normalisierer gleicht die Höhe der einzelnen Zeichen an, indem er horizontale Reihen der gelesenen Video-Information weglässt oder kombiniert. Er reduziert die Breite der Zeichen durch Weglassung oder Kombination vertikaler Abtastungen. Das resultierende Digitalsignal wird dann an den Merkmal-Detektor 9 übertragen.
Die Zeichenerkennung erfolgt anhand der Video-Daten durch einen Messwert-Extraktionsprozess im Merkmaldetektor 9, auf den eine Entscheidungsphase folgt. In der Messwert-Extraktionsphase werden die wichtigen Unterscheidungsmerkmale des Zeichens aus dem Inhalt eines im Video-Prozessor 7 vorgesehenen Schieberegisters ermittelt. Jeder Messwert (z.B. ein horizontaler Serif links unten, ein offener Kopf, oder ein horizontaler
WA9-75-001 - 28 -
709817/0670
Μι
Ballten in der Mitte), auch als Messwert-Vektor bezeichnet, wird an einer bestimmten Stelle in einem Register gespeichert und vom Merkmal-Detektor 9 an einen Merkmal-Vergleicher (latein.) 10, einen Merkmal-Vergleicher · (kyrill..) 11 und einen Merkmal-Vergleicher (numer.) 12 ausgegeben. Der Merkmal-Vergleicher 10 vergleicht den Messwert-Vektor des untersuchten Zeichens mit einem Messwert-Vektor für alphabetische Zeichen, deren Merkmale in einem dem lateinischen Alphabet zugeordneten Merkmal-Speicher 13 gespeichert sind. Die Zeichen des lateinischen Alphabets, deren Merkmale mit denen des abgetasteten Zeichens am ßesten übereinstimmen, werden auf einer Ausgabeleitung 14 ausgegeben. Auf die gleiche Weise vergleicht der Merkmal-Vergleicher 11 den Messwert-Vektor vom Merkmal-Detektor 9 mit den Zeichen des kyrillischen Alphabets, die in einem Merkmal-Speicher 15 gespeichert sind. Und auf einer Ausgabeleitung 16 werden die kyrillischen Buchstaben ausgegeben, deren Merkmale mit denen des abgetasteten Zeichens am besten übereinstimmen. Dieser Prozess wird für jeden weiteren vorhandenen Kanal wiederholt,·im gewählten Beispiel schliesslich für den numerischen Kanal, in dem der Merkmal-Verglcicher 12 den Vergleich mit den in einem Merkmal-Speicher 17 gespeicherten Merkmalen der numerischen Zeichen vergleicht und das Zeichen mit der besten Uebereinstimmung auf der Ausgabeleitung 18 ausgibt. Falls in einem der Merkmal-Vergleicher keine einen
WA9-75-001 - 29 -
709817/067Ö
Minimalwert überschreitende Uebereinstimmunj? für den betreffenden Kanal ermittelt wird, erscheint auf der zugeordneten Ausgabeleitung ein Rückweisungssymbol. Die Fig. 3 zeigt Zeichenfelder 19, 20 und 21, die aufgrund der einlaufenden Video-Daten von den einzelnen Merkmal-Verglcichern 10, 11, 12 auf die Leitungen 14, 16 und 18 gegeben worden sein können
Der in Fig. 3 gezeigte Zeichenleser 2 mit seinen Ausgangsleitungen 14, 16 und 18 ist auch in Fig. 4 dargestellt. Die Leitungen 14, 16 und 18 sind an einen Pufferspeicher 22 angeschlossen, von dem das lateinische Zeichenfeld über eine Leitung 23 zu einem Schieberegister 24 und zu einem Speicher-Adressregister 25 übertragen wird. Das kyrillische Zeichenfeld läuft über eine Leitung 26 zu einem Schieberegister 27 und einem Adressregister 28, und das numerische Zeichenfeld schliesslich läuft über eine Leitung 29 zu einem Schieberegister 30 und einem Adressregister 31. Von der Eingangszelle 32 des Schieberegisters 24 führt eine Leitung zu einem Felddetektor 33. Der Zweck dieser Verbindung ist die Prüfung auf Vorhandensein einer Leerstelle oder eines Worttrennzeichens. Wenn eine Leerstelle erkannt ist, wird durch eine Steuereinheit 34 der Entscheidungsp-rozess eingeleitet.
WA9-75-001 - 30 -
709817/067$
Wenn also in der Eingangszelle 32 des Schieberegisters 24 eine Leerstelle auftritt, veranlasst die Steuereinheit 34 die zeichenweise Einspeisung des lateinischen Zeichenfeldes in das Schieberegister 24 in Synchronismus mit der Einspeisung des kyrillischen Zeichenfeldes in das Schieberegister 27 und der Einspeisung des numerischen Zeichenfeldes in das Schieberegister 30. Gleichzeitig erfolgt auch die sequentielle Ladung der Adressregister 25, 28 und 31 mit den ihnen zugeordneten Zeichenfeldern. Das lateinische Zeichen im Adressregister 25, das kyrillische Zeichen im Adressregister 28 und das numerische Zeichen im Adressregister 31 bilden gemeinsam die Speicheradressen für die drei geeigneten zusammengesetzten bedingten Wahrscheinlichkeiten (P „ ), die aus Speichern 35, 36 und 37 abgerufen werden können.
Der Zugriff zu diesen Speichern 35, 36 und 37 ist vieldimensional (z.B. dreidimensional). Er benutzt die in den entsprechenden Adressregistern 25, 28 und 31 gespeicherten Zeichendaten, um sukzessive die Anzahl der Dimensionen des Zugriffs zu reduzieren, bis der Wahrscheinlichkeitsfaktor ΡΜΓΓ durch eine einfache, d.h. eindimensionale Nachschlageoperation erhältlich gemacht werden kann. Bei'einem System, das zwischen N Alphabeten unterscheiden muss, wird dieser Zugriffsprozess N-mal durchgeführt. Die drei logisch separaten PMr„-Spei eher
WA9-75-001 - 31 -
7098177 0678
der Fig. 2 sind in den Speichern 35 bis 37 der Fig. 4 enthalten. Sie unterscheiden sich organisatorisch durch die Achse (d.h. Alphabet), von der ihre Ρ.,ρρ-Faktoren abhängen, indem nämlich die Achse α dem Speicher 35,, die Achse β dem Speicher 36 und die Achse γ dem Speicher 37. zugeordnet ist. Der Betriebsablauf der Anordnung nach Fig. 4 sieht vor, dass die Adressregister 25, 28 und 31 derjenigen Kanäle, auf denen die beste Uebereinstimmung festgestellt worden ist, die ihnen zugeordneten Speicher 35, 36 und 37 adressieren und auf diese Weise eine Speichergruppe der Dimension N-I bilden. Darauf wird eines der verbliebenen Adressregister 25, 28, 31 ausgewählt, die Achse seines nun logisch reduzierten Speichers abzufragen, bis eine Uebereinstimmung erzielt ist und die Dimension des betreffenden P „„-Speichers Aveiter logisch um eine Dimension zu reduzieren. Dieser Prozess wird rekursiv für jedes der Adressregister durchgeführt. Bei jeder Uebereinstimmung wird die Dimension des zugeordneten P „-Speichers um einen Grad ernierdrigt. Das ergibt sich mit Fig. 2 als die Zurückführung von einem Würfel (dreidimensionaler Speicher) auf eine Fläche (zweidimensionaler Speicher), und von einer Fläche auf eine Linie (eindimensionaler Speicher). Das letzte Adressregister führt eine einfache eindimensionale Nachschlagoperation durch, die mit der Ausgabe des betreffenden PMrr~ Wertes endet. Im Sinne des geschilderten geometrischen Vergleichs
WA9-75-001 - 32 -
70981 7/067S
entspricht dies der Wahl eines Punktes auf einer Linie.
Die P.,„„-Faktoren sind in einem dreidimensionalen Speicher MCC r
35 bis 37 gespeichert. Die Wahrscheinlichkeitswerte im Speicher 35 entsprechen dem kyrillischen Zeichen R. und dem numerischen Zeichen N„, die von ihren entsprechenden Kanälen verkannt worden sind, vorausgesetzt, dass ein lateinischer Buchstabe E. tatsächlich abgetastet worden ist (oberes Teilbild der Fig. 2). Der P -Wert bezüglich der zusammengesetzten bedingten Wahrscheinlichkeit, dass ein numerisches Zeichen N und ein lateinisches Zeichen E. durch ihre entsprechende Kanäle verkannt worden sind, wenn ein kyrillisches Zeichen R. tatsächlich abgetastet wurde, ist im Speicher gespeichert (mittleres Teilbild der Fig. 2). Entsprechend enthält der Speicher 37 die Werte, die sich auf die zusammengesetzte bedingte Wahrscheinlichkeit beziehen, dass ein kyrillisches Zeichen R. und ein lateinisches Zeichen E. durch ihre entsprechenden Kanäle verkannt worden sind, wobei vorausgesetzt ist, dass tatsächlich ein'numerisches Zeichen N„ abgetastet worden ist (unteres Teilbild der Fig. 2) .
Die im Speicherausgaberegister 38 sequentiell gespeicherten Werte der zusammengesetzten bedingten Wahrscheinlichkeiten P werden sequentiell in einem Multiplikator 39 multipliziert
WA9-75-001 - 33 -
709817/0676
Der Multiplikationsprozess läuft kontinuierlich ab, bis die Produkte aller dem lateinischen Alphabet zugeordneten zusammengesetzten bedingten Wahrscheinlichkeiten für das im Schieberegister 24 stehende lateinische Zeichenfeld berechnet worden sind. Das Ende der Multiplikation wird durch Prüfung der Eingangszelle 32 des Schieberegisters 24 auf eine Leerstelle festgestellt. In gleicher Weise wird für jedes der übrigen Zeichenfelder und die ihnen zugeordneten Wahrscheinlichkeiten in den Ausgaberegistern 40 und 41 das Produkt der zusammengesetzten bedingten Wahrscheinlichkeiten Ρι«ρΓ durch die Multiplikatoren 42 und 43 sequentiell berechnet und in Speichern 44 und 45 gespeichert. Das Ende eines jeden Feldes wird von der Eingangszelle 32 des Schieberegisters 24 festgestellt. Das Produkt der bedingten Wahrscheinlichkeiten für das lateinische Alphabet, das im Speicher 46 gespeichert ist, wird auf das Register 47 übertragen und die Produkte der übrigen Wahrscheinlichkeiten, die in den Speichern 44 und 45 gespeichert sind, werden in die Register 48 und 49 übertragen. Der Inhalt der Register 47, 48 und 49 wird mittels eines Vergleichers 50, der N = 3 Kanäle aufweist, auf relative Grosse verglichen.
Falls beispielsweise die bedingte Wahrscheinlichkeit des lateinischen Zeichens grösserist, bedeutet das, dass die numerischen
WA9-75-001 - 34 -
709817/0676
Zeichen auf der Leitung 39 und die kyrillischen Zeichen auf der Leitung 37 besser verträglich sind mit der Annahme, dass ein lateinisches Zeichen (Leitung 14) abgetastet und als numerisch bzw. kyrillisch verkannt worden ist, als umgekehrt. Mit anderen Worten sind die lateinischen Zeichen besser verträglich mit der Annahme, dass numerische oder kyrillische Zeichen abgetastet und als lateinische Zeichen verkannt wurden Wenn die Wahrscheinlichkeit grosser ist, dass das abgetastete Wort dem im Schieberegister 24 gespeicherten lateinischen Zeichenfeld entspricht, wird der Vergleicher 50 einen Schalter 51 betätigen, so dass das lateinische Zeichenfeld aus dem Schieberegister 24 in das Ausgangsregister 52 übertragen und auf der Ausgangsleitung 53 für die Weiterverarbeitung zur Verfugung gestellt wird. In den Ausgangsdatenstrom kann über die Leitung 54 ein Kennzeichen für das lateinische Alphabet eingefügt werden.
Wenn das Produkt der den numerischen Zeichen zugeordneten zusammengesetzten bedingten Wahrscheinlichkeiten im Register
49 grosser ist als das Produkt der in den Registern 47 und gespeicherten Wahrscheinlichkeiten, betätigt der Vergleicher
50 einen Schalter 55, wodurch das im Register 30 gespeicherte numerische Zeichenfeld über das Ausgangsregister 52 auf die Ausgangsleitung 53 zur Uebertragung und Weiterverarbeitung
WA9-75-001 - 35 -
709817/0676
ausgegeben wird. Ein Kennzeichen für das numerische Alphabet kann dabei von einem Kennzeichengenerator 56 über die Leitung 54 in den Ausgangsstrom auf der Leitung 53 eingefügt werden.
Falls die dem kyrillischen Alphabet zugeordnete, im Register 48 gespeicherte Wahrscheinlichkeit grosser ist als das Produkt der Wahrscheinlichkeiten für die numerischen und lateinischen Alphabete in den Registern 47 und 49, schaltet der \fergleicher 50 den Schalter 57, wodurch das kyrillische Zeichenfeld aus dem Register 27 auf das Ausgangsregister 52 und die· Ausgangsleitung 53 geschaltet wird.
Der bisher beschriebene Diskriminator kann ohne Abweichung vom Erfindungsgedanken modifiziert werden, um die gleiche Art der Unterscheidung beispielsweise zwischen verschiedenen Schriftarten der gleichen Kategorie oder zwischen handgeschriebenen und maschinengeschriebenen Zeichen auszuführen. Gemäss den Fig. 2 und 4 ist die Arbeitsweise des Diskriminators im allgemeinen derart, dass für ein lateinisches Zeichen "G" auf der α-Achse (Leitung 14), das kyrillische Zeichen auf der ß-Achse (Leitung 16) ein " fl" und das Zahlzeichen auf der γ-Achse (Leitung 18) eine "4" ist, die Speicher 35, 36 und 37 die Matrizen 1, 58 und 59 der zusammengesetzten Wahrscheinlichkeiten in die zugeordneten zweidimen-
WA9-75-001 - 36 -
709817/0678
2640S37
sionalen Arbeitsspeicher 60, 61 und 62 übertragen. Dann veranlasst der Arbeitsspeicher 60, dem über die Leitung 63 das 3 = Ά -Zeichen zugeführt wird, den Zugriff zu einer Spalte von Wahrscheinlichkeitswerten in der Matrix 1 und deren Uebertragung in den eindimensionalen Arbeitsspeicher 64. Entsprechend wird das y=4-Zeichen auf der Leitung 65 den Wahrscheinlichkeitswert in der Matrix 1 aus dem Speicher 64 abrufen und zum Ausgaberegister 38 übertragen. Diese singuläre Wahrscheinlichkeit ist in der Matrix 1 am Schnittpunkt der ß- und γ-Achsen für die entsprechenden Werte " Ά" und "4" gespeichert. In gleicher Weise erfolgt der Zugriff zu den zweidimensionalen Speichern 61 und 62 durch die α- und γ-Zeichen über die Leitungen 66 und 67, um einen Satz eindimensionaler Wahrscheinlichkeitswerte aus den Matrizen 58 und 59 abzurufen und in die eindimensionalen Arbeitsspeicher 68 und 69 zu übertragen. Die γ- und α-Zeichen auf den Leitungen 70 und 71 veranlassen die Uebertragung der singulären Wahrscheinlichkeitswerte von den Matrizen 58 und in die Register 40 und 41. Wie bereits erwähnt, werden die Werte PMrr der zusammengesetzten bedingten Wahrscheinlichkeiten, die sequentiell in den Registern 38, 40 und 41 gespeichert sind, sequentiell in den ihnen zugeordneten Multiplikatoren 39, 42 und 43 multipliziert. Der Multiplikationsprozess läuft kontinuierlich, bis das Produkt aller bedingten Wahrscheinlichkeiten für die in den Schieberegistern 24, 27 und 30 gespeicherten
WA9-75-001 - 37 -
7098177 0676
lateinischen, kyrillischen und numerischen Felder berechnet ist. Der Vergleicher 50 ermittelt dann, welches der Produkte das grösste ist und betätigt einen der Schalter 51, 57 oder 55, um die Uebertragung der Zeichen des korrekten Zeichenfeldes an das Ausgangsregister 52 zu gestatten. Die Rückstellung aller Speicher erfolgt durch einen Rückstellkreis
WA9-75-001 - 38 -
709817/0676

Claims (3)

  1. PATENTANSPRÜCHE
    Verfahren zum Unterscheiden zwischen N>2 Alphabeten angehörende Zeichen, die in einem von einem Zeichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen, wobei jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmt, gekennzeichnet durch die Verfahrensschrittc: Speichern eines Wertes der bedingten Wahrscheinlichkeit, dass ein bestimmtes Zeichen eines Alphabets vom Zeichenleser angegeben wurde, wenn aber Zeichen eines anderen Alphabets abgetastet wurden, in jedem von mit den N Ausgabeleitungen \rerbundenen N Speichern, Abrufen aus den N Speichern von N Werten von bedingten Wahrscheinlichkeiten, dass jedes auf einer Ausgabeleitung angegebene Zeichen eines Alphabets durch den Zeichenleser falsch erkannt und daher fälschlich auf einer der anderen Ausgabeleitungen angegeben worden ist, Multiplizieren aller abgerufenen N Werte der bedingten Wahrscheinlichkeiten gesondert für jedes der vom Zeichenleser über die N Ausgabeleitungen angegebenen Alphabete, um Produkte der entsprechenden bedingten Wahrscheinlichkeiten zu entwickeln, und
    Vergleichen in einem Vergleicher der Grossen jedes der N Produkte der bedingten Wahrscheinlichkeiten, um das möglicherweise zutreffende der vom Zeichenleser ange-
    WA 975 001 - 39 -
    709817/0678
    ORiQiNAL INSPECTED
    gebenen Zeichen mit demjenigen Produkt der bedingten Wahrscheinlichkeiten zu korrelieren, welches den grössten Wert aufweist.
  2. 2. Verfahren nach Patentanspruch 1, zum Unterscheiden zwischen zu zwei Buchstabenalphabeten und zu einem Zahlzeichenalphabet gehörenden Zeichen eines Zeichenfeldes, wobei über eine erste Ausgabeleitung mit dem ersten Buchstabenalphabet bestmöglich übereinstimmende Zeichen ausgegeben werden, über eine zweite Ausgabeleitung mit dem zweiten Buchstabenalphabet bestmöglich übereinstimmende Zeichen und über eine dritte Ausgabeleitung mit dem Zahlzeichenalphabet bestmöglich übereinstimmende Zeichen ausgegeben werden, dadurch gekennzeichnet, dass in den drei Ausgabeleitungen zugeordneten Speichern den Zeichen ihrer Alphabete entsprechende bedingte Wahrschein]ichkeitswerte gespeichert werden, die für jedes vom Zeichenleser über eine Ausgabeleitung gelieferte Zeichen eines Alphabets angeben, mit welcher Wahrscheinlichkeit gleichzeitig die möglichen Kombina-
    tionen der Zeichen der beiden anderen Alphabete über die diesen zugeordneten Ausgabeleitungen geliefert werden, wenn tatsächlich ein zu diesen anderen Alphabeten gehörendes Zeichen abgetastet wurde,
    Abrufen der gespeicherten bedingten Wahrscheinlichkeitswerte aus den drei Speichern durch eine je einem abgetasteten Zeichen
    WA 975 001 - 40 -
    709817/0670
    entsprechende Zeichentriade schrittweise für alle Zeichen des Zeichenfeldes,
    iteratives Multiplizieren aller einem Alphabet zugeordneten, abgerufenen bedingten Wahrscheinlichkeitswerte miteinander getrennt für alle drei Alphabete, zum Ermitteln eines Wertes der bedingten Gesamtwahrscheinlichkeit, dass alle dem einen der Alphabete zugeordneten Zeichen falsch erkannt worden sind als den jeweils anderen Alphabeten zuzuordnende Zeichen, und Vergleichen der ermittelten Werte der drei Gesamtwahrscheinlichkeiten und Durchschalten derjenigen Ausgabeleitung, über welche die Zeichen ausgegeben werden, denen jeweils der grösste Wert der Gesamtwahrscheinlichkeit zugeordnet ist.
  3. 3. Vorrichtung zur Durchführung der Verfahren nach Anspruch 1 und/oder 2, dadurch gekennzeichnet, dass die N Speicher je einen ersten N-dimensionalen Speichersektor (35, 36, 37) einen zweiten (N-i)-dimensionalen Speichersektor (60, 61, 62), usw., bis einen letzten (N-n=1)-dimensionalen Speichersektor (64, 68, 69) umfassen, wobei jeweils der Speichersektor mit der niedrigeren Dimension an den Speichersektor der nächsthöheren Dimension sowie an ein Adressregister (25, 28, 31) angeschlossen ist, mit dem die Speichersektoren der höheren Dimensionen des gleichen Speichers nicht verbunden sind, dass die 1-dimensionalen Speichersektoren (64, 68, 69) über Ausgaberegister (38, 40, 41) mit den Multiplikatoren (39, 42, 43) verbunden sind, und dass alle Speichersektoren (35, 36, 37; 60, 61, 62; 64, 68, 69) als Festwertspeicher ausgebildet sind, in denen Tabellenwerte bedingter Wahrscheinlichkeiten in Form von Matrizen gespeichert sind, deren Dimension durch die Dimension des betreffenden Speichersektors bestimmt ist.
    ' · WA 975 001 - 41 -
DE19762640537 1975-10-24 1976-09-09 Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen Ceased DE2640537A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US05/625,618 US3988715A (en) 1975-10-24 1975-10-24 Multi-channel recognition discriminator

Publications (1)

Publication Number Publication Date
DE2640537A1 true DE2640537A1 (de) 1977-04-28

Family

ID=24506884

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762640537 Ceased DE2640537A1 (de) 1975-10-24 1976-09-09 Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen

Country Status (8)

Country Link
US (1) US3988715A (de)
JP (1) JPS5253634A (de)
CA (1) CA1061000A (de)
CH (1) CH604277A5 (de)
DE (1) DE2640537A1 (de)
FR (1) FR2329023A1 (de)
GB (1) GB1554884A (de)
IT (1) IT1075853B (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3026055A1 (de) * 1980-07-09 1982-01-28 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Schaltungsanordnung zur maschinellen zeichererkennung

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4373193A (en) * 1977-08-29 1983-02-08 Hewlett-Packard Company Logic state analyzer
JPS5854433B2 (ja) * 1980-09-11 1983-12-05 日本電気株式会社 相違度検出装置
US4593367A (en) * 1984-01-16 1986-06-03 Itt Corporation Probabilistic learning element
US4620286A (en) * 1984-01-16 1986-10-28 Itt Corporation Probabilistic learning element
US4599692A (en) * 1984-01-16 1986-07-08 Itt Corporation Probabilistic learning element employing context drive searching
US4599693A (en) * 1984-01-16 1986-07-08 Itt Corporation Probabilistic learning system
GB2179483B (en) * 1985-08-20 1989-08-02 Nat Res Dev Apparatus and methods for analysing data arising from conditions which can be represented by finite state machines
US4805225A (en) * 1986-11-06 1989-02-14 The Research Foundation Of The State University Of New York Pattern recognition method and apparatus
US4897880A (en) * 1987-02-17 1990-01-30 Soricon Corporation Data acquisition control method and system for a hand held reader
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
US5257323A (en) * 1991-05-29 1993-10-26 Canon Kabushiki Kaisha Selection agent for a symbol determination system with multiple character recognition processors
JP3046111B2 (ja) * 1991-11-08 2000-05-29 キヤノン株式会社 文字認識方法及びその装置
US5848187A (en) * 1991-11-18 1998-12-08 Compaq Computer Corporation Method and apparatus for entering and manipulating spreadsheet cell data
US5459739A (en) * 1992-03-18 1995-10-17 Oclc Online Computer Library Center, Incorporated Merging three optical character recognition outputs for improved precision using a minimum edit distance function
JP3131287B2 (ja) * 1992-05-27 2001-01-31 株式会社日立製作所 パターン認識装置
TW222337B (de) * 1992-09-02 1994-04-11 Motorola Inc
US6272238B1 (en) * 1992-12-28 2001-08-07 Canon Kabushiki Kaisha Character recognizing method and apparatus
US5377280A (en) * 1993-04-19 1994-12-27 Xerox Corporation Method and apparatus for automatic language determination of European script documents
US5434932A (en) * 1994-07-28 1995-07-18 West Publishing Company Line alignment apparatus and process
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
JP2737734B2 (ja) * 1995-12-13 1998-04-08 日本電気株式会社 指紋分類装置
US5913185A (en) * 1996-08-19 1999-06-15 International Business Machines Corporation Determining a natural language shift in a computer document
GB9625284D0 (en) * 1996-12-04 1997-01-22 Canon Kk A data processing method and apparatus for identifying a classification to which data belongs
US6137863A (en) * 1996-12-13 2000-10-24 At&T Corp. Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition
US6154579A (en) * 1997-08-11 2000-11-28 At&T Corp. Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6219453B1 (en) 1997-08-11 2001-04-17 At&T Corp. Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
US6047251A (en) * 1997-09-15 2000-04-04 Caere Corporation Automatic language identification system for multilingual optical character recognition
US6141661A (en) * 1997-10-17 2000-10-31 At&T Corp Method and apparatus for performing a grammar-pruning operation
US6205428B1 (en) 1997-11-20 2001-03-20 At&T Corp. Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers
US6223158B1 (en) 1998-02-04 2001-04-24 At&T Corporation Statistical option generator for alpha-numeric pre-database speech recognition correction
US6205261B1 (en) 1998-02-05 2001-03-20 At&T Corp. Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique
US6272456B1 (en) * 1998-03-19 2001-08-07 Microsoft Corporation System and method for identifying the language of written text having a plurality of different length n-gram profiles
AUPP340798A0 (en) * 1998-05-07 1998-05-28 Canon Kabushiki Kaisha Automated video interpretation system
US6400805B1 (en) 1998-06-15 2002-06-04 At&T Corp. Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition
US7937260B1 (en) 1998-06-15 2011-05-03 At&T Intellectual Property Ii, L.P. Concise dynamic grammars using N-best selection
US7031925B1 (en) 1998-06-15 2006-04-18 At&T Corp. Method and apparatus for creating customer specific dynamic grammars
CA2400345C (en) * 2000-03-06 2007-06-05 Iarchives, Inc. System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location
US7120302B1 (en) * 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
RU2251737C2 (ru) * 2002-10-18 2005-05-10 Аби Софтвер Лтд. Способ автоматического определения языка распознаваемого текста при многоязычном распознавании
JPWO2004084121A1 (ja) * 2003-03-17 2006-06-22 富士通株式会社 車両識別方法及び装置
US7587308B2 (en) * 2005-11-21 2009-09-08 Hewlett-Packard Development Company, L.P. Word recognition using ontologies
US7781693B2 (en) 2006-05-23 2010-08-24 Cameron Lanning Cormack Method and system for sorting incoming mail
US8055104B2 (en) 2007-03-02 2011-11-08 Adi, Llc Process performance evaluation for Enterprise data systems
US8005775B2 (en) * 2008-03-18 2011-08-23 Yahoo! Inc. System and method for detecting human judgment drift and variation control
JP6011214B2 (ja) * 2012-09-28 2016-10-19 オムロン株式会社 画像処理システムおよび画像処理方法
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1015014B (it) * 1973-10-25 1977-05-10 Ibm Sistema di elaborazione dei dati perfezionato per l analisi di ca ratteri provenienti da un lettore ottico
US3842402A (en) * 1973-10-25 1974-10-15 Ibm Bayesian online numeric discriminator

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3026055A1 (de) * 1980-07-09 1982-01-28 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Schaltungsanordnung zur maschinellen zeichererkennung

Also Published As

Publication number Publication date
FR2329023A1 (fr) 1977-05-20
GB1554884A (en) 1979-10-31
JPS5711473B2 (de) 1982-03-04
CH604277A5 (de) 1978-08-31
CA1061000A (en) 1979-08-21
US3988715A (en) 1976-10-26
JPS5253634A (en) 1977-04-30
IT1075853B (it) 1985-04-22
FR2329023B1 (de) 1979-04-06

Similar Documents

Publication Publication Date Title
DE2640537A1 (de) Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen
DE3689416T2 (de) Mustermerkmalextraktion.
DE69722971T2 (de) Automatisches sprachenerkennungssystem für die mehrsprachige optische zeichenerkennung
DE60204005T2 (de) Verfahren und einrichtung zur erkennung eines handschriftlichen musters
DE69602444T2 (de) System und verfahren zum einschränken des suchumfangs in einem lexikon
DE69030310T2 (de) Beschränkungsabhängig gesteuerte on-line Erkennung von handgeschriebenen Zeichen und Symbolen
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE69230092T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE69610478T2 (de) Zeichenerkennungssystembestimmung von abgetasteten und &#34;echtzeit&#34;-handgeschriebenen zeichen
DE2541204C3 (de) Einrichtung zur Fehlerkorrektur
DE3716787C2 (de)
DE69428590T2 (de) Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung
DE69424196T2 (de) Automatische Zeichenerkennung mit Verwendung statischer und dynamischer Parameter
DE3485953T2 (de) Verfahren und anlage zur on-line-erkennung handgeschriebener muster.
DE69417105T2 (de) Vorrichtung und Verfahren zum Erkennen handgeschriebener Symbole
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE68916978T2 (de) Zeichenkettenerkennungssystem.
DE3851867T2 (de) Zeichenerkennungsgerät.
DE69426479T2 (de) Optische Mehrfontzeichenerkennung mit einem Verbindungsschachtelansatz
DE4232507A1 (de) Verfahren zum Kennzeichnen, Wiederauffinden und Sortieren von Dokumenten
DE3632832A1 (de) Zeichenerkennungssystem
DE69329330T2 (de) Texterkennung
DE2540101A1 (de) Automatisches zeichenerkennungs- system
DE2435889B2 (de) Verfahren und einrichtung zur unterscheidung von zeichengruppen
DE60031502T2 (de) Verfahren und Vorrichtung zur Typbestimmung eines Formblatts

Legal Events

Date Code Title Description
OD Request for examination
8131 Rejection