DE2640537A1 - Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen - Google Patents
Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichenInfo
- Publication number
- DE2640537A1 DE2640537A1 DE19762640537 DE2640537A DE2640537A1 DE 2640537 A1 DE2640537 A1 DE 2640537A1 DE 19762640537 DE19762640537 DE 19762640537 DE 2640537 A DE2640537 A DE 2640537A DE 2640537 A1 DE2640537 A1 DE 2640537A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- characters
- alphabet
- alphabets
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
Verfahren und Vorrichtung zum Unterscheiden zwischen N>2
Alphabeten angehörenden Zeichen.
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen,
die in einem von einem Zeichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden
Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen. Dabei soll jedes ausgegebene Zeichen
für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmen.
Optische Zeichenerkennungsvorrichtungen dienen zum Erkennen von in schriftlicher z.B. gedruckter oder handgeschriebender
Form vorliegenden Daten und zum Einlesen dieser Daten in binär codierter Form in eine datenverarbeitende Anlage. Bei
7Q9817/067&
Zeichensymbolen, die aus Ziffern, Buchstaben und sonstigen Zeichen gemischt sind, ist es ausserordentlich wichtig, dass
deren Bedeutung klar erkannt wird. Dazu gehört zunächst die Unterscheidung, welchem der Alphabete, für die der Zcichenleser
eingerichtet ist, ein abgetastetes Zeichen angehört. Aus dem Schweizer Patent 578.216 und dem USA Patent 3.842.402
sind ein Verfahren und eine Vorrichtung zum Unterscheiden zwischen Zahlzeichen und Buchstaben bekannt, wobei eine
Zeichenerkennungsvorrichtung mit zwei Kanälen verwendet wird. In dem einen Kanal wird jedes optisch gelesene Zeichen als
ein zu erkennendes alphabetisches Zeichen betrachtet, während im anderen Kanal jedes gelesene Zeichen als ein numerisches
Zeichen betrachtet wird. Die daraus resultierenden Datenströme werden parallel verarbeitet, wobei ihre vertikale
Redundanz nach wahrscheinlichkeitstheoretischen Methoden ermittelt wird. Nach Bayes kann die bedingte Wahrscheinlichkeit
von Ereignissen bestimmt werden, welche sich paarweise gegenseitig ausschliessen, wie z.B. das Lesen eines Zeichens als
Ziffer oder als Buchstabe.
Verfahren und Vorrichtungen, die eine Unterscheidung zwischen zu mehr als zwei Alphabeten gehörenden Zeichen gestatten (N>2)
sind bisher nicht bekannt geworden. Zweck der vorliegenden Erfindung ist daher, hier Abhilfe zu schaffen. Demnach betrifft
WA9-75-001 - 2 -
709817/0670
die vorliepende Erfindung ein Verfahren zum Unterscheiden zwischen N>2 Alphabeten angehörenden Zeichen, die in einem
von einem Zcichenleser abgetasteten Zeichenfeld vorkommen
können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete
Ausgabeleitungen, wobei jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmt.
Das Verfahren ist gekennzeichnet durch die Vorfahrensschritte:
Speichern eines Wertes der bedingten Wahrscheinlichkeit, dass ein bestimmtes Zeichen eines Alphabets'vom Zeichenleser
angegeben wurde, wenn aber Zeichen eines anderen Alphabets abgetastet wurden, in jedem von mit den N-Ausgabeleitungen
verbundenen N Speichern, Abrufen aus den N Speichern von N Werten von bedingten Wahrscheinlichkeiten, dass jedes auf einer Ausgabeleitung
angegebene Zeichen eines Alphabets durch den Zeichenlcser falsch erkannt und daher fälschlich auf einer der anderen
Ausgabeleitungen angegeben worden ist, Multiplizieren aller abgerufenen N Werte der bedingten
Wahrscheinlichkeiten gesondert für jedes der vom Zeichenleser über die N Ausgabeleitungen angegebenen Alphabete,
um Produkte der entsprechenden bedingten Wahrscheinlichkeiten zu entwickeln, und
WA9-75- 01 - 3 -
709817/067$
ι-
Vergleichen in einem Verglcicher der Grossen jeder der N
Produkte der bedingten Wahrscheinlichkeiten, um das zutreffende der vom Zeichenleser angegebenen Zeichen mit demjenigen der
Produkte der bedingten Wahrscheinlichkeiten zu korrelieren, welches den grössten Wert aufweist.
Ferner betrifft die Erfindung eine Vorrichtung zum Ausführen des vorgenannten Verfahrens, mit einem ein Zeichenfeld abtastenden
optischen Zeichenleser mit N>2 Ausgabcleitungen, die je einem von N>2 Alphabeten zugeordnet sind, mit N von
N Adressregistern ansteuerbaren Speichern für Tafclwerte bedingter Wahrscheinlichkeiten, mit N>2 Multipliziereinrichtungen,
die mit den Speichern verbunden sind und mit einem an die Ausgänge der Multipliziereinrichtungen angeschlossenen
•Vergleicher, welche Vorrichtung dadurch gekennzeichnet ist, dass die N Speicher je einen ersten N-dimensionalen Speichersektor,
einen zweiten (N-I)-dimensionalen Speichersektor usw,
bis einen letzten (N-n=l)-dimensionalen Speichersektor umfassen, wobei jeweils der Speichersektor mit der niedrigeren
Dimension an den Speichersektor der nächsthöheren Dimension sowie an ein Adressregister angeschlossen ist, mit dem die
Speichersektoren der höheren Dimensionen des gleichen Speichers nicht verbunden sind, dass die 1-dimensionalen Speichersektoren
über Ausgaberegister mit den Multiplikatoren verbunden
WA9-75-001 - 4 -
70981 7/067S
sind, und dass alle Speichersektoren als Festwertspeicher ausgebildet sind, in denen Tabellenwerte bedingter Wahrscheinlichkeiten
in Form von Matrizen fest gespeichert sind, deren Dimension durch die Dimension des· betreffenden
Speichersektors bestimmt ist.
Die Vorteile der Erfindung sind in ihrer Fähigkeit zu sehen, zwischen drei und
mehr Zeichensätze unterscheiden zu können.
Einzelheiten des erfindungsgemässen Verfahrens und eines
Ausführungsbeispiels einer Vorrichtung zum Ausführen des Verfahrens werden nachstehend anhand der Zeichnungen erläutert.
In den Zeichnungen zeigen:
Fig. 1 Paare und Triaden von miteinander verwechslungsfähigen
Zeichen verschiedener Alphabete;
Fig. 2 schematisch Speichermatrizen mit bedingten Wahrscheinlichkeitswerten
für einen dreikanaligen Diskriminator, der für die Unterscheidung zwischen lateinischen, kyrillischen und numerischen Zeichen
eingerichtet ist;
Fig. 3 ein Blockschaltbild eines dreikanaligen Zeichenlesers,
Fig. 4+5 zusammengesetzt ein Blockschaltbild eines dreikanaligen Diskriminators.
WA9-75-001 - 5 -
709817/0670
Die alphabetischen Symbole, die für die Schreibung der meisten europäischen Sprachen angewandt werden, haben sich aus
einer geschriebenen Repräsentation von Sprachlauten entwickc]t, die auf die Griechen zurückgeht, während die in allen europäischen
Sprachen benutzte Schreibung der Zahlzeichen von den Arabern erfunden worden ist. Mit wenigen Ausnahmen erfolgte
die Entwicklung der Zeichen des Alphabets und der Zahlzeichen unabhängig voneinander. Das hat dazu geführt,-dass für alphabetische
und numerische Zeichen identische oder sehr ähnliche Symbole verwendet werden. In ähnlicher Weise haben sich beispielsweise
auch die alphabetischen Zeichen der russischenkyrillischen Schrift bzw. des japanischen Kanji-Alphabets
unabhängig entwickelt und benutzen einige Zeichen, die denen der lateinischen Schrift ähnlich sind. Beispiele für derartige
geometrische Aehnlichkeiten können jeder Konkordanztabelle von Alphabeten entnommen werden.
Vergleichbare Verhältnisse liegen vor bei der Aehnlichkeit im Aussehen von korrespondierenden Zeichen in verschiedenen
Schriftarten wie beispielsweise "A" in der Schriftart "Advocate"
im Vergleich mit dem Zeichen "A" der Schriftart "Script". (Einzelheiten dieser Schriftarten sind in diesem Zusammenhang
ohne Belang, es genügt, dass sie unterschiedlich sind.) Wenn der Benutzer (d.h. Leser) der Zeichensymbole ein Mensch ist,
WA9-75-001 . - 6 -
709817/067^
kann er bei der Analyse des Zusammenhangs und der alphabetischen Form, in welcher das betreffende Zeichen erscheint, seinen
Scharfsinn anwenden und dabei die Wahrscheinlichkeit reduzieren,
dass'die vom Schreiber beabsichtigte Bedeutung beeinträchtigt wird. Mit der Einführung von maschinellen optischen Zeichenlesern
für das Lesen von Daten von gedruckten, mit der Schreibmaschine geschriebenen oder handgeschriebenen Dokumenten wird
die verwirrende Aehnlichkeit zwischen Zeichen verschiedener Alphabete, Schriftarten und numerischer Symbole besonders
kritisch.
In der Fig. 1 ist der Fall eines drei Kanäle aufiveisenden
optischen Zeichenlesers gezeigt, der ein Beispiel von gemischten lateinischen, kyrillischen und numerischen Zeichen zu
lesen hat, die verschiedene Kategorien von alphanumerischen Problempaaren und -triaden darstellen. Es ist einleuchtend,
dass die Unterschiede zwischen den einzelnen Kategorien nicht immer klar hervortreten. Obwohl Verwechslungsmöglichkeiten,
wie die in der Figur dargestellten, nicht dauernd auftreten, kommen sie doch oft genug vor, um die Zurückführung eines
gedruckten, maschinengeschriebenen oder handgeschriebenen Textes auf eine computerbezogene Datenbasis ernsthaft zu
behindern. Die Fig. 1 zeigt Verwechslungsmöglichkeiten zwischen dem Zahlzeichen "0" und dem Buchstaben "OM, dem Zahl-
WA9-75-001 - 7 -
10 9 8 1 7 / 0 6 7 $
zeichen "1" und dem Buchstaben "1", die in einer Umgebung,
in der viele verschiedene Schriftarten vorkommen, gewöhnlich
nicht unterscheidbar sind. Das gleiche gilt für die Zeichenpaare "5" und den Buchstaben "S", das Zahlzeichen "2" und
den Buchstaben "Z", das lateinische "!?" und den kyrillischen
Buchstaben "III", sowie die Buchstaben "Y" und "q", die topologisch
ähnlich und daher nur durch die Schärfe der Ecken unterscheidbar sind, was jedoch eines der Merkmale ist, die
als erste verschwinden, wenn die Druckqualität nachlässt.
Aehnliches gilt für die Zeichentriaden mit dem Zahlzeichen "6" und den Buchstaben 11G" und "L· ", dem Zahlzeichen "8" und
den Buchstaben "B" und "3", dem Zahlzeichen "9" und den Buchstaben "g" und "H", die ebenfalls nur in sehr untergeordneten
topologischen Merkmalen voneinander abweichen, die bereits bei leichtem Nachlassen der Druckqualität verschwinden.
Entsprechendes gilt für die Triaden mit dem Zahlzeichen "4" (oben offen) und den Buchstaben "H" und "H", dem Zahlzeichen
"4" (oben geschlossen) und den Buchstaben "A" und "A",
dem Zahlzeichen "7" und den Buchstaben "Y" und " <I ", dem
Zahlzeichen "8" und den Buchstaben "S" und "b", und dem
Zahlzeichen "8" und den Buchstaben "e" und "E", die sich
zwar etwas besser unterscheiden, als aus der Fig. 1 hervorgeht, die jedoch bei der in maschinengeschriebenem Text
üblichen Qualität gelegentlich verwechselt werden. Schliess-
WA9-75-a01 ' - 8 -
709817/067S
lieh sind in der Fig. 1 noch weitere vier Triaden angegeben,
die das Zahlzeichen "7" und die Buchstaben "T" und "Γ",
das Zahlzeichen "0" und die Buchstaben "N" und "Φ", das Zahlzeichen
"0" und die Buchstaben "C" und "C", das Zahlzeichen "9" und die Buchstaben "U" und "Jl" umfassen, die sich, durch
Merkmale unterscheiden, die bei schlanken Schriftarten wenig ausgeprägt sind, oder weil die Vorrichtung zum Trennen der
Zeichen im Zeichenleser nicht einwandfrei funktioniert.
Der Schlüssel zur zuverlässigen Textverarbeitung ist die Fähigkeit, leicht und sicher in der Voranalyse der Ausgabe
des Zeichenlesers Felder von zu verschiedenen Alphabeten gehörenden Zeichen gegeneinander abzugrenzen. Die zuverlässige
Unterscheidung zwischen Feldern von zu verschiedenen Alphabeten gehörenden Zeichen in einer Umgebung, in der tatsächlich
verschiedene Alphabete vorkommen, ist ein sehr komplizierter Vorgang, was darauf zurückzuführen ist, dass
die meisten modernen Schriftarten unabhängig voneinander entwickelt worden sind, wobei kein Versuch gemacht wurde,
die gegenseitige Verwechselbarkeit auszuschliessen. Daher kommen in vielen verschiedenen Alphabeten die gleichen fundamentalen
geometrischen Formen vor. Daher kann es vorkommen, dass bei einem dreikanaligen Zeichenleser viele geläufige
alphabetische Wörter, die aus dem lateinischen Alphabet
WA9-75-001 - 9 -
709817/067$
gebildet sind, teilweise oder ganz als numerische oder kyrillische
Felder verkannt werden. Beispiele derartiger Verkennungen sind "South" in "80478", "804TH" oder "bOUTH", "Third" in.
"781rd", und "BEJlH11 in "BEAN" oder "88th". Das Problem bei
der Unterscheidung von Zeichenfeldern beruht insbesondere darauf, dass reale oder vorgebliche Ketten von Zeichen sich
nicht für die Methoden der direkten Analyse des Textzusammenhangs anbieten. Beispielsweise ist ein numerisches Feld vollkommen
nicht-redundant, da jeder Satz von numerischen Zeichen einen sinnvollen Datensatz darstellen kann.
In bekannten zweikanaligen Zeichenlesesystemen, ausgenommen die in den USA-Patenten 3,839,702 und 3,842,402 beschriebenen,
wird die endgültige Unterscheidung alphabetisch/numerisch jedes Zeichenfeldes durch einen Ausschliessungsprozess erreicht
Dieser verlangt, dass ein alphabetischer Erkennungsstrom, der jedem Feld oder Unterfeld entspricht, auf Uebereinstimmung mit
einem gespeicherten Wörterbuch von zulässigen empfangenen Daten geprüft wird, die im voraus bekannt sind. Alle Felder
oder Ünterfelder, die keine Uebereinstimmung ergeben, werden als numerisch bezeichnet. Bei einer Anwendung, wie beispielsweise
der Verarbeitung von Postsendungen oder bei der Textverarbeitung, ist dieses Vorgehen nicht möglich, da das
Wörterbuch von zulässigen empfangenen Daten exzessiv gross
WA9-75-001 - 10 -
709817/067$
sein müsste und die für die vielen erforderlichen Zugriffe
zu dem Wörterbuch nötige Zeit prohibitiv lang wäre. Daher ist dieses Vorgehen auch nicht geeignet für ein Vielkanalsystem,
d.h. ein System mit mehr als zwei Kanälen.
Der hier benutzte Begriff "Alphabet" soll verstanden werden
als ein in vereinbarter Reihenfolge geordneter Zeichenvorrat, beispielsweise die Buchstaben des lateinischen Alphabets
oder die Zahlzeichen, sowie jeden von den anderen verschiedenen Satz von Buchstabenzeichen einer Schriftart oder Schriftgrösse.
Der zu beschreibende Vielkanal-Zeichenerkennungs-Diskriminator führt einen Alphabet-Entscheidungsprozess zwischen drei oder
mehr Ketten von Zeichen aus, die von einem optischen Zcichenleser ausgegeben werden. Er gehört zu einem System, das einen
optischen Zeichenleser umfasst, der eine Kette von Zeichen in einem Zeichenfeld abtastet, Mittel für die Ausgabe auf einer
einem ersten Alphabet (z.B. lateinisches Alphabet) zugeordneten Leitung, auf der Zeichen ausgegeben werden, die möglichst
genau dem ersten Zeichenalphabet entsprechen, entsprechende Mittel für die Ausgabe auf einer zweiten Ausgabeleitung, die
einem zweiten Alphabet (z.B. kyrillisches Alphabet) zugeordnet sind und Mittel für die Ausgabe auf einer dritten Ausgabe-
WA9-75-001 - 11 -
709817/067$
2640S37
leitung, die einem weiteren Alphabet zugeordnet ist, usw., bis zu Mitteln für die Ausgabe auf einer η-ten Ausgabeleitung,
die einem numerischen Zeichenvorrat zugeordnet ist.
Ein erstes Speicher-Adressregister ist mit der ersten Ausgabeleitung
verbunden und speichert sequentiell jedes alphabetische Zeichen des Zeichenfeldes, das auf der ersten Ausgabeleitung
erscheint. Entsprechend sind weitere Speicher-Adressregister den übrigen Ausgabeleitungen zugeordnet, bis hin zur n-ten
Ausgabeleitung für die numerischen Zeichen, die auf der n-ten Ausgabeleitung ausgegeben werden.
Weiter sind Speicher vorgesehen, die mit jedem der erwähnten Speicher-Adressregister verbunden sind, und in denen ein Satz
von N-dimensionalen Matrizen von zusammengesetzten bedingten Wahrscheinlichkeiten, die eine quantisierte Aussage darüber
liefern, dass, wenn der Zeichenleser ein Zeichen dem ersten Alphabet zugeordnet hat, gewisse damit im Zusammenhang aufgetretene
Zeichen für alle Kombinationen, in denen sie mit Zeichen anderer Alphabete aufgetreten sind, falsch erkannt
wurden. Entsprechende zusammengesetzte bedingte Wahrscheinlichkeiten sind für jedes Alphabet in dem Speicher gespeichert,
zu dem Zugriff möglich ist mittels einer N-dimensionalen Adresse, die eindeutig durch den Inhalt der aufeinanderfolgen-
WA9-75-001 - 12 -
709817/067$
den Speicher-Adressregister gebildet wird, um die zusammengesetzte
bedingte Wahrscheinlichkeit zu ergeben, dass das im ersten Speicher-Adressregister gespeicherte Zeichen des ersten
Alphabets vom Zeichenleser als das spezifische Zeichen des zweiten Alphabets \'erlesen worden Ist, das im zweiten Speicher-Adressregister
gespeichert ist und als das spezifische Zeichen des dritten Alphabets, welches im dritten Speicher-Adressregister
gespeichert ist, usw., je nach Anzahl .der dem System zugänglichen Alphabete.
Der Zugriff zum Speicher liefert für jedes im ersten Adressregister
stehende Zeichen über einen Multiplikator das Produkt der zusammengesetzten bedingten Wahrscheinlichkeiten für
das erste Alphabet. Entsprechend werden die Produkte der zusammengesetzten bedingten Wahrscheinlichkeiten für die in den
übrigen Adressregistern stehenden Zeichen für die übrigen Alphabete entwickelt. Mit dem Multiplikator ist ein Vergleicher
verbunden, der die Grossen der Produkte der Wahrscheinlichkeiten miteinander vergleicht. Das Ausgangssignal des Vergleichers
schaltet diejenige Ausgangsleitung des Zeichenlesers durch, für die das grösste Produkt ermittelt x^orden
ist, wodurch das korrekte Alphabet für den Zweck der Datenübertragung ausgewählt wird.
WA9-75-001 - 13 -
709817/067S
Auf diese Weise ist der zu beschreibende Vielkanal-Diskriminator
imstande, zwischen einer Vielzahl von alphabetischen und numerischen Zeichenfeldern zu unterscheiden, die von
einem Zeichenleser abgetastet worden sind, ohne dass der Diskriminator von einem gespeicherten Wörterbuch zulässiger,
im voraus bekannter empfangener Daten Gebrauch machen muss. Dementsprechend kann die Alphabetunterscheidung nach Stil,
Form oder Schriftart in wesentlich kürzerer Zeit erfolgen, als das bisher möglich war.
Zum besseren Verständnis des Verfahrens der Diskrimination
zwischen verschiedenen Alphabeten sind einige theoretische Ueberlegungen erforderlich. Das Verfahren der Vielkanal-Erkennungs-Diskrimination
sucht die Unterscheidung zwischen den Alphabeten durch Zuordnung einer gewissen Form von
Quasi-Redundanz zu einem Zeichenfeld zu erreichen. Redundanz im Sinne des Textzusammhangs bedeutet, dass zwischen dem
Vorhandensein eines Zeichens und einem anderen eine Abhängigkeit besteht. Normalerweise wird Text-Redundanz in horizontaler
Richtung zwischen den Zeichen auf einer Zeile und innerhalb eines Wortes angenommen. Ein Beispiel für dieses Konzept
ist die Digramm-Statistik. Diese Wahrscheinlichkeiten der
Nebeneinanderstellung von Zeichen erlaubt die Vorhersage von wahrscheinlich folgenden Zeichen aufgrund der Kenntnis der
WA9-75-001 - 14 -
709817/0676
vorhergehenden Zeichen. Daher würde in der Buchstabenfolge "SPRI-G" wahrscheinlich "N" beispielsweise gegenüber "Z"
bevorzugt, um die freie Position zu füllen. Dieser Sachverhalt ist begrifflich und mathematisch in den bereits
erwähnten USA-Patenten 3,839,702 und 3,842,402 erläutert.
Obwohl für numerische Zeichenfelder eine horizontale Redundanz
nicht gegeben ist, existiert eine Redundanz von einer speziellen vertikalen Natur. Beispielsweise kann beim
Abtasten eines Artikels über "President Gerald Ford 1600 Pennsylvania ..." in einer russischen Zeitung mittels eines
dreikanaligen Zeichenlesers das folgende Ergebnis erhalten werden, wobei "*" bedeutet, dass eine Erkennung nicht möglich
war:
1. alphabetischer Kanal: PRESI*ENT GE*ALD FORD 1*00
2. alphabetischer Kanal: ΡΒΕΒ*ΓΕΜΓ CEPA*fl *O** *bOO
numerischer Kanal: 4*840*457 68*4*0 *0*0 1600
Hier ist ein Konzept der vertikalen Redundanz entwickelt worden, das einen Zusammenhang herstellt zwischen der Erkennung
eines Zeichens in einem Kanal mit einem Satz von möglichen Verkennungen in den anderen Kanälen. Die fundamentale
Grosse, auf welcher die Diskrimination beruht, ist die so-
WA9-75-001 - 15 -
709817/067S
genannte Vielkanal-Verwechslungs-Wahrscheinlichkeit Ρ»«Γρ·
Die allgemeine Form der Verwechslungs-Wahrscheinlichkeit
worin α,β,ψ, usw die verschiedenen Alphabete oder Schriftarten
bedeuten, über die der Vielkanal-Zeichenleser eine Erkennung durchführt. Die Indizes i, j, k, usw. repräsentieren
die zulässigen Zeichenerkennungen in jedem der entsprechenden Alphabete, wobei natürlich vorausgesetzt ist,
dass für jedes zugelassene Alphabet ein unabhängiger Erkennungskanal und die zugehörige Logik vorhanden sind. Gleichung (1)
drückt die Wahrscheinlichkeit der Beobachtung einer gleichzeitigen Erkennung von ou im α-Kanal, ß. im ß-Kanal, ... und
ir, im TT-Kanal aus, wobei angenommen ist, dass ein Feld im
γ-Alphabet tatsächlich abgetastet wurde und γ durch die zugeordnete
Erkennungslogik erkannt wurde. Mit anderen Worten kann unter der Bedingung, dass γ aufgetreten ist, die Gleichung
(1) über alle Zeichen in den α-, β-, γ-, .··, und π-Alphabeten
ausgewertet werden. Das ergibt eine N-dimensionale Matrix von Wahrscheinlichkeitsfaktoren für die Möglichkeit,
dass jedes Zeichen eines Alphabets durch die anderen N-I Erkennungskanäle als eine Kombination der ihnen zugeordneten
Zeichen verkannt worden ist.
WA9-75-001 - 16 -
709817/067$
Das probabilistische Verhältnis, das in der Form der Gleichung
(1) ausgedrückt ist, weicht mathematisch von den einen einzelnen Faktor umfassenden bedingten Wahrscheinlichkeiten
ab, die in den Ausführungsbcispielen der USA-Patente 3,839,702 und 3,842,402 für Zweikanal-(a/numferisch)-Unterscheidung gezeigt
sind und im allgemeinen Γ(α|γ) bezeichnet sind. Mit
M.G. Kendall: "The Advance Theory of Statistics - Volume T",
Charles Griffin & Co., Seite 301, und Tung Au:."Fundamentals
of Systems Engineering Probabilistic Model", Addision Wesley, Seite 276, kann man zeigen, dass Ρ(α|γ) sich auf ein Regrcssions-Modell
der Form:
α = E(a+by) (2)
bezieht, worin E für den erwarteten Wert steht und a und b Konstanten sind, die mittels Regressionsflächen mit minimiertem
quadratischem Abstand lösbar sind. Beispielsweise bezieht sich der Ausdruck der zusammengesetzten bedingten Wahrscheinlichkeit
PCa, B|y) auf:
Ρ(α, β|γ) ° Ρ(α|γ) · P(ß|a, γ) = E(a + by) · E(c + da + 1γ)
Vergleicht man die Elemente der Gleichungen (2) und (3), so
ergibt sich, dass keine Kombination von einfachen bedingten Wahrscheinlichkeitsfaktoren einen Ausdruck liefern kann, der
WA9-75-001 - 17 -
709817/0676
* 2540537
die Entscheidungseigenschaften einer zusammengesetzten bedingten Wahrscheinlichkeit aufweist. Daher kann weder die
in den genannten Patenten offenbarte Lehre noch die Benutzung der darin beschriebenen Mechanismen das gewünschte Resultat
ergeben, das unter Benutzung des ii/eiter unten zu beschrciben-'den
Ausführungsbeispiels einer Diskriminatorschaltung erzielt
werden kann.
Für einen optischen Zeichenleser mit N Kanälen gibt es N-I
zusätzliche zusammengesetzte bedingte Wahrscheinlichkeiten, die als Gegenstücke zur Gleichung (1) für die anderen Erkennungskanäle
dienen. Jeder Ausdruck einer zusammengesetzten bedingten Wahrscheinlichkeit ist von dem zulässigen Erkennungs
Alphabet eines anderen Kanals abhängig. Die entsprechenden Wahrscheinlichkeitsfaktoren werden für jeden Kanal als N-dimensionale
Matrix gespeichert, deren Elemente die Erkennung in einem Alphabet in Beziehung setzen zur Möglichkeit, dass
sein Video-Bild durch die anderen Erkennungskanäle verkannt wird. Dies ist graphisch in Fig. 2 dargestellt, worin die
Konfiguration eines Wahrscheinlichkeitsfaktor-Speichers die
Matrix Anordnungen für einen Diskriminator mit drei Kanälen zeigt.
WA9-75-001 . - 18 -
709817/0676
•In Fig. 2 ist die mit α bezeichnete Achse der Ausgabeleitung
für das lateinische Alphabet zugeordnet, die mit β bezeichnete
Achse ist der Ausgabeleitung für das kyrillische Alphabet zugeordnet und die mit γ bezeichnete Achse entsprechend der
Ausgabcleitung für die numerischen Zeichen. Im oberen Teil der
Fig. 2 ist gezeigt, dass ein vom Zeichenleser angebotener Buchstäbe
des lateinischen Alphabets, der über die Ausgabeleitung α läuft, entsprechend vorgegebenen, Zusammengesetz ten bedingten
Wahrscheinlichkeiten für alle Kombinationen von kyrillischen und numerischen Zeichen \rerkannt worden sein kann. Wenn beispielsweise
der lateinische Buchstaben "G" vom Zeichenleser angeboten wird, stehen die zweidimensionalen Wahrscheinlichkeitswerte
der Matrix 1 zur Verfügung. Wird über die Leitung β ein kyrillisches Zeichen "b" und über die Leitung γ ein
Zahlzeichen "6" angeboten, wird der Wert der zusammengesetzten bedingten Wahrscheinlichkeit am Schnittpunkt β-γ abgefragt.
Liefert der Zeichenleser auf der a-Ausgabeleitung eine "8",
wird die zusammengesetzte bedingte Wahrscheinlichkeit am Schnittpunkt β = L/γδ abgefragt.
In ähnlicher Weise [mittleres Teilbild der Fig. 2) führt ein
kyrillisches Zeichen " b" auf der ß-Leitung, ein lateinisches Zeichen "G" auf der α-Leitung und eine "6" auf der γ-Leitung
zum Zugriff zur zusammengesetzten bedingten Wahrscheinlichkeit
WA9-75-001 - 19 -
709817/067$
am Schnittpunkt α-γ. Schliesslich führt eine "6" auf der γ-Leitung
(unteres Teilbild der Fig. 2), ein lateinischer Buchstabe "G" auf der α-Leitung und ein kyrillischer Buchstabe
".£> " auf der ß-Leitung zum Zugriff zur zusammengesetzten
bedingten Wahrscheinlichkeit am Schnittpunkt ß-ot.
Wenn ein Zeichenfeld abgetastet worden ist und wenigstens zwei Kanäle ein Ausgangssignal mit einer Erkennungsqualität
liefern, die die Zugehörigkeit des Zeichenfeldes zu einem Alphabet zweifelhaft macht, wird der Diskriminator in Anspruch
genommen und die P .,„,,-Matrizen abgefragt. Für jeden
Kanal, bezüglich dessen die Zugehörigkeit des Zeichenfeldcs
zweifelhaft ist, wird unter Benutzung der P.)rr-Faktoren ein
Produkt entwickelt, das vom Ausgangssignals dieses Kanals abhängt und die entsprechenden Ausgangssignale der anderen
Kanäle berücksichtigt. Die Entscheidung bezüglich der Zugehörigkeit des Zeichenfeldes zu einem Alphabet wird getroffen
zugunsten desjenigen Kanals, auf den das PMp -Produkt mit
der höchsten Wahrscheinlichkeit entfiel.
Die vorstehende Diskussion des Vielkanal-Erkennungs-Diskrimi-
nators im Zusammenhang mit einem N-Kanal-Zeichenleser ist
die allgemeinste Form, die sich denken lässt. Der Diskriminator
kann auch Anwendung finden im Zusammenhang mit einem japanischen
WA9-75-001 ' - 20 -
709817/0676
optischen Zeichenleser, der sowohlvdas Katakana-Alphabet
wie auch das Romnji-Alphabet lesen kann. Da das Romnji-Alphabet
auch die römischen und arabischen Zahlen enthält, verlangt der japanische Zeichenleser drei unabhängige
Erkennungs-Kanäle. Dem Fachmann ist bekannt, dass Zeichenleser für Katakana- und Romnji-Zeichen bereits zum
Stande der Technik gehören. Wenn die Erkennung im Mehrkanal-Betrieb erfolgt, lassen sich die zwischen den-Kanälen auftretenden
Zeichenverwechslungen durch drei P. „-Gleichungen beschreiben. Wenn "K" das Katakana-Alphabet bedeutet und "R."
und "Rn" den alphabetischen bzw. numerischen Teil des Romnji-Alphabets,
lauten die P -Gleichungen wie folgt:
C j
PMCC
PMCC (V = p(% » K1 I R^) (5)
PMCC <V = P(K1' \
worin j, i und 1 Variable sind, die sich ändern über die zulässigen Zeichenidentifikationen der Erkennungsalphabete,
zu denen sie gehören.
Die Gleichungen (4) bis (6) werden wie folgt angewandt,
wenn ein Video-Bild- vorhanden ist: 1. ein Katakana-Symbol
(hier mit "K" bezeichnet), 2. das Romnji-Zahlzeichen "7"
WA9-75-001 - 21 -
709817/067$
und 3. der Romnji-Buchstabe "T". Somit
PMCC (K) = P(T>
7I K>
PMCG (V = P (7, K| T) (8)
PMCC(V =
Gleichung (7) drückt beispielsweise die Wahrscheinlichkeit aus, dass beim Abtasten eines Katakana-Feldes*und Erkennen
eines Video-Bildes als 11K", das Video-Bild ein "T" in der
R.-Logik und eine "7" in der R^-Logik ergeben würde- Die
Gleichungen (8) und (9) beziehen sich auf ähnliche Wahrscheinlichkeits-Aussagen,
vtfobei die Annahme bezüglich Gleichung (8) die ist, dass das Feld dem Romnji-Alphabet zugehört
und nach Gleichung (9) ein Romnji-Zahlzeichen ist.
Wenn die Gleichungen (4) bis (6) für alle in den zugeordneten Erkennungs-Alphabeten vorkommenden Zeichen ausgewertet
sind, liefert jede von ihnen eine separate, dreidimensionale Matrix. Eine Zeichenmatrix von der Grosse 30 χ 11 χ 150 ist
erforderlich, um die Wahrscheinlichkeit zu speichern, auf die Zugriff besteht gemäss den Gleichungen (7) bis (9).
Der Diskriminator wird herangezogen, wenn ein Feld abgetastet wird, dessen Erkennungs-Ausgangssignal zweifelhaft ist, wie
WA9-75-001 - 22 -
709817/067$
im folgenden Beispiel 1, weil alle drei Kanäle einen möglichen Kandidaten liefern:
Beispiel 1 Katakana-Kanal: K1-K2-K3
Romnji-Buchstaben-Kanal: C-A-T
Romnji numerischer Kanal: 0-4-7
Das Gleiche gilt, wenn nur der Katakana-Kanal· und der Ronin j i-Buchstaben-Kanal
mögliche Kandidaten liefern, wie im folgenden Beispiel 2:
Beispiel 2 Katakana-Kanal: K4-K5-K6
Romnj i-Buchstaben-Kanal: C-A-T Romnji numerischer Kanal: *-4_*
Es sei darauf hingewiesen, dass die Notationen "K", "Kl", "K2" usw. verschiedene Katakana-Symbole bedeuten, die eine gewisse
optische Aehnlichkeit mit den entsprechenden Romnji-Zeichen
aufweisen, und dass sie hier so bezeichnet sind, um die Schreibung zu erleichtern.
Der Diskriminator muss beim Beispiel 1 zwischen drei Möglichkeiten
entscheiden und beim Beispiel 2 zwischen zwei Möglichkeiten. Die Entscheidung des Diskriminators erfolgt aufgrund
WA9-75-001 - 23 -
709 817/0 676
der Untersuchung der Kanäle auf den P„ „-Wert, den sie aufweisen.
Wenn "L" das Produkt der P.,- -Wahrscheinlichkeiten
je Zeichen bedeutet, ergibt sich für:
In Beispiel 1:
In Beispiel 1:
L (Katakana) = P(C,0| Kl) *P(A,4| K2) -P(T, 7|K3)
L (Romnji alpha)= P(O, Kl|C)-P(4, K2|A)*P(7, K3|T)
L (Romnji numer.) = P(Kl, C|0)-P(K2, A|4)-P(K3, Ti 7)
in Beispiel 2:
L (Katakana) = P(C, *|Κ4)·Ρ(Α, 4|K5)-P(T, *|K6)
L (Romnji alpha)= P(*, K4|C)-P(4, K5|A)*P(*. K6|T)
Die Entscheidung für die Zugehörigkeit des abgetasteten Feldes zu einem Alphabet ergibt sich aufgrund des grössten Wertes von
L. Analog der Benutzung des Diskriminators für die Unterscheidung zwischen mehreren Alphabeten ist er auch für die Unterscheidung
zwischen verschiedenen Schriftarten des gleichen Alphabets anwendbar. Ein geeigneter Vielkanal-Zeichenlcser
hätte eine Gruppe von parallelen Erkennungsschaltungen aufzuweisen, deren jede für die Zeichenform und die Besonderheiten
der Zeichentrennung einer speziellen Schriftart optimiert sein müsste. Eine mögliche Konfiguration für einen derartigen
Zeichenleser könnte beispielsweise einen Kanal für die Schrift OCR-A, einen Kanal für die Schrift OCR-B sowie je einen Kanal
für die Schriftarten "Advocate", "Orator" und "Script" auf-
WA9-75-001 - 24 -
709817/0676
weisen. Die verschiedenen Zeichenformen der genannten Schriftarten
sind mit weiteren Beispielen in dem von der Anmelderin herausgegebenen Heft "IBM 'Selectric' Typewriter Type Styles"
abgebildet.
Es sei jedoch darauf hingewiesen, dass weder die Namen noch die speziellen Merkmale dieser Schriftarten für die vorliegende
Beschreibung irgend eine einschränkende Bedeutung haben sollen.
Wie erwähnt, ist die Erkennungs-Logik jedes der verschiedenen Kanäle an die* ihm zugeordnete Schriftart angepasst. Mit dem
Diskriminator ist also aufgrund der Ausgangssignale von den verschiedenen Erkennungskanälen zu entscheiden, welche Schriftart
von den betreffenden Kanälen gerade abgetastet wird. Aufgrund der Entscheidung des Diskriminators wird das Ausgangssignal
des betreffenden Erkennungskanals als die zuverlässigste Erkennung der abgetasteten Daten weiterverarbeitet. Die Entscheidung
des Diskriminators wird normalerweise auf der Basis eines Unterfeldes gefällt.
Beim Abtasten der Zeichen "A" und "B" der Schriftart "Script"
können die verschiedenen Kanäle z.B. folgendes Ergebnis liefern (wobei ein Sternchen "*" eine Rückweisung bedeutet):
WA9-75-001 - 25 -
70981770678
A3
OCR-A-Kanal | N* |
OCR-B-Kanal | AS |
Advocate-Kanal | VS |
Orator-Kanal | XB |
Script-Kanal | AB |
Der Diskriminator untersucht die zusammengesetzte bedingte
Wahrscheinlichkeit der Ereignisse unter Benutzting empirisch
entwickelter und gespeicherter P.pp-Wahrscheinlichkeitsfaktoren,
die auf die entsprechenden Schriftarten abgestimmt sind. Für das angeführte Beispiel ergibt sich:
L(OCR-A) - P (A0CR_B>
VAdvocate' Orator· AScript I HOCR-A>
5^ (5OCR-B' SAdvocate' B0rator' BScript ' OCR-A
L(OCR-B) = P(N0CR_A, VAdvocateS Xorator' AScript ' AOCR-B)
xP ^OCRA' SAdvocate' BOrator' BScript ' SOCR-B
SAdvocate' BOrator' BScript ' SOCR-B
L(Advocate) = P(N 0CR-A' AOCR-B' XOrator» AScript ' VAdvocate^
xP^*0CR-A» SOCR-B' BOrator' BScript '
L(Orator) = P(N0CR_A>
AQCR_B>
V^^^, A Script ' XOrator)
xP^OCR-A' SOCR-B' SAdvocate' Script Orator
L(Script) = P(N0CR_A» AOCR-B' VAdvocate'· X0rator ' AScript)
(*OCR-A' SOCR-B' SAdvocate' BOrator ' 3
WA9-75-001 - 26 -
709817/067$
Die Entscheidung des Systems bezüglich der Schriftart bzw. des Kanals gibt dann die höchste Wahrscheinlichkeit wieder,
welche die oben aufgeführten Ausdrücke liefern, und für das Beispiel der Buchstaben "A" und "B" der Schriftart "Script"
wäre das "L(Script)".
Es wird nun die Schaltung des Diskriminators beschrieben.
Fig. 4 zeigt den Vielkanal-Zeichenleser 2, der im Zusammenhang
mit dem Vielkanal-Erkennungs-Diskriminator verwendet werden kann. Bei der Textverarbeitung wird die auf dem Dokument
3 erscheinende Information einer Suchoperation unterworfen, bei der ein Sucher 4 eine Vorabtastungs- und Formatverarbeitungs-Funktion
ausführt. Die Vorabtastung besteht aus dem Sammeln digitaler Information von den optischen Abtastpfaden
des Suchers 4 und Uebertragen der Information in einen Format-Prozessor 5. Der Format-Prozessor ermittelt aus den
digitalen Daten eine Zeileninformation; bei der Bearbeitung von Postsendungen würde er beispielsweise, das Auffinden der
Adresse übernehmen. Bei der Zeilensuchoperation werden die horizontalen und vertikalen Koordinaten aller potentiellen
Textzeilen ermittelt und die geometrischen Koordinaten erzeugt, die der Prozessor benötigt, um den Ort und die Verdrehung
des Textes zu berechnen. Bei der Postverarbeitung ermittelt die Adressensuchoperation den besten Adressenblock
WA9-75-001 - 27 -
70981770676
auf dem Poststück und liefert die horizontalen und vertikalen Startpositionen und die Verdrehungsdaten für die Leseoperation.
Das Ausgangssignal des Lesers 6 ist digitalisiert und wird für jede vorgeschriebene Distanz des Dokumententransports (z.B.
0,1 mm) dem Video-Prozessor 7 zugeführt. Der Video-Prozessor hat drei Hauptaufgaben: Blockverarbeitung, Zeichentrennung und
Zeichennormalisierung. Die Blockverarbeitung folgt der Druckzeile und speichert die Video-Information für die Zeile. Sie
berechnet die Zeichenbreite für jede Video-Zeile und überträgt sie in den Zeichentrenner und Normalisierer'8. Der Normalisierer
gleicht die Höhe der einzelnen Zeichen an, indem er horizontale Reihen der gelesenen Video-Information weglässt
oder kombiniert. Er reduziert die Breite der Zeichen durch Weglassung oder Kombination vertikaler Abtastungen.
Das resultierende Digitalsignal wird dann an den Merkmal-Detektor 9 übertragen.
Die Zeichenerkennung erfolgt anhand der Video-Daten durch einen Messwert-Extraktionsprozess im Merkmaldetektor 9, auf den eine
Entscheidungsphase folgt. In der Messwert-Extraktionsphase werden die wichtigen Unterscheidungsmerkmale des Zeichens aus
dem Inhalt eines im Video-Prozessor 7 vorgesehenen Schieberegisters ermittelt. Jeder Messwert (z.B. ein horizontaler
Serif links unten, ein offener Kopf, oder ein horizontaler
WA9-75-001 - 28 -
709817/0670
Μι
Ballten in der Mitte), auch als Messwert-Vektor bezeichnet,
wird an einer bestimmten Stelle in einem Register gespeichert und vom Merkmal-Detektor 9 an einen Merkmal-Vergleicher
(latein.) 10, einen Merkmal-Vergleicher · (kyrill..) 11 und einen Merkmal-Vergleicher (numer.) 12 ausgegeben. Der Merkmal-Vergleicher
10 vergleicht den Messwert-Vektor des untersuchten Zeichens mit einem Messwert-Vektor für alphabetische Zeichen,
deren Merkmale in einem dem lateinischen Alphabet zugeordneten Merkmal-Speicher 13 gespeichert sind. Die Zeichen des lateinischen
Alphabets, deren Merkmale mit denen des abgetasteten Zeichens am ßesten übereinstimmen, werden auf einer Ausgabeleitung
14 ausgegeben. Auf die gleiche Weise vergleicht der Merkmal-Vergleicher 11 den Messwert-Vektor vom Merkmal-Detektor
9 mit den Zeichen des kyrillischen Alphabets, die in einem Merkmal-Speicher 15 gespeichert sind. Und auf einer
Ausgabeleitung 16 werden die kyrillischen Buchstaben ausgegeben,
deren Merkmale mit denen des abgetasteten Zeichens am besten übereinstimmen. Dieser Prozess wird für jeden weiteren
vorhandenen Kanal wiederholt,·im gewählten Beispiel schliesslich
für den numerischen Kanal, in dem der Merkmal-Verglcicher 12 den Vergleich mit den in einem Merkmal-Speicher 17 gespeicherten
Merkmalen der numerischen Zeichen vergleicht und das Zeichen mit der besten Uebereinstimmung auf der Ausgabeleitung
18 ausgibt. Falls in einem der Merkmal-Vergleicher keine einen
WA9-75-001 - 29 -
709817/067Ö
Minimalwert überschreitende Uebereinstimmunj? für den betreffenden
Kanal ermittelt wird, erscheint auf der zugeordneten Ausgabeleitung ein Rückweisungssymbol. Die Fig. 3 zeigt
Zeichenfelder 19, 20 und 21, die aufgrund der einlaufenden Video-Daten von den einzelnen Merkmal-Verglcichern 10, 11,
12 auf die Leitungen 14, 16 und 18 gegeben worden sein können
Der in Fig. 3 gezeigte Zeichenleser 2 mit seinen Ausgangsleitungen
14, 16 und 18 ist auch in Fig. 4 dargestellt. Die Leitungen 14, 16 und 18 sind an einen Pufferspeicher 22 angeschlossen,
von dem das lateinische Zeichenfeld über eine Leitung 23 zu einem Schieberegister 24 und zu einem Speicher-Adressregister
25 übertragen wird. Das kyrillische Zeichenfeld läuft über eine Leitung 26 zu einem Schieberegister 27
und einem Adressregister 28, und das numerische Zeichenfeld schliesslich läuft über eine Leitung 29 zu einem Schieberegister
30 und einem Adressregister 31. Von der Eingangszelle 32 des Schieberegisters 24 führt eine Leitung zu einem
Felddetektor 33. Der Zweck dieser Verbindung ist die Prüfung auf Vorhandensein einer Leerstelle oder eines Worttrennzeichens.
Wenn eine Leerstelle erkannt ist, wird durch eine Steuereinheit 34 der Entscheidungsp-rozess eingeleitet.
WA9-75-001 - 30 -
709817/067$
Wenn also in der Eingangszelle 32 des Schieberegisters 24
eine Leerstelle auftritt, veranlasst die Steuereinheit 34 die zeichenweise Einspeisung des lateinischen Zeichenfeldes
in das Schieberegister 24 in Synchronismus mit der Einspeisung des kyrillischen Zeichenfeldes in das Schieberegister 27 und
der Einspeisung des numerischen Zeichenfeldes in das Schieberegister 30. Gleichzeitig erfolgt auch die sequentielle Ladung
der Adressregister 25, 28 und 31 mit den ihnen zugeordneten Zeichenfeldern. Das lateinische Zeichen im Adressregister 25,
das kyrillische Zeichen im Adressregister 28 und das numerische Zeichen im Adressregister 31 bilden gemeinsam die Speicheradressen
für die drei geeigneten zusammengesetzten bedingten Wahrscheinlichkeiten (P „ ), die aus Speichern 35, 36 und 37
abgerufen werden können.
Der Zugriff zu diesen Speichern 35, 36 und 37 ist vieldimensional (z.B. dreidimensional). Er benutzt die in den entsprechenden
Adressregistern 25, 28 und 31 gespeicherten Zeichendaten, um sukzessive die Anzahl der Dimensionen des Zugriffs
zu reduzieren, bis der Wahrscheinlichkeitsfaktor ΡΜΓΓ
durch eine einfache, d.h. eindimensionale Nachschlageoperation erhältlich gemacht werden kann. Bei'einem System, das zwischen
N Alphabeten unterscheiden muss, wird dieser Zugriffsprozess
N-mal durchgeführt. Die drei logisch separaten PMr„-Spei eher
WA9-75-001 - 31 -
7098177 0678
der Fig. 2 sind in den Speichern 35 bis 37 der Fig. 4 enthalten. Sie unterscheiden sich organisatorisch durch die
Achse (d.h. Alphabet), von der ihre Ρ.,ρρ-Faktoren abhängen,
indem nämlich die Achse α dem Speicher 35,, die Achse β dem
Speicher 36 und die Achse γ dem Speicher 37. zugeordnet ist. Der Betriebsablauf der Anordnung nach Fig. 4 sieht vor, dass
die Adressregister 25, 28 und 31 derjenigen Kanäle, auf denen die beste Uebereinstimmung festgestellt worden ist, die ihnen
zugeordneten Speicher 35, 36 und 37 adressieren und auf diese Weise eine Speichergruppe der Dimension N-I bilden. Darauf
wird eines der verbliebenen Adressregister 25, 28, 31 ausgewählt, die Achse seines nun logisch reduzierten Speichers abzufragen,
bis eine Uebereinstimmung erzielt ist und die Dimension des betreffenden P „„-Speichers Aveiter logisch um eine
Dimension zu reduzieren. Dieser Prozess wird rekursiv für jedes der Adressregister durchgeführt. Bei jeder Uebereinstimmung
wird die Dimension des zugeordneten P „-Speichers um einen Grad ernierdrigt. Das ergibt sich mit Fig. 2 als
die Zurückführung von einem Würfel (dreidimensionaler Speicher) auf eine Fläche (zweidimensionaler Speicher), und von einer
Fläche auf eine Linie (eindimensionaler Speicher). Das letzte Adressregister führt eine einfache eindimensionale Nachschlagoperation
durch, die mit der Ausgabe des betreffenden PMrr~
Wertes endet. Im Sinne des geschilderten geometrischen Vergleichs
WA9-75-001 - 32 -
70981 7/067S
entspricht dies der Wahl eines Punktes auf einer Linie.
Die P.,„„-Faktoren sind in einem dreidimensionalen Speicher
MCC r
35 bis 37 gespeichert. Die Wahrscheinlichkeitswerte im Speicher 35 entsprechen dem kyrillischen Zeichen R. und dem
numerischen Zeichen N„, die von ihren entsprechenden Kanälen
verkannt worden sind, vorausgesetzt, dass ein lateinischer Buchstabe E. tatsächlich abgetastet worden ist (oberes Teilbild
der Fig. 2). Der P -Wert bezüglich der zusammengesetzten bedingten Wahrscheinlichkeit, dass ein numerisches
Zeichen N und ein lateinisches Zeichen E. durch ihre entsprechende
Kanäle verkannt worden sind, wenn ein kyrillisches Zeichen R. tatsächlich abgetastet wurde, ist im Speicher
gespeichert (mittleres Teilbild der Fig. 2). Entsprechend enthält der Speicher 37 die Werte, die sich auf die zusammengesetzte
bedingte Wahrscheinlichkeit beziehen, dass ein kyrillisches Zeichen R. und ein lateinisches Zeichen E. durch ihre
entsprechenden Kanäle verkannt worden sind, wobei vorausgesetzt ist, dass tatsächlich ein'numerisches Zeichen N„ abgetastet
worden ist (unteres Teilbild der Fig. 2) .
Die im Speicherausgaberegister 38 sequentiell gespeicherten Werte der zusammengesetzten bedingten Wahrscheinlichkeiten
P werden sequentiell in einem Multiplikator 39 multipliziert
WA9-75-001 - 33 -
709817/0676
Der Multiplikationsprozess läuft kontinuierlich ab, bis die
Produkte aller dem lateinischen Alphabet zugeordneten zusammengesetzten
bedingten Wahrscheinlichkeiten für das im Schieberegister 24 stehende lateinische Zeichenfeld berechnet
worden sind. Das Ende der Multiplikation wird durch Prüfung der Eingangszelle 32 des Schieberegisters 24 auf eine Leerstelle
festgestellt. In gleicher Weise wird für jedes der übrigen Zeichenfelder und die ihnen zugeordneten Wahrscheinlichkeiten
in den Ausgaberegistern 40 und 41 das Produkt der zusammengesetzten bedingten Wahrscheinlichkeiten Ρι«ρΓ durch
die Multiplikatoren 42 und 43 sequentiell berechnet und in Speichern 44 und 45 gespeichert. Das Ende eines jeden Feldes
wird von der Eingangszelle 32 des Schieberegisters 24 festgestellt.
Das Produkt der bedingten Wahrscheinlichkeiten für das lateinische Alphabet, das im Speicher 46 gespeichert ist,
wird auf das Register 47 übertragen und die Produkte der übrigen Wahrscheinlichkeiten, die in den Speichern 44 und 45
gespeichert sind, werden in die Register 48 und 49 übertragen. Der Inhalt der Register 47, 48 und 49 wird mittels eines Vergleichers
50, der N = 3 Kanäle aufweist, auf relative Grosse verglichen.
Falls beispielsweise die bedingte Wahrscheinlichkeit des lateinischen
Zeichens grösserist, bedeutet das, dass die numerischen
WA9-75-001 - 34 -
709817/0676
Zeichen auf der Leitung 39 und die kyrillischen Zeichen auf der Leitung 37 besser verträglich sind mit der Annahme, dass
ein lateinisches Zeichen (Leitung 14) abgetastet und als numerisch bzw. kyrillisch verkannt worden ist, als umgekehrt.
Mit anderen Worten sind die lateinischen Zeichen besser verträglich mit der Annahme, dass numerische oder kyrillische
Zeichen abgetastet und als lateinische Zeichen verkannt wurden Wenn die Wahrscheinlichkeit grosser ist, dass das abgetastete
Wort dem im Schieberegister 24 gespeicherten lateinischen Zeichenfeld entspricht, wird der Vergleicher 50 einen Schalter
51 betätigen, so dass das lateinische Zeichenfeld aus dem Schieberegister 24 in das Ausgangsregister 52 übertragen und
auf der Ausgangsleitung 53 für die Weiterverarbeitung zur
Verfugung gestellt wird. In den Ausgangsdatenstrom kann über die Leitung 54 ein Kennzeichen für das lateinische Alphabet
eingefügt werden.
Wenn das Produkt der den numerischen Zeichen zugeordneten zusammengesetzten bedingten Wahrscheinlichkeiten im Register
49 grosser ist als das Produkt der in den Registern 47 und
gespeicherten Wahrscheinlichkeiten, betätigt der Vergleicher
50 einen Schalter 55, wodurch das im Register 30 gespeicherte numerische Zeichenfeld über das Ausgangsregister 52 auf die
Ausgangsleitung 53 zur Uebertragung und Weiterverarbeitung
WA9-75-001 - 35 -
709817/0676
ausgegeben wird. Ein Kennzeichen für das numerische Alphabet kann dabei von einem Kennzeichengenerator 56 über die Leitung
54 in den Ausgangsstrom auf der Leitung 53 eingefügt werden.
Falls die dem kyrillischen Alphabet zugeordnete, im Register 48 gespeicherte Wahrscheinlichkeit grosser ist als das Produkt
der Wahrscheinlichkeiten für die numerischen und lateinischen Alphabete in den Registern 47 und 49, schaltet der \fergleicher
50 den Schalter 57, wodurch das kyrillische Zeichenfeld aus dem Register 27 auf das Ausgangsregister 52 und die· Ausgangsleitung
53 geschaltet wird.
Der bisher beschriebene Diskriminator kann ohne Abweichung vom Erfindungsgedanken modifiziert werden, um die gleiche Art
der Unterscheidung beispielsweise zwischen verschiedenen Schriftarten der gleichen Kategorie oder zwischen handgeschriebenen
und maschinengeschriebenen Zeichen auszuführen. Gemäss den Fig. 2 und 4 ist die Arbeitsweise des Diskriminators
im allgemeinen derart, dass für ein lateinisches Zeichen "G" auf der α-Achse (Leitung 14), das kyrillische
Zeichen auf der ß-Achse (Leitung 16) ein " fl" und das Zahlzeichen
auf der γ-Achse (Leitung 18) eine "4" ist, die Speicher 35, 36 und 37 die Matrizen 1, 58 und 59 der zusammengesetzten
Wahrscheinlichkeiten in die zugeordneten zweidimen-
WA9-75-001 - 36 -
709817/0678
2640S37
sionalen Arbeitsspeicher 60, 61 und 62 übertragen. Dann veranlasst
der Arbeitsspeicher 60, dem über die Leitung 63 das 3 = Ά -Zeichen zugeführt wird, den Zugriff zu einer Spalte
von Wahrscheinlichkeitswerten in der Matrix 1 und deren Uebertragung in den eindimensionalen Arbeitsspeicher 64. Entsprechend
wird das y=4-Zeichen auf der Leitung 65 den Wahrscheinlichkeitswert in der Matrix 1 aus dem Speicher 64 abrufen und zum Ausgaberegister
38 übertragen. Diese singuläre Wahrscheinlichkeit ist in der Matrix 1 am Schnittpunkt der ß- und γ-Achsen für
die entsprechenden Werte " Ά" und "4" gespeichert. In gleicher
Weise erfolgt der Zugriff zu den zweidimensionalen Speichern
61 und 62 durch die α- und γ-Zeichen über die Leitungen 66 und 67, um einen Satz eindimensionaler Wahrscheinlichkeitswerte
aus den Matrizen 58 und 59 abzurufen und in die eindimensionalen Arbeitsspeicher 68 und 69 zu übertragen. Die γ- und α-Zeichen
auf den Leitungen 70 und 71 veranlassen die Uebertragung der singulären Wahrscheinlichkeitswerte von den Matrizen 58 und
in die Register 40 und 41. Wie bereits erwähnt, werden die Werte PMrr der zusammengesetzten bedingten Wahrscheinlichkeiten,
die sequentiell in den Registern 38, 40 und 41 gespeichert sind, sequentiell in den ihnen zugeordneten Multiplikatoren 39, 42
und 43 multipliziert. Der Multiplikationsprozess läuft kontinuierlich, bis das Produkt aller bedingten Wahrscheinlichkeiten
für die in den Schieberegistern 24, 27 und 30 gespeicherten
WA9-75-001 - 37 -
7098177 0676
lateinischen, kyrillischen und numerischen Felder berechnet ist. Der Vergleicher 50 ermittelt dann, welches der Produkte
das grösste ist und betätigt einen der Schalter 51, 57 oder 55, um die Uebertragung der Zeichen des korrekten Zeichenfeldes
an das Ausgangsregister 52 zu gestatten. Die Rückstellung aller Speicher erfolgt durch einen Rückstellkreis
WA9-75-001 - 38 -
709817/0676
Claims (3)
- PATENTANSPRÜCHEVerfahren zum Unterscheiden zwischen N>2 Alphabeten angehörende Zeichen, die in einem von einem Zeichenleser abgetasteten Zeichenfeld vorkommen können, zum Ausgeben von den N>2 Alphabeten angehörenden Zeichen über N>2 den Alphabeten individuell zugeordnete Ausgabeleitungen, wobei jedes ausgegebene Zeichen für sein Alphabet bestmöglich mit einem abgetasteten Zeichen übereinstimmt, gekennzeichnet durch die Verfahrensschrittc: Speichern eines Wertes der bedingten Wahrscheinlichkeit, dass ein bestimmtes Zeichen eines Alphabets vom Zeichenleser angegeben wurde, wenn aber Zeichen eines anderen Alphabets abgetastet wurden, in jedem von mit den N Ausgabeleitungen \rerbundenen N Speichern, Abrufen aus den N Speichern von N Werten von bedingten Wahrscheinlichkeiten, dass jedes auf einer Ausgabeleitung angegebene Zeichen eines Alphabets durch den Zeichenleser falsch erkannt und daher fälschlich auf einer der anderen Ausgabeleitungen angegeben worden ist, Multiplizieren aller abgerufenen N Werte der bedingten Wahrscheinlichkeiten gesondert für jedes der vom Zeichenleser über die N Ausgabeleitungen angegebenen Alphabete, um Produkte der entsprechenden bedingten Wahrscheinlichkeiten zu entwickeln, undVergleichen in einem Vergleicher der Grossen jedes der N Produkte der bedingten Wahrscheinlichkeiten, um das möglicherweise zutreffende der vom Zeichenleser ange-WA 975 001 - 39 -709817/0678ORiQiNAL INSPECTEDgebenen Zeichen mit demjenigen Produkt der bedingten Wahrscheinlichkeiten zu korrelieren, welches den grössten Wert aufweist.
- 2. Verfahren nach Patentanspruch 1, zum Unterscheiden zwischen zu zwei Buchstabenalphabeten und zu einem Zahlzeichenalphabet gehörenden Zeichen eines Zeichenfeldes, wobei über eine erste Ausgabeleitung mit dem ersten Buchstabenalphabet bestmöglich übereinstimmende Zeichen ausgegeben werden, über eine zweite Ausgabeleitung mit dem zweiten Buchstabenalphabet bestmöglich übereinstimmende Zeichen und über eine dritte Ausgabeleitung mit dem Zahlzeichenalphabet bestmöglich übereinstimmende Zeichen ausgegeben werden, dadurch gekennzeichnet, dass in den drei Ausgabeleitungen zugeordneten Speichern den Zeichen ihrer Alphabete entsprechende bedingte Wahrschein]ichkeitswerte gespeichert werden, die für jedes vom Zeichenleser über eine Ausgabeleitung gelieferte Zeichen eines Alphabets angeben, mit welcher Wahrscheinlichkeit gleichzeitig die möglichen Kombina-tionen der Zeichen der beiden anderen Alphabete über die diesen zugeordneten Ausgabeleitungen geliefert werden, wenn tatsächlich ein zu diesen anderen Alphabeten gehörendes Zeichen abgetastet wurde,Abrufen der gespeicherten bedingten Wahrscheinlichkeitswerte aus den drei Speichern durch eine je einem abgetasteten ZeichenWA 975 001 - 40 -709817/0670entsprechende Zeichentriade schrittweise für alle Zeichen des Zeichenfeldes,iteratives Multiplizieren aller einem Alphabet zugeordneten, abgerufenen bedingten Wahrscheinlichkeitswerte miteinander getrennt für alle drei Alphabete, zum Ermitteln eines Wertes der bedingten Gesamtwahrscheinlichkeit, dass alle dem einen der Alphabete zugeordneten Zeichen falsch erkannt worden sind als den jeweils anderen Alphabeten zuzuordnende Zeichen, und Vergleichen der ermittelten Werte der drei Gesamtwahrscheinlichkeiten und Durchschalten derjenigen Ausgabeleitung, über welche die Zeichen ausgegeben werden, denen jeweils der grösste Wert der Gesamtwahrscheinlichkeit zugeordnet ist.
- 3. Vorrichtung zur Durchführung der Verfahren nach Anspruch 1 und/oder 2, dadurch gekennzeichnet, dass die N Speicher je einen ersten N-dimensionalen Speichersektor (35, 36, 37) einen zweiten (N-i)-dimensionalen Speichersektor (60, 61, 62), usw., bis einen letzten (N-n=1)-dimensionalen Speichersektor (64, 68, 69) umfassen, wobei jeweils der Speichersektor mit der niedrigeren Dimension an den Speichersektor der nächsthöheren Dimension sowie an ein Adressregister (25, 28, 31) angeschlossen ist, mit dem die Speichersektoren der höheren Dimensionen des gleichen Speichers nicht verbunden sind, dass die 1-dimensionalen Speichersektoren (64, 68, 69) über Ausgaberegister (38, 40, 41) mit den Multiplikatoren (39, 42, 43) verbunden sind, und dass alle Speichersektoren (35, 36, 37; 60, 61, 62; 64, 68, 69) als Festwertspeicher ausgebildet sind, in denen Tabellenwerte bedingter Wahrscheinlichkeiten in Form von Matrizen gespeichert sind, deren Dimension durch die Dimension des betreffenden Speichersektors bestimmt ist.' · WA 975 001 - 41 -
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US05/625,618 US3988715A (en) | 1975-10-24 | 1975-10-24 | Multi-channel recognition discriminator |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2640537A1 true DE2640537A1 (de) | 1977-04-28 |
Family
ID=24506884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19762640537 Ceased DE2640537A1 (de) | 1975-10-24 | 1976-09-09 | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen |
Country Status (8)
Country | Link |
---|---|
US (1) | US3988715A (de) |
JP (1) | JPS5253634A (de) |
CA (1) | CA1061000A (de) |
CH (1) | CH604277A5 (de) |
DE (1) | DE2640537A1 (de) |
FR (1) | FR2329023A1 (de) |
GB (1) | GB1554884A (de) |
IT (1) | IT1075853B (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3026055A1 (de) * | 1980-07-09 | 1982-01-28 | Computer Gesellschaft Konstanz Mbh, 7750 Konstanz | Schaltungsanordnung zur maschinellen zeichererkennung |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4373193A (en) * | 1977-08-29 | 1983-02-08 | Hewlett-Packard Company | Logic state analyzer |
JPS5854433B2 (ja) * | 1980-09-11 | 1983-12-05 | 日本電気株式会社 | 相違度検出装置 |
US4593367A (en) * | 1984-01-16 | 1986-06-03 | Itt Corporation | Probabilistic learning element |
US4620286A (en) * | 1984-01-16 | 1986-10-28 | Itt Corporation | Probabilistic learning element |
US4599692A (en) * | 1984-01-16 | 1986-07-08 | Itt Corporation | Probabilistic learning element employing context drive searching |
US4599693A (en) * | 1984-01-16 | 1986-07-08 | Itt Corporation | Probabilistic learning system |
GB2179483B (en) * | 1985-08-20 | 1989-08-02 | Nat Res Dev | Apparatus and methods for analysing data arising from conditions which can be represented by finite state machines |
US4805225A (en) * | 1986-11-06 | 1989-02-14 | The Research Foundation Of The State University Of New York | Pattern recognition method and apparatus |
US4897880A (en) * | 1987-02-17 | 1990-01-30 | Soricon Corporation | Data acquisition control method and system for a hand held reader |
JPH0634256B2 (ja) * | 1987-03-04 | 1994-05-02 | シャープ株式会社 | 接触文字切出し方法 |
US5257323A (en) * | 1991-05-29 | 1993-10-26 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
JP3046111B2 (ja) * | 1991-11-08 | 2000-05-29 | キヤノン株式会社 | 文字認識方法及びその装置 |
US5848187A (en) * | 1991-11-18 | 1998-12-08 | Compaq Computer Corporation | Method and apparatus for entering and manipulating spreadsheet cell data |
US5459739A (en) * | 1992-03-18 | 1995-10-17 | Oclc Online Computer Library Center, Incorporated | Merging three optical character recognition outputs for improved precision using a minimum edit distance function |
JP3131287B2 (ja) * | 1992-05-27 | 2001-01-31 | 株式会社日立製作所 | パターン認識装置 |
TW222337B (de) * | 1992-09-02 | 1994-04-11 | Motorola Inc | |
US6272238B1 (en) * | 1992-12-28 | 2001-08-07 | Canon Kabushiki Kaisha | Character recognizing method and apparatus |
US5377280A (en) * | 1993-04-19 | 1994-12-27 | Xerox Corporation | Method and apparatus for automatic language determination of European script documents |
US5434932A (en) * | 1994-07-28 | 1995-07-18 | West Publishing Company | Line alignment apparatus and process |
US5805747A (en) * | 1994-10-04 | 1998-09-08 | Science Applications International Corporation | Apparatus and method for OCR character and confidence determination using multiple OCR devices |
JP2737734B2 (ja) * | 1995-12-13 | 1998-04-08 | 日本電気株式会社 | 指紋分類装置 |
US5913185A (en) * | 1996-08-19 | 1999-06-15 | International Business Machines Corporation | Determining a natural language shift in a computer document |
GB9625284D0 (en) * | 1996-12-04 | 1997-01-22 | Canon Kk | A data processing method and apparatus for identifying a classification to which data belongs |
US6137863A (en) * | 1996-12-13 | 2000-10-24 | At&T Corp. | Statistical database correction of alphanumeric account numbers for speech recognition and touch-tone recognition |
US6154579A (en) * | 1997-08-11 | 2000-11-28 | At&T Corp. | Confusion matrix based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US6219453B1 (en) | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
US6047251A (en) * | 1997-09-15 | 2000-04-04 | Caere Corporation | Automatic language identification system for multilingual optical character recognition |
US6141661A (en) * | 1997-10-17 | 2000-10-31 | At&T Corp | Method and apparatus for performing a grammar-pruning operation |
US6205428B1 (en) | 1997-11-20 | 2001-03-20 | At&T Corp. | Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers |
US6223158B1 (en) | 1998-02-04 | 2001-04-24 | At&T Corporation | Statistical option generator for alpha-numeric pre-database speech recognition correction |
US6205261B1 (en) | 1998-02-05 | 2001-03-20 | At&T Corp. | Confusion set based method and system for correcting misrecognized words appearing in documents generated by an optical character recognition technique |
US6272456B1 (en) * | 1998-03-19 | 2001-08-07 | Microsoft Corporation | System and method for identifying the language of written text having a plurality of different length n-gram profiles |
AUPP340798A0 (en) * | 1998-05-07 | 1998-05-28 | Canon Kabushiki Kaisha | Automated video interpretation system |
US6400805B1 (en) | 1998-06-15 | 2002-06-04 | At&T Corp. | Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition |
US7937260B1 (en) | 1998-06-15 | 2011-05-03 | At&T Intellectual Property Ii, L.P. | Concise dynamic grammars using N-best selection |
US7031925B1 (en) | 1998-06-15 | 2006-04-18 | At&T Corp. | Method and apparatus for creating customer specific dynamic grammars |
CA2400345C (en) * | 2000-03-06 | 2007-06-05 | Iarchives, Inc. | System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location |
US7120302B1 (en) * | 2000-07-31 | 2006-10-10 | Raf Technology, Inc. | Method for improving the accuracy of character recognition processes |
RU2251737C2 (ru) * | 2002-10-18 | 2005-05-10 | Аби Софтвер Лтд. | Способ автоматического определения языка распознаваемого текста при многоязычном распознавании |
JPWO2004084121A1 (ja) * | 2003-03-17 | 2006-06-22 | 富士通株式会社 | 車両識別方法及び装置 |
US7587308B2 (en) * | 2005-11-21 | 2009-09-08 | Hewlett-Packard Development Company, L.P. | Word recognition using ontologies |
US7781693B2 (en) | 2006-05-23 | 2010-08-24 | Cameron Lanning Cormack | Method and system for sorting incoming mail |
US8055104B2 (en) | 2007-03-02 | 2011-11-08 | Adi, Llc | Process performance evaluation for Enterprise data systems |
US8005775B2 (en) * | 2008-03-18 | 2011-08-23 | Yahoo! Inc. | System and method for detecting human judgment drift and variation control |
JP6011214B2 (ja) * | 2012-09-28 | 2016-10-19 | オムロン株式会社 | 画像処理システムおよび画像処理方法 |
US10192127B1 (en) | 2017-07-24 | 2019-01-29 | Bank Of America Corporation | System for dynamic optical character recognition tuning |
US10346702B2 (en) | 2017-07-24 | 2019-07-09 | Bank Of America Corporation | Image data capture and conversion |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1015014B (it) * | 1973-10-25 | 1977-05-10 | Ibm | Sistema di elaborazione dei dati perfezionato per l analisi di ca ratteri provenienti da un lettore ottico |
US3842402A (en) * | 1973-10-25 | 1974-10-15 | Ibm | Bayesian online numeric discriminator |
-
1975
- 1975-10-24 US US05/625,618 patent/US3988715A/en not_active Expired - Lifetime
-
1976
- 1976-09-09 DE DE19762640537 patent/DE2640537A1/de not_active Ceased
- 1976-09-14 CH CH1164176A patent/CH604277A5/xx not_active IP Right Cessation
- 1976-09-22 FR FR7629487A patent/FR2329023A1/fr active Granted
- 1976-09-24 IT IT27580/76A patent/IT1075853B/it active
- 1976-09-30 GB GB40581/76A patent/GB1554884A/en not_active Expired
- 1976-10-22 JP JP51126350A patent/JPS5253634A/ja active Granted
- 1976-10-25 CA CA264,592A patent/CA1061000A/en not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3026055A1 (de) * | 1980-07-09 | 1982-01-28 | Computer Gesellschaft Konstanz Mbh, 7750 Konstanz | Schaltungsanordnung zur maschinellen zeichererkennung |
Also Published As
Publication number | Publication date |
---|---|
FR2329023A1 (fr) | 1977-05-20 |
GB1554884A (en) | 1979-10-31 |
JPS5711473B2 (de) | 1982-03-04 |
CH604277A5 (de) | 1978-08-31 |
CA1061000A (en) | 1979-08-21 |
US3988715A (en) | 1976-10-26 |
JPS5253634A (en) | 1977-04-30 |
IT1075853B (it) | 1985-04-22 |
FR2329023B1 (de) | 1979-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE3689416T2 (de) | Mustermerkmalextraktion. | |
DE69722971T2 (de) | Automatisches sprachenerkennungssystem für die mehrsprachige optische zeichenerkennung | |
DE60204005T2 (de) | Verfahren und einrichtung zur erkennung eines handschriftlichen musters | |
DE69602444T2 (de) | System und verfahren zum einschränken des suchumfangs in einem lexikon | |
DE69030310T2 (de) | Beschränkungsabhängig gesteuerte on-line Erkennung von handgeschriebenen Zeichen und Symbolen | |
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE69230092T2 (de) | Verfahren und Gerät zur Zeichenerkennung | |
DE69610478T2 (de) | Zeichenerkennungssystembestimmung von abgetasteten und "echtzeit"-handgeschriebenen zeichen | |
DE2541204C3 (de) | Einrichtung zur Fehlerkorrektur | |
DE3716787C2 (de) | ||
DE69428590T2 (de) | Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung | |
DE69424196T2 (de) | Automatische Zeichenerkennung mit Verwendung statischer und dynamischer Parameter | |
DE3485953T2 (de) | Verfahren und anlage zur on-line-erkennung handgeschriebener muster. | |
DE69417105T2 (de) | Vorrichtung und Verfahren zum Erkennen handgeschriebener Symbole | |
EP1665132B1 (de) | Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten | |
DE68916978T2 (de) | Zeichenkettenerkennungssystem. | |
DE3851867T2 (de) | Zeichenerkennungsgerät. | |
DE69426479T2 (de) | Optische Mehrfontzeichenerkennung mit einem Verbindungsschachtelansatz | |
DE4232507A1 (de) | Verfahren zum Kennzeichnen, Wiederauffinden und Sortieren von Dokumenten | |
DE3632832A1 (de) | Zeichenerkennungssystem | |
DE69329330T2 (de) | Texterkennung | |
DE2540101A1 (de) | Automatisches zeichenerkennungs- system | |
DE2435889B2 (de) | Verfahren und einrichtung zur unterscheidung von zeichengruppen | |
DE60031502T2 (de) | Verfahren und Vorrichtung zur Typbestimmung eines Formblatts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OD | Request for examination | ||
8131 | Rejection |