DE69319514T2 - Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung - Google Patents

Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung

Info

Publication number
DE69319514T2
DE69319514T2 DE69319514T DE69319514T DE69319514T2 DE 69319514 T2 DE69319514 T2 DE 69319514T2 DE 69319514 T DE69319514 T DE 69319514T DE 69319514 T DE69319514 T DE 69319514T DE 69319514 T2 DE69319514 T2 DE 69319514T2
Authority
DE
Germany
Prior art keywords
pixel
comparisons
standard pattern
comparison
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69319514T
Other languages
English (en)
Other versions
DE69319514D1 (de
Inventor
Hadar C/O Canon Res. Cen. America Inc Palo Alto Ca 94304 Avi-Itzhak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69319514D1 publication Critical patent/DE69319514D1/de
Publication of DE69319514T2 publication Critical patent/DE69319514T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

  • Die Erfindung betrifft die Erkennung von eingegebenen Symbolen und insbesondere die Verbesserung von Bildelement- Standardmustern zur Erleichterung des Übereinstimmungsvergleichs der Standardmuster mit den eingegebenen Symbolen. Die Symbole können beispielsweise optische Zeichen (Text), Radarrückgabesignale oder Phonem-Klangmuster zur Audiomustererkennung sein.
  • Bisher wurden Korrelationskoeffizienten zur Identifikation eingehender Bildelementbilder, wie Radarrückgabesignale und Zeichenbitmaps, verwendet. Die eingegebenen Bildelementbilder wurden mit Bibliothek-Standardmusterbildern bildelementweise verglichen. Die Summe aller Bildelementvergleiche bei jedem Bild-/Standardmuster-übereinstimmungsvergleich erzeugte einen die engste Übereinstimmung anzeigenden Korrelationskoeffizienten. Dieses herkömmliche Korrelationsverfahren beinhaltete jedoch keine Änderung oder Verbesserung der die Bibliothekstandardmuster bildenden Bildelemente.
  • Die US-A-5 204 914 offenbart ein Zeichenerkennungsverfahren mit den Schritten Erfassen eines zweidimensionalen Bildelementarrays, wobei sich ein unbekanntes Zeichen in dem zweidimensionalen Array befindet, Berechnen gewichteter Korrelationskoeffizienten zwischen dem unbekannten Zeichen und einen trainierten bzw. gelernten Zeichensatz und Erkennen des unbekannten Zeichens als gelerntes Zeichen mit dem am höchsten gewichteten Korrelationskoeffizienten über dem Schwellenwert.
  • Die US-A-3 191 149 offenbart ein Spezifikationsidentifikationsgerät zum Übereinstimmungsvergleich eines Spektrums mit einem Satz von Referenzen. Die Referenzen werden im Ansprechen auf Abweichungen allmählich verändert.
  • Entsprechend einer Ausgestaltung der Erfindung ist ein Verfahren zur Erkennungsverbesserung einer Bibliothek von L nicht verbesserten Bildelementbildern bezüglich einer vorher vorhandenen Gruppe von G Bildelementsymbolen zur Ausbildung einer Bibliothek von G Erkennungs-verbesserten Bildelement- Standardmustern der G Bildelementsymbole ausgestaltet, mit den Schritten Vergleichen jedes der G Bildelementsymbole mit jedem der L Bildelementbilder zum Erhalten von G x L Vergleichen, die G Sätze von L vergleichen, einen Satz von L Vergleichen für jedes Bildelementsymbol Si der G Bildelementsymbole, ausbilden, wobei jeder Satz von Vergleichen einen Vergleich Ci für jedes Bildelementbild Ij aufweist, Identifizieren des Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze von Vergleichen mit dem engsten Vergleich mit dem Bildelenentsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Primärvergleichen bildet, Identifizieren des Sekundärvergleichs aus den L-1 verbleibenden Vergleichen in jedem der G Sätze von Vergleichen mit dem nächst-engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Sekundärvergleichen bildet, um G Paar von identifizierten Vergleichen C* und C**, ein Paar aus jedem der G Sätze von Vergleichen, zu erhalten, Bestimmen von G Erkennungsspielräumen, einen Erkennungsspielraum zwischen jedem Paar der identifizierten Vergleiche C* und C**, wobei die Größe eines Erkennungsspielraums die Differenz zwischen dem Wert von C* und dem Wert von C** ist, Auswählen des einzigen Paars identifizierter Vergleiche C* und C** mit dem kleinsten Erkennungsspielraum M* von allen G Paaren identifizierter Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr für eine korrekte Bilderkennung interpretiert wird, Identifizieren des dem Paar identifizierter Vergleiche C* und C** entsprechenden einzigen Paars von Bildelementbildern I* und I** Gewichten bestimmter Bildelemente des engesten Bildelementbildes I* und des nächst-engsten Bildelementbildes I** die dem ausgewählten Paar identifizierter Vergleiche C* und C** entsprechen, um den Erkennungsspielraum M* dazwischen inkremental zu erhöhen, wodurch bewirkt wird, daß die Bildelementbilder das engste Bildelement-Standardmuster T* oder das nächst-engste Bildelement-Standardmuster T** oder beides werden, und Wiederholen der Vergleichs-, Identifikations-, Bestimmungs-, Auswahl- und Gewichtungsschritte bis der zwischen den nicht verbesserten Bildelement-Eingangsbildern und den verbesserten Bildelement- Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung dient, wobei die Bibliothek der Bildelementbilder somit eine Bibliothek verbesserter Symbol- Standardmuster geworden ist, die bezüglich der vorher vorhandenen Gruppe von G Bildelementsymbolen Erkennungs-verbessert wurden, wobei zumindest einige dieser Standardmuster gewichtete Bildelementaberrationen aufweisen, die in dem entsprechenden Bildelementsymbol der vorher vorhandenen Gruppe von G Bildelementsymbolen nicht vorhanden sind.
  • Gemäß einer anderen Ausgestaltung der Erfindung ist ein Gerät zur Erkennungsverbesserung einer Bibliothek von L nicht verbesserten Bildelementbildern bezüglich einer vorher vorhandenen Gruppe von G Bildelementsymbolen zur Ausbildung einer Bibliothek von G Erkennungs-verbesserten Bildelement- Standardmustern der G Bildelementsymbole ausgestaltet, mit einer ersten Speichereinrichtung zur Speicherung der Bibliothek der zu verbessernden L nicht verbesserten Bildelementbilder zum Erhalten der Bibliothek der G Erkennungsverbesserten Bildelement-Standardmuster, einer zweiten Speichereinrichtung für die vorher vorhandene Gruppe von G Bildelementsymbolen, einer Vergleichereinrichtung zum Vergleich jedes der G Bildelementsymbole mit jedem der L Bildelementbilder zum Erhalten von G x L Vergleichen, die G Sätze von L Vergleichen, einen Satz von L Vergleichen für jedes Bildelementsymbole Si der G Bildelementsymbole, ausbilden, wobei je der Satz von Vergleichen einen Vergleich Ci für jedes Bildelement Ij aufweist, einer ersten Identifizierungseinrichtung zur Identifizierung der Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze von Vergleichen mit dem engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Primärvergleichen bildet, einer zweiten Identifizierungseinrichtung zur Identifizierung des Sekundrvergleichs C** aus den L-1 verbleibenden Vergleichen in jedem der G Sätze von Vergleichen mit dem nächstengsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Sekundärvergleichen C** bildet, um G Paare identifizierter Vergleiche C* und C**, ein Paar für jeden der G Sätze von Vergleichen, auszubilden, einer Bestimmungseinrichtung zur Bestimmung von G Erkennungsspielräumen, einen Erkennungsspielraum zwischen jedem Paar identifizierter Vergleiche C* und C** wobei die Größe eines Erkennungsspielraums die Differenz zwischen dem Wert von C* und dem Wert von C** ist, einer Auswahleinrichtung zur Auswahl des einzigen Paars identifizierter Vergleiche C* und C** mit dem kleinsten Erkennungsspielraum M* von allen G Paaren identifizierter Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr für eine korrekte Bilderkennung interpretiert wird, einer dritten Identifizierungseinrichtung zur Identifizierung des einzigen Paars von Bildelementbildern I* und I**, die dem Paar identifizierter Vergleiche C* und C** entsprechen, einer Gewichtungseinrichtung zur Gewichtung bestimmter Bildelemente des engstenbildelementbildes I* und des nächst-engsten Bildele mentbildes I**, die dem ausgewählten Paar identifizierter Vergleiche C* und C** entsprechen, um den Erkennungsspielraum M* dazwischen inkremental zu erhöhen, wodurch bewirkt wird, daß die Bildelementbilder das engste Bildelement- Standardmuster T* oder das nächst-engste Bildelement- Standardmuster T** oder beides werden, wobei die Vergleichereinrichtung, die erste, zweite und dritte Identifizierungseinrichtung, die Bestimmungseinrichtung, die Auswahleinrichtung und die Gewichtungseinrichtung zur Wiederholung des Vergleiches, der Identifizierung, Bestimmung, Auswahl und Gewichtung betreibbar sind, bis der zwischen den nicht verbesserten Bildelement-Eingangsbildern und den verbesserten Bildelement-Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung dient, wobei die Bibliothek der Bildelementbilder somit eine Bibliothek verbesserter Symbol-Standardmuster geworden ist, die bezüglich der vorher vorhandenen Gruppe von G Bildelementsymbolen Erkennungsverbessert wurden, wobei zumindest einige dieser Standardmuster gewichtete Bildelementaberrationen aufweisen, die in den entsprechenden Bildelementsymbolen der vorher vorhandenen Gruppe von G Bildelementsymbolen nicht vorhanden sind.
  • Nachstehend werden Ausführungsbeispiele der Erfindung unter Bezugnahme auf die beiliegende Zeichnung beschrieben. Es zeigen:
  • Fig. 1A eine Vergleichsmatrix (allgemeiner Fall) von G x L Vergleichen zwischen einer Gruppe von G Eingangssymbolen und einer Bibliothek von L Bildern,
  • Fig. 1B eine Vergleichsmatrix zwischen Kleinbuchstaben- Eingangssymbolen a-z und einer Bibliothek für Kleinbuchstabem-Bilder,
  • Fig. 2 ein Ablaufdiagramm der Schritte in dem Verfahren zur Standardmusterverbesserung,
  • Fig. 3A ein Diagramm von Anfangs-Bildvergleichskoeffizienten zwischen dem einzelnen Kleinbuchstaben-Eingangssymbol o und den Kleinbuchstaben a-z in Fig. 1B,
  • Fig. 3B ein Diagramm fortgeschrittener Standardmuster- Vergleichskoeffizienten zwischen dem Kleinbuchstaben- Eingangssymbol o und den Kleinbuchstaben a-z,
  • Figuren 4A und 4B Diagramme für das Kleinbuchstaben- Eingangssymbol c ähnlich den Figuren 3A und 3B,
  • Figuren 5A und 5B Diagramme für das Kleinbuchstaben- Eingangssymbol e ähnlich den Figuren 3A und 3B,
  • Figuren 6A bis 6G Bildelement-Querschnitte der o-, c- und e- Standardmusterbitmaps, wobei die Entwicklung von Metapegeln und verblassenden Pegeln während des Verbesserungsvorgangs gezeigt ist, und
  • Fig. 7 ein schematisches Blockschaltbild eines Geräts zur Implementation des Standardmuster-Verbesserungsverfahrens in der Praxis.
  • Allgemeines Verbesserungsverfahren - (Fig. 1A, 1B und 2)
  • Eine Bibliothek von L nicht verbesserten Bildern (Bildelement-Bitmaps) wird zur optischen Zeichenerkennung (OCR) bezüglich einer vorher vorhandenen Gruppe von G Eingangssymbolen (Bildelement-Bitmaps) zur Erzeugung einer Bibliothek von G Erkennungs-verbesserten Standardmustern (Bildelement-Bitmaps) der G Eingangssymbole verbessert. Die Verbesserung wird durch einen Vergleich jedes Bildes der Bibliothek mit jedem Symbol der Gruppe und durch Gewichtung der Bilder mit der größten Verwechslungsmöglichkeit durchgeführt. Die Bibliothek L nicht verbesserter Bilder erstreckt sich entlang der vertikalen Achse der GxL-Vergleichsmatrix in Fig. 1A (gezeigt als Bilder I&sub1; I&sub2; I&sub3;...Ii...IL). Die vorher vorhandene Gruppe von G Eingangssymbolen erstreckt sich entlang der horizontalen Achse der Matrix (gezeigt als Symbole S&sub1; S&sub2; S&sub3;...Si...SG). Die Bibliothek G Erkennungs-verbesserter Standardmuster (T&sub1; T&sub2;...Ti...TG) ist nicht in der GxL-Matrix gezeigt. Allerdings erstrecken sich die Symbol-/Bild- Vergleiche für die Bibliothek der G Erkennungs-verbesserten Standardmuster entlang der Diagonalen der GxL-Matrix (gezeigt als Standardmustervergleiche T&sub1;&sub1; T&sub2;&sub2; T&sub3;&sub3;...Tij...TGL), wobei die Eingangssymbole den nicht verbesserten Bildern entsprechen. Diese diagonale Standardmusterbeziehung setzt voraus, daß die Symbole und Bilder entlang jeder Achse in der gleichen Reihenfolge vorhanden sind, d.h. Si = Ij und Si+1 = Ij+1. Eine Vergleichsmatrix für Kleinbuchstaben a-z ist in Fig. 1B gezeigt, wobei insbesondere die Symbol-/Bildvergleiche für das Cluster ähnlich aussehender Zeichen o, c und e veranschaulicht sind.
  • Die Schritte des Standardmusterverbesserungsverfahrens sind in Fig. 2 zusammengefaßt und werden nachstehend beschrieben.
  • Ausbilden der Bibliothek L nicht verbesserter Bildelementbilder (I&sub1; I&sub2; I&sub3;...Ij...IL), die sich in die unterscheidende Bibliothek G verbesserter Standardmuster entwickeln werden.
  • Ausbilden der Gruppe der G Bildelementsymbole (S&sub1; S&sub2; S&sub3;...Si...SG) in der bestimmten in Frage kommenden Benutzerschriftart. Übliche Schriftarten bzw. Fonts für alphanumerische Anwendungen sind Courier und Times Roman. Typischerweise enthalten Benutzerschriftarten
  • Großbuchstaben ABCDEFGHIJKLMNOPQRSTUVWXYZ
  • Kleinbuchstaben abcdefghijklmnopqrstuvwxyz
  • Zahlen 1234567890 und
  • Zeichen !$'$%^&*()&submin;+=[]{};'':"\ ,< .> /?.
  • Dieses Verbesserungsverfahren kann bei anderen Erkennungsanwendungen, wie bei Radarrückgabesignalen und Audioerkennungsanwendungen, einschließlich Phonem-Klangmuster (Sprachfonts) angewendet werden.
  • Die Schriftarten der nicht verbesserten Bilder und der Eingangssymbole können zur Maximierung des anfänglichen Symbol/Bildvergleichs und zur Ausbildung eines geeigneten Ausgangspunkts zur Standardmusterentwicklung identisch sein. Dagegen kann die anfängliche Bildschriftart eine allgemeine Schrift art oder eine spezielle Vorgängerschriftart der Eingangssymbolschriftart oder selbst ein auf weißem Rauschen beruhendes Standardmuster sein. Die Anzahl L von Bildern in der Bibliothek kann größer oder gleich der Anzahl von Symbolen G in der Gruppe sein. Die Bibliothek kann Bildeinträge aufweisen, die nicht in den Eingangssymbolen enthalten sind. Diese "freien" Bilder sind nicht an den Symbol-/Bildvergleichen beteiligt und verändern sich daher nicht und werden keine Standardmuster. L sollte nicht kleiner als G sein, um zu verhindern, daß sich ein einzelnes Bild im Ansprechen auf zwei getrennte Eingangssymbole zu entwickeln versucht.
  • Vergleichen jedes der G Eingangssymbole mit jedem der L nicht verbesserten Bilder zum Erhalten von GxL Vergleichen, wie es in Körper der GxL-Matrix in Fig. 1 gezeigt ist. Die Symbol/Bild-Vergleiche werden durch den Vergleich jedes Bildelements der allgemeinen nicht verbesserten Bilder Ij mit jedem Bildelement des allgemeinen Eingangssymbols Si beruhend auf einer Vergleichsfunktion durchgeführt (die nachstehend in dem Cauchy-Shwartz-Abschnitt näher beschrieben ist). Die GxL Vergleiche bilden G Sätze von L Vergleichen, einen Satz von L Vergleichen für jedes Eingangssymbol. Jeder Satz der L Vergleiche enthält einen Vergleich Cij für ein nicht verbessertes Bild Ij. Der Satz der Vergleiche für das allgemeine Symbol Si erstreckt sich in der Spalte über Si nach oben (gezeigt als Ci2 Ci2 Ci3...Tij...CIL). Der anfängliche Spaltensatz der L Vergleiche für das Eingangssymbol (Kleinbuchstabe)bezüglich einer alphanumerischen Bildschriftart wird in der Bildsatzdarstellung in Fig. 3A angezeigt.
  • Identifizieren des Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze der Vergleiche mit dem engsten Vergleich mit dem Bildelementsymbol Si für diesen Satz. Im ganzen werden G Primärvergleiche C* identifiziert, die eine Reihen-Primär-Auswahl (C&sub1;* C&sub2;* C&sub3;*...Ci*...CL*) bilden. Der höchste bzw. beste Vergleich C** für das Eingangssymbol (Kleinbuchstaben) ist natürlich das nicht verbesserte Bild o (Kleinbuchstaben).
  • Identifizieren des Sekundärvergleichs C** aus den L-1 verbleibenden Vergleichen in jedem der G Sätze der Vergleiche mit dem nächst-engsten Vergleich mit dem Eingangssymbol Si. Das dem Sekundärvergleich C** zugrundeliegende Bild ist das Bild, das am wahrscheinlichsten mit dem Eingangssymbol verwechselt wird. Im ganzen werden G Sekundärvergleiche C** identifiziert, die eine Reihen-Sekundärauswahl (C&sub1;** C&sub2;** C&sub3;**...Ci**...CL**) bilden. Die Primär- und Sekundärauswahl bilden G Paare identifizierter Vergleich C* und C**, ein Paar aus jedem der G Spaltensätze der Vergleiche. Der nächstbeste Vergleich C** für das Eingangssymbol o in Fig. 3A ist der o/c-Sekundärvergleich für das nicht verbesserte Bild c (Kleinbuchstaben). Die Symbole o und c und e bilden ein Cluster ähnlich geformter Bilder, die eine große Verwechslungsmöglichkeit aufweisen und "anti-Zeichen" werden (siehe nächster Abschnitt über Anti-Zeichen und Cluster).
  • Bestimmen von G Erkennungsspielräumen (M&sub1; M&sub2; M&sub3;...Mi...MG), einen Erkennungsspielraum zwischen jedem Paar identifizierter Primär- und Sekundärvergleich C* und C**. Im ganzen werden G Erkennungsspielräume M bestimmt. Die Größe des Spielraums M ist die Differenz zwischen dem Wert von C* und dem Wert von C**. Der o/c-Spielraum beträgt 0,88, wie es in Fig. 3A gezeigt ist.
  • Auswählen des einzigen Paars identifizierter Vergleiche C* und C**, die den kleinsten Erkennungsspielraum M* aller der G Paar identifizierter Vergleiche bilden. Je kleiner der Erkennungsspielraum ist, desto größer ist die Gefahr einer OCR- Verwechslung.
  • Identifizieren des einzigen Paars von Bildern I* und I**, die dem Paar identifizierter Vergleich C* und C** zugrunde liegen. Das Bild I* stellt die Übereinstimmung für das Eingangssymbol Si dar, und das Bild I** ist die Quelle für die größtmögliche Verwechslung mit Si.
  • Gewichten bestimmter Bildelemente entweder des engsten Bildelementbildes 1* oder des nächst-engsten Bildelementbildes I** oder beider, die dem ausgewählten Paar identifizierter Vergleich C* und C** zugrundeliegen, um den Erkennungsspielraum M* dazwischen zu erhöhen, wobei bewirkt wird, daß die Bildelementbilder das engste Bildelement-Standardmuster T* oder das nächst-engste Bildelement-Standardmuster T** oder beides werden.
  • Wiederholen der Vergleichs-, Identifizierungs-, Bestimmungs-, Auswahl- und Gewichtungsschritte, bis die Bibliothek der Bildelementbilder eine Bibliothek mit ausreichend verbesserten Symbolstandardmustern (T&sub1; T&sub2; T&sub3;...Ti...TG) geworden ist. Die gewichteten Bildelementaberrationen, die in den verbesserten Standardmustern erzeugt werden, sind in dem entsprechenden Bildelementsymbol der zuvor vorhandenen Gruppe der G Bildelementsymbole (S&sub1; S&sub2; S&sub3;...Si...SG) nicht vorhanden.
  • Abschluß
  • Der Verbesserungsgewichtungsvorgang ist beendet, wenn der zwischen den Eingangssymbolen und den Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter sicherer minimaler Wert ist. Das heißt, wenn selbst der am meisten fehlerträchtige Symbol-/Standardmustervergleich mit ausreichend hoher Wahrscheinlichkeit richtig ist. Der Vorgang kann auch beendet werden, wenn die inkrementale Erhöhung des kleinsten Spielraums kleiner als eine vorbestimmte minimale Erhöhung ist. Das heißt, wenn die Änderungsrate des Erkennungsspielraums der Standardmuster bei jeder Wiederholung vernachlässigbar ist und die dafür erforderliche Zeit nicht wert ist. Alternativ dazu kann der Vorgang nach der Ausführung einer bestimmten Anzahl von Gewichtungswiederholungen oder nach dem Ablauf einer zuvor zugewiesenen Verarbeitungszeitperiode gestoppt werden. Die Verbesserung der Standardmuster kann gelegentlich durch die Ausbildung eines lokalen Maximums in der Spielraumkontur zwischen dem Primärvergleich und dem Sekundärvergleich verlangsamt werden. Handelt es sich um ein instabiles lokales Maximum, geht es während nachfolgender Wiederholungen zurück und der Verbesserungsvorgang kehrt zu der vorherigen ungehinderten Geschwindigkeit zurück. Ist das lokale Maximum jedoch stabil, wird der Verbesserungsvorgang permanent zwischen dem Primär- und dem Sekundärvergleich gesperrt. Der Erkennungsspielraum bleibt auf dem gleichen Pegel ohne Änderung fest.
  • Anti-Zeichen - (Figuren 3A, 4A, 5A)
  • Die Symbole o, c und e bilden ein Cluster ähnlich geformter Bilder mit hoher Verwechslungswahrscheinlichkeit. Die Zeichen des Clusters werden abwechselnd Anti-Zeichen, wenn sie während des Verbesserungsvorgangs einander gegenüber stehen. Zu Beginn sind lediglich o und c Anti-Zeichen (fett in dem o- Spaltesatzdiagramm in Fig. 3A). Das Cluster der Anti-Zeichen für o wird dann erweitert und enthält die "censu"-Anti-Zeichen (fett in dem o-Spaltensatzdiagramm in Fig. 3B). Andere Cluster der ähnlich aussehenden Kleinbuchstaben-Anti- Zeichen werden durch f und t und durch h und b gebildet. Ein Beispiel eines Zeichendoppelgängers ist "," und ";". Ein besonders schwieriges Doppelgängerduster wird durch die Zahl 1, den Kleinbuchstaben 1, den Großbuchstaben I und das Ausrufezeichen "!" gebildet. Das Standardmuster für jedes Elementsymbol eines Clusters der Doppelgänger-Anti-Zeichen muß sich selbst gegenüber den anderen Elementen des gleichen Clusters unterscheiden.
  • Ein Vergleichsmatrix für Kleinbuchstabensymbole a-z ist in Fig 1B gezeigt, wo insbesondere die Symbol-/Bild-Vergleiche des Clusters der Doppelgängerzeichen o, c und e dargestellt sind. Die Eingangssymbolfonts (mit o, c und e als Kleinbuchstaben) erstrecken sich in alphanumerischer Ordnung entlang der horizontalen Achse der Vergleichsmatrix in Fig. 1B. Die Bildfonts (die auch o, c und e als Kleinbuchstaben enthalten) erstrecken sich entlang der vertikalen Achse. Der Anfangssatz der L Vergleiche des Eingangssymbols o mit jedem der Bilder ist in Fig. 1B gezeigt und erstreckt sich vertikal in einer Spalte oberhalb des Eingangssymbols o. In Fig. 1B sind aus Platzgründen lediglich die Kleinbuchstabenbilder gezeigt. Die Großbuchstaben, Zahlen und Zeichen wurden weggelassen.
  • Die Spalte L anfänglicher Vergleiche für das Einganssymbol (Kleinbuchstaben) wird in dem Bildsatzdiagramm in Fig. 3A in unterschiedlicher Form dargestellt. Die anfänglich nicht verbesserten Bilder erstrecken sich in alphanumerischer Reihenfolge entlang der x-Achse des Diagramms. Die Werte der Symbol-/Bildvergleiche (zwischen 0 und 1,00) werden über die y- Achse aufgetragen. Das o-Spaltensatzdiagramm in Fig. 3A beruht auf der Kleinbuchstaben-Vergleichsmatrix in Fig. 1B, d.h. auf den o-Vergleichen in der vertikalen Spalte, die sich über der o-Position entlang der horizontalen Achse erstreckt. Jedes Symbol der Gruppe der G Eingangssymbole weist ein unterschiedliches Bildsatzdiagramm aus L Symbol/Bildvergleichen ähnlich dem o-Satzdiagramm in Fig. 3A auf. Das Bildspaltensatzdiagramm der anfänglichen Vergleiche für das Eingangssymbol c ist in Fig. 4A gezeigt, und das Bildspaltensatzdiagramm für e ist in Fig. 5A gezeigt.
  • Während des Primärvergleichschritts werden im ganzen G Primärvergleiche C* identifiziert. Der beste Vergleich C* für das Eingangssymbol o (Kleinbuchstaben) ist natürlich das nicht verbesserte Bild o (Kleinbuchstaben). Der o/o-Vergleich (fett) weist einen Wert von 1,00 auf, da in dem Ausführungsbeispiel in Fig. 3A die Bildschriftart identisch mit der Symbolschriftart ist. C* für das Eingangssymbol c ist das Bild c mit einem Wert von 1,00 (siehe Fig. 4A - fett) und C* für das Eingangssymbol e ist das Bild e (siehe Fig. 5A - fett).
  • Während des Sekundärvergleichschritts werden im ganzen G Sekundärvergleiche C** identifiziert, die G Paare identifizierter Vergleich C* und C**, ein Paar aus jedem der G Sätze von Vergleichen, bilden. Der nächstbeste Vergleiche C** für das Eingangssymbol o in Fig. 3A ist der o/c-Vergleich (fett) für das nicht verbesserte Bild c (Kleinbuchstaben), der dem Symbol o ähnlicher als die anderen L-1 Bilder in der alphanumerischen Bibliothek ist. Der o/c-Vergleich (fett) weist einen Wert von lediglich 0,88 auf, da das Bild c mit dem Eingangssymbol o nicht identisch ist. Der ole-Vergleich in Fig. 3A beträgt mit 0,84 etwas weniger. Im Fall des Eingangssymbols c (siehe Fig. 4A) ist C** der Vergleich c/o (fett) mit einem Wert von 0,88. Im Fall des Eingangssymbols e (siehe Fig. 5A) ist C** der Vergleich e/c (fett) mit 0,86.
  • * Die Größe des Erkennungsspielraums M, der bei jeder Wiederholung bestimmt wird, ist die Differenz zwischen dem Wert C* und dem Wert C**. Der anfängliche o/c-Spielraum beträgt 0,12 (siehe Fig. 3A), und der anfängliche c/o-Spielraum beträgt auch 0,12 (siehe Fig. 4A). Der anfängliche e/c-Spielraum beträgt 0,14 (siehe Fig. 5A).
  • Allgemeiner Fall dM/dT* und dM/dT**
  • Der allgemeine Fall der Standardmusterverbesserung bezüglich eines bestimmten Eingangssymbols Si enthält die Maximierung des minimalen Erkennungsspielraums zwischen dem Primärvergleich C* und dem maximalen Sekundärvergleich C**, die das ausgewählte Paar identifizierter Vergleich C* und C** bilden, mit der allgemeinen Beziehung:
  • Maximieren von M = min[C* - max(C**)]
  • wobei
  • M der Erkennungsspielraum zwischen C* und C**,
  • C* der Primärvergleich für das Standardmuster T*, das das engste Standardmuster in der Bibliothek bezüglich des Eingangssymbols Si ist, und
  • C** der Sekundärvergleich für das Standardmuster T** ist, das das zweit-engste Standardmuster in der Bibliothek bezüglich des Eingangssymbol Si ist.
  • Multivariable Funktionen, wie der Erkennungsspielraum M, können durch eine Anzahl allgemeiner numerischer Optimierungsprozesse maximiert werden. Der bei dem Ausführungsbeispiel in den Figuren 3, 4 und 5 verwendete Prozeß ist das Gradientenanstiegs- oder steilste Anstiegverfahren und bezieht sich auf das steilste Abfall-Verfahren, das bei Minimierungsproblemen verwendet wird. Zur Erhöhung des Erkennungsspielraums M muß C** durch Gewichtung verringert oder C* erhöht werden oder, beides. Bei dem inkrementalen Gewichtungseffekt bei dem Standardmuster T** werden Bildelementaberrationen in dessen Bitmap entwickelt, wodurch C** verringert wird. Das heißt, nach mehreren Wiederholungen der Gewichtung sieht T** immer weniger wie das Eingangssymbol Si aus, wodurch ein niedrigerer Wert des Vergleichs C** bewirkt wird.
  • Die resultierende Erhöhung des c/o-Spielraums wird in dem fortgeschrittenen Standardmuster-Spaltensatzdiagramm in Fig. 3B angezeigt (direkt unter dem anfänglichen Bildsatzdiagramm in Fig. 3A). Das o-Standardmusterdiagramm zeigt einen fortgeschrittenen Satz der L Vergleiche für das Eingangssymbol (Kleinbuchstaben)bezüglich der Standardmuster (Kleinbuchstaben). Das fortgeschrittene Standardmusterdiagramm in Fig. 3B weist die gleiche Form wie das Anfangsbilddiagramm in Fig. 3A auf. Die verbesserten Standardmuster erstrecken sich in alphanumerischer Ordnung entlang der x-Achse des Diagramms. Der Wert des Vergleichs ist gegenüber der y- Achse aufgetragen. Der o/c-Spielraum hat sich von 0,12 in dem Anfangsbilddiagramm in Fig. 3A auf 0,21 in dem fortgeschrittenen Standardmusterdiagramm in Fig. 3B erhöht. Jedes der G Eingangssymbole weist ein unterschiedliches Standardmustersatzdiagramm mit L Vergleichen ähnlich dem o-Satz in Fig. 3B auf, das aus dem Anfangsbildsatzdiagramm entwickelt ist. Das Standardmuster-Spaltensatzdiagramm fortgeschrittener Vergleiche für das Eingangssymbol c ist in Fig. 4B gezeigt, und das Standardmustersatzdiagramm für e ist in Fig. 5B gezeigt.
  • Der inkrementale Gewichtungseffekt akkumuliert auch Bildelementaberrationen in dem Bitmap des Standardmusters T* und kann eine leichte Verringerung von C* bewirken. Das heißt, nach mehreren Wiederholungen der Gewichtung sieht T* immer weniger wie das Eingangssymbol Si aus. Da jedoch bei jeder Wiederholung M maximiert wird, bleibt C* auf einem Pegel nahe 1,00. Die resultierende Verringerung des ob-Vergleichs ist in dem fortgeschrittenen Standardmustersatzdiagramm in Fig. 3B ersichtlich. Der o/o-Vergleich wurde von 1,00 in Fig. 3A auf 0,96 in Fig. 38 verringert. Der c/c-Vergleich wurde auch auf 0,96 verringert (siehe Fig. 4B), und der e/e-Vergleich wurde 0,98 (siehe Fig. 5B).
  • Im Fall des Symbol-/Bildvergleichs o/c (siehe Fig. 3B) erhöht sich der o/c-Spielraum und erreicht den o/e-Spielraum von 0,21. Ist der o/c-Spielraum größer als der o/e-Spielraum, ersetzt C** des o/e-Vergleichs C** des o/c Vergleichs. Wenn die Wiederholungen fortschreiten, alterniert das Standardmuster T** zwischen dem Standardmuster c und dem Standardmuster e, bis sowohl der o/c-Spielraum als auch der o/e-Spielraum unter den Spielraum für ein anderes Bild wie n oder s fallen. Wenn sich der Erkennungsspielraum erhöht, wird das Cluster o der Anti-Zeichen erweitert und enthält c, e, n, s und u, wie es in Fig. 3B gezeigt ist. Eine weitere Verbesserung des o- Standardmusters würde den Spielraum ein wenig erhöhen, so daß m und z enthalten wären. Fig. 4B zeigt ein Cluster von Anti- Zeichen, die sich nahe dem Vergleichswert 0,75 für das Eingangssymbol c ansammeln, und Fig. 5B zeigt das Cluster c, und s bei 0,77.
  • Der maximale Spielraum M wird durch inkrementale Gewichtung des Standardmusters T* und des Standardmusters T** während der Vergleichs-Wiederholzyklen erreicht. Die inkrementalen Standardmustergewichtungen W* und W** werden über die erste Ableitung (Vektorgradient) des Erkennungsspielraums nach den Mehrfach-Vektorkomponenten der Standardmuster T* und T** bestimmt:
  • dM/dT* = dC/dT* - dC**/dT*
  • und
  • dM/dT** = dC*/dT** - dC**/dT**
  • Die Gewichtungserhöhungen bei jedem Schritt, die bei jeder Wiederholung zu T* und T** addiert werden, betragen:
  • W* = u*(dM/dT*)
  • und
  • W** = u**(dM/dT**)
  • wobei u* der Gewichtungsfaktor mu bei dM/dT* für jede Vergleichswiederholung
  • und
  • u** der Gewichtungsfaktor mu bei dM/dT** für jede Vergleichwiederholung ist.
  • Die Gewichtungsfaktoren u* und u** können gleich oder in Abhängigkeit von der Verbesserungsanwendung verschieden sein. Im allgemeinen unterstützt ein größeres mu eine größere Veränderung in M bei jeder Wiederholung, woraus sich eine höhere Entwicklungsrate ergibt. Jedoch können große Veränderungen ein Untertunneln des Zielmaximuns in der M-Funktion verursachen und instabile Oszillationen bei dem Wiederholungsvorgang auslösen. Kleine mu sind langsamer und stabiler. Ein gemäßigtes mu kann zum Erreichen eines Maximums verwendet werden und auf ein kleineres mu zur genaueren Lokalisierung des Maximas verringert werden.
  • Jede Wiederholung n des Verbesserungsvorgangs erzeugt ein neues Standardmuster Tn+1, das sich ein wenig von dem alten Standardmuster Tn unterscheidet:
  • T*n+1 = T*n + W* = T*n + u*(dM/dT*) = T*n + u*(dC*/dT* = dC**/dT*)
  • T**n-1= T**n + W**= T**n + u**(dM/dT**) = T**n + u**(dC*/dT** - dC**/dT**)
  • Mit jeder Wiederholung weichen T** und C** weiter von T* und C* ab, und der Erkennungsspielraum M wird größer. Die Trennung hält solange an, bis ein neues Paar identifizierter Primär- und Sekundärvergleiche C* und C** (mit neuen Standardmustern T* und T**) die gegenwärtigen ersetzen.
  • Entwicklung der o-Anti-Zeichen "censu"
  • Die Entwicklung der Bibliothek der Standardmuster im Ansprechen auf das Eingangssymbol o und des erweiterten Anti- Zeichen-Clusters c, e, n, s und u wird nachstehend beschrieben. Diese Wiederholung durch die Wiederholungssequenz beruht auf den Diagrammdaten der Figuren 3A und 38 und auf der Anfangsbedingung, daß das anfängliche Standardmuster o mit dem Symbol o identisch ist, wobei ein einziger Gewichtungsfaktor u*=u**=0,01 ist.
  • Bein=0 (vor einer Wiederholung)
  • Standardmuster o&sub0; = Eingangssymbol o
  • Bei n=10 (nach 10 Wiederholungen)
  • Standardmuster o&sub1;&sub0; = (Standardmuster o&sub0;) - 0,10
  • (Standardmuster c)
  • Der c-Standardmusterkoeffizient ist das Produkt aus (n) (u)=(10) (0,01)=10. Bei den ersten zehn Wiederholungen 1-10 ist das Standardmuster für C** lediglich das Standardmuster c, und die Erhöhung von M pro Wiederholungen ist außerordentlich groß.
  • Bei n=16
  • Standardmuster o&sub1;&sub6; = (Standardmuster o&sub0;) - 0.13
  • (Standardmuster c) - 0,03 (Standardmuster e)
  • Während der sechs Wiederholungen 11-16 alterniert das Standardmuster für C** zwischen Standardmuster c und Standardmuster e. Jeder Koeffizient erhöht sich um 3x 0,01, und die Erhöhung von M pro Wiederholung ist weniger schnell.
  • Bei n=28
  • Standardmuster o&sub2;&sub8; = (Standardmuster o&sub0;) - 0,17
  • (Standardmuster c) - 0,07 (Standardmuster e) - 0,04
  • (Standardmuster n)
  • Während der zwölf Wiederholungen 17-28 alterniert das Standardmuster für C** zwischen Standardmuster c, Standardmuster e und Standardmuster n. Jeder Koeffizient erhöht sich um 4x 0,01.
  • Bei n=36
  • Standardmuster o&sub3;&sub6; = (Standardmuster o&sub0;) - 0,19
  • (Standardmuster c) - 0,09 (Standardmuster e) - 0,06
  • (Standardmuster n) - 0,02 (Standardmuster s)
  • Während der acht Wiederholungen 29-36 alterniert das Standardmuster für C** zwischen Standardmuster c, Standardmuster e, Standardmuster n und Standardmuster s. Jeder Koeffizient erhöht sich um 2x 0,01.
  • Bei n=51
  • Standardmuster o&sub5;&sub1; = (Standardmuster o&sub0;) - 0,22
  • (Standardmuster c) - 0,12 (Standardmuster e) - 0,09
  • (Standardmuster n) - 0,05 (Standardmuster s) - 0,03
  • (Standardmuster u)
  • Während der 15 Wiederholungen 37-51 alterniert das Standardmuster für C** zwischen Standardmuster c, Standardmuster e, Standardmuster n, Standardmuster s und Standardmuster u. Jeder Koeffizient erhöht sich um 3x0,01 und die Erhöhung von M pro Wiederholung ist sehr langsam.
  • Jedes Eingangssymbol und jedes zugehörige Cluster weist eine ähnliche Abfolge auf, wobei die Vergleiche für die Anti- Zeichen sich in Richtung eines gemeinsamen Vergleichswerts und Erkennungsspielraums entwickeln. Hält der Wiederholungsvorgang weiter an, erhöht sich die Anzahl von Anti-Zeichen und die Entwicklungsrate verlangsamt sich. Der Prozeß kann beendet werden, wenn die minimale Verbesserung bei der Verbesserung für die nächste Wiederholung den Berechnungsaufwand nicht mehr wert ist.
  • Vergleichsfunktion - Cauchy-Shwartz
  • Die Vergleichsfunktion zwischen einem Eingangssymbol Si und den Bibliothekstandardmustern (T&sub1; T&sub2; T&sub3;...Ti...TG) beinhaltet eine bildelementweise Behandlung und Summation des Si-Bitmaps mit jedem Standardmuster-Bitmap. Die bildelementweise Behandlung liefert den Satz numerischer Vergleichskoeffizienten (Ci1 Ci2 Ci3...Tij...CiL) für das Eingangssymbol Si. Die GxL Vergleiche sind numerische Koeffizienten des Vergleichs, deren Wert den Grad der Bildelementähnlichkeit zwischen dem Symbol Sj und dem Standardmuster unter Vergleich darstellt. Vorzugsweise zeigt ein Koeffizient mit einem hohen Wert einen engen Vergleich zwischen Si und dem Standardmuster an, und ein Koeffizient mit einem niedrigen Wert zeigt einen entfernten Vergleich zwischen Si und dem Standardmuster an. Vorzugsweise sind die Bildelementdaten in den Symbol- und Standardmuster- Bitmaps innerhalb des Bitmap zentriert und rotationssymmetrisch ausgerichtet. Die Bitmaps können auf die gleiche An zahl an Bildelementreihen und Bildelementspalten X/Y-skaliert werden, wodurch entsprechende Bildelementpositionen in jedem Bitmap ausgebildet werden.
  • Jede geeignete Vergleichsfunktion, wie die Cauchy-Shwartz- Funktion, kann angewendet werden, die das Symbol- Standardmuster-Skalarprodukt (die Summation des Produkts entsprechender Bildelemente) geteilt durch die Symbolnorm Si und die Standardmusternorm Ti darstellt:
  • Cauchy-Shwartz-Funktion = (Si) (Ti)/( Si )( Ti ).
  • Der Vektor jedes Bildelements in dem Eingangssymbol-Bitmap wird mit dem Vektor des entsprechenden Bildelements in dem Standardmuster-Bitmap multipliziert und durch die zwei Normen geteilt. Die Norm ist ein Normalisierungsfaktor aus der Quadratwurzel der Summe der Quadrate jedes Bildelementwerts in dem Bitmap. Der Cauchy-Shwartz-Vergleich für jedes Symbol/Standardmuster liefert einen Vergleichskoeffizienten mit einem Wert zwischen 0 und 1,00, wie es entlang der vertikalen Achse in den Figuren 3, 4 und 5 gezeigt ist. Der vorstehende Ausdruck der Cauchy-Shwartz-Funktion kann durch Vor- Normalisierung des Si-Terms vereinfacht werden:
  • Cauchy-Shwartz-Funktion = (Si) (Ti)/( Ti ).
  • Der Si-Term in dem neuen vereinfachten Ausdruck stellt nun den komplexeren früheren Term (Si)/( Si ) dar. Bezüglich der vereinfachten Cauchy-Shwartz-Funktion ergibt sich der Verbesserungsvorgang zu:
  • für den Primärvergleich
  • C* = (Si) (T*)/( T* ),
  • und für den Sekundärvergleich
  • C** = (Si) (T**)/( T** ).
  • Mathematisch gesehen beinhaltet der Standardmusterverbesserungsvorgang das Auffinden eines Satzes von Vektorstandardmustern (T&sub1; T&sub2; T&sub3;...Ti...Tc), die den minimalen Erkennungsspielraum zwischen dem Primärvergleich C* und dem maximalen Sekundärvergleich C** maximieren (über alle Standardmuster):
  • Maximieren von M = Min [(Si) (T*)/( T* )- Max {(Si) (T**)/( T**)}]
  • Die Ableitungen der Cauchy-Shwartz-Vergleichsfunktion ergeben sich zu:
  • dM/dT* = dC*/dT* - dC**/dT* = Si/ T* - (Si T*)T*/( T* )³
  • und
  • dM/dT** = dC*/dT** - dC**/dT** = Si/ T** - (Si T**)T**/( T** )³.
  • Meta-Schwarz, Meta-Weiß und Verblassen (Fig. 6)
  • Das Eingangssymbol-Bitmap und die anfänglichen Bildbitmaps konnen im binären Datenformat vorliegen (1-en und 0-en), oder können Tonabstufungs-Grauskaladaten enthalten, die von dem Toner (oder der Tinte) gedruckter Schriftarten abgetastet werden. Die Abtastung und Verarbeitung kann aufgrund elektronischer Signale und mechanischer Schwingungen, die die Grauskalenpegel (oder binären Daten) verzerren, Rauschelemente einführen. Wenn die Wiederholungen fortschreiten, entwickeln die verbesserten Standardmuster Aberrationen, die durch die inkrementale Gewichtung ausgebildet werden, die (durch Addition oder Subtraktion) zu einer bereits in dem Bitmap vorhandenen Toner-Grauskalen- und Rauschverzerrung hinzukommen. Die von Natur aus Brüche darstellenden Gewichtungsinkremente bewirken, daß alle binären Anfangsbilder sich in nicht binäre Standardmuster entwickeln. Die anfänglichen Grauskalenbilder sind natürlich bereits nicht binär. Die Gewichtungsinkremente werden zu der zuvor vorhandenen Grauskala und Erzeugung von Meta-Schwarz- und Meta-Weiß-Grauskalenpegeln hinzuaddiert, die über dem schwärzesten Schwarz und dem hellsten Weiß liegen, die aus gedruckten Fonts erhalten werden können. Die Akkumulation der Gewichtungsaberrationen in jedem Anti-Zeichen- Standardmuster verursacht eine Verringerung des Sekundärvergleichs C** und eine Erhöhung des Erkennungsspielraums M.
  • Die Figuren 6A-6G zeigen die Entwicklung der Meta-Schwarzund Meta-Weiß-Gewichtung während der ersten 16 Wiederholungen des "censu"-Anti-Zeichenbeispiels für das Eingangssymbol o, wie es vorstehend beschrieben wurde. Diese Figuren zeigen die Grauskalenpegel jedes Bildelements entlang der mittleren horizontalen Reihe der Bildelemente in den "oce"- Bitmapstandardmustern.
  • Der Querschnitt durch die mittlere Reihe enthält die kritischen Unterschiede zwischen den oce-Standardmustern:
  • 1) der schwarze horizontale Strich in e, wobei o und c beide weiße mittlere Bereiche aufweisen,
  • 2) der weiße Spalt auf der rechten Seite in c und
  • 3) der schwarze Strich auf der rechten Seite in o an der Position entsprechend dem Spalt in c.
  • Die Strichbreite in den in Fig. 6 gezeigten Kleinbuchstaben- Standardmustern beträgt vier Bildelemente.
  • Die Bitmapbildelemente in dem Ausführungsbeispiel in Fig. 6 weisen 256 Grauskalenpegel, 128 Pegel auf jeder Seite eines Null-Halbtonpegels auf. Der Pegel +100 stellt die von dem Toner des gedruckten Zeichens erhältliche schwärzeste Intensität dar, und der Pegel -100 stellt die von dem Hintergrund des weißen Papiers erhältliche weißeste Intensität dar. In dem Ausführungsbeispiel in Fig. 6 weisen alle Tonerbildelemente den schwärzesten Pegel +100 auf, und alle Hintergrundbildelemente liegen auf dem weißesten Pegel -100. Die Reihenquerschnitte sind in idealer Form gezeigt, rauschfrei mit quadratischen Ecken und perfekten vertikalen Schwarz-/Weiß- Schnittstellen. Die Pegel +101 bis +128 über dem Tonerpegel sind für die Meta-Schwarzwerte reserviert, und die Pegel -101 bis -128 unterhalb des Hintergrundpegels sind für Meta- Weißwerte reserviert.
  • Fig. 6A zeigt den Querschnitt durch die mittlere Reihe des anfänglichen o-Standardmusters vor einer Wiederholung (bei n=0) . Der schwarze Strich linker Hand und der Strich rechter Hand des 0 sind als vier dunkle Bildelemente (+100) gespeichert. Der linke weiße und der rechte weiße Rand und der mittlere Bereich des o sind als weiße Bildelemente (-100) gespeichert. Fig. 6B zeigt den entsprechenden Querschnitt des anfänglichen c-Standardmusters (n=0) mit vier dunklen Bildelementen für den schwarzen linken Strich und weißen Bildelementen für den Rest der Bildelementreihe. Weiß bildet den linken und rechten Rand und den mittleren Bereich von c plus den rechten Spalt.
  • Meta-Schwarz, Meta-Weiß
  • Die Figuren 6C und 6D zeigen die o- und c-Querschnitte nach zehn Wiederholungen (n=10) des Verbesserungsvorgangs zwischen den Standardmustern. Der o-Querschnitt hat eine leichte Meta- Schwarz-Aberration (größer als +100) über den rechten Strich entwickelt, und der c-Querschnitt hat eine leichte Meta-Weiß- Aberration(geringer als -100) unter dem rechten Spalt entwickelt. Die Metapegel werden zu den Standardmustern addiert, wenn die entsprechenden Bildelemente der zwei Standardmuster- Bitmaps entgegengesetzte Vorzeichen aufweisen. Das heißt, wenn ein Bildelement eines Standardmusters + (schwarz) und das entsprechende Bildelement des anderen Standardmustern - (weiß) ist. Dieser additive Effekt für entgegengesetzte Bildelemente beruht auf der Polaritätsänderung, die durch die grundlegende Erkennungsspielraumbeziehung eingeführt wird.
  • Die Metapegel heben den Unterschied zwischen den ausgewählten C*- und C**-Standardmustern hervor.
  • Verblassen
  • Ein entgegengesetzter subtraktiver Effekt des Verblassens tritt auf, wenn die entsprechenden Bildelemente die gleichen Vorzeichen, beide + (schwarz) oder - (weiß), aufweisen. Der weiße linke Rand in beiden n=10-Standardmustern hat sich von dem maximalen Weiß -100 (Figuren 6A und 6B, n=0) zu einem weniger intensiven Weiß (Figuren 6C und 6D, n=10) entwickelt. Der rechte Rand und die weißen mittleren Gebiete beider Standardmuster wurden auch auf eine weniger intensive Position gehoben. Die Verblassungspegel unterdrücken die Ähnlichkeiten zwischen dem C*- und C**-Standardmuster.
  • Die folgende Tabelle zeigt die Entwicklung von Metapegeln für entgegengesetzte Bildelemente und von Verblassungspegeln für gleiche Bildelemente bei zehn Wiederholungen mit einem Gewichtungsfaktor von u=0,01.
  • Fig. 6E zeigt den Querschnitt durch die mittlere Reihe des anfängichen e-Standardmusters vor einer Wiederholung (n=0). Der horizontale Strich von e erscheint als Haupt-Schwarz- Bereich (+100). Während der elften Wiederholung wird das e- Standardmuster ein C**-Anti-Zeichen bezüglich des o- Standardmusters. Die Figuren 6F und GG zeigen den o- und e- Querschnitt nach sechs weiteren Wiederholungen (n=16). Der e- Querschnitt hat eine Meta-Schwarz-Aberration entlang der schwarzen horizontalen Strichbildelemente entwickelt. Der o- Querschnitt hat sich in Richtung von Meta-Weiß entlang des weißen mittleren Gebiets bewegt. Sowohl der e-Querschnitt als auch der o-Querschnitt sind ein wenig über dem linken und rechten Strich aufgrund dem gemeinsamen Schwarz in beiden Standardmustern verblaßt. Der e- und der o-Querschnitt sind auch ein wenig über den linken und rechten Rand aufgrund des gemeinsamen Weiß verblaßt. Die Metapegel und Verblassungspegel, die die Unterschiede hervorheben und die Ähnlichkeiten unterdrücken, können aufgrund der RMS-(quadratisches Mittel)Natur der Vergleichskoeffizienten als im Gleichgewicht befindlich angesehen werden. Die Quadratwurzel der Summe der Quadrate der Bildelementpegel in jedem Bitmap bleibt konstant. Daher gibt es für jede Metapegelentwicklung in einem fortgeschrittenen Standardmuster eine gleiche und entgegengesetzte Verblassungsentwicklung.
  • Standardmuster-Verbesserungssystem (Fig. 7)
  • Eine Symbolbibliothek 72:S enthält eine zuvor vorhandene Gruppe von G Bildelementsymbolen (S&sub1; S&sub2; S&sub3;...Si...SG). Eine Bildbibliothek 72:1 enthält L nicht verbesserte Bildelementbilder (I&sub1; I&sub2; I&sub3;...Ij...IL), aus denen G verbesserte Standardmuster (T&sub1; T&sub2; T&sub3;...Ti...TG) der G Bildelementsymbole werden sollen. Eine Symbol-Bild-Vergleichereinrichtung 74 vergleicht jedes der G Bildelementsymbole mit jedem der L Bildelementbilder, um GxL Vergleiche zu erhalten&sub1; die G Sätze von L Vergleichen (C&sub1; C&sub2; C&sub3;...Cj...CL) bilden, die vorübergehend in einem GxL-Speicher 76 gespeichert werden. Ein Satz aus L Vergleichen wird für jedes Bildelementsymbol Si der G Bildelementsymbole gebildet. Jeder Satz von Vergleichen weist einen Vergleich C* für jedes Bildelement Ij auf. Der Primärvergleich C** wird aus den L Vergleichen in jedem der G Sätze der Vergleiche mit dem engsten Vergleich mit dem Bildelementsymbol Si für diesen Satz von Vergleichen identifiziert. Der Sekundärvergleich C*** wird aus den L-l verbleibenden Vergleichen in jedem der G Sätze der Vergleiche mit dem nächstengsten Vergleich mit dem Bildelementsymbol Si für diesen Satz der Vergleiche identifiziert. G Paare identifizierter Vergleich Ci* und Ci** werden gebildet, ein Paar aus jedem der G Sätze von Vergleichen. Die G Paare werden vorübergehend in einem Paar-Speicher 77 gespeichert. G Erkennungsspielräume (M&sub1; M&sub2; M&sub3;...Mi...MG) werden bestimmt, ein Erkennungsspielraum zwischen jedem Paar identifizierter Vergleich Ci* und Ci**. Die G Erkennungsspielräume werden in dem Paar-Speicher 77 gespeichert. Das einzige Paar identifizierter Vergleiche Ci* und Ci** wird aus dem Paar-Speicher 77 ausgewählt, das den kleinsten Erkennungsspielraum Mi* aller der G Paare in dem Paar-Speicher bildet. Der Paar-Speicher adressiert das einzige Paar der Bildelementbilder Ij* und Ij** in der Bildbibliothek 72:1, das dem Paar identifizierter Vergleiche C** und Ci** entspricht. Eine Bildelement-Gewichtungseinrichtung 78 gewichtet bestimmte Bildelemente entweder des engsten Bildelementbildes Ij* oder des nächst-engsten Bildelementes Ij** oder beider. Die gewichteten Bilder entsprechen dem ausgewählten Paar identifizierter Vergleiche Ci* und Ci** zur Erhöhung des Erkennungsspielraums Mi* dazwischen. Die Vergleichs-, Identifikation-, Bestimmungs-, Auswahl- und Gewichtungsschritte werden wiederholt, bis die L Bildelementbilder in der Bildbibliothek 72:1 eine Bibliothek verbesserter Symbol-Standardmuster (T&sub1; T&sub2; T&sub3;...Ti...TG) geworden sind, von denen zumindest einige gewichtete Bildelementaberrationen aufweisen,die in dem entsprechenden Bildelementsymbol der zuvor vorhandenen Gruppe der G Bildelementsymbole (S&sub1; S&sub2; S&sub3;...Si...SG) in der Symbolbibliothek 72:S nicht vorhanden sind.
  • Die Implementation der offenbarten und beanspruchten Verfahren und des Geräts im einzelnen ist natürlich nicht festgelegt. Ein Fachmann hat die Möglichkeit, diese Verfahren durch die Bereitstellung eines geeignet programmierten Computers zu implementieren, und/oder es kann eine darauf zugeschnittene Hardware vorgesehen werden, wenn das Erfordernis hoher Leistung den Aufwand rechtfertigt. Jeder beschriebene Schritt der Verfahren kann einfach durch herkömmliche Datenverarbeitungseinrichtungen implementiert werden, während die Kombination derartiger Einrichtungen gemäß der Erfindung eine Verbesserung auf dem Gebiet automatischer Erkennungssysteme liefert.
  • Für den Fachmann ist es offensichtlich, daß die Aufgaben der Erfindung wie vorstehend beschrieben gelöst werden. Natürlich können der vorstehend beschriebene Aufbau und die Ausführungsbeispiele verändert werden, ohne von dem Konzept der Erfindung abzuweichen. Ferner können Merkmale der in den verschiedenen Figuren gezeigten Ausführungsbeispiele bei Ausführungsbeispielen der anderen Figuren verwendet werden. Daher ist der Schutzbereich der Erfindung lediglich durch die folgenden Patentansprüche bestimmt.

Claims (56)

1. Verfahren zur Erkennungsverbesserung einer Bibliothek von L nicht verbesserten Bildelementbildern {I&sub1; I&sub2; I&sub3; .. Ij .. IL} bezüglich einer vorher vorhandenen Gruppe von G Bildelementsymbolen (S&sub1; S&sub2; S&sub3; .. Si .. SG} zur Ausbildung einer Bibliothek von G Erkennungs-verbesserten Bildelement- Standardmustern {T&sub1; T&sub2; T&sub3; .. Ti .. TG} der G Bildelementsymbole, mit den Schritten
Vergleichen jedes der G Bildelementsymbole mit jedem der L Bildelementbilder zum Erhalten von GxL Vergleichen, die G Sätze von L Vergleichen {C&sub1; C&sub2; C&sub3; .. Cj .. CL}, einen Satz von L Vergleichen für jedes Bildelementsymbol Si der G Bildelementsymbole, ausbilden, wobei jeder Satz von Vergleichen einen Vergleich Ci für jedes Bildelementbild Ij aufweist,
Identifizieren des Primärvergleichs C* aus den L Vergleichen in jeden der G Sätze von Vergleichen mit dem engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Primärvergleichen C*={C&sub1;* C&sub2;* C&sub3;* .. Ci* .. CL*} bildet,
Identifizieren des Sekundärvergleichs aus den L-1 verbleibenden Vergleichen in jedem der G Sätze von Vergleichen mit dem nächst-engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Sekundärvergleichen C**={C&sub1;** C&sub2;** C&sub3;** .. Ci** .. CL**} bildet, um G Paare von identifizierten Vergleichen C* und C**, ein Paar aus jedem der G Sätze von Vergleichen, zu erhalten, Bestimmen von G Erkennungsspielräumen {M&sub1; M&sub2; M&sub3; .. Mi .. MG}, einen Erkennungsspielraum zwischen jedem Paar der identifizierten Vergleiche C* und C**, wobei die Größe eines Erkennungsspielraums die Differenz zwischen dem Wert von C* und dem Wert von C** ist,
Auswählen des einzigen Paars identifizierter Vergleiche C* und C** mit dem kleinsten Erkennungsspielraum M* von allen G Paaren identifizierter Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr für eine korrekte Bilderkennung interpretiert wird,
Identifizieren des dem Paar identifizierter Vergleiche C* und C** entsprechenden einzigen Paars von Bildelementbildern I* und I**,
Gewichten bestimmter Bildelemente des engsten Bildelementbildes I* und des nächst-engsten Bildelementbildes I**, die dem ausgewählten Paar identifizierter Vergleiche C* und C** entsprechen, um den Erkennungsspielraum M* dazwischen inkremental zu erhöhen, wodurch bewirkt wird, daß die Bildelementbilder das engste Bildelement-Standardmuster T* oder das nächst-engste Bildelement-Standardmuster T** oder beides werden, und
Wiederholen der Vergleichs-, Identifikations-, Bestimmungs-, Auswahl- und Gewichtungsschritte bis der zwischen den nicht verbesserten Bildelement-Eingangsbildern und den verbesserten Bildelement-Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung dient, wobei die Bibliothek der Bildelementbilder somit eine Bibliothek verbesserter Symbol-Standardmuster {T&sub1; T&sub2; T&sub3; .. Ti .. Tc} geworden ist, die bezüglich der vorher vorhandenen Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG} Erkennungsverbessert wurden, wobei zumindest einige dieser Standardmuster gewichtete Bildelementaberrationen aufweisen, die in dem entsprechenden Eildelementsymbol der vorher vorhandenen Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SC} nicht vorhanden sind.
2. Verfahren nach Anspruch 1, wobei die Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn der kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist.
3. Verfahren nach Anspruch 1, wobei die Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn die inkrementale Erhöhung des kleinsten Erkennungsspielraums bei jeder Wiederholung kleiner als eine vorbestimmte minimale Erhöhung ist.
4. Verfahren nach Anspruch 1, wobei die Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn eine bestimmte Anzahl von Gewichtungswiederholungen ausgeführt wurde.
5. Verfahren nach Anspruch 1, wobei die Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn eine vorher zugewiesene Periode einer Wiederholungsverarbeitungszeit abgelaufen ist.
6. Verfahren nach Anspruch 1, wobei die Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn die einzelnen Standardmuster in Clustern ähnlich gestalteter Standardmuster sich zu dem gleichen Erkennungsspielraum weiterentwickelt haben und wechselseitige Anti-Zeichen geworden sind.
7.Verfahren nach Anspruch 1, wobei L größer als G und G gleich T ist.
8. Verfahren nach Anspruch 1, wobei die Gruppe von G Bildelementsymbolen alphanumerische Symbole und die Bibliothek von T Bildelement-Standardmustern die gleichen durch gewichtete Bildelementaberrationen verbesserten alphanumerischen Symbole sind.
9. Verfahren nach Anspruch 8, wobei L gleich G und G gleich T ist.
10. Verfahren nach Anspruch 9, wobei die Bibliothek von G Bildelementbildern den alphanumerischen Symbolen der Gruppe von G Bildelementsymbolen entsprechende alphanumerische Symbole sind.
11. Verfahren nach Anspruch 9, wobei die Bibliothek von G Bildelementbildern alphanumerische Symbole sind, die zu den alphanumerischen Symbolen der Gruppe von G Bildelementsymbolen identisch sind.
12. Verfahren nach Anspruch 1, wobei die GxL Vergleiche numerische Koeffizienten des Vergleichs sind, deren Wert den Grad der Bildelementähnlichkeit zwischen dem Bildelementsymbol Si und dem Bildelementbild Ij unter Vergleich anzeigt.
13. Verfahren nach Anspruch 12, wobei ein Koeffizient mit einem hohen Wert einen engen Vergleich zwischen Si und Ij anzeigt, und ein Koeffizient mit einem niedrigen Wert einen entfernten Vergleich zwischen Si und Ij anzeigt.
14. Verfahren nach Anspruch 12, wobei der Erkennungsspielraum die Difference zwischen den Vergleichen C* und C** jedes ausgewählten Paars von Vergleichen ist.
15. Verfahren nach Anspruch 14, wobei die Erkennungsverbesserung bezüglich eines bestimmten Bildelementsymbols Si ein Maximieren des minimalen Erkennungsspielraums zwischen dem Primärvergleich C* und dem maximalen Sekundärvergleich C**, die für das Bildelementsymbol Si bilden, mit der allgemeinen Beziehung beinhaltet:
Maximieren von M = min[C**)]
wobei
M der Erkennungsspielraum zwischen C* und C**,
C* der Primärvergleich für das Standardmuster T*, das das engste Standardmuster in der Bibliothek zu dem Bildelementsymbol Si ist, und
ist, das das zweit-engste Standardmuster in der Bibliothek zu dem Bildelementsymbol Si ist.
16. Verfahren nach Anspruch 15, wobei nur das engste Bildelementbild I* gewichtet wird, wodurch bewirkt wird, daß das engste Bildelementbild I* das engste Bildelement- Standardmuster T* wird.
17. Verfahren nach Anspruch 16, wobei die zu dem engsten Standardmuster T* bei jeder Wiederholung addierte Gewichtung durch die erste Ableitung des Erkennungsspielraums M* nach dem Standardmuster T* bestimmt wird:
W* = u*(dM/dT*) = u*(dC/dT* - dC**/dT*)
wobei
W* die bei jeder Wiederholung addierte Gewichtung und
u* ein Gewichtungsfaktor mu* für dM/dT* ist.
18. Verfahren nach Anspruch 17, wobei jede Wiederholung des Verbesserungsvorgangs ein neues T*-Standardmuster erzeugt, das geringfügig von dem alten T*-Standardmuster verschieden ist:
T*n+1 = T*n + W* = T*n + u*(dM/dT*) = T*n + u*(dC*/dT* - dC**/dT*)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster und
T*n das alte T*-Standardmuster ist.
19. Verfahren nach Anspruch 15, wobei nur das nächst-engste Bildelementbild I** gewichtet wird, wodurch bewirkt wird, daß das nächst-engste Bildelementbild I** das nächst-engste Bildelement-Standardmuster T** wird.
20. Verfahren nach Anspruch 19, wobei die zu dem nächstengsten Standardmuster T** bei jeder Wiederholung addierte Gewichtung durch die erste Ableitung des Erkennungsspielraums M** nach dem Standardmuster T** bestimmt wird:
W** = u**(dM/dT**) = u**(dC/dT** - dC**/dT**)
wobei
W** die bei jeder Wiederholung addierte Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
21. Verfahren nach Anspruch 20, wobei jede Wiederholung des Verbesserungsvorgangs ein neues T**-Standardmuster erzeugt, das geringfügig von dem alten T**-Standardmuster verschieden ist:
T**n+1 = T**n + W** = T**n + u**(dM/dT**) = T**n + u**(dC/dT** - dC**/dT**)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
22. Verfahren nach Anspruch 15, wobei sowohl das engste Bildelementbild I* als auch das nächste-engste Bildelementbild I** gewichtet werden, wodurch bewirkt wird, daß das engste Bildelementbild I* das engste Bildelement-Standardmuster T*, und das nächst-engste Bildelementbild I** das nächst-engste Bildelement-Standardmuster T** wird.
23. Verfahren nach Anspruch 22, wobei die zu T* und zu dem Standardmuster T** bei jeder Wiederholung addierte Gewichtung durch die erste Ableitung der Erkennungsspielraum M* und M** nach den Standardmustern T* und T** bestimmt wird:
W* = u*(dM/dT*) = u*(dC*/dT* - dC**/dT*)
W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**)
wobei
W* die zu T* bei jeder Wiederholung addierte Gewichtung,
u* ein Gewichtungsfaktor mu* für dM/dT*.
W** die zu T** bei jeder Wiederholung addierte Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
24. Verfahren nach Anspruch 23, wobei der Gewichtungsfaktor u* gleich dem Gewichtungsfaktor u** ist.
25. Verfahren nach Anspruch 23, wobei jede Wiederholung neue T*- und T**-Standardmuster erzeugt, die geringfügig von den alten T*- und T**-Standardmustern verschieden sind:
T*n+1 = T*n + W* = T*n + u*(dC*/dT* - dC**/dT*)
T**n=1 = T**n + W** = T**n + u**(dC*/dT** - dC**/dT**)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster,
T*n das alte T*-Standardmuster,
T**n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
26. Verfahren nach Anspruch 12, wobei der Wert jedes numerischen Koeffizienten des Vergleichs C&sub1; auf einem bildelementweisen Vergleich zwischen jedem Bildelement des Bildelementsymbols Si und jedem Bildelement des Bildelementbildes Ij untervergleich beruht.
27. Verfahren nach Anspruch 26, wobei der bildelementweise Vergleich das Skalarprodukt zwischen jedem Bildelement des Bildelementsymbols Si und jedem Bildelement des Bildelementbildes Ij unter Vergleich ist.
28. Verfahren nach Anspruch 26, wobei der bildelementweise Vergleich auf der Cauchy-Shwartz-Funktion basiert:
Cauchy-Shwartz-Funktion =
(Si) (Ti)/( Si )( Ti )
wobei
(Si) das Eingangssymbol unter Vergleich,
(Ti) das verbesserte Standardmuster unter Vergleich,
( Si ) die Symbolnorm und
( Ti ) die Standardmusternorm ist
29. Gerät zur Erkennungsverbesserung einer Bibliothek von L nicht verbesserten Bildelementbildern {I&sub1; I&sub2; I&sub3; .. Ij .. IL} bezüglich einer vorher vorhandenen Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG} zur Ausbildung einer Bibliothek von G Erkennungs-verbesserten Bildelement- Standardmustern {T&sub1; T&sub2; T&sub3; .. Ti .. TG} der G Bildelementsymbole, mit
einer ersten Speichereinrichtung zur Speicherung der Bibliothek der zu verbessernden L nicht verbesserten Bildelementbilder {I&sub1; I&sub2; I&sub3; .. I&sub3; .. IL} zum Erhalten der Bibliothek der G Erkennungs-verbesserten Bildelement-Standardmuster {T&sub1; T&sub2; T&sub3; .. Ti .. TG},
einer zweiten Speichereinrichtung für die vorher vorhandene Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG},
einer Vergleichereinrichtung zum Vergleich jedes der G Bildelementsymbole mit jedem der L Bildelementbilder zum Erhalten von GxL Vergleichen, die G Sätze von L Vergleichen {C&sub1; C&sub2; C&sub3; .. C&sub3; .. CL}, einen Satz von L Vergleichen für jedes Bildelementsymbol Si der G Bildelementsymbole, ausbilden, wobei jeder Satz von Vergleichen einen Vergleich C* für jedes Bildelementbild Ij aufweist,
einer ersten Identifizierungseinrichtung zur Identifizierung des Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze von Vergleichen mit dem engsten Vergleich mit dem Bildelenentsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Primärvergleichen C*={C&sub1;* C&sub2;* C&sub3;* .. Ci* .. CL*} bildet,
einer zweiten Identifizierungseinrichtung zur Identifizierung des Sekundärvergleichs C** aus den L-1 verbleibenden Vergleichen in jedem der G Sätze von Vergleichen mit dem nächst-engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Sekundärvergleichen C**={C&sub1;** C&sub2;** C&sub3;** .. Ci** .. CL**} bildet, um G Paare identifizierter Vergleiche C* und C**, ein Paar für jeden der G Sätze von Vergleichen, auszubilden,
einer Bestimmungseinrichtung zur Bestimmung von G Erkennungsspielräumen {M&sub1; M&sub2; M&sub3; .. Mi .. MG} einen Erkennungsspielraum zwischen jedem Paar identifizierter Vergleiche C* und C**, wobei die Größe eines Erkennungsspielraums die Differenz zwischen dem Wert von C* und dem Wert von C** ist.
einer Auswahleinrichtung zur Auswahl des einzigen Paars identifizierter Vergleiche C* und C** mit em kleinsten Erkennungsspielraum M* von allen G Paaren identifizierter Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr für eine korrekte Bilderkennung interpretiert wird,
einer dritten Identifizierungseinrichtung zur Identifizierung des einzigen Paars von Bildelementbildern I* und I**, die dem Paar identifizierter Vergleiche C* und C** entsprechen,
einer Gewichtungseinrichtung zur Gewichtung bestimmter Bildelemente des engsten Bildelementbildes I* und des nächstengsten Bildelementbildes I** die dem ausgewählten Paar identifizierter Vergleiche C* und C** entsprechen, um den Erkennungsspielraum M* dazwischen inkremental zu erhöhen, wodurch bewirkt wird, daß die Bildelementbilder das engste Bildelement-Standardmuster T* oder das nächst-engste Bildelement-Standardmuster T** oder beides werden,
wobei die Vergleichereinrichtung, die erste, zweite und dritte Identifizierungseinrichtung, die Bestimmungseinrichtung, die Auswahleinrichtung und die Gewichtungseinrichtung zur Wiederholung des Vergleichs, der Identifizierung, Bestimmung, Auswahl und Gewichtung betreibbar sind, bis der zwischen den nicht verbesserten Bildelement-Eingangsbildern und den verbesserten Bildelement-Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung dient, wobei die Bibliothek der Bildelementbilder somit eine Bibliothek verbesserter Symbol-Standardmuster {T&sub1; T&sub2; T&sub3; .. .. TG} geworden ist, die bezüglich der vorher vorhandenen Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG} Erkennungs-verbessert wurden, wobei zumindest einige dieser Standardmuster gewichtete Bildelementaberrationen aufweisen, die in den entsprechenden Bildelementsymbolen der vorher vorhandenen Gruppe von G Bildelementsymbolen {Si S&sub2; S&sub3; .. Si .. SG} nicht vorhanden sind.
30. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden der Erkennungsverbesserung der Bildelement-Standardmuster, wenn der kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist.
31. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden der Erkennungsverbesserung der Bildelement-Standardmuster, wenn die inkrementale Erhöhung des kleinsten Erkennungsspielraums bei jeder Wiederholung kleiner als eine vorbestimmte minimale Erhöhung ist.
32. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden der Erkennungsverbesserung der Bildelement-Standardmuster, wenn eine bestimmte Anzahl von Gewichtungswiederholungen ausgeführt wurde.
33. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden der Erkennungsverbesserung der Bildelement-Standardmuster, wenn eine zuvor zugewiesene Periode einer Wiederholungsverarbeitungszeit abgelaufen ist.
34. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden der Erkennungsverbesserung der Bildelement-Standardmuster, wenn die einzelnen Standardmuster in Clustern ähnlich gestalteter Standardmuster sich zu dem gleichen Erkennungsspielraum weiterentwickelt haben und wechselseitige Anti-Zeichen geworden sind.
35. Gerät nach Anspruch 29, wobei L größer als G und G gleich T ist.
36. Verfahren nach Anspruch 29, wobei die zweite Speichereinrichtung eine Gruppe von G alphanumerischen Symbolen speichert, und die Bibliothek von T Bildelement-Standardmustern die gleichen durch gewichtete Bildelementaberrationen verbesserten alphanumerischen Symbole sind.
37. Gerät nach Anspruch 36, wobei L gleich G und G gleich T ist.
33. Gerät nach Anspruch 37, wobei die Bibliothek von G Bildelementbildern den alphanumerischen Symbolen der Gruppe von G Bildelementsymbolen entsprechende alphanumerische Symbole sind.
39. Gerät nach Anspruch 37, wobei die Bibliothek von G Bildelementbildern alphanumerische Symbole sind, die zu den alphanumerischen Symbolen der Gruppe von G Bildelementsymbolen identisch sind.
40. Gerät nach Anspruch 29, wobei die Vergleichereinrichtung zur Ausführung der GxL Vergleiche zum Erhalten numerischer Koeffizienten eines Vergleichs eingerichtet ist, deren Wert den Grad der Bildelementähnlichkeit des Bildelementsymbols Si und des Bildelementbildes Ij unter Vergleich anzeigt.
41. Gerät nach Anspruch 40, wobei die Vergleichereinrichtung zur Ausbildung der numerischen Vergleichskoeffizienten derart eingerichtet ist, daß ein Koeffizient mit einem hohen Wert einen engen Vergleich zwischen Si und Ij anzeigt, und ein Koeffizient mit einem geringen Wert einen entfernten Vergleich zwischen Si und Ij anzeigt.
42. Gerät nach Anspruch 40, wobei die Bestimmungseinrichtung zur Bestimmung des Erkennungsspielraums mittels der Differenz zwischen den Vergleichen C* und C** jedes ausgewählten Paars der Vergleiche eingerichtet ist.
43. Gerät nach Anspruch 42, mit einer Einrichtung zur Maximierung des minimalen Erkennungsspielraums zwischen dem Primärvergleich C* und dem maximalen Sekundärvergleich C**, die das ausgewählte Paar identifizierter Vergleich C* und C** für das Bildelementsymbol Si bilden, unter Verwendung der allgemeinen Beziehung:
Maximierung von M = min[C* - max(C**)]
wobei
M der Erkennungsspielraum zwischen C* und C**,
C* der Primärvergleich für das Standardmuster T*, das
C** der Primärvergleich für das Standardmuster T*, das das engste Standardmuster in der Bibliothek zu dem Bildelementsymbol Si ist, und
C** der Sekundärvergleich für das Standardmuster T** ist, das das zweit-engste Standardmuster in der Bibliothek zu dem Bildelementsymbol Si ist.
44. Gerät nach Anspruch 431 wobei die Gewichtungseinrichtung zur Gewichtung nur des engsten Bildelementbildes I* eingerichtet ist, wodurch bewirkt wird, daß das engste Bildelementbild I* das engste Bildelement-Standardmuster T* wird.
45. Gerät nach Anspruch 44, wobei die Gewichtungseinrichtung zur Bestimmung der zu dem engsten Standardmuster T* addierten Gewichtung bei jeder Wiederholung durch die erste Ableitung des Erkennungsspielraums M* nach dem Standardmuster T* unter Verwendung folgender Beziehung eingerichtet ist:
W* = u* (dM/dT*) = u*(dC*/dT* - dC**/dT*)
wobei
W* die bei jeder Wiederholung addierte Gewichtung und
u* ein Gewichtungsfaktor mu* für dM/dT* ist.
46. Gerät nach Anspruch 45, wobei die Gewichtungseinrichtung zur Erzeugung eines neuen Standardmusters T*, das geringfügig von dem alten Standardmuster T* verschieden ist, unter Verwendung folgender Beziehung eingerichtet ist:
T*n+1 = T*n + W* = T*n + u*(dM/dT*) = T*n + u*(dC/dT* - dC**/dT*)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster und
T*n das alte T*-Standardmuster ist.
47. Gerät nach Anspruch 43, wobei die Gewichtungseinrichtung zur Gewichtung nur des nächst-engsten Bildelementbildes I** eingerichtet ist, wodurch bewirkt wird, daß das nächst-engste Bildelementbild I** das nächst-engste Bildelement- Standardmuster T** wird.
48. Gert nach Anspruch 471 wobei die Gewichtungseinrichtung zur Bestimmung der zu dem nächst-engsten Standardmuster T** hinzugefügten Gewichtung bei jeder Wiederholung durch die erste Ableitung des Erkennungsspielraums M** nach dem Standardmuster T** unter Verwendung folgender Beziehung eingerichtet ist:
W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**)
wobei
W** die bei jeder Wiederholung addierte Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
49. Gerät nach Anspruch 48, wobei die Gewichtungseinrichtung zur Erzeugung eines neuen Standardmusters T**., das geringfügig von dem alten Standardmuster T** verschieden ist, bei jeder Wiederholung unter Verwendung folgender Beziehung eingerichtet ist:
T**n+1 = T**n + W** = T**n + u**(dM/dT**) = T**n + u**(dC*/dT** - dC**/dT**)
wobei
n die Wiederholungsanzahl,
T**n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
50. Gerät nach Anspruch 43, wobei die Gewichtungseinrichtung zur Gewichtung sowohl des engsten Bildelementbildes I* als auch des nächst-engsten Bildelementbildes I** eingerichtet ist, um zu bewirken, daß das engste Bildelementbild I* das engste Bildelement-Standardmuster T* und das nächst-engste Blldelementbild I** das nächst-engste Bildelement- Standardmuster T** wird.
51. Gerät nach Anspruch 50, wobei die Gewichtungseinrichtung zur Bestimmung der zu dem Standardmuster T* und zu dem Standardmuster T** hinzugefügten Gewichtung bei jeder Wiederholung durch die erste Ableitung der Erkennungsspielräume M* und M** nach den Standardmustern T* und T** unter Verwendung folgender Beziehung eingerichtet ist:
W* = u*(dM/dT*) = u*(dC/dT* - dC**/dT*)
W* = u**(dM/dT**) = u**(dC/dT** - dC**/dT**)
wobei
W* die zu T* bei jeder Wiederholung addierte Gewichtung,
u* ein Gewichtungsfaktor mu* für dM/dT*,
W** die zu T** bei jeder Wiederholung addierte Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
52. Gerät nach Anspruch 51, wobei der Gewichtungsfaktor u* gleich dem Gewichtungsfaktor u** ist.
53. Gerät nach Anspruch 51, wobei die Gewichtungseinrichtung zur Erzeugung neuer Standardmuster T* und T**, die geringfügig von den alten Standardmustern T* und T* verschieden sind, unter Verwendung folgender Beziehung eingerichtet ist:
T*n+1 = T*n + W* = T*n + u*(dC/dT* - dC**/dT*)
T**n+1 = T**n + W** = T**n + u**(dC/dT** = dC**/dT**)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster,
T*n das alte T*-Standardmuster,
T**n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
54. Gerät nach Anspruch 40, wobei die Vergleichereinrichtung zur Verwendung eines Werts für jeden numerischen Koeffizienten des Vergleichs C* eingerichtet ist, der auf einem bildelementweisen Vergleich zwischen jedem Bildelement des Bildelementsymbols Si und jedem Bildelement des Bildelementbildes Ij unter Vergleich beruht.
55. Gerät nach Anspruch 54, wobei die Vergleichereinrichtung zur Ausführung des bildelementweisen Vergleichs als Skalarprodukt zwischen jedem Bildelement des Bildelementsymbols Si und jedem Bildelement des Bildelementbildes Ij unter Vergleich eingerichtet ist.
56. Gerät nach Anspruch 541 wobei die Vergleichereinrichtung zur Ausführung des bildelementweisen Vergleichs beruhend auf der Cauchy-Shwartz-Funktion eingerichtet ist:
Cauchy-Shwartz-Funktion =
(Si) (Ti)/( Si )( Ti )]
wobei
(Si) das Eingangssymbol unter Vergleich,
(Ti) das verbesserte Standardmuster unter Vergleich,
( Si ) die Symbolnorm und
( Ti ) die Standardmusternorm ist.
DE69319514T 1992-09-01 1993-08-31 Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung Expired - Fee Related DE69319514T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/937,732 US5379349A (en) 1992-09-01 1992-09-01 Method of OCR template enhancement by pixel weighting

Publications (2)

Publication Number Publication Date
DE69319514D1 DE69319514D1 (de) 1998-08-13
DE69319514T2 true DE69319514T2 (de) 1998-12-10

Family

ID=25470328

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69319514T Expired - Fee Related DE69319514T2 (de) 1992-09-01 1993-08-31 Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung

Country Status (4)

Country Link
US (1) US5379349A (de)
EP (1) EP0586217B1 (de)
JP (1) JPH06168359A (de)
DE (1) DE69319514T2 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0608148B1 (de) * 1993-01-22 2000-04-12 Canon Kabushiki Kaisha Verbesserung von Standardmustern zur Erkennung
JPH0749927A (ja) * 1993-08-09 1995-02-21 Nireco Corp パターン認識方法
US5909509A (en) * 1996-05-08 1999-06-01 Industrial Technology Research Inst. Statistical-based recognition of similar characters
US6473524B1 (en) 1999-04-14 2002-10-29 Videk, Inc. Optical object recognition method and system
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes
US7697758B2 (en) * 2006-09-11 2010-04-13 Google Inc. Shape clustering and cluster-level manual identification in post optical character recognition processing
US7646921B2 (en) * 2006-09-11 2010-01-12 Google Inc. High resolution replication of document based on shape clustering
KR101486495B1 (ko) * 2006-09-08 2015-02-04 구글 인코포레이티드 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법
US8175394B2 (en) * 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
CN102402693B (zh) * 2010-09-09 2014-07-30 富士通株式会社 处理包含字符的图像的方法和设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3191149A (en) * 1962-01-15 1965-06-22 Ibm Specimen identification apparatus with means for altering stored specimen reference functions
US3275986A (en) * 1962-06-14 1966-09-27 Gen Dynamics Corp Pattern recognition systems
US3209328A (en) * 1963-02-28 1965-09-28 Ibm Adaptive recognition system for recognizing similar patterns
US3267431A (en) * 1963-04-29 1966-08-16 Ibm Adaptive computing system capable of being trained to recognize patterns
US3539994A (en) * 1967-09-14 1970-11-10 Ibm Adaptive template pattern categorizing system
US3588823A (en) * 1968-03-28 1971-06-28 Ibm Mutual information derived tree structure in an adaptive pattern recognition system
US3548202A (en) * 1968-11-29 1970-12-15 Ibm Adaptive logic system for unsupervised learning
US5204914A (en) * 1991-08-30 1993-04-20 Eastman Kodak Company Character recognition method using optimally weighted correlation
US5159644A (en) * 1991-08-30 1992-10-27 Eastman Kodak Company Character recognition method using statistically weighted correlation

Also Published As

Publication number Publication date
EP0586217A2 (de) 1994-03-09
JPH06168359A (ja) 1994-06-14
US5379349A (en) 1995-01-03
EP0586217A3 (en) 1994-09-21
EP0586217B1 (de) 1998-07-08
DE69319514D1 (de) 1998-08-13

Similar Documents

Publication Publication Date Title
DE60208223T2 (de) Anordnung und verfahren zur gesichtserkennung unter verwendung von teilen des gelernten modells
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE69422446T2 (de) Mustererkennung
DE3633743C2 (de)
DE69604481T2 (de) Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
DE69426479T2 (de) Optische Mehrfontzeichenerkennung mit einem Verbindungsschachtelansatz
DE69424196T2 (de) Automatische Zeichenerkennung mit Verwendung statischer und dynamischer Parameter
DE60114469T2 (de) Methode und Gerät zur Bestimmung von interessanten Bildern und zur Bildübermittlung
DE69333811T2 (de) Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones
DE69319514T2 (de) Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung
DE112016005062T5 (de) Kaskadiertes neuronales netzwerk mit massstabsabhängiger poolbildung zur objekterfassung
Cichocki et al. Adaptive learning algorithm for principal component analysis with partial data
DE102014223226A1 (de) Diskriminator, Unterscheidungsprogramm und Unterscheidungsverfahren
DE69330708T2 (de) Texterkennung unter Verwendung zwei-dimensionaler stochastischer Modelle
DE69331867T2 (de) Verfahren und Vorrichtung zur Eingabeklassifizierung mit nichtkugeligen Neuronen
DE69331518T2 (de) Neuronales Netz zum Vergleich von Merkmalen von Bildmustern
EP0978088A1 (de) Verfahren und anordnung zur mustererkennung auf statistischer basis
DE69529015T2 (de) Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition
DE102006059659B4 (de) Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild
DE69423607T2 (de) Verfahren zum klassifizieren von bildern mit ausgabeabbildungen
DE69805280T2 (de) Gerät und verfahren zur mustererkennung.
DE69324977T2 (de) Bitmap-bildsegmentierung unter anwendung eines ladungsmodells fuer pixels
DE69710207T2 (de) Verfahren und gerät zur mustererkennung mit verwendung eines in unterkategorieen unterverteilten lexikons
DE19942223C2 (de) Klassifikationsverfahren mit Rückweisungsklasse
DE69423921T2 (de) Verbesserung von Standardmustern zur Erkennung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee