DE69319514T2 - Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung - Google Patents
Verfahren und Gerät zum Verbessern von Standardmustern für ErkennungInfo
- Publication number
- DE69319514T2 DE69319514T2 DE69319514T DE69319514T DE69319514T2 DE 69319514 T2 DE69319514 T2 DE 69319514T2 DE 69319514 T DE69319514 T DE 69319514T DE 69319514 T DE69319514 T DE 69319514T DE 69319514 T2 DE69319514 T2 DE 69319514T2
- Authority
- DE
- Germany
- Prior art keywords
- pixel
- comparisons
- standard pattern
- comparison
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 60
- 238000001514 detection method Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 18
- 230000004075 alteration Effects 0.000 claims description 15
- 230000006872 improvement Effects 0.000 claims description 15
- 230000002708 enhancing effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 11
- XRPLBRIHZGVJIC-UHFFFAOYSA-L chembl3182776 Chemical compound [Na+].[Na+].NC1=CC(N)=CC=C1N=NC1=CC=C(C=2C=CC(=CC=2)N=NC=2C(=CC3=CC(=C(N=NC=4C=CC=CC=4)C(O)=C3C=2N)S([O-])(=O)=O)S([O-])(=O)=O)C=C1 XRPLBRIHZGVJIC-UHFFFAOYSA-L 0.000 description 6
- 238000005562 fading Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000227425 Pieris rapae crucivora Species 0.000 description 1
- 101100311330 Schizosaccharomyces pombe (strain 972 / ATCC 24843) uap56 gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 101150018444 sub2 gene Proteins 0.000 description 1
- 230000005641 tunneling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
- Die Erfindung betrifft die Erkennung von eingegebenen Symbolen und insbesondere die Verbesserung von Bildelement- Standardmustern zur Erleichterung des Übereinstimmungsvergleichs der Standardmuster mit den eingegebenen Symbolen. Die Symbole können beispielsweise optische Zeichen (Text), Radarrückgabesignale oder Phonem-Klangmuster zur Audiomustererkennung sein.
- Bisher wurden Korrelationskoeffizienten zur Identifikation eingehender Bildelementbilder, wie Radarrückgabesignale und Zeichenbitmaps, verwendet. Die eingegebenen Bildelementbilder wurden mit Bibliothek-Standardmusterbildern bildelementweise verglichen. Die Summe aller Bildelementvergleiche bei jedem Bild-/Standardmuster-übereinstimmungsvergleich erzeugte einen die engste Übereinstimmung anzeigenden Korrelationskoeffizienten. Dieses herkömmliche Korrelationsverfahren beinhaltete jedoch keine Änderung oder Verbesserung der die Bibliothekstandardmuster bildenden Bildelemente.
- Die US-A-5 204 914 offenbart ein Zeichenerkennungsverfahren mit den Schritten Erfassen eines zweidimensionalen Bildelementarrays, wobei sich ein unbekanntes Zeichen in dem zweidimensionalen Array befindet, Berechnen gewichteter Korrelationskoeffizienten zwischen dem unbekannten Zeichen und einen trainierten bzw. gelernten Zeichensatz und Erkennen des unbekannten Zeichens als gelerntes Zeichen mit dem am höchsten gewichteten Korrelationskoeffizienten über dem Schwellenwert.
- Die US-A-3 191 149 offenbart ein Spezifikationsidentifikationsgerät zum Übereinstimmungsvergleich eines Spektrums mit einem Satz von Referenzen. Die Referenzen werden im Ansprechen auf Abweichungen allmählich verändert.
- Entsprechend einer Ausgestaltung der Erfindung ist ein Verfahren zur Erkennungsverbesserung einer Bibliothek von L nicht verbesserten Bildelementbildern bezüglich einer vorher vorhandenen Gruppe von G Bildelementsymbolen zur Ausbildung einer Bibliothek von G Erkennungs-verbesserten Bildelement- Standardmustern der G Bildelementsymbole ausgestaltet, mit den Schritten Vergleichen jedes der G Bildelementsymbole mit jedem der L Bildelementbilder zum Erhalten von G x L Vergleichen, die G Sätze von L vergleichen, einen Satz von L Vergleichen für jedes Bildelementsymbol Si der G Bildelementsymbole, ausbilden, wobei jeder Satz von Vergleichen einen Vergleich Ci für jedes Bildelementbild Ij aufweist, Identifizieren des Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze von Vergleichen mit dem engsten Vergleich mit dem Bildelenentsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Primärvergleichen bildet, Identifizieren des Sekundärvergleichs aus den L-1 verbleibenden Vergleichen in jedem der G Sätze von Vergleichen mit dem nächst-engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Sekundärvergleichen bildet, um G Paar von identifizierten Vergleichen C* und C**, ein Paar aus jedem der G Sätze von Vergleichen, zu erhalten, Bestimmen von G Erkennungsspielräumen, einen Erkennungsspielraum zwischen jedem Paar der identifizierten Vergleiche C* und C**, wobei die Größe eines Erkennungsspielraums die Differenz zwischen dem Wert von C* und dem Wert von C** ist, Auswählen des einzigen Paars identifizierter Vergleiche C* und C** mit dem kleinsten Erkennungsspielraum M* von allen G Paaren identifizierter Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr für eine korrekte Bilderkennung interpretiert wird, Identifizieren des dem Paar identifizierter Vergleiche C* und C** entsprechenden einzigen Paars von Bildelementbildern I* und I** Gewichten bestimmter Bildelemente des engesten Bildelementbildes I* und des nächst-engsten Bildelementbildes I** die dem ausgewählten Paar identifizierter Vergleiche C* und C** entsprechen, um den Erkennungsspielraum M* dazwischen inkremental zu erhöhen, wodurch bewirkt wird, daß die Bildelementbilder das engste Bildelement-Standardmuster T* oder das nächst-engste Bildelement-Standardmuster T** oder beides werden, und Wiederholen der Vergleichs-, Identifikations-, Bestimmungs-, Auswahl- und Gewichtungsschritte bis der zwischen den nicht verbesserten Bildelement-Eingangsbildern und den verbesserten Bildelement- Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung dient, wobei die Bibliothek der Bildelementbilder somit eine Bibliothek verbesserter Symbol- Standardmuster geworden ist, die bezüglich der vorher vorhandenen Gruppe von G Bildelementsymbolen Erkennungs-verbessert wurden, wobei zumindest einige dieser Standardmuster gewichtete Bildelementaberrationen aufweisen, die in dem entsprechenden Bildelementsymbol der vorher vorhandenen Gruppe von G Bildelementsymbolen nicht vorhanden sind.
- Gemäß einer anderen Ausgestaltung der Erfindung ist ein Gerät zur Erkennungsverbesserung einer Bibliothek von L nicht verbesserten Bildelementbildern bezüglich einer vorher vorhandenen Gruppe von G Bildelementsymbolen zur Ausbildung einer Bibliothek von G Erkennungs-verbesserten Bildelement- Standardmustern der G Bildelementsymbole ausgestaltet, mit einer ersten Speichereinrichtung zur Speicherung der Bibliothek der zu verbessernden L nicht verbesserten Bildelementbilder zum Erhalten der Bibliothek der G Erkennungsverbesserten Bildelement-Standardmuster, einer zweiten Speichereinrichtung für die vorher vorhandene Gruppe von G Bildelementsymbolen, einer Vergleichereinrichtung zum Vergleich jedes der G Bildelementsymbole mit jedem der L Bildelementbilder zum Erhalten von G x L Vergleichen, die G Sätze von L Vergleichen, einen Satz von L Vergleichen für jedes Bildelementsymbole Si der G Bildelementsymbole, ausbilden, wobei je der Satz von Vergleichen einen Vergleich Ci für jedes Bildelement Ij aufweist, einer ersten Identifizierungseinrichtung zur Identifizierung der Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze von Vergleichen mit dem engsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Primärvergleichen bildet, einer zweiten Identifizierungseinrichtung zur Identifizierung des Sekundrvergleichs C** aus den L-1 verbleibenden Vergleichen in jedem der G Sätze von Vergleichen mit dem nächstengsten Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von Vergleichen eine Auswahl von G Sekundärvergleichen C** bildet, um G Paare identifizierter Vergleiche C* und C**, ein Paar für jeden der G Sätze von Vergleichen, auszubilden, einer Bestimmungseinrichtung zur Bestimmung von G Erkennungsspielräumen, einen Erkennungsspielraum zwischen jedem Paar identifizierter Vergleiche C* und C** wobei die Größe eines Erkennungsspielraums die Differenz zwischen dem Wert von C* und dem Wert von C** ist, einer Auswahleinrichtung zur Auswahl des einzigen Paars identifizierter Vergleiche C* und C** mit dem kleinsten Erkennungsspielraum M* von allen G Paaren identifizierter Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr für eine korrekte Bilderkennung interpretiert wird, einer dritten Identifizierungseinrichtung zur Identifizierung des einzigen Paars von Bildelementbildern I* und I**, die dem Paar identifizierter Vergleiche C* und C** entsprechen, einer Gewichtungseinrichtung zur Gewichtung bestimmter Bildelemente des engstenbildelementbildes I* und des nächst-engsten Bildele mentbildes I**, die dem ausgewählten Paar identifizierter Vergleiche C* und C** entsprechen, um den Erkennungsspielraum M* dazwischen inkremental zu erhöhen, wodurch bewirkt wird, daß die Bildelementbilder das engste Bildelement- Standardmuster T* oder das nächst-engste Bildelement- Standardmuster T** oder beides werden, wobei die Vergleichereinrichtung, die erste, zweite und dritte Identifizierungseinrichtung, die Bestimmungseinrichtung, die Auswahleinrichtung und die Gewichtungseinrichtung zur Wiederholung des Vergleiches, der Identifizierung, Bestimmung, Auswahl und Gewichtung betreibbar sind, bis der zwischen den nicht verbesserten Bildelement-Eingangsbildern und den verbesserten Bildelement-Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung dient, wobei die Bibliothek der Bildelementbilder somit eine Bibliothek verbesserter Symbol-Standardmuster geworden ist, die bezüglich der vorher vorhandenen Gruppe von G Bildelementsymbolen Erkennungsverbessert wurden, wobei zumindest einige dieser Standardmuster gewichtete Bildelementaberrationen aufweisen, die in den entsprechenden Bildelementsymbolen der vorher vorhandenen Gruppe von G Bildelementsymbolen nicht vorhanden sind.
- Nachstehend werden Ausführungsbeispiele der Erfindung unter Bezugnahme auf die beiliegende Zeichnung beschrieben. Es zeigen:
- Fig. 1A eine Vergleichsmatrix (allgemeiner Fall) von G x L Vergleichen zwischen einer Gruppe von G Eingangssymbolen und einer Bibliothek von L Bildern,
- Fig. 1B eine Vergleichsmatrix zwischen Kleinbuchstaben- Eingangssymbolen a-z und einer Bibliothek für Kleinbuchstabem-Bilder,
- Fig. 2 ein Ablaufdiagramm der Schritte in dem Verfahren zur Standardmusterverbesserung,
- Fig. 3A ein Diagramm von Anfangs-Bildvergleichskoeffizienten zwischen dem einzelnen Kleinbuchstaben-Eingangssymbol o und den Kleinbuchstaben a-z in Fig. 1B,
- Fig. 3B ein Diagramm fortgeschrittener Standardmuster- Vergleichskoeffizienten zwischen dem Kleinbuchstaben- Eingangssymbol o und den Kleinbuchstaben a-z,
- Figuren 4A und 4B Diagramme für das Kleinbuchstaben- Eingangssymbol c ähnlich den Figuren 3A und 3B,
- Figuren 5A und 5B Diagramme für das Kleinbuchstaben- Eingangssymbol e ähnlich den Figuren 3A und 3B,
- Figuren 6A bis 6G Bildelement-Querschnitte der o-, c- und e- Standardmusterbitmaps, wobei die Entwicklung von Metapegeln und verblassenden Pegeln während des Verbesserungsvorgangs gezeigt ist, und
- Fig. 7 ein schematisches Blockschaltbild eines Geräts zur Implementation des Standardmuster-Verbesserungsverfahrens in der Praxis.
- Eine Bibliothek von L nicht verbesserten Bildern (Bildelement-Bitmaps) wird zur optischen Zeichenerkennung (OCR) bezüglich einer vorher vorhandenen Gruppe von G Eingangssymbolen (Bildelement-Bitmaps) zur Erzeugung einer Bibliothek von G Erkennungs-verbesserten Standardmustern (Bildelement-Bitmaps) der G Eingangssymbole verbessert. Die Verbesserung wird durch einen Vergleich jedes Bildes der Bibliothek mit jedem Symbol der Gruppe und durch Gewichtung der Bilder mit der größten Verwechslungsmöglichkeit durchgeführt. Die Bibliothek L nicht verbesserter Bilder erstreckt sich entlang der vertikalen Achse der GxL-Vergleichsmatrix in Fig. 1A (gezeigt als Bilder I&sub1; I&sub2; I&sub3;...Ii...IL). Die vorher vorhandene Gruppe von G Eingangssymbolen erstreckt sich entlang der horizontalen Achse der Matrix (gezeigt als Symbole S&sub1; S&sub2; S&sub3;...Si...SG). Die Bibliothek G Erkennungs-verbesserter Standardmuster (T&sub1; T&sub2;...Ti...TG) ist nicht in der GxL-Matrix gezeigt. Allerdings erstrecken sich die Symbol-/Bild- Vergleiche für die Bibliothek der G Erkennungs-verbesserten Standardmuster entlang der Diagonalen der GxL-Matrix (gezeigt als Standardmustervergleiche T&sub1;&sub1; T&sub2;&sub2; T&sub3;&sub3;...Tij...TGL), wobei die Eingangssymbole den nicht verbesserten Bildern entsprechen. Diese diagonale Standardmusterbeziehung setzt voraus, daß die Symbole und Bilder entlang jeder Achse in der gleichen Reihenfolge vorhanden sind, d.h. Si = Ij und Si+1 = Ij+1. Eine Vergleichsmatrix für Kleinbuchstaben a-z ist in Fig. 1B gezeigt, wobei insbesondere die Symbol-/Bildvergleiche für das Cluster ähnlich aussehender Zeichen o, c und e veranschaulicht sind.
- Die Schritte des Standardmusterverbesserungsverfahrens sind in Fig. 2 zusammengefaßt und werden nachstehend beschrieben.
- Ausbilden der Bibliothek L nicht verbesserter Bildelementbilder (I&sub1; I&sub2; I&sub3;...Ij...IL), die sich in die unterscheidende Bibliothek G verbesserter Standardmuster entwickeln werden.
- Ausbilden der Gruppe der G Bildelementsymbole (S&sub1; S&sub2; S&sub3;...Si...SG) in der bestimmten in Frage kommenden Benutzerschriftart. Übliche Schriftarten bzw. Fonts für alphanumerische Anwendungen sind Courier und Times Roman. Typischerweise enthalten Benutzerschriftarten
- Großbuchstaben ABCDEFGHIJKLMNOPQRSTUVWXYZ
- Kleinbuchstaben abcdefghijklmnopqrstuvwxyz
- Zahlen 1234567890 und
- Zeichen !$'$%^&*()&submin;+=[]{};'':"\ ,< .> /?.
- Dieses Verbesserungsverfahren kann bei anderen Erkennungsanwendungen, wie bei Radarrückgabesignalen und Audioerkennungsanwendungen, einschließlich Phonem-Klangmuster (Sprachfonts) angewendet werden.
- Die Schriftarten der nicht verbesserten Bilder und der Eingangssymbole können zur Maximierung des anfänglichen Symbol/Bildvergleichs und zur Ausbildung eines geeigneten Ausgangspunkts zur Standardmusterentwicklung identisch sein. Dagegen kann die anfängliche Bildschriftart eine allgemeine Schrift art oder eine spezielle Vorgängerschriftart der Eingangssymbolschriftart oder selbst ein auf weißem Rauschen beruhendes Standardmuster sein. Die Anzahl L von Bildern in der Bibliothek kann größer oder gleich der Anzahl von Symbolen G in der Gruppe sein. Die Bibliothek kann Bildeinträge aufweisen, die nicht in den Eingangssymbolen enthalten sind. Diese "freien" Bilder sind nicht an den Symbol-/Bildvergleichen beteiligt und verändern sich daher nicht und werden keine Standardmuster. L sollte nicht kleiner als G sein, um zu verhindern, daß sich ein einzelnes Bild im Ansprechen auf zwei getrennte Eingangssymbole zu entwickeln versucht.
- Vergleichen jedes der G Eingangssymbole mit jedem der L nicht verbesserten Bilder zum Erhalten von GxL Vergleichen, wie es in Körper der GxL-Matrix in Fig. 1 gezeigt ist. Die Symbol/Bild-Vergleiche werden durch den Vergleich jedes Bildelements der allgemeinen nicht verbesserten Bilder Ij mit jedem Bildelement des allgemeinen Eingangssymbols Si beruhend auf einer Vergleichsfunktion durchgeführt (die nachstehend in dem Cauchy-Shwartz-Abschnitt näher beschrieben ist). Die GxL Vergleiche bilden G Sätze von L Vergleichen, einen Satz von L Vergleichen für jedes Eingangssymbol. Jeder Satz der L Vergleiche enthält einen Vergleich Cij für ein nicht verbessertes Bild Ij. Der Satz der Vergleiche für das allgemeine Symbol Si erstreckt sich in der Spalte über Si nach oben (gezeigt als Ci2 Ci2 Ci3...Tij...CIL). Der anfängliche Spaltensatz der L Vergleiche für das Eingangssymbol (Kleinbuchstabe)bezüglich einer alphanumerischen Bildschriftart wird in der Bildsatzdarstellung in Fig. 3A angezeigt.
- Identifizieren des Primärvergleichs C* aus den L Vergleichen in jedem der G Sätze der Vergleiche mit dem engsten Vergleich mit dem Bildelementsymbol Si für diesen Satz. Im ganzen werden G Primärvergleiche C* identifiziert, die eine Reihen-Primär-Auswahl (C&sub1;* C&sub2;* C&sub3;*...Ci*...CL*) bilden. Der höchste bzw. beste Vergleich C** für das Eingangssymbol (Kleinbuchstaben) ist natürlich das nicht verbesserte Bild o (Kleinbuchstaben).
- Identifizieren des Sekundärvergleichs C** aus den L-1 verbleibenden Vergleichen in jedem der G Sätze der Vergleiche mit dem nächst-engsten Vergleich mit dem Eingangssymbol Si. Das dem Sekundärvergleich C** zugrundeliegende Bild ist das Bild, das am wahrscheinlichsten mit dem Eingangssymbol verwechselt wird. Im ganzen werden G Sekundärvergleiche C** identifiziert, die eine Reihen-Sekundärauswahl (C&sub1;** C&sub2;** C&sub3;**...Ci**...CL**) bilden. Die Primär- und Sekundärauswahl bilden G Paare identifizierter Vergleich C* und C**, ein Paar aus jedem der G Spaltensätze der Vergleiche. Der nächstbeste Vergleich C** für das Eingangssymbol o in Fig. 3A ist der o/c-Sekundärvergleich für das nicht verbesserte Bild c (Kleinbuchstaben). Die Symbole o und c und e bilden ein Cluster ähnlich geformter Bilder, die eine große Verwechslungsmöglichkeit aufweisen und "anti-Zeichen" werden (siehe nächster Abschnitt über Anti-Zeichen und Cluster).
- Bestimmen von G Erkennungsspielräumen (M&sub1; M&sub2; M&sub3;...Mi...MG), einen Erkennungsspielraum zwischen jedem Paar identifizierter Primär- und Sekundärvergleich C* und C**. Im ganzen werden G Erkennungsspielräume M bestimmt. Die Größe des Spielraums M ist die Differenz zwischen dem Wert von C* und dem Wert von C**. Der o/c-Spielraum beträgt 0,88, wie es in Fig. 3A gezeigt ist.
- Auswählen des einzigen Paars identifizierter Vergleiche C* und C**, die den kleinsten Erkennungsspielraum M* aller der G Paar identifizierter Vergleiche bilden. Je kleiner der Erkennungsspielraum ist, desto größer ist die Gefahr einer OCR- Verwechslung.
- Identifizieren des einzigen Paars von Bildern I* und I**, die dem Paar identifizierter Vergleich C* und C** zugrunde liegen. Das Bild I* stellt die Übereinstimmung für das Eingangssymbol Si dar, und das Bild I** ist die Quelle für die größtmögliche Verwechslung mit Si.
- Gewichten bestimmter Bildelemente entweder des engsten Bildelementbildes 1* oder des nächst-engsten Bildelementbildes I** oder beider, die dem ausgewählten Paar identifizierter Vergleich C* und C** zugrundeliegen, um den Erkennungsspielraum M* dazwischen zu erhöhen, wobei bewirkt wird, daß die Bildelementbilder das engste Bildelement-Standardmuster T* oder das nächst-engste Bildelement-Standardmuster T** oder beides werden.
- Wiederholen der Vergleichs-, Identifizierungs-, Bestimmungs-, Auswahl- und Gewichtungsschritte, bis die Bibliothek der Bildelementbilder eine Bibliothek mit ausreichend verbesserten Symbolstandardmustern (T&sub1; T&sub2; T&sub3;...Ti...TG) geworden ist. Die gewichteten Bildelementaberrationen, die in den verbesserten Standardmustern erzeugt werden, sind in dem entsprechenden Bildelementsymbol der zuvor vorhandenen Gruppe der G Bildelementsymbole (S&sub1; S&sub2; S&sub3;...Si...SG) nicht vorhanden.
- Der Verbesserungsgewichtungsvorgang ist beendet, wenn der zwischen den Eingangssymbolen und den Standardmustern erzeugte kleinste Erkennungsspielraum größer als ein vorbestimmter sicherer minimaler Wert ist. Das heißt, wenn selbst der am meisten fehlerträchtige Symbol-/Standardmustervergleich mit ausreichend hoher Wahrscheinlichkeit richtig ist. Der Vorgang kann auch beendet werden, wenn die inkrementale Erhöhung des kleinsten Spielraums kleiner als eine vorbestimmte minimale Erhöhung ist. Das heißt, wenn die Änderungsrate des Erkennungsspielraums der Standardmuster bei jeder Wiederholung vernachlässigbar ist und die dafür erforderliche Zeit nicht wert ist. Alternativ dazu kann der Vorgang nach der Ausführung einer bestimmten Anzahl von Gewichtungswiederholungen oder nach dem Ablauf einer zuvor zugewiesenen Verarbeitungszeitperiode gestoppt werden. Die Verbesserung der Standardmuster kann gelegentlich durch die Ausbildung eines lokalen Maximums in der Spielraumkontur zwischen dem Primärvergleich und dem Sekundärvergleich verlangsamt werden. Handelt es sich um ein instabiles lokales Maximum, geht es während nachfolgender Wiederholungen zurück und der Verbesserungsvorgang kehrt zu der vorherigen ungehinderten Geschwindigkeit zurück. Ist das lokale Maximum jedoch stabil, wird der Verbesserungsvorgang permanent zwischen dem Primär- und dem Sekundärvergleich gesperrt. Der Erkennungsspielraum bleibt auf dem gleichen Pegel ohne Änderung fest.
- Die Symbole o, c und e bilden ein Cluster ähnlich geformter Bilder mit hoher Verwechslungswahrscheinlichkeit. Die Zeichen des Clusters werden abwechselnd Anti-Zeichen, wenn sie während des Verbesserungsvorgangs einander gegenüber stehen. Zu Beginn sind lediglich o und c Anti-Zeichen (fett in dem o- Spaltesatzdiagramm in Fig. 3A). Das Cluster der Anti-Zeichen für o wird dann erweitert und enthält die "censu"-Anti-Zeichen (fett in dem o-Spaltensatzdiagramm in Fig. 3B). Andere Cluster der ähnlich aussehenden Kleinbuchstaben-Anti- Zeichen werden durch f und t und durch h und b gebildet. Ein Beispiel eines Zeichendoppelgängers ist "," und ";". Ein besonders schwieriges Doppelgängerduster wird durch die Zahl 1, den Kleinbuchstaben 1, den Großbuchstaben I und das Ausrufezeichen "!" gebildet. Das Standardmuster für jedes Elementsymbol eines Clusters der Doppelgänger-Anti-Zeichen muß sich selbst gegenüber den anderen Elementen des gleichen Clusters unterscheiden.
- Ein Vergleichsmatrix für Kleinbuchstabensymbole a-z ist in Fig 1B gezeigt, wo insbesondere die Symbol-/Bild-Vergleiche des Clusters der Doppelgängerzeichen o, c und e dargestellt sind. Die Eingangssymbolfonts (mit o, c und e als Kleinbuchstaben) erstrecken sich in alphanumerischer Ordnung entlang der horizontalen Achse der Vergleichsmatrix in Fig. 1B. Die Bildfonts (die auch o, c und e als Kleinbuchstaben enthalten) erstrecken sich entlang der vertikalen Achse. Der Anfangssatz der L Vergleiche des Eingangssymbols o mit jedem der Bilder ist in Fig. 1B gezeigt und erstreckt sich vertikal in einer Spalte oberhalb des Eingangssymbols o. In Fig. 1B sind aus Platzgründen lediglich die Kleinbuchstabenbilder gezeigt. Die Großbuchstaben, Zahlen und Zeichen wurden weggelassen.
- Die Spalte L anfänglicher Vergleiche für das Einganssymbol (Kleinbuchstaben) wird in dem Bildsatzdiagramm in Fig. 3A in unterschiedlicher Form dargestellt. Die anfänglich nicht verbesserten Bilder erstrecken sich in alphanumerischer Reihenfolge entlang der x-Achse des Diagramms. Die Werte der Symbol-/Bildvergleiche (zwischen 0 und 1,00) werden über die y- Achse aufgetragen. Das o-Spaltensatzdiagramm in Fig. 3A beruht auf der Kleinbuchstaben-Vergleichsmatrix in Fig. 1B, d.h. auf den o-Vergleichen in der vertikalen Spalte, die sich über der o-Position entlang der horizontalen Achse erstreckt. Jedes Symbol der Gruppe der G Eingangssymbole weist ein unterschiedliches Bildsatzdiagramm aus L Symbol/Bildvergleichen ähnlich dem o-Satzdiagramm in Fig. 3A auf. Das Bildspaltensatzdiagramm der anfänglichen Vergleiche für das Eingangssymbol c ist in Fig. 4A gezeigt, und das Bildspaltensatzdiagramm für e ist in Fig. 5A gezeigt.
- Während des Primärvergleichschritts werden im ganzen G Primärvergleiche C* identifiziert. Der beste Vergleich C* für das Eingangssymbol o (Kleinbuchstaben) ist natürlich das nicht verbesserte Bild o (Kleinbuchstaben). Der o/o-Vergleich (fett) weist einen Wert von 1,00 auf, da in dem Ausführungsbeispiel in Fig. 3A die Bildschriftart identisch mit der Symbolschriftart ist. C* für das Eingangssymbol c ist das Bild c mit einem Wert von 1,00 (siehe Fig. 4A - fett) und C* für das Eingangssymbol e ist das Bild e (siehe Fig. 5A - fett).
- Während des Sekundärvergleichschritts werden im ganzen G Sekundärvergleiche C** identifiziert, die G Paare identifizierter Vergleich C* und C**, ein Paar aus jedem der G Sätze von Vergleichen, bilden. Der nächstbeste Vergleiche C** für das Eingangssymbol o in Fig. 3A ist der o/c-Vergleich (fett) für das nicht verbesserte Bild c (Kleinbuchstaben), der dem Symbol o ähnlicher als die anderen L-1 Bilder in der alphanumerischen Bibliothek ist. Der o/c-Vergleich (fett) weist einen Wert von lediglich 0,88 auf, da das Bild c mit dem Eingangssymbol o nicht identisch ist. Der ole-Vergleich in Fig. 3A beträgt mit 0,84 etwas weniger. Im Fall des Eingangssymbols c (siehe Fig. 4A) ist C** der Vergleich c/o (fett) mit einem Wert von 0,88. Im Fall des Eingangssymbols e (siehe Fig. 5A) ist C** der Vergleich e/c (fett) mit 0,86.
- * Die Größe des Erkennungsspielraums M, der bei jeder Wiederholung bestimmt wird, ist die Differenz zwischen dem Wert C* und dem Wert C**. Der anfängliche o/c-Spielraum beträgt 0,12 (siehe Fig. 3A), und der anfängliche c/o-Spielraum beträgt auch 0,12 (siehe Fig. 4A). Der anfängliche e/c-Spielraum beträgt 0,14 (siehe Fig. 5A).
- Der allgemeine Fall der Standardmusterverbesserung bezüglich eines bestimmten Eingangssymbols Si enthält die Maximierung des minimalen Erkennungsspielraums zwischen dem Primärvergleich C* und dem maximalen Sekundärvergleich C**, die das ausgewählte Paar identifizierter Vergleich C* und C** bilden, mit der allgemeinen Beziehung:
- Maximieren von M = min[C* - max(C**)]
- wobei
- M der Erkennungsspielraum zwischen C* und C**,
- C* der Primärvergleich für das Standardmuster T*, das das engste Standardmuster in der Bibliothek bezüglich des Eingangssymbols Si ist, und
- C** der Sekundärvergleich für das Standardmuster T** ist, das das zweit-engste Standardmuster in der Bibliothek bezüglich des Eingangssymbol Si ist.
- Multivariable Funktionen, wie der Erkennungsspielraum M, können durch eine Anzahl allgemeiner numerischer Optimierungsprozesse maximiert werden. Der bei dem Ausführungsbeispiel in den Figuren 3, 4 und 5 verwendete Prozeß ist das Gradientenanstiegs- oder steilste Anstiegverfahren und bezieht sich auf das steilste Abfall-Verfahren, das bei Minimierungsproblemen verwendet wird. Zur Erhöhung des Erkennungsspielraums M muß C** durch Gewichtung verringert oder C* erhöht werden oder, beides. Bei dem inkrementalen Gewichtungseffekt bei dem Standardmuster T** werden Bildelementaberrationen in dessen Bitmap entwickelt, wodurch C** verringert wird. Das heißt, nach mehreren Wiederholungen der Gewichtung sieht T** immer weniger wie das Eingangssymbol Si aus, wodurch ein niedrigerer Wert des Vergleichs C** bewirkt wird.
- Die resultierende Erhöhung des c/o-Spielraums wird in dem fortgeschrittenen Standardmuster-Spaltensatzdiagramm in Fig. 3B angezeigt (direkt unter dem anfänglichen Bildsatzdiagramm in Fig. 3A). Das o-Standardmusterdiagramm zeigt einen fortgeschrittenen Satz der L Vergleiche für das Eingangssymbol (Kleinbuchstaben)bezüglich der Standardmuster (Kleinbuchstaben). Das fortgeschrittene Standardmusterdiagramm in Fig. 3B weist die gleiche Form wie das Anfangsbilddiagramm in Fig. 3A auf. Die verbesserten Standardmuster erstrecken sich in alphanumerischer Ordnung entlang der x-Achse des Diagramms. Der Wert des Vergleichs ist gegenüber der y- Achse aufgetragen. Der o/c-Spielraum hat sich von 0,12 in dem Anfangsbilddiagramm in Fig. 3A auf 0,21 in dem fortgeschrittenen Standardmusterdiagramm in Fig. 3B erhöht. Jedes der G Eingangssymbole weist ein unterschiedliches Standardmustersatzdiagramm mit L Vergleichen ähnlich dem o-Satz in Fig. 3B auf, das aus dem Anfangsbildsatzdiagramm entwickelt ist. Das Standardmuster-Spaltensatzdiagramm fortgeschrittener Vergleiche für das Eingangssymbol c ist in Fig. 4B gezeigt, und das Standardmustersatzdiagramm für e ist in Fig. 5B gezeigt.
- Der inkrementale Gewichtungseffekt akkumuliert auch Bildelementaberrationen in dem Bitmap des Standardmusters T* und kann eine leichte Verringerung von C* bewirken. Das heißt, nach mehreren Wiederholungen der Gewichtung sieht T* immer weniger wie das Eingangssymbol Si aus. Da jedoch bei jeder Wiederholung M maximiert wird, bleibt C* auf einem Pegel nahe 1,00. Die resultierende Verringerung des ob-Vergleichs ist in dem fortgeschrittenen Standardmustersatzdiagramm in Fig. 3B ersichtlich. Der o/o-Vergleich wurde von 1,00 in Fig. 3A auf 0,96 in Fig. 38 verringert. Der c/c-Vergleich wurde auch auf 0,96 verringert (siehe Fig. 4B), und der e/e-Vergleich wurde 0,98 (siehe Fig. 5B).
- Im Fall des Symbol-/Bildvergleichs o/c (siehe Fig. 3B) erhöht sich der o/c-Spielraum und erreicht den o/e-Spielraum von 0,21. Ist der o/c-Spielraum größer als der o/e-Spielraum, ersetzt C** des o/e-Vergleichs C** des o/c Vergleichs. Wenn die Wiederholungen fortschreiten, alterniert das Standardmuster T** zwischen dem Standardmuster c und dem Standardmuster e, bis sowohl der o/c-Spielraum als auch der o/e-Spielraum unter den Spielraum für ein anderes Bild wie n oder s fallen. Wenn sich der Erkennungsspielraum erhöht, wird das Cluster o der Anti-Zeichen erweitert und enthält c, e, n, s und u, wie es in Fig. 3B gezeigt ist. Eine weitere Verbesserung des o- Standardmusters würde den Spielraum ein wenig erhöhen, so daß m und z enthalten wären. Fig. 4B zeigt ein Cluster von Anti- Zeichen, die sich nahe dem Vergleichswert 0,75 für das Eingangssymbol c ansammeln, und Fig. 5B zeigt das Cluster c, und s bei 0,77.
- Der maximale Spielraum M wird durch inkrementale Gewichtung des Standardmusters T* und des Standardmusters T** während der Vergleichs-Wiederholzyklen erreicht. Die inkrementalen Standardmustergewichtungen W* und W** werden über die erste Ableitung (Vektorgradient) des Erkennungsspielraums nach den Mehrfach-Vektorkomponenten der Standardmuster T* und T** bestimmt:
- dM/dT* = dC/dT* - dC**/dT*
- und
- dM/dT** = dC*/dT** - dC**/dT**
- Die Gewichtungserhöhungen bei jedem Schritt, die bei jeder Wiederholung zu T* und T** addiert werden, betragen:
- W* = u*(dM/dT*)
- und
- W** = u**(dM/dT**)
- wobei u* der Gewichtungsfaktor mu bei dM/dT* für jede Vergleichswiederholung
- und
- u** der Gewichtungsfaktor mu bei dM/dT** für jede Vergleichwiederholung ist.
- Die Gewichtungsfaktoren u* und u** können gleich oder in Abhängigkeit von der Verbesserungsanwendung verschieden sein. Im allgemeinen unterstützt ein größeres mu eine größere Veränderung in M bei jeder Wiederholung, woraus sich eine höhere Entwicklungsrate ergibt. Jedoch können große Veränderungen ein Untertunneln des Zielmaximuns in der M-Funktion verursachen und instabile Oszillationen bei dem Wiederholungsvorgang auslösen. Kleine mu sind langsamer und stabiler. Ein gemäßigtes mu kann zum Erreichen eines Maximums verwendet werden und auf ein kleineres mu zur genaueren Lokalisierung des Maximas verringert werden.
- Jede Wiederholung n des Verbesserungsvorgangs erzeugt ein neues Standardmuster Tn+1, das sich ein wenig von dem alten Standardmuster Tn unterscheidet:
- T*n+1 = T*n + W* = T*n + u*(dM/dT*) = T*n + u*(dC*/dT* = dC**/dT*)
- T**n-1= T**n + W**= T**n + u**(dM/dT**) = T**n + u**(dC*/dT** - dC**/dT**)
- Mit jeder Wiederholung weichen T** und C** weiter von T* und C* ab, und der Erkennungsspielraum M wird größer. Die Trennung hält solange an, bis ein neues Paar identifizierter Primär- und Sekundärvergleiche C* und C** (mit neuen Standardmustern T* und T**) die gegenwärtigen ersetzen.
- Die Entwicklung der Bibliothek der Standardmuster im Ansprechen auf das Eingangssymbol o und des erweiterten Anti- Zeichen-Clusters c, e, n, s und u wird nachstehend beschrieben. Diese Wiederholung durch die Wiederholungssequenz beruht auf den Diagrammdaten der Figuren 3A und 38 und auf der Anfangsbedingung, daß das anfängliche Standardmuster o mit dem Symbol o identisch ist, wobei ein einziger Gewichtungsfaktor u*=u**=0,01 ist.
- Bein=0 (vor einer Wiederholung)
- Standardmuster o&sub0; = Eingangssymbol o
- Bei n=10 (nach 10 Wiederholungen)
- Standardmuster o&sub1;&sub0; = (Standardmuster o&sub0;) - 0,10
- (Standardmuster c)
- Der c-Standardmusterkoeffizient ist das Produkt aus (n) (u)=(10) (0,01)=10. Bei den ersten zehn Wiederholungen 1-10 ist das Standardmuster für C** lediglich das Standardmuster c, und die Erhöhung von M pro Wiederholungen ist außerordentlich groß.
- Bei n=16
- Standardmuster o&sub1;&sub6; = (Standardmuster o&sub0;) - 0.13
- (Standardmuster c) - 0,03 (Standardmuster e)
- Während der sechs Wiederholungen 11-16 alterniert das Standardmuster für C** zwischen Standardmuster c und Standardmuster e. Jeder Koeffizient erhöht sich um 3x 0,01, und die Erhöhung von M pro Wiederholung ist weniger schnell.
- Bei n=28
- Standardmuster o&sub2;&sub8; = (Standardmuster o&sub0;) - 0,17
- (Standardmuster c) - 0,07 (Standardmuster e) - 0,04
- (Standardmuster n)
- Während der zwölf Wiederholungen 17-28 alterniert das Standardmuster für C** zwischen Standardmuster c, Standardmuster e und Standardmuster n. Jeder Koeffizient erhöht sich um 4x 0,01.
- Bei n=36
- Standardmuster o&sub3;&sub6; = (Standardmuster o&sub0;) - 0,19
- (Standardmuster c) - 0,09 (Standardmuster e) - 0,06
- (Standardmuster n) - 0,02 (Standardmuster s)
- Während der acht Wiederholungen 29-36 alterniert das Standardmuster für C** zwischen Standardmuster c, Standardmuster e, Standardmuster n und Standardmuster s. Jeder Koeffizient erhöht sich um 2x 0,01.
- Bei n=51
- Standardmuster o&sub5;&sub1; = (Standardmuster o&sub0;) - 0,22
- (Standardmuster c) - 0,12 (Standardmuster e) - 0,09
- (Standardmuster n) - 0,05 (Standardmuster s) - 0,03
- (Standardmuster u)
- Während der 15 Wiederholungen 37-51 alterniert das Standardmuster für C** zwischen Standardmuster c, Standardmuster e, Standardmuster n, Standardmuster s und Standardmuster u. Jeder Koeffizient erhöht sich um 3x0,01 und die Erhöhung von M pro Wiederholung ist sehr langsam.
- Jedes Eingangssymbol und jedes zugehörige Cluster weist eine ähnliche Abfolge auf, wobei die Vergleiche für die Anti- Zeichen sich in Richtung eines gemeinsamen Vergleichswerts und Erkennungsspielraums entwickeln. Hält der Wiederholungsvorgang weiter an, erhöht sich die Anzahl von Anti-Zeichen und die Entwicklungsrate verlangsamt sich. Der Prozeß kann beendet werden, wenn die minimale Verbesserung bei der Verbesserung für die nächste Wiederholung den Berechnungsaufwand nicht mehr wert ist.
- Die Vergleichsfunktion zwischen einem Eingangssymbol Si und den Bibliothekstandardmustern (T&sub1; T&sub2; T&sub3;...Ti...TG) beinhaltet eine bildelementweise Behandlung und Summation des Si-Bitmaps mit jedem Standardmuster-Bitmap. Die bildelementweise Behandlung liefert den Satz numerischer Vergleichskoeffizienten (Ci1 Ci2 Ci3...Tij...CiL) für das Eingangssymbol Si. Die GxL Vergleiche sind numerische Koeffizienten des Vergleichs, deren Wert den Grad der Bildelementähnlichkeit zwischen dem Symbol Sj und dem Standardmuster unter Vergleich darstellt. Vorzugsweise zeigt ein Koeffizient mit einem hohen Wert einen engen Vergleich zwischen Si und dem Standardmuster an, und ein Koeffizient mit einem niedrigen Wert zeigt einen entfernten Vergleich zwischen Si und dem Standardmuster an. Vorzugsweise sind die Bildelementdaten in den Symbol- und Standardmuster- Bitmaps innerhalb des Bitmap zentriert und rotationssymmetrisch ausgerichtet. Die Bitmaps können auf die gleiche An zahl an Bildelementreihen und Bildelementspalten X/Y-skaliert werden, wodurch entsprechende Bildelementpositionen in jedem Bitmap ausgebildet werden.
- Jede geeignete Vergleichsfunktion, wie die Cauchy-Shwartz- Funktion, kann angewendet werden, die das Symbol- Standardmuster-Skalarprodukt (die Summation des Produkts entsprechender Bildelemente) geteilt durch die Symbolnorm Si und die Standardmusternorm Ti darstellt:
- Cauchy-Shwartz-Funktion = (Si) (Ti)/( Si )( Ti ).
- Der Vektor jedes Bildelements in dem Eingangssymbol-Bitmap wird mit dem Vektor des entsprechenden Bildelements in dem Standardmuster-Bitmap multipliziert und durch die zwei Normen geteilt. Die Norm ist ein Normalisierungsfaktor aus der Quadratwurzel der Summe der Quadrate jedes Bildelementwerts in dem Bitmap. Der Cauchy-Shwartz-Vergleich für jedes Symbol/Standardmuster liefert einen Vergleichskoeffizienten mit einem Wert zwischen 0 und 1,00, wie es entlang der vertikalen Achse in den Figuren 3, 4 und 5 gezeigt ist. Der vorstehende Ausdruck der Cauchy-Shwartz-Funktion kann durch Vor- Normalisierung des Si-Terms vereinfacht werden:
- Cauchy-Shwartz-Funktion = (Si) (Ti)/( Ti ).
- Der Si-Term in dem neuen vereinfachten Ausdruck stellt nun den komplexeren früheren Term (Si)/( Si ) dar. Bezüglich der vereinfachten Cauchy-Shwartz-Funktion ergibt sich der Verbesserungsvorgang zu:
- für den Primärvergleich
- C* = (Si) (T*)/( T* ),
- und für den Sekundärvergleich
- C** = (Si) (T**)/( T** ).
- Mathematisch gesehen beinhaltet der Standardmusterverbesserungsvorgang das Auffinden eines Satzes von Vektorstandardmustern (T&sub1; T&sub2; T&sub3;...Ti...Tc), die den minimalen Erkennungsspielraum zwischen dem Primärvergleich C* und dem maximalen Sekundärvergleich C** maximieren (über alle Standardmuster):
- Maximieren von M = Min [(Si) (T*)/( T* )- Max {(Si) (T**)/( T**)}]
- Die Ableitungen der Cauchy-Shwartz-Vergleichsfunktion ergeben sich zu:
- dM/dT* = dC*/dT* - dC**/dT* = Si/ T* - (Si T*)T*/( T* )³
- und
- dM/dT** = dC*/dT** - dC**/dT** = Si/ T** - (Si T**)T**/( T** )³.
- Das Eingangssymbol-Bitmap und die anfänglichen Bildbitmaps konnen im binären Datenformat vorliegen (1-en und 0-en), oder können Tonabstufungs-Grauskaladaten enthalten, die von dem Toner (oder der Tinte) gedruckter Schriftarten abgetastet werden. Die Abtastung und Verarbeitung kann aufgrund elektronischer Signale und mechanischer Schwingungen, die die Grauskalenpegel (oder binären Daten) verzerren, Rauschelemente einführen. Wenn die Wiederholungen fortschreiten, entwickeln die verbesserten Standardmuster Aberrationen, die durch die inkrementale Gewichtung ausgebildet werden, die (durch Addition oder Subtraktion) zu einer bereits in dem Bitmap vorhandenen Toner-Grauskalen- und Rauschverzerrung hinzukommen. Die von Natur aus Brüche darstellenden Gewichtungsinkremente bewirken, daß alle binären Anfangsbilder sich in nicht binäre Standardmuster entwickeln. Die anfänglichen Grauskalenbilder sind natürlich bereits nicht binär. Die Gewichtungsinkremente werden zu der zuvor vorhandenen Grauskala und Erzeugung von Meta-Schwarz- und Meta-Weiß-Grauskalenpegeln hinzuaddiert, die über dem schwärzesten Schwarz und dem hellsten Weiß liegen, die aus gedruckten Fonts erhalten werden können. Die Akkumulation der Gewichtungsaberrationen in jedem Anti-Zeichen- Standardmuster verursacht eine Verringerung des Sekundärvergleichs C** und eine Erhöhung des Erkennungsspielraums M.
- Die Figuren 6A-6G zeigen die Entwicklung der Meta-Schwarzund Meta-Weiß-Gewichtung während der ersten 16 Wiederholungen des "censu"-Anti-Zeichenbeispiels für das Eingangssymbol o, wie es vorstehend beschrieben wurde. Diese Figuren zeigen die Grauskalenpegel jedes Bildelements entlang der mittleren horizontalen Reihe der Bildelemente in den "oce"- Bitmapstandardmustern.
- Der Querschnitt durch die mittlere Reihe enthält die kritischen Unterschiede zwischen den oce-Standardmustern:
- 1) der schwarze horizontale Strich in e, wobei o und c beide weiße mittlere Bereiche aufweisen,
- 2) der weiße Spalt auf der rechten Seite in c und
- 3) der schwarze Strich auf der rechten Seite in o an der Position entsprechend dem Spalt in c.
- Die Strichbreite in den in Fig. 6 gezeigten Kleinbuchstaben- Standardmustern beträgt vier Bildelemente.
- Die Bitmapbildelemente in dem Ausführungsbeispiel in Fig. 6 weisen 256 Grauskalenpegel, 128 Pegel auf jeder Seite eines Null-Halbtonpegels auf. Der Pegel +100 stellt die von dem Toner des gedruckten Zeichens erhältliche schwärzeste Intensität dar, und der Pegel -100 stellt die von dem Hintergrund des weißen Papiers erhältliche weißeste Intensität dar. In dem Ausführungsbeispiel in Fig. 6 weisen alle Tonerbildelemente den schwärzesten Pegel +100 auf, und alle Hintergrundbildelemente liegen auf dem weißesten Pegel -100. Die Reihenquerschnitte sind in idealer Form gezeigt, rauschfrei mit quadratischen Ecken und perfekten vertikalen Schwarz-/Weiß- Schnittstellen. Die Pegel +101 bis +128 über dem Tonerpegel sind für die Meta-Schwarzwerte reserviert, und die Pegel -101 bis -128 unterhalb des Hintergrundpegels sind für Meta- Weißwerte reserviert.
- Fig. 6A zeigt den Querschnitt durch die mittlere Reihe des anfänglichen o-Standardmusters vor einer Wiederholung (bei n=0) . Der schwarze Strich linker Hand und der Strich rechter Hand des 0 sind als vier dunkle Bildelemente (+100) gespeichert. Der linke weiße und der rechte weiße Rand und der mittlere Bereich des o sind als weiße Bildelemente (-100) gespeichert. Fig. 6B zeigt den entsprechenden Querschnitt des anfänglichen c-Standardmusters (n=0) mit vier dunklen Bildelementen für den schwarzen linken Strich und weißen Bildelementen für den Rest der Bildelementreihe. Weiß bildet den linken und rechten Rand und den mittleren Bereich von c plus den rechten Spalt.
- Die Figuren 6C und 6D zeigen die o- und c-Querschnitte nach zehn Wiederholungen (n=10) des Verbesserungsvorgangs zwischen den Standardmustern. Der o-Querschnitt hat eine leichte Meta- Schwarz-Aberration (größer als +100) über den rechten Strich entwickelt, und der c-Querschnitt hat eine leichte Meta-Weiß- Aberration(geringer als -100) unter dem rechten Spalt entwickelt. Die Metapegel werden zu den Standardmustern addiert, wenn die entsprechenden Bildelemente der zwei Standardmuster- Bitmaps entgegengesetzte Vorzeichen aufweisen. Das heißt, wenn ein Bildelement eines Standardmusters + (schwarz) und das entsprechende Bildelement des anderen Standardmustern - (weiß) ist. Dieser additive Effekt für entgegengesetzte Bildelemente beruht auf der Polaritätsänderung, die durch die grundlegende Erkennungsspielraumbeziehung eingeführt wird.
- Die Metapegel heben den Unterschied zwischen den ausgewählten C*- und C**-Standardmustern hervor.
- Ein entgegengesetzter subtraktiver Effekt des Verblassens tritt auf, wenn die entsprechenden Bildelemente die gleichen Vorzeichen, beide + (schwarz) oder - (weiß), aufweisen. Der weiße linke Rand in beiden n=10-Standardmustern hat sich von dem maximalen Weiß -100 (Figuren 6A und 6B, n=0) zu einem weniger intensiven Weiß (Figuren 6C und 6D, n=10) entwickelt. Der rechte Rand und die weißen mittleren Gebiete beider Standardmuster wurden auch auf eine weniger intensive Position gehoben. Die Verblassungspegel unterdrücken die Ähnlichkeiten zwischen dem C*- und C**-Standardmuster.
- Die folgende Tabelle zeigt die Entwicklung von Metapegeln für entgegengesetzte Bildelemente und von Verblassungspegeln für gleiche Bildelemente bei zehn Wiederholungen mit einem Gewichtungsfaktor von u=0,01.
- Fig. 6E zeigt den Querschnitt durch die mittlere Reihe des anfängichen e-Standardmusters vor einer Wiederholung (n=0). Der horizontale Strich von e erscheint als Haupt-Schwarz- Bereich (+100). Während der elften Wiederholung wird das e- Standardmuster ein C**-Anti-Zeichen bezüglich des o- Standardmusters. Die Figuren 6F und GG zeigen den o- und e- Querschnitt nach sechs weiteren Wiederholungen (n=16). Der e- Querschnitt hat eine Meta-Schwarz-Aberration entlang der schwarzen horizontalen Strichbildelemente entwickelt. Der o- Querschnitt hat sich in Richtung von Meta-Weiß entlang des weißen mittleren Gebiets bewegt. Sowohl der e-Querschnitt als auch der o-Querschnitt sind ein wenig über dem linken und rechten Strich aufgrund dem gemeinsamen Schwarz in beiden Standardmustern verblaßt. Der e- und der o-Querschnitt sind auch ein wenig über den linken und rechten Rand aufgrund des gemeinsamen Weiß verblaßt. Die Metapegel und Verblassungspegel, die die Unterschiede hervorheben und die Ähnlichkeiten unterdrücken, können aufgrund der RMS-(quadratisches Mittel)Natur der Vergleichskoeffizienten als im Gleichgewicht befindlich angesehen werden. Die Quadratwurzel der Summe der Quadrate der Bildelementpegel in jedem Bitmap bleibt konstant. Daher gibt es für jede Metapegelentwicklung in einem fortgeschrittenen Standardmuster eine gleiche und entgegengesetzte Verblassungsentwicklung.
- Eine Symbolbibliothek 72:S enthält eine zuvor vorhandene Gruppe von G Bildelementsymbolen (S&sub1; S&sub2; S&sub3;...Si...SG). Eine Bildbibliothek 72:1 enthält L nicht verbesserte Bildelementbilder (I&sub1; I&sub2; I&sub3;...Ij...IL), aus denen G verbesserte Standardmuster (T&sub1; T&sub2; T&sub3;...Ti...TG) der G Bildelementsymbole werden sollen. Eine Symbol-Bild-Vergleichereinrichtung 74 vergleicht jedes der G Bildelementsymbole mit jedem der L Bildelementbilder, um GxL Vergleiche zu erhalten&sub1; die G Sätze von L Vergleichen (C&sub1; C&sub2; C&sub3;...Cj...CL) bilden, die vorübergehend in einem GxL-Speicher 76 gespeichert werden. Ein Satz aus L Vergleichen wird für jedes Bildelementsymbol Si der G Bildelementsymbole gebildet. Jeder Satz von Vergleichen weist einen Vergleich C* für jedes Bildelement Ij auf. Der Primärvergleich C** wird aus den L Vergleichen in jedem der G Sätze der Vergleiche mit dem engsten Vergleich mit dem Bildelementsymbol Si für diesen Satz von Vergleichen identifiziert. Der Sekundärvergleich C*** wird aus den L-l verbleibenden Vergleichen in jedem der G Sätze der Vergleiche mit dem nächstengsten Vergleich mit dem Bildelementsymbol Si für diesen Satz der Vergleiche identifiziert. G Paare identifizierter Vergleich Ci* und Ci** werden gebildet, ein Paar aus jedem der G Sätze von Vergleichen. Die G Paare werden vorübergehend in einem Paar-Speicher 77 gespeichert. G Erkennungsspielräume (M&sub1; M&sub2; M&sub3;...Mi...MG) werden bestimmt, ein Erkennungsspielraum zwischen jedem Paar identifizierter Vergleich Ci* und Ci**. Die G Erkennungsspielräume werden in dem Paar-Speicher 77 gespeichert. Das einzige Paar identifizierter Vergleiche Ci* und Ci** wird aus dem Paar-Speicher 77 ausgewählt, das den kleinsten Erkennungsspielraum Mi* aller der G Paare in dem Paar-Speicher bildet. Der Paar-Speicher adressiert das einzige Paar der Bildelementbilder Ij* und Ij** in der Bildbibliothek 72:1, das dem Paar identifizierter Vergleiche C** und Ci** entspricht. Eine Bildelement-Gewichtungseinrichtung 78 gewichtet bestimmte Bildelemente entweder des engsten Bildelementbildes Ij* oder des nächst-engsten Bildelementes Ij** oder beider. Die gewichteten Bilder entsprechen dem ausgewählten Paar identifizierter Vergleiche Ci* und Ci** zur Erhöhung des Erkennungsspielraums Mi* dazwischen. Die Vergleichs-, Identifikation-, Bestimmungs-, Auswahl- und Gewichtungsschritte werden wiederholt, bis die L Bildelementbilder in der Bildbibliothek 72:1 eine Bibliothek verbesserter Symbol-Standardmuster (T&sub1; T&sub2; T&sub3;...Ti...TG) geworden sind, von denen zumindest einige gewichtete Bildelementaberrationen aufweisen,die in dem entsprechenden Bildelementsymbol der zuvor vorhandenen Gruppe der G Bildelementsymbole (S&sub1; S&sub2; S&sub3;...Si...SG) in der Symbolbibliothek 72:S nicht vorhanden sind.
- Die Implementation der offenbarten und beanspruchten Verfahren und des Geräts im einzelnen ist natürlich nicht festgelegt. Ein Fachmann hat die Möglichkeit, diese Verfahren durch die Bereitstellung eines geeignet programmierten Computers zu implementieren, und/oder es kann eine darauf zugeschnittene Hardware vorgesehen werden, wenn das Erfordernis hoher Leistung den Aufwand rechtfertigt. Jeder beschriebene Schritt der Verfahren kann einfach durch herkömmliche Datenverarbeitungseinrichtungen implementiert werden, während die Kombination derartiger Einrichtungen gemäß der Erfindung eine Verbesserung auf dem Gebiet automatischer Erkennungssysteme liefert.
- Für den Fachmann ist es offensichtlich, daß die Aufgaben der Erfindung wie vorstehend beschrieben gelöst werden. Natürlich können der vorstehend beschriebene Aufbau und die Ausführungsbeispiele verändert werden, ohne von dem Konzept der Erfindung abzuweichen. Ferner können Merkmale der in den verschiedenen Figuren gezeigten Ausführungsbeispiele bei Ausführungsbeispielen der anderen Figuren verwendet werden. Daher ist der Schutzbereich der Erfindung lediglich durch die folgenden Patentansprüche bestimmt.
Claims (56)
1. Verfahren zur Erkennungsverbesserung einer Bibliothek von
L nicht verbesserten Bildelementbildern {I&sub1; I&sub2; I&sub3; .. Ij .. IL}
bezüglich einer vorher vorhandenen Gruppe von G
Bildelementsymbolen (S&sub1; S&sub2; S&sub3; .. Si .. SG} zur Ausbildung einer
Bibliothek von G Erkennungs-verbesserten Bildelement-
Standardmustern {T&sub1; T&sub2; T&sub3; .. Ti .. TG} der G
Bildelementsymbole, mit den Schritten
Vergleichen jedes der G Bildelementsymbole mit jedem der
L Bildelementbilder zum Erhalten von GxL Vergleichen, die G
Sätze von L Vergleichen {C&sub1; C&sub2; C&sub3; .. Cj .. CL}, einen Satz von
L Vergleichen für jedes Bildelementsymbol Si der G
Bildelementsymbole, ausbilden, wobei jeder Satz von Vergleichen
einen Vergleich Ci für jedes Bildelementbild Ij aufweist,
Identifizieren des Primärvergleichs C* aus den L
Vergleichen in jeden der G Sätze von Vergleichen mit dem engsten
Vergleich mit dem Bildelementsymbol Si, wobei dieser Satz von
Vergleichen eine Auswahl von G Primärvergleichen C*={C&sub1;* C&sub2;*
C&sub3;* .. Ci* .. CL*} bildet,
Identifizieren des Sekundärvergleichs aus den L-1
verbleibenden Vergleichen in jedem der G Sätze von Vergleichen
mit dem nächst-engsten Vergleich mit dem Bildelementsymbol
Si, wobei dieser Satz von Vergleichen eine Auswahl von G
Sekundärvergleichen C**={C&sub1;** C&sub2;** C&sub3;** .. Ci** .. CL**} bildet,
um G Paare von identifizierten Vergleichen C* und C**, ein
Paar aus jedem der G Sätze von Vergleichen, zu erhalten,
Bestimmen von G Erkennungsspielräumen {M&sub1; M&sub2; M&sub3; .. Mi ..
MG}, einen Erkennungsspielraum zwischen jedem Paar der
identifizierten Vergleiche C* und C**, wobei die Größe eines
Erkennungsspielraums die Differenz zwischen dem Wert von C* und
dem Wert von C** ist,
Auswählen des einzigen Paars identifizierter Vergleiche
C* und C** mit dem kleinsten Erkennungsspielraum M* von allen
G Paaren identifizierter Vergleiche aus den G Sätzen von
Vergleichen, wobei ein kleiner Erkennungsspielraum als Gefahr
für eine korrekte Bilderkennung interpretiert wird,
Identifizieren des dem Paar identifizierter Vergleiche
C* und C** entsprechenden einzigen Paars von
Bildelementbildern I* und I**,
Gewichten bestimmter Bildelemente des engsten
Bildelementbildes I* und des nächst-engsten Bildelementbildes I**,
die dem ausgewählten Paar identifizierter Vergleiche C* und
C** entsprechen, um den Erkennungsspielraum M* dazwischen
inkremental zu erhöhen, wodurch bewirkt wird, daß die
Bildelementbilder das engste Bildelement-Standardmuster T* oder das
nächst-engste Bildelement-Standardmuster T** oder beides
werden, und
Wiederholen der Vergleichs-, Identifikations-,
Bestimmungs-, Auswahl- und Gewichtungsschritte bis der zwischen den
nicht verbesserten Bildelement-Eingangsbildern und den
verbesserten Bildelement-Standardmustern erzeugte kleinste
Erkennungsspielraum größer als ein vorbestimmter minimaler Wert
ist, der als Kennzeichen einer sicheren Erkennung dient,
wobei die Bibliothek der Bildelementbilder somit eine
Bibliothek verbesserter Symbol-Standardmuster {T&sub1; T&sub2; T&sub3; .. Ti .. Tc}
geworden ist, die bezüglich der vorher vorhandenen Gruppe von
G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG}
Erkennungsverbessert wurden, wobei zumindest einige dieser
Standardmuster gewichtete Bildelementaberrationen aufweisen, die in dem
entsprechenden Eildelementsymbol der vorher vorhandenen
Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SC} nicht
vorhanden sind.
2. Verfahren nach Anspruch 1, wobei die
Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn der
kleinste Erkennungsspielraum größer als ein vorbestimmter
minimaler Wert ist.
3. Verfahren nach Anspruch 1, wobei die
Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn die
inkrementale Erhöhung des kleinsten Erkennungsspielraums bei
jeder Wiederholung kleiner als eine vorbestimmte minimale
Erhöhung ist.
4. Verfahren nach Anspruch 1, wobei die
Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn eine
bestimmte Anzahl von Gewichtungswiederholungen ausgeführt
wurde.
5. Verfahren nach Anspruch 1, wobei die
Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn eine
vorher zugewiesene Periode einer
Wiederholungsverarbeitungszeit abgelaufen ist.
6. Verfahren nach Anspruch 1, wobei die
Erkennungsverbesserung der Bildelement-Standardmuster beendet wird, wenn die
einzelnen Standardmuster in Clustern ähnlich gestalteter
Standardmuster sich zu dem gleichen Erkennungsspielraum
weiterentwickelt haben und wechselseitige Anti-Zeichen geworden
sind.
7.Verfahren nach Anspruch 1, wobei L größer als G und G
gleich T ist.
8. Verfahren nach Anspruch 1, wobei die Gruppe von G
Bildelementsymbolen alphanumerische Symbole und die Bibliothek von T
Bildelement-Standardmustern die gleichen durch gewichtete
Bildelementaberrationen verbesserten alphanumerischen Symbole
sind.
9. Verfahren nach Anspruch 8, wobei L gleich G und G gleich T
ist.
10. Verfahren nach Anspruch 9, wobei die Bibliothek von G
Bildelementbildern den alphanumerischen Symbolen der Gruppe
von G Bildelementsymbolen entsprechende alphanumerische
Symbole sind.
11. Verfahren nach Anspruch 9, wobei die Bibliothek von G
Bildelementbildern alphanumerische Symbole sind, die zu den
alphanumerischen Symbolen der Gruppe von G
Bildelementsymbolen identisch sind.
12. Verfahren nach Anspruch 1, wobei die GxL Vergleiche
numerische Koeffizienten des Vergleichs sind, deren Wert den Grad
der Bildelementähnlichkeit zwischen dem Bildelementsymbol Si
und dem Bildelementbild Ij unter Vergleich anzeigt.
13. Verfahren nach Anspruch 12, wobei ein Koeffizient mit
einem hohen Wert einen engen Vergleich zwischen Si und Ij
anzeigt, und ein Koeffizient mit einem niedrigen Wert einen
entfernten Vergleich zwischen Si und Ij anzeigt.
14. Verfahren nach Anspruch 12, wobei der Erkennungsspielraum
die Difference zwischen den Vergleichen C* und C** jedes
ausgewählten Paars von Vergleichen ist.
15. Verfahren nach Anspruch 14, wobei die
Erkennungsverbesserung bezüglich eines bestimmten Bildelementsymbols Si ein
Maximieren des minimalen Erkennungsspielraums zwischen dem
Primärvergleich C* und dem maximalen Sekundärvergleich C**, die
für das Bildelementsymbol Si bilden, mit der allgemeinen
Beziehung beinhaltet:
Maximieren von M = min[C**)]
wobei
M der Erkennungsspielraum zwischen
C* und C**,
C* der Primärvergleich für das Standardmuster T*, das
das engste Standardmuster in der Bibliothek zu dem
Bildelementsymbol Si ist, und
ist, das das zweit-engste Standardmuster in der Bibliothek zu
dem Bildelementsymbol Si ist.
16. Verfahren nach Anspruch 15, wobei nur das engste
Bildelementbild I* gewichtet wird, wodurch bewirkt wird, daß das
engste Bildelementbild I* das engste Bildelement-
Standardmuster T* wird.
17. Verfahren nach Anspruch 16, wobei die zu dem engsten
Standardmuster T* bei jeder Wiederholung addierte Gewichtung
durch die erste Ableitung des Erkennungsspielraums M* nach
dem Standardmuster T* bestimmt wird:
W* = u*(dM/dT*) = u*(dC/dT* - dC**/dT*)
wobei
W* die bei jeder Wiederholung addierte Gewichtung und
u* ein Gewichtungsfaktor mu* für dM/dT* ist.
18. Verfahren nach Anspruch 17, wobei jede Wiederholung des
Verbesserungsvorgangs ein neues T*-Standardmuster erzeugt,
das geringfügig von dem alten T*-Standardmuster verschieden
ist:
T*n+1 = T*n + W* = T*n + u*(dM/dT*)
= T*n + u*(dC*/dT* - dC**/dT*)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster und
T*n das alte T*-Standardmuster ist.
19. Verfahren nach Anspruch 15, wobei nur das nächst-engste
Bildelementbild I** gewichtet wird, wodurch bewirkt wird, daß
das nächst-engste Bildelementbild I** das nächst-engste
Bildelement-Standardmuster T** wird.
20. Verfahren nach Anspruch 19, wobei die zu dem
nächstengsten Standardmuster T** bei jeder Wiederholung addierte
Gewichtung durch die erste Ableitung des Erkennungsspielraums
M** nach dem Standardmuster T** bestimmt wird:
W** = u**(dM/dT**) = u**(dC/dT** - dC**/dT**)
wobei
W** die bei jeder Wiederholung addierte Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
21. Verfahren nach Anspruch 20, wobei jede Wiederholung des
Verbesserungsvorgangs ein neues T**-Standardmuster erzeugt,
das geringfügig von dem alten T**-Standardmuster verschieden
ist:
T**n+1 = T**n + W** = T**n + u**(dM/dT**)
= T**n + u**(dC/dT** - dC**/dT**)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
22. Verfahren nach Anspruch 15, wobei sowohl das engste
Bildelementbild I* als auch das nächste-engste Bildelementbild I**
gewichtet werden, wodurch bewirkt wird, daß das engste
Bildelementbild I* das engste Bildelement-Standardmuster T*, und
das nächst-engste Bildelementbild I** das nächst-engste
Bildelement-Standardmuster T** wird.
23. Verfahren nach Anspruch 22, wobei die zu T* und zu dem
Standardmuster T** bei jeder Wiederholung addierte Gewichtung
durch die erste Ableitung der Erkennungsspielraum M* und M**
nach den Standardmustern T* und T** bestimmt wird:
W* = u*(dM/dT*) = u*(dC*/dT* - dC**/dT*)
W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**)
wobei
W* die zu T* bei jeder Wiederholung addierte Gewichtung,
u* ein Gewichtungsfaktor mu* für dM/dT*.
W** die zu T** bei jeder Wiederholung addierte
Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
24. Verfahren nach Anspruch 23, wobei der Gewichtungsfaktor
u* gleich dem Gewichtungsfaktor u** ist.
25. Verfahren nach Anspruch 23, wobei jede Wiederholung neue
T*- und T**-Standardmuster erzeugt, die geringfügig von den
alten T*- und T**-Standardmustern verschieden sind:
T*n+1 = T*n + W* = T*n + u*(dC*/dT* - dC**/dT*)
T**n=1 = T**n + W** = T**n + u**(dC*/dT** - dC**/dT**)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster,
T*n das alte T*-Standardmuster,
T**n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
26. Verfahren nach Anspruch 12, wobei der Wert jedes
numerischen Koeffizienten des Vergleichs C&sub1; auf einem
bildelementweisen Vergleich zwischen jedem Bildelement des
Bildelementsymbols Si und jedem Bildelement des Bildelementbildes Ij
untervergleich beruht.
27. Verfahren nach Anspruch 26, wobei der bildelementweise
Vergleich das Skalarprodukt zwischen jedem Bildelement des
Bildelementsymbols Si und jedem Bildelement des
Bildelementbildes Ij unter Vergleich ist.
28. Verfahren nach Anspruch 26, wobei der bildelementweise
Vergleich auf der Cauchy-Shwartz-Funktion basiert:
Cauchy-Shwartz-Funktion =
(Si) (Ti)/( Si )( Ti )
wobei
(Si) das Eingangssymbol unter Vergleich,
(Ti) das verbesserte Standardmuster unter Vergleich,
( Si ) die Symbolnorm und
( Ti ) die Standardmusternorm ist
29. Gerät zur Erkennungsverbesserung einer Bibliothek von L
nicht verbesserten Bildelementbildern {I&sub1; I&sub2; I&sub3; .. Ij .. IL}
bezüglich einer vorher vorhandenen Gruppe von G
Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG} zur Ausbildung einer
Bibliothek von G Erkennungs-verbesserten Bildelement-
Standardmustern {T&sub1; T&sub2; T&sub3; .. Ti .. TG} der G
Bildelementsymbole, mit
einer ersten Speichereinrichtung zur Speicherung der
Bibliothek der zu verbessernden L nicht verbesserten
Bildelementbilder {I&sub1; I&sub2; I&sub3; .. I&sub3; .. IL} zum Erhalten der Bibliothek
der G Erkennungs-verbesserten Bildelement-Standardmuster {T&sub1;
T&sub2; T&sub3; .. Ti .. TG},
einer zweiten Speichereinrichtung für die vorher
vorhandene Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG},
einer Vergleichereinrichtung zum Vergleich jedes der G
Bildelementsymbole mit jedem der L Bildelementbilder zum
Erhalten von GxL Vergleichen, die G Sätze von L Vergleichen {C&sub1;
C&sub2; C&sub3; .. C&sub3; .. CL}, einen Satz von L Vergleichen für jedes
Bildelementsymbol Si der G Bildelementsymbole, ausbilden,
wobei jeder Satz von Vergleichen einen Vergleich C* für jedes
Bildelementbild Ij aufweist,
einer ersten Identifizierungseinrichtung zur
Identifizierung des Primärvergleichs C* aus den L Vergleichen in
jedem der G Sätze von Vergleichen mit dem engsten Vergleich mit
dem Bildelenentsymbol Si, wobei dieser Satz von Vergleichen
eine Auswahl von G Primärvergleichen C*={C&sub1;* C&sub2;* C&sub3;* .. Ci* ..
CL*} bildet,
einer zweiten Identifizierungseinrichtung zur
Identifizierung des Sekundärvergleichs C** aus den L-1 verbleibenden
Vergleichen in jedem der G Sätze von Vergleichen mit dem
nächst-engsten Vergleich mit dem Bildelementsymbol Si, wobei
dieser Satz von Vergleichen eine Auswahl von G
Sekundärvergleichen C**={C&sub1;**
C&sub2;** C&sub3;** .. Ci** .. CL**} bildet, um G
Paare identifizierter Vergleiche C* und C**, ein Paar für
jeden der G Sätze von Vergleichen, auszubilden,
einer Bestimmungseinrichtung zur Bestimmung von G
Erkennungsspielräumen {M&sub1; M&sub2; M&sub3; .. Mi .. MG} einen
Erkennungsspielraum zwischen jedem Paar identifizierter Vergleiche C*
und C**, wobei die Größe eines Erkennungsspielraums die
Differenz zwischen dem Wert von C* und dem Wert von C** ist.
einer Auswahleinrichtung zur Auswahl des einzigen Paars
identifizierter Vergleiche C* und C** mit em kleinsten
Erkennungsspielraum M* von allen G Paaren identifizierter
Vergleiche aus den G Sätzen von Vergleichen, wobei ein kleiner
Erkennungsspielraum als Gefahr für eine korrekte
Bilderkennung interpretiert wird,
einer dritten Identifizierungseinrichtung zur
Identifizierung des einzigen Paars von Bildelementbildern I* und I**,
die dem Paar identifizierter Vergleiche C* und C**
entsprechen,
einer Gewichtungseinrichtung zur Gewichtung bestimmter
Bildelemente des engsten Bildelementbildes I* und des
nächstengsten Bildelementbildes I** die dem ausgewählten Paar
identifizierter Vergleiche C* und C** entsprechen, um den
Erkennungsspielraum M* dazwischen inkremental zu erhöhen,
wodurch bewirkt wird, daß die Bildelementbilder das engste
Bildelement-Standardmuster T* oder das nächst-engste
Bildelement-Standardmuster T** oder beides werden,
wobei die Vergleichereinrichtung, die erste, zweite und
dritte Identifizierungseinrichtung, die
Bestimmungseinrichtung, die Auswahleinrichtung und die Gewichtungseinrichtung
zur Wiederholung des Vergleichs, der Identifizierung,
Bestimmung, Auswahl und Gewichtung betreibbar sind, bis der
zwischen den nicht verbesserten Bildelement-Eingangsbildern und
den verbesserten Bildelement-Standardmustern erzeugte
kleinste Erkennungsspielraum größer als ein vorbestimmter
minimaler Wert ist, der als Kennzeichen einer sicheren Erkennung
dient, wobei die Bibliothek der Bildelementbilder somit eine
Bibliothek verbesserter Symbol-Standardmuster {T&sub1; T&sub2; T&sub3; ..
.. TG} geworden ist, die bezüglich der vorher vorhandenen
Gruppe von G Bildelementsymbolen {S&sub1; S&sub2; S&sub3; .. Si .. SG}
Erkennungs-verbessert wurden, wobei zumindest einige dieser
Standardmuster gewichtete Bildelementaberrationen aufweisen, die
in den entsprechenden Bildelementsymbolen der vorher
vorhandenen Gruppe von G Bildelementsymbolen {Si S&sub2; S&sub3; .. Si .. SG}
nicht vorhanden sind.
30. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden
der Erkennungsverbesserung der Bildelement-Standardmuster,
wenn der kleinste Erkennungsspielraum größer als ein
vorbestimmter minimaler Wert ist.
31. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden
der Erkennungsverbesserung der Bildelement-Standardmuster,
wenn die inkrementale Erhöhung des kleinsten
Erkennungsspielraums bei jeder Wiederholung kleiner als eine vorbestimmte
minimale Erhöhung ist.
32. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden
der Erkennungsverbesserung der Bildelement-Standardmuster,
wenn eine bestimmte Anzahl von Gewichtungswiederholungen
ausgeführt wurde.
33. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden
der Erkennungsverbesserung der Bildelement-Standardmuster,
wenn eine zuvor zugewiesene Periode einer
Wiederholungsverarbeitungszeit abgelaufen ist.
34. Gerät nach Anspruch 29, mit einer Einrichtung zum Beenden
der Erkennungsverbesserung der Bildelement-Standardmuster,
wenn die einzelnen Standardmuster in Clustern ähnlich
gestalteter Standardmuster sich zu dem gleichen Erkennungsspielraum
weiterentwickelt haben und wechselseitige Anti-Zeichen
geworden sind.
35. Gerät nach Anspruch 29, wobei L größer als G und G gleich
T ist.
36. Verfahren nach Anspruch 29, wobei die zweite
Speichereinrichtung eine Gruppe von G alphanumerischen Symbolen
speichert, und die Bibliothek von T Bildelement-Standardmustern
die gleichen durch gewichtete Bildelementaberrationen
verbesserten alphanumerischen Symbole sind.
37. Gerät nach Anspruch 36, wobei L gleich G und G gleich T
ist.
33. Gerät nach Anspruch 37, wobei die Bibliothek von G
Bildelementbildern den alphanumerischen Symbolen der Gruppe von G
Bildelementsymbolen entsprechende alphanumerische Symbole
sind.
39. Gerät nach Anspruch 37, wobei die Bibliothek von G
Bildelementbildern alphanumerische Symbole sind, die zu den
alphanumerischen Symbolen der Gruppe von G Bildelementsymbolen
identisch sind.
40. Gerät nach Anspruch 29, wobei die Vergleichereinrichtung
zur Ausführung der GxL Vergleiche zum Erhalten numerischer
Koeffizienten eines Vergleichs eingerichtet ist, deren Wert
den Grad der Bildelementähnlichkeit des Bildelementsymbols Si
und des Bildelementbildes Ij unter Vergleich anzeigt.
41. Gerät nach Anspruch 40, wobei die Vergleichereinrichtung
zur Ausbildung der numerischen Vergleichskoeffizienten derart
eingerichtet ist, daß ein Koeffizient mit einem hohen Wert
einen engen Vergleich zwischen Si und Ij anzeigt, und ein
Koeffizient mit einem geringen Wert einen entfernten
Vergleich zwischen Si und Ij anzeigt.
42. Gerät nach Anspruch 40, wobei die Bestimmungseinrichtung
zur Bestimmung des Erkennungsspielraums mittels der Differenz
zwischen den Vergleichen C* und C** jedes ausgewählten Paars
der Vergleiche eingerichtet ist.
43. Gerät nach Anspruch 42, mit einer Einrichtung zur
Maximierung des minimalen Erkennungsspielraums zwischen dem
Primärvergleich C* und dem maximalen Sekundärvergleich C**, die
das ausgewählte Paar identifizierter Vergleich C* und C** für
das Bildelementsymbol Si bilden, unter Verwendung der
allgemeinen Beziehung:
Maximierung von M = min[C* - max(C**)]
wobei
M der Erkennungsspielraum zwischen C* und C**,
C* der Primärvergleich für das Standardmuster T*, das
C** der Primärvergleich für das Standardmuster T*, das
das engste Standardmuster in der Bibliothek zu dem
Bildelementsymbol Si ist, und
C** der Sekundärvergleich für das Standardmuster T**
ist, das das zweit-engste Standardmuster in der Bibliothek zu
dem Bildelementsymbol Si ist.
44. Gerät nach Anspruch 431 wobei die Gewichtungseinrichtung
zur Gewichtung nur des engsten Bildelementbildes I*
eingerichtet ist, wodurch bewirkt wird, daß das engste
Bildelementbild I* das engste Bildelement-Standardmuster T* wird.
45. Gerät nach Anspruch 44, wobei die Gewichtungseinrichtung
zur Bestimmung der zu dem engsten Standardmuster T* addierten
Gewichtung bei jeder Wiederholung durch die erste Ableitung
des Erkennungsspielraums M* nach dem Standardmuster T* unter
Verwendung folgender Beziehung eingerichtet ist:
W* = u* (dM/dT*) = u*(dC*/dT* - dC**/dT*)
wobei
W* die bei jeder Wiederholung addierte Gewichtung und
u* ein Gewichtungsfaktor mu* für dM/dT* ist.
46. Gerät nach Anspruch 45, wobei die Gewichtungseinrichtung
zur Erzeugung eines neuen Standardmusters T*, das geringfügig
von dem alten Standardmuster T* verschieden ist, unter
Verwendung folgender Beziehung eingerichtet ist:
T*n+1 = T*n + W* = T*n + u*(dM/dT*)
= T*n + u*(dC/dT* - dC**/dT*)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster und
T*n das alte T*-Standardmuster ist.
47. Gerät nach Anspruch 43, wobei die Gewichtungseinrichtung
zur Gewichtung nur des nächst-engsten Bildelementbildes I**
eingerichtet ist, wodurch bewirkt wird, daß das nächst-engste
Bildelementbild I** das nächst-engste Bildelement-
Standardmuster T** wird.
48. Gert nach Anspruch 471 wobei die Gewichtungseinrichtung
zur Bestimmung der zu dem nächst-engsten Standardmuster T**
hinzugefügten Gewichtung bei jeder Wiederholung durch die
erste Ableitung des Erkennungsspielraums M** nach dem
Standardmuster T** unter Verwendung folgender Beziehung eingerichtet
ist:
W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**)
wobei
W** die bei jeder Wiederholung addierte Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
49. Gerät nach Anspruch 48, wobei die Gewichtungseinrichtung
zur Erzeugung eines neuen Standardmusters T**., das
geringfügig von dem alten Standardmuster T** verschieden ist, bei
jeder Wiederholung unter Verwendung folgender Beziehung
eingerichtet ist:
T**n+1 = T**n + W** = T**n + u**(dM/dT**)
= T**n + u**(dC*/dT** - dC**/dT**)
wobei
n die Wiederholungsanzahl,
T**n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
50. Gerät nach Anspruch 43, wobei die Gewichtungseinrichtung
zur Gewichtung sowohl des engsten Bildelementbildes I* als
auch des nächst-engsten Bildelementbildes I** eingerichtet
ist, um zu bewirken, daß das engste Bildelementbild I* das
engste Bildelement-Standardmuster T* und das nächst-engste
Blldelementbild I** das nächst-engste Bildelement-
Standardmuster T** wird.
51. Gerät nach Anspruch 50, wobei die Gewichtungseinrichtung
zur Bestimmung der zu dem Standardmuster T* und zu dem
Standardmuster T** hinzugefügten Gewichtung bei jeder
Wiederholung durch die erste Ableitung der Erkennungsspielräume M*
und M** nach den Standardmustern T* und T** unter Verwendung
folgender Beziehung eingerichtet ist:
W* = u*(dM/dT*) = u*(dC/dT* - dC**/dT*)
W* = u**(dM/dT**) = u**(dC/dT** - dC**/dT**)
wobei
W* die zu T* bei jeder Wiederholung addierte Gewichtung,
u* ein Gewichtungsfaktor mu* für dM/dT*,
W** die zu T** bei jeder Wiederholung addierte
Gewichtung und
u** ein Gewichtungsfaktor mu** für dM/dT** ist.
52. Gerät nach Anspruch 51, wobei der Gewichtungsfaktor u*
gleich dem Gewichtungsfaktor u** ist.
53. Gerät nach Anspruch 51, wobei die Gewichtungseinrichtung
zur Erzeugung neuer Standardmuster T* und T**, die
geringfügig von den alten Standardmustern T* und T* verschieden
sind, unter Verwendung folgender Beziehung eingerichtet ist:
T*n+1 = T*n + W* = T*n + u*(dC/dT* - dC**/dT*)
T**n+1 = T**n + W** = T**n + u**(dC/dT** = dC**/dT**)
wobei
n die Wiederholungsanzahl,
T*n+1 das neue T*-Standardmuster,
T*n das alte T*-Standardmuster,
T**n+1 das neue T**-Standardmuster und
T**n das alte T**-Standardmuster ist.
54. Gerät nach Anspruch 40, wobei die Vergleichereinrichtung
zur Verwendung eines Werts für jeden numerischen
Koeffizienten des Vergleichs C* eingerichtet ist, der auf einem
bildelementweisen Vergleich zwischen jedem Bildelement des
Bildelementsymbols Si und jedem Bildelement des Bildelementbildes
Ij unter Vergleich beruht.
55. Gerät nach Anspruch 54, wobei die Vergleichereinrichtung
zur Ausführung des bildelementweisen Vergleichs als
Skalarprodukt zwischen jedem Bildelement des Bildelementsymbols Si
und jedem Bildelement des Bildelementbildes Ij unter
Vergleich eingerichtet ist.
56. Gerät nach Anspruch 541 wobei die Vergleichereinrichtung
zur Ausführung des bildelementweisen Vergleichs beruhend auf
der Cauchy-Shwartz-Funktion eingerichtet ist:
Cauchy-Shwartz-Funktion =
(Si) (Ti)/( Si )( Ti )]
wobei
(Si) das Eingangssymbol unter Vergleich,
(Ti) das verbesserte Standardmuster unter Vergleich,
( Si ) die Symbolnorm und
( Ti ) die Standardmusternorm ist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/937,732 US5379349A (en) | 1992-09-01 | 1992-09-01 | Method of OCR template enhancement by pixel weighting |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69319514D1 DE69319514D1 (de) | 1998-08-13 |
DE69319514T2 true DE69319514T2 (de) | 1998-12-10 |
Family
ID=25470328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69319514T Expired - Fee Related DE69319514T2 (de) | 1992-09-01 | 1993-08-31 | Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung |
Country Status (4)
Country | Link |
---|---|
US (1) | US5379349A (de) |
EP (1) | EP0586217B1 (de) |
JP (1) | JPH06168359A (de) |
DE (1) | DE69319514T2 (de) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0608148B1 (de) * | 1993-01-22 | 2000-04-12 | Canon Kabushiki Kaisha | Verbesserung von Standardmustern zur Erkennung |
JPH0749927A (ja) * | 1993-08-09 | 1995-02-21 | Nireco Corp | パターン認識方法 |
US5909509A (en) * | 1996-05-08 | 1999-06-01 | Industrial Technology Research Inst. | Statistical-based recognition of similar characters |
US6473524B1 (en) | 1999-04-14 | 2002-10-29 | Videk, Inc. | Optical object recognition method and system |
US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
US7697758B2 (en) * | 2006-09-11 | 2010-04-13 | Google Inc. | Shape clustering and cluster-level manual identification in post optical character recognition processing |
US7646921B2 (en) * | 2006-09-11 | 2010-01-12 | Google Inc. | High resolution replication of document based on shape clustering |
KR101486495B1 (ko) * | 2006-09-08 | 2015-02-04 | 구글 인코포레이티드 | 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법 |
US8175394B2 (en) * | 2006-09-08 | 2012-05-08 | Google Inc. | Shape clustering in post optical character recognition processing |
CN102402693B (zh) * | 2010-09-09 | 2014-07-30 | 富士通株式会社 | 处理包含字符的图像的方法和设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3191149A (en) * | 1962-01-15 | 1965-06-22 | Ibm | Specimen identification apparatus with means for altering stored specimen reference functions |
US3275986A (en) * | 1962-06-14 | 1966-09-27 | Gen Dynamics Corp | Pattern recognition systems |
US3209328A (en) * | 1963-02-28 | 1965-09-28 | Ibm | Adaptive recognition system for recognizing similar patterns |
US3267431A (en) * | 1963-04-29 | 1966-08-16 | Ibm | Adaptive computing system capable of being trained to recognize patterns |
US3539994A (en) * | 1967-09-14 | 1970-11-10 | Ibm | Adaptive template pattern categorizing system |
US3588823A (en) * | 1968-03-28 | 1971-06-28 | Ibm | Mutual information derived tree structure in an adaptive pattern recognition system |
US3548202A (en) * | 1968-11-29 | 1970-12-15 | Ibm | Adaptive logic system for unsupervised learning |
US5204914A (en) * | 1991-08-30 | 1993-04-20 | Eastman Kodak Company | Character recognition method using optimally weighted correlation |
US5159644A (en) * | 1991-08-30 | 1992-10-27 | Eastman Kodak Company | Character recognition method using statistically weighted correlation |
-
1992
- 1992-09-01 US US07/937,732 patent/US5379349A/en not_active Expired - Fee Related
-
1993
- 1993-08-31 EP EP93306854A patent/EP0586217B1/de not_active Expired - Lifetime
- 1993-08-31 DE DE69319514T patent/DE69319514T2/de not_active Expired - Fee Related
- 1993-09-01 JP JP5217765A patent/JPH06168359A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP0586217A2 (de) | 1994-03-09 |
JPH06168359A (ja) | 1994-06-14 |
US5379349A (en) | 1995-01-03 |
EP0586217A3 (en) | 1994-09-21 |
EP0586217B1 (de) | 1998-07-08 |
DE69319514D1 (de) | 1998-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60208223T2 (de) | Anordnung und verfahren zur gesichtserkennung unter verwendung von teilen des gelernten modells | |
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE69422446T2 (de) | Mustererkennung | |
DE3633743C2 (de) | ||
DE69604481T2 (de) | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern | |
DE69426479T2 (de) | Optische Mehrfontzeichenerkennung mit einem Verbindungsschachtelansatz | |
DE69424196T2 (de) | Automatische Zeichenerkennung mit Verwendung statischer und dynamischer Parameter | |
DE60114469T2 (de) | Methode und Gerät zur Bestimmung von interessanten Bildern und zur Bildübermittlung | |
DE69333811T2 (de) | Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones | |
DE69319514T2 (de) | Verfahren und Gerät zum Verbessern von Standardmustern für Erkennung | |
DE112016005062T5 (de) | Kaskadiertes neuronales netzwerk mit massstabsabhängiger poolbildung zur objekterfassung | |
Cichocki et al. | Adaptive learning algorithm for principal component analysis with partial data | |
DE102014223226A1 (de) | Diskriminator, Unterscheidungsprogramm und Unterscheidungsverfahren | |
DE69330708T2 (de) | Texterkennung unter Verwendung zwei-dimensionaler stochastischer Modelle | |
DE69331867T2 (de) | Verfahren und Vorrichtung zur Eingabeklassifizierung mit nichtkugeligen Neuronen | |
DE69331518T2 (de) | Neuronales Netz zum Vergleich von Merkmalen von Bildmustern | |
EP0978088A1 (de) | Verfahren und anordnung zur mustererkennung auf statistischer basis | |
DE69529015T2 (de) | Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition | |
DE102006059659B4 (de) | Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild | |
DE69423607T2 (de) | Verfahren zum klassifizieren von bildern mit ausgabeabbildungen | |
DE69805280T2 (de) | Gerät und verfahren zur mustererkennung. | |
DE69324977T2 (de) | Bitmap-bildsegmentierung unter anwendung eines ladungsmodells fuer pixels | |
DE69710207T2 (de) | Verfahren und gerät zur mustererkennung mit verwendung eines in unterkategorieen unterverteilten lexikons | |
DE19942223C2 (de) | Klassifikationsverfahren mit Rückweisungsklasse | |
DE69423921T2 (de) | Verbesserung von Standardmustern zur Erkennung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |