DE60132315T2 - Verbessertes verfahren zur bildbinarisierung - Google Patents

Verbessertes verfahren zur bildbinarisierung Download PDF

Info

Publication number
DE60132315T2
DE60132315T2 DE60132315T DE60132315T DE60132315T2 DE 60132315 T2 DE60132315 T2 DE 60132315T2 DE 60132315 T DE60132315 T DE 60132315T DE 60132315 T DE60132315 T DE 60132315T DE 60132315 T2 DE60132315 T2 DE 60132315T2
Authority
DE
Germany
Prior art keywords
image
pixels
thresholds
values
gray level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60132315T
Other languages
English (en)
Other versions
DE60132315D1 (de
Inventor
Aviad Zlotnick
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE60132315D1 publication Critical patent/DE60132315D1/de
Application granted granted Critical
Publication of DE60132315T2 publication Critical patent/DE60132315T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Image Input (AREA)
  • Optical Fibers, Optical Fiber Cores, And Optical Fiber Bundles (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung betrifft allgemein Verfahren und Vorrichtungen zur Bildverarbeitung und insbesondere Verfahren zur Umsetzung von Graupegelbildern in Binärwerte.
  • STAND DER TECHNIK
  • Verfahren zur Umsetzung von Bildern in Binärwerte sind in der Technik allgemein bekannt. Allgemein gesagt, diese Verfahren verwenden ein Graupegelbild, bei dem jedes Bildelement einen entsprechenden Mehrbit-Graupegelwert besitzt, und setzt es in ein Binärbild um, bei dem jedes Bildelement einen Binärwert besitzt, der entweder schwarz (Vordergrund) oder weiß (Hintergrund) ist. Eine Umsetzung in Binärwerte wird insbesondere bei der Vereinfachung von Dokumentbildern verwendet, um Informationen, die auf das Dokument gedruckt oder geschrieben sind, zu verarbeiten und zu speichern.
  • Das schnellste und einfachste Verfahren zur Umsetzung in Binärwerte besteht einfach darin, einen Schwellenwert zu bestimmen und festzulegen, dass alle Bildelemente, die einen Graupegelwert über dem Schwellenwert haben, weiß sind, während jene, die unter dem Schwellenwert liegen, schwarz sind. Dieses Verfahren hat jedoch häufig einen Verlust oder ein Durcheinander der Informationen, die in dem Graupegelbild enthalten sind, zur Folge. Diese Informationen sind hauptsächlich in Kanten enthalten, die in dem Bild erscheinen, und hängen nicht so sehr von der absoluten Helligkeit der Bildelemente wie von ihrer relativen Helligkeit in Bezug auf ihre Nachbarn ab. Deswegen wird in Abhängigkeit von der Wahl des Schwellenwertes eine in dem Graupegelbild vorhandene aussagekräftige Kante in dem Binärbild verschwinden, wenn die Bildelemente auf beiden Seiten der Kante beim Umsetzen in Binärwerte auf den gleichen Wert umgesetzt werden. Artefakte in dem Binärbild können dagegen mit dem Erscheinen von Kanten in dem Graupegelbild in einem Bereich des kontinuierlichen Übergangs auftreten, wenn Bildelemente mit sehr ähnlichen Graupegelwerten auf entgegengesetzten Seiten des gewählten Schwellenwertes liegen.
  • Diese Probleme werden durch die folgenden Tabellen veranschaulicht. Tabelle I zeigt Bildelementwerte in einem 5 × 5-Bild, wobei höhere Werte hellere Bildelemente darstellen. Tabelle I
    Grau Spalte 1 Spalte 2 Spalte 3 Spalte 4 Spalte 5
    Zeile 1 10 10 10 11 11
    Zeile 2 10 11 12 13 14
    Zeile 3 16 17 18 19 20
    Zeile 4 14 16 14 16 18
    Zeile 5 16 14 16 14 90
  • Wenn dieses Bild unter Verwendung eines Schwellenwertes von 85 in Binärwerte ungesetzt wird, ergibt sich das in Tabelle II gezeigte Ergebnis: Tabelle II
    Schwellenwert 85 Spalte 1 Spalte 2 Spalte 3 Spalte 4 Spalte 5
    Zeile 1 0 0 0 0 0
    Zeile 2 0 0 0 0 0
    Zeile 3 0 0 0 0 0
    Zeile 4 0 0 0 0 0
    Zeile 5 0 0 0 0 1
  • Die großen Lücken, die das Bildelement in der unteren rechten Ecke umgeben, werden in dem in Binärwerte umgesetzten Bild dargestellt, alle anderen Lücken sind jedoch verloren. (Der Ausdruck "Lücke" wird im Kontext der vorliegenden Patentanmeldung und in den Ansprüchen verwendet, um die absolute Differenz des Graupegels zwischen einem Paar benachbarter Bildelemente zu bezeichnen.) Wenn dagegen der Schwellenwert auf 15 eingestellt ist, ergibt sich das in Tabelle III gezeigte Binärbild: Tabelle III
    Schwellenwert 15 Spalte 1 Spalte 2 Spalte 3 Spalte 4 Spalte 5
    Zeile 1 0 0 0 0 0
    Zeile 2 0 0 0 0 0
    Zeile 3 1 1 1 1 1
    Zeile 4 0 1 0 1 1
    Zeile 5 1 0 1 0 1
  • Die Lücke mit der Größe 6 zwischen den Zeilen 2 und 3, die wahrscheinlich einer echten Kante im Bild entspricht, wird in dem Binärbild dargestellt. Die großen Lücken in der unteren rechten Ecke sind jedoch verloren. Gleichzeitig sind kleine Lücken (der Größe 2) zwischen den Zeilen 4 und 5, die infolge von Störungen vorhanden sein könnten, in dem Binärbild dargestellt. Dadurch gehen bedeutende Kanten, die in dem Graupegelbild vorhanden sind, verloren, während zugelassen wird, dass unbedeutende Lücken Artefakte erzeugen.
  • Aus den Gründen, die durch diese Tabellen veranschaulicht werden, ermöglichen praktische Algorithmen zur Umsetzung in Binärwerte, dass der Schwellenwert der Umsetzung in Binärwerte verändert wird. Diese Algorithmen machen im Allgemeinen Annahmen über den Bildinhalt, indem sie den besten Schwellenwert ermitteln, der bei dem gesamten Bild oder in speziellen Bereichen des Bildes verwendet werden soll. Die Annahmen können sich auf die Größen von Objekten in dem Bild, Histogrammeigenschaften, Störpegel oder andere Bildeigenschaften beziehen. Da Algorithmen zur Umsetzung in Binärwerte von derartigen Annahmen abhängig sind, neigen sie dazu, bei speziellen Typen von Bildern oder Objekten, für die sie entwickelt wurden, gut zu funktionieren, jedoch bei anderen zu versagen. Ein textorientierter Algorithmus zur Umsetzung in Binärwerte kann z. B. bei einem Dokumentbild, das Text auf einem einfachen Hintergrund enthält, gut funktionieren, während er versagen kann, wenn der Hintergrund strukturiert ist. Des Weiteren enthalten Dokumentbilder häufig hervortretende Merkmale, die von einfachem Text verschieden sind, wie etwa Symbole, Linien und Kasten, deren Bewahrung in dem Binärbild wichtig ist und die verloren gehen, wenn eine textorientierte Umsetzung in Binärwerte verwendet wird.
  • Die Umsetzung eines Bildes in "Trinärwerte" ist als ein Verfahren zur Verarbeitung von Graupegelbildern vorgeschlagen worden, jedoch nicht im Kontext der Bilddarstellung von Dokumenten. Typischerweise ist ein Bereich von "grauen" Bildelementwerten zwischen den niedrigen Werten des schwarzen Bereichs und den hohen Werten des weißen Bereichs definiert. Es ist festgestellt worden, dass das resultierende Trinärbild in vielen Anwendungen der Bilderkennung und Bildkorrelation nützlich ist.
  • In der US-Patentschrift 5 067 162 werden z. B. ein Verfahren und eine Vorrichtung zur Identitätsprüfung unter Verwendung der Bildkorrelation beschrieben, die typischerweise auf der Analyse von Fingerabdrücken beruht. Um Unsicherheiten und Schwankungen von Kantenbestimmungen in dem Fingerabdruckbild zu beseitigen, wird eine Technik zur Umsetzung in Trinärwerte verwendet, um alle Bildelemente in einen von drei Pegeln aufzuteilen: schwarz, grau oder weiß. Ein Histogramm von Grauwerten des Graupegelbilds wird ermittelt und Schwellenwerte schwarz-grau und grau-weiß werden gemäß einer gleichmäßigen Ein-Drittel-Verteilung aufgestellt. Alle Bildelemente, die Grauwerte aufweisen, die dunkler als der Schwellenwert schwarz-grau sind, werden in schwarze Bildelemente umgesetzt; alle Bildelemente, die Grauwerte aufweisen, die heller als der Schwellenwert grau-weiß sind, werden in weiße Bildelemente umgesetzt; und alle anderen Bildelemente werden in folgenden Korrelationsberechnungen ignoriert. Deswegen repräsentieren schwarze und weiße Bildelemente mit hoher Sicherheit Steg- und Talbereiche des Fingerabdruckbildes, während die grauen Bildelemente die Übergangsbereiche zwischen den Stegen und Tälern repräsentieren.
  • Als ein weiteres Beispiel werden in der US-Patentschrift 5 715 325 Vorrichtungen und Verfahren zum Erfassen eines Gesichts in einem Videobild beschrieben. Gesichtsbilder werden verarbeitet, um feine Einzelheiten zu beseitigen und einen harten Kontrast zu schaffen, was ein Bild zur Folge hat, dass nahezu in Binärwerte umgesetzt ist (das dunkle Blöcke und helle Blöcke aufweist), jedoch trotzdem einige Blöcke enthält, die nicht eindeutig kategorisiert werden können. Um die Einfachheit der Verarbeitung zu unterstützen, wird das Bild als ein Trinärbild behandelt, wobei dunkle Bereiche mit negativen Einsen (–1), helle Bereiche mit Einsen (1) und nicht definierbare Bereiche mit Nullen (0) gekennzeichnet werden. Das Trinärbild wird dann mit verschiedenen Gesichtsmustern verglichen, um eine optimale Übereinstimmung zu finden.
  • In der US-Patentschrift 4 520 505 wird ein Zeichenlesesystem beschrieben, bei dem, nachdem ein binär codiertes Zeichenmuster, das unter Verwendung eines niedrigen Schwellenwertes erhalten wurde, unter bestimmten Bedingungen ausgedünnt wurde, eine lokale Verarbeitung bewirkt wird, um festzustellen, ob ein Bildelement Teil der Zeichenfolge ist.
  • In der US-Patentschrift 5 138 671 wird ein Verfahren zum Festlegen des Schwellenwertes eines Bildes beschrieben, durch das ein geeigneter Schwellenwert für die Umsetzung in Binärwerte ohne den Einfluss von anderen Faktoren als die Lichtintensität eines Objekts oder seine Reflexionsfähigkeit ermittelt werden kann.
  • Zusammenfassung der Erfindung
  • Die Erfindung stellt ein Verfahren nach Anspruch 1 sowie eine entsprechende Vorrichtung und ein Computerprogramm bereit.
  • In bevorzugten Ausführungsformen der vorliegenden Erfindung wird ein Graupegeleingabebild allgemein als ein Vorbereitungsschritt für die Erzeugung eines Binärausgabebildes in Trinärwerte umgesetzt. Das Eingabebild wird zunächst analysiert, um Änderungen unter den Graupegelwerten der Bildelemente in dem Bild zu kennzeichnen, wie etwa Lücken zwischen den Werten benachbarter Bildelemente. Anhand dieser Änderungen werden obere und untere Schwellenwerte der Umsetzung in Binärwerte festgelegt, derart, dass Bildelemente mit Graupegelwerten über dem oberen Schwellenwert als weiß klassifiziert werden und jene unter dem unteren Schwellenwert als schwarz klassifiziert werden. Die Bildelemente mit Graupegelwerten zwischen dem oberen und dem unteren Schwellenwert, die im Folgenden als Zwischenbildelemente oder graue Bildelemente bezeichnet werden, werden dann vorzugsweise so verarbeitet, um eine optimale Klassifizierung dieser Bildelemente als schwarz oder weiß zu bestimmen.
  • Der obere und der untere Schwellenwert zur Umsetzung in Binärwerte werden so ausgewählt, dass die Anzahl von bedeutenden Kanten in dem Eingabebild, die in dem Ausgabebinärbild bewahrt werden, vergrößert wird, während die Anzahl von Artefaktkanten, die auftreten, verringert wird. Die Erzeugung des Binärbildes auf diese Weise überträgt die hervorstehenden Merkmale des Eingabebildes eindeutig im Wesentlichen ohne Abhängigkeit vom Typ des Bildinhalts. Ein Bereich von unterschiedlichen Schwellenwerten wird in Bezug auf die Graupegeländerungen unter den Bildelementen bewertet, um optimale obere und untere Schwellenwerte zu wählen. Die Bewertung beruht vorzugsweise auf einer statistischen Analyse der Graupegellücken zwischen den Bildelementen. Alternativ oder zusätzlich können andere statistische Analysen und Informationsquellen, wie etwa tatsächliche Kanten, die durch Kantenerfassungsalgorithmen gefunden werden, bei der Wahl der Schwellenwerte verwendet werden.
  • In einigen bevorzugten Ausführungsformen der vorliegenden Erfindung werden die Zwischenbildelemente anhand ihrer Beziehung zu anderen benachbarten Bildelementen klassifiziert. Vorzugsweise werden Bildelemente, die bedeutend heller sind als ein Durchschnittswert ihrer Nachbarn, als weiß klassifiziert, während jene, die bedeutend dunkler als der Durchschnittswert sind, als schwarz klassifiziert werden. Diese Klassifizierung muss nicht von den gewählten oberen und unteren Schwellenwerten abhängen. Bildelemente, die sich von dem Durchschnittswert ihrer Nachbarn nicht wesentlich unterscheiden, werden typischerweise unter Verwendung eines Schwellenwertes wie z. B. der Mittelwert aus oberem und unterem Schwellenwert klassifiziert.
  • Alternativ können andere Verfahren angewendet werden, um die Zwischenbildelemente zu klassifizieren oder auf andere Weise zu verarbeiten. In einer bevorzugten Ausführungsform wird ein textorientierter Algorithmus zur Umsetzung in Binärwerte auf das Graupegelbild angewendet, und die Zwischenbildelemente werden unter Verwendung der Ergebnisse dieses Algorithmus klassifiziert. In einer weiteren bevorzugten Ausführungsform werden die Graupegelwerte der Zwischenbildelemente gemeinsam mit den Binärwerten der anderen Bildelemente gespeichert. Das Speichern des Bildes auf diese Weise erfordert weit weniger Speicherplatz als das vollständige Graupegelbild, es werden jedoch nahezu alle wesentlichen Informationen in dem Bild zur Verwendung bewahrt, wenn das Bild für eine spätere Verarbeitung oder die Betrachtung durch eine Bedienperson abgerufen wird.
  • Das Festlegen des oberen und des unteren Schwellenwertes beinhaltet vorzugsweise das Analysieren von Änderungen unter den Graupegelwerten der Bildelemente in dem Eingabebild und das Festlegen der Schwellenwerte in Reaktion auf die analysierten Änderungen. Es wird am meisten bevorzugt, dass das Analysieren der Änderungen unter den Graupegelwerten das Suchen von Kanten in dem Eingabebild beinhaltet und dass das Festlegen der Schwellenwerte das Wählen der Schwellenwerte in der Weise beinhaltet, dass die Kanten in dem Ausgabebild, das aus den zugewiesenen Binärwerten aufgebaut ist, beibehalten werden.
  • Zusätzlich oder alternativ beinhaltet das Analysieren der Änderungen unter den Graupegelwerten das Suchen von Lücken zwischen den Graupegeln benachbarter Bildelemente, und das Festlegen der Schwellenwerte beinhaltet das Auswählen der Schwellenwerte in der Weise, dass die Lücken, die signifikant sind, gegenüber den Lücken, die nicht signifikant sind, in einem Ausgabebild, das aus den zugewiesenen Binärwerten aufgebaut ist, beibehalten werden. Das Auswählen der Schwellenwerte beinhaltet vorzugsweise das Definieren der Lücken, die signifikant sind, als jene Lücken, deren Betrag größer als die ausgewählte Differenz zwischen dem oberen und unteren Schwellenwert ist. Es wird am meisten bevorzugt, dass das Auswählen der Schwellenwerte das Auswählen des oberen und des unteren Schwellenwertes in der Weise beinhaltet, dass eine Leistungsbewertungspunktzahl, die für mehrere unterschiedliche Paare aus unterem und oberem Schwellenwert berechnet wird, den größtmöglichen Wert erreicht, wobei die Punktzahl mit der Anzahl von signifikanten Lücken, die in dem Ausgabebild durch die ausgewählten Schwellenwerte beibehalten werden, positiv korreliert und mit der Anzahl von nicht signifikanten Lücken, die beibehalten werden und der Anzahl von signifikanten Lücken, die in dem Ausgabebild durch die ausgewählten Schwellenwerte nicht beibehalten werden, negativ korreliert.
  • Das Festlegen der Schwellenwerte beinhaltet vorzugsweise das Auswählen der Schwellenwerte in der Weise, dass Kanteninformationen in einem Ausgabebild, das aus den zugewiesenen Binärwerten aufgebaut ist, beibehalten werden. Es wird am meisten bevorzugt, dass das Auswählen der Schwellenwerte das Wählen der Schwellenwerte im Wesentlichen ohne Abhängigkeit vom Typ der Bildmerkmale, zu denen die Informationen gehören, beinhaltet. Zusätzlich oder alternativ enthält das Auswählen der Schwellenwerte das Suchen eines optimalen Mittelwertes des oberen und des unteren Schwellenwertes und das Suchen eines optimalen Wertes der ausgewählten Differenz zwischen den Schwellenwerten.
  • Des Weiteren beinhaltet das verarbeiten der Bildelemente in der Zwischengruppe vorzugsweise das Analysieren von Änderungen unter den Graupegelwerten der Bildelemente in dem Eingabebild und das Festlegen der Zuweisungen der Bildelemente zu dem ersten und dem zweiten Binärwert in Reaktion auf die analysierten Änderungen. Es wird am meisten bevorzugt, dass das Festlegen der Zuweisungen in Reaktion auf die analysierten Änderungen das Suchen einer signifikanten Differenz zwischen dem Graupegelwert eines der Bildelemente und den Graupegelwerten der anderen Bildelemente in seiner Nachbarschaft und das Zuweisen der Bildelemente zu dem ersten oder dem zweiten Binärwert in Reaktion auf die Differenz beinhaltet.
  • In einer bevorzugten Ausführungsform beinhaltet das Verarbeiten der Bildelemente in der Zwischengruppe das Anwenden eines Verfahrens zur Umsetzung in Binärwerte, das für Text optimiert ist, um die optimalen Zuweisungen der Bildelemente in die Zwischengruppe festzulegen.
  • Das Verfahren beinhaltet vorzugsweise das Ausgeben eines Binärbildes, das aus den zugewiesenen Binärwerten der Bildelemente aufgebaut ist.
  • In einer Ausführungsform beinhaltet das Erzeugen des trinären Ausgabebildes das Anzeigen des Ausgabebildes. In einer weiteren bevorzugten Ausführungsform beinhaltet das Erzeugen des trinären Ausgabebildes das Speichern des Ausgabebildes in einem Speicher.
  • In einer bevorzugten Ausführungsform beinhaltet die Vorrichtung eine Anzeige, die mit dem Prozessor verbunden ist, um das trinäre Ausgabebild zu empfangen und anzuzeigen. In einer weiteren bevorzugten Ausführungsform beinhaltet die Vorrichtung eine Speichereinrichtung, die mit dem Prozessor verbunden ist, um das trinäre Ausgabebild zu empfangen und zu speichern.
  • Die vorliegende Erfindung wird vollständiger verstanden aus der folgenden genauen Beschreibung ihrer bevorzugten Ausführungsformen, die gemeinsam mit den Zeichnungen erfolgt, in denen:
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • 1 eine schematische Wiedergabe eines Graupegelbildes ist, das durch einen Scanner aufgenommen wurde, der nach dem Stand der Technik bekannt ist;
  • 2 und 3 schematische Wiedergaben von Binärbildern sind, die durch Verarbeiten des Graupegelbildes von 1 unter Verwendung bekannter Verfahren zur Umsetzung in Binärwerte erzeugt wurden;
  • 4 eine schematische bildliche Darstellung der Bildverarbeitungsvorrichtung gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung ist;
  • 5 ein Ablaufplan ist, der ein Verfahren zum Umsetzen von Bildern in Binärwerte gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung schematisch veranschaulicht;
  • 6 ein Ablaufplan ist, der Einzelheiten des Verfahrens von 5 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung schematisch veranschaulicht; und
  • 7 eine schematische Darstellung eines Binärbildes ist, das durch verarbeitendes Graupegelbildes von 1 unter Verwendung des Verfahrens der 5 und 6 erzeugt wurde.
  • GENAUE BESCHREIBUNG BEVORZUGTER AUSFÜHRUNGSFORMEN
  • Die 1 bis 3 sind schematische Wiedergaben von Bildern eines Schecks 20, die zum Vergleichen von verschiedenen Verfahren zum Umsetzung von Bildern in Binärwerte dargestellt sind. 1 ist ein Graupegelbild des Schecks, wie es durch einen Dokumentenscanner aufgenommen wurde. Der Scheck enthält gedruckte Zeichen 22 auf einem strukturierten Hintergrund 24 gemeinsam mit weiteren Merkmalen wie etwa Linien 26 und ein Logo 28. Ein solcher Scheck könnte von einem Steuerzahler zusammen mit seinen Steuerrückzahlungsformularen übermittelt werden. Alle Formulare werden abgetastet, und ihre Bilder werden durch die Steuerbehörden für eine spätere Bezugnahme gespeichert. Die Bilder werden typischerweise vor der Speicherung in Binärwerte umgesetzt, um das Volumen der gespeicherten Daten zu verringern. Es ist im Allgemeinen wichtig, dass die Linien, das Logo und andere kennzeichnende Einzelheiten in dem Bild beibehalten werden, so dass der Scheck (oder ein anderes Dokument) deutlich identifiziert werden kann, wenn es aus dem Speicher abgerufen wird.
  • 2 zeigt ein Bild 30 des Schecks nach der Umsetzung in Binärwerte unter Verwendung eines Algorithmus, der im Allgemeinen gut bei Dokumentenbildern funktioniert. Der Algorithmus wurde für Dokumente entwickelt, die einen einfachen Hintergrund haben, und versagt bei dem strukturierten Hintergrund des Schecks.
  • 3 zeigt ein Bild 35 des Schecks nach der Umsetzung in Binärwerte unter Verwendung eines Algorithmus, der speziell für Text "abgestimmt" ist. Der Algorithmus wird in der US-Patentanmeldung 09/310 287 beschrieben, die an den Einreicher der vorliegenden Patentanmeldung übertragen ist. In diesem Fall sind die Zeichen deutlich, Abschnitte von Linien 26 und des Logos 28 sind jedoch verloren gegangen. Die Schwierigkeiten, die durch die 2 und 3 dargestellt sind, werden durch bevorzugte Ausführungsformen der vorliegenden Erfindung überwunden.
  • Es erfolgt nun eine Bezugnahme auf 4, die eine schematische bildliche Darstellung der Bildverarbeitungsvorrichtung 40 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung ist. Die Vorrichtung umfasst einen Scanner 42 oder einen anderen geeigneten Typ einer Bildaufnahmevorrichtung, der in der Technik bekannt ist, der ein Dokument wie z. B. den Scheck 20 (1) aufnimmt und abtastet. Der Scanner nimmt ein Graupegelbild des Dokuments auf und befördert die entsprechenden Bilddaten zu einem Bildprozessor 44, der typischerweise einen geeigneten Universalcomputer umfasst. Das Bild wird alternativ von einer anderen Quelle in den Prozessor eingegeben. Der Prozessor 44 verarbeitet das Graupegelbild, um ein Trinärbild des Dokuments zu erzeugen und verarbeitet dann das Trinärbild weiter, um unter Verwendung der im Folgenden beschriebenen Verfahren ein Binärbild zu erzeugen. Das Trinär- oder das Binärbild wird typischerweise auf einem Monitor 46 angezeigt und/oder für einen späteren Abruf in einem Massenspeicher 48 gespeichert. Die Bilder können außerdem gedruckt oder über ein Netzwerk übertragen werden und können des Weiteren z. B. unter Verwendung von Verfahren der optischen Zeichenerkennung (OCR), die in der Technik bekannt sind, einer weiteren Verarbeitung unterzogen werden.
  • Die Bildverarbeitungsfunktionen des Prozessors 44 werden vorzugsweise unter Verwendung von Software ausgeführt, die auf dem Prozessor abläuft und eine Ausführungsform der vorliegenden Erfindung darstellt, wie im Folgenden genau beschrieben wird. Die Software kann auf materiellen Medien wie z. B. Disketten oder CD-ROM bereitgestellt und in den Computer geladen werden. Die Software kann alternativ über eine Netzwerkverbindung oder eine andere elektronische Verbindung in den Computer heruntergeladen werden. Der Prozessor 44 kann des Weiteren alternativ spezielle fest verdrahtete Elemente oder einen digitalen Signalprozessor zum Ausführen einiger oder aller Bildverarbeitungsschritte umfassen.
  • 5 ist ein Ablaufplan, der ein Verfahren zum Umsetzung von Graupegelbildern in Binärwerte gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung schematisch veranschaulicht. Ein Graupegelbild wie z. B. das Bild von 1 wird in einem Bildeingabeschritt 50 in den Prozessor 44 eingegeben. Die Graupegelwerte der Elemente und insbesondere die Lücken zwischen den Werten benachbarter Elemente werden in einem Optimierungsschritt 52 analysiert, um einen optimalen mittleren Schwellenwert T und einen Differenzwert D zu finden. T und D definieren einen oberen Schwellenwert, der durch T + D/2 gegeben ist, und einen unteren Schwellenwert, der durch T – D/2 gegeben ist. In einem Schritt 54 zum Umsetzen in Trinärwerte werden alle Bildelemente in dem Eingabebild in drei Gruppen klassifiziert: jene Bildelemente, die Graupegelwerte unter dem unteren Schwellenwert aufweisen, werden als schwarz gekennzeichnet (oder Vordergrund, typischerweise binär 1); jene über dem oberen Schwellenwert werden als weiß gekennzeichnet (oder Hintergrund, binär 0); und jene zwischen dem oberen und dem unteren Schwellenwert werden als grau gekennzeichnet. Das Ergebnis ist ein Tertiärbild, das auf dem Monitor 46 angezeigt oder im Speicher 48 gespeichert werden kann.
  • Im Schritt 52 werden die Werte von T und D so gewählt, dass die Anzahl von signifikanten Kanten, die in dem Eingabebild vorhanden sind, in dem Ausgabebinärbild beibehalten wird, wobei gleichzeitig die Anzahl von Artefaktkanten, die auftreten, vermindert wird. Zu diesem Zweck wird eine "signifikante Lücke" zwischen zwei benachbarten Bildelementen als eine Lücke definiert, deren absolute Größe größer als D ist. Eine Lücke wird in einem Ausgabebinärbild I(T) "dargestellt", das unter Verwendung von T als Schwellenwert der Umsetzung in Binärwerte erzeugt wird, wenn die Bildelemente auf beiden Seiten der Lücke in I(T) unterschiedliche Binärwerte aufweisen. Mit anderen Worten, die Lücke wird dargestellt, wenn eines der Bildelemente in dem Ausgabebild einen Graupegelwert größer als T aufweist und der andere kleiner als T ist. Die optimalen Werte von T und D werden dann vorzugsweise gefunden, indem eine Leistungsbewertungsfunktion den größtmöglichen Wert erreicht, die so gewählt ist, dass sie die folgenden Kriterien erfüllt:
    • 1. Sie korreliert positiv mit der Anzahl von signifikanten Lücken in dem Eingabebild, die in I(T) dargestellt werden;
    • 2 Sie korreliert negativ mit der Anzahl von nicht signifikanten Lücken in dem Eingabebild, die in I(T) dargestellt werden; und
    • 3. Sie korreliert negativ mit der Anzahl von signifikanten Lücken in dem Eingabebild, die nicht in I(T) dargestellt werden.
  • Um eine derartige Leistungsbewertungsfunktion zu berechnen, soll N(T, D) eine gewichtete Zahl von nichtsignifikanten Lücken in dem Eingabebild sein, die in I(T) dargestellt werden. Die Gewichtung erfolgt vorzugsweise in der Weise, dass gilt: je kleiner die Lücke ist, die in I(T) dargestellt ist, desto größer ist ihre Gewichtung. Mit anderen Worten, jede Lücke, die in N(T, D) gezählt wird, besitzt ein Bildelement mit einem Graupegelwert größer als T und das andere Bildelement mit einem Graupegelwert kleiner als T, wobei die absolute Differenz zwischen den Graupegelwerten nicht größer als D ist. MAX soll den größten Graupegelwert in dem Bild bezeichnen, so dass N(T MAX) die gewichtete Zahl aller Lücken ist, die in I(T) dargestellt sind. G(D) soll ein gewichteter Zählwert der Anzahl von signifikanten Lücken in dem Bild sein, d. h. Lücken mit einer absoluten Differenz größer als D zwischen den Graupegelwerten der Bildelemente. Dann werden die folgenden Maßzahlen definiert:
    • 1. good(T, D) = N(T, MAX) – N(T, D), der gewichtete Zählwert der signifikanten Lücken, die in I(T) dargestellt sind;
    • 2. artifacts(T, D) = N(T, D), nichtsignifikante Lücken in I(T);
    • 3. missed(T, D) = G(D) – good(T, D), signifikante Lücken, die in I(T) fehlen.
  • Diese Maßzahlen entsprechen den drei Kriterien, die oben angegeben wurden. Die Leistungsbewertungspunktzahl (Score) eines beliebigen Paars (T, D) ist dann gegeben durch: Score(T, D) = good(T, D) – artifacts(T, D) – missed(T, D).
  • Das Paar (T, D), das die höchste Leistungsbewertungspunktzahl ergibt, wird im Schritt 54 zur Verwendung ausgewählt.
  • Diese Leistungsbewertungspunktzahl und das Verfahren zum Auswählen von T und D wurden oben beispielhaft beschrieben, wobei außerdem andere Punktzahlen und Verfahren verwendet werden können, um T und D zu optimieren. Die Gewichtungen, die den Lücken zugewiesen sind, können z. B. verändert werden. Obwohl die hier definierten "Lücken" sich auf benachbarte Bildelemente beziehen, müssen die Bildelemente keine direkten Nachbarn sein, sondern können stattdessen durch einen kleinen Abstand voneinander getrennt sein. Es kann außerdem nicht erforderlich sein, alle Lücken in dem Bild zu bewerten, sondern es kann eine repräsentative Auswahl verwendet werden. Da ferner der Zweck der Bewertung der Lücken hauptsächlich darin besteht, Werte von T und D zu wählen, die echte Kanten in dem Binärbild beibehalten, kann ein Kantenoperator wie etwa eine Sobel-Transformation verwendet werden, um Kanten in dem Graupegelbild zu kennzeichnen. T und D können dann für die Bildelementlücken optimiert werden, die diesen Kanten entsprechen. Weitere Informationsquellen in dem Graupegelbild wie z. B. V-förmige Intensitätsprofile ("Dachkanten", die gewöhnlich bei dünnen Linien und Textmerkmalen angetroffen werden) können gleichfalls für diesen Zweck verwendet werden. Weitere Verfahren zum Auswählen des oberen und des unteren Schwellenwertes sind einem Fachmann geläufig und werden als im Umfang der vorliegenden Erfindung liegend betrachtet.
  • In 5 werden in einem Verarbeitungsschritt 56 grauer Bildelemente die Zwischenbildelemente getrennt verarbeitet und vorzugsweise Binärwerten zugewiesen. Ein bevorzugtes Verfahren zur Umsetzung der Zwischenbildelemente in Binärwerte wird im Folgenden unter Bezugnahme auf 6 beschrieben. In einer alternativen Ausführungsform wird ein textorientierter Algorithmus zur Umsetzung in Binärwerte wie jener, der in 3 zum Erzeugen des Bildes 35 verwendet wird, auf das Graupegeleingabebild angewendet. Die Zwischenbildelemente (grauen Bildelemente) vom Schritt 54 sowie wahlweise die weißen Bildelemente werden dann den Binärwerten zugewiesen, die durch den textorientierten Algorithmus zur Umsetzung in Binärwerte erzeugt werden. Weitere Verfahren zum verarbeiten der Zwischenbildelemente sind einem Fachmann geläufig und werden als im Umfang der vorliegenden Erfindung liegend betrachtet. Die Zwischenbildelemente werden alternativ nicht in Binärwerte umgesetzt, und ihre Graupegelwerte werden gespeichert und gemeinsam mit den Binärwerten der anderen Bildelemente angezeigt.
  • Nachdem alle Bildelemente in Binärwerte umgesetzt wurden, wird das Binärbild im Ausgabeschritt 58 zur Anzeige, Speicherung oder Weiterverarbeitung ausgegeben. Wahlweise wird das Trinärbild ebenfalls ausgegeben.
  • 6 ist ein Ablaufplan, der Einzelheiten des Verarbeitungsschritts 56 grauer Bildelemente gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung schematisch veranschaulicht. Das Wesen des Verfahrens von 6 besteht darin, dass Bildelemente, die sich als wesentlich heller oder dunkler als ihre Nachbarn hervorheben, als weiß oder schwarz gekennzeichnet werden. Deswegen wird für jedes der Zwischenbildelemente ein lokaler Mittelwert der Graupegelwerte der Bildelemente in seiner Umgebung in einem Mittelwertbildungsschritt 60 ermittelt. In einem Schritt 62 der schwarzen Bildelemente werden jene Bildelemente, deren Graupegelwerte um eine Differenz größer als D kleiner als der lokale Mittelwert sind, als binär schwarz zugewiesen. Bildelemente, deren Graupegelwerte um einen Wert größer als D größer als der lokale Mittelwert sind, werden in einem Schritt 62 der weißen Bildelemente als binär weiß zugewiesen. Alternativ kann ein anderer geeigneter Differenzwert anstelle von D in den Schritten 62 und 64 verwendet werden. Des Weiteren können alternativ oder zusätzlich andere Maße und Operatoren wie z. B. Kantenoperatoren verwendet werden, um die Bildelemente zu finden, die sich unter den Zwischenbildelementen hervorheben.
  • Die restlichen Bildelemente, die nicht in den Schritten 62 oder 64 kategorisiert wurden, werden in einem Schwellenwertschritt 66 verarbeitet. Diese Bildelemente werden vorzugsweise einfach um den Schwellenwert T in Binärwerte umgesetzt, so dass Bildelemente mit Graupegelwerten größer als T als binär weiß zugewiesen werden und die anderen Bildelemente als binär schwarz zugewiesen werden. Alternativ kann ein anderes Verfahren zur Schwellenwertbildung verwendet werden.
  • 7 ist eine schematische Darstellung eines Binärbildes 70 des Schecks 20, das unter Verwendung des Verfahrens der 5 und 6 gemäß einer bevorzugten Ausführungsform der vorliegenden Erfindung erzeugt wird. Während die Zeichen 22 nicht so deutlich wie in 3 sind, werden die Linien 26 und das Logo 28 genau wiedergegeben.
  • Obwohl bevorzugte Ausführungsformen oben unter Bezugnahme auf die Erzeugung von Dokumentenbildern beschrieben wurden, ist es klar, dass die Grundgedanken der vorliegenden Erfindung auch in anderen Anwendungen der Bildverarbeitung verwendet werden können. Die oben beschriebenen Verfahren können z. B. angepasst werden, um Kanten mit einer vorgegebenen verhältnismäßig gleichmäßigen Stärke in einem Bild zu erfassen und zwischen den Kanten in dem Bild, die tatsächlich hervorstechende Merkmale repräsentieren, und jenen, die infolge von Artefakten entstehen oder auf andere Weise nicht signifikant sind, zu unterscheiden. Die Verfahren der vorliegenden Erfindung können außerdem mit den nötigen Abänderungen bei Farbbildern und Bildern von dreidimensionalen Objekten angewendet werden.

Claims (4)

  1. Verfahren zur Umsetzung eines Bildes in Binärwerte, wobei das Verfahren Folgendes umfasst: Empfangen (50) eines Graupegel-Eingabebildes, das eine Vielzahl von Bildelementen aufweist, die entsprechende Graupegelwerte besitzen; Festlegen (52) eines unteren Schwellenwertes und eines oberen Schwellenwertes, der um eine ausgewählte Differenz größer als der untere Schwellenwert ist; Zuweisen (54) eines ersten Binärwertes zu den Bildelementen in dem Graupegelbild, die Graupegelwerte über dem oberen Schwellenwert besitzen, und eines zweiten Binärwertes zu den Bildelementen in dem Graupegelbild, die Graupegelwerte unter dem unteren Schwellenwert besitzen; und Verarbeiten (56) der Bildelemente in einer Zwischengruppe, die Graupegelwerte zwischen dem unteren und dem oberen Schwellenwert besitzen, um Zuweisungen der Bildelemente in der Zwischengruppe zu dem ersten und dem zweiten Binärwert festzulegen; dadurch gekennzeichnet, dass das Festlegen des unteren und des oberen Schwellenwertes das Analysieren von Änderungen unter den Graupegelwerten der Bildelemente im Eingabebild und das Festlegen der Schwellenwerte in Reaktion auf die analysierten Änderungen umfasst; das Analysieren der Änderungen unter den Graupegelbildern das Suchen nach Lücken zwischen den Graupegeln benachbarter Bildelemente umfasst und das Festlegen der Schwellenwerte das Auswählen der Schwellenwerte in der Weise umfasst, dass in einem Ausgabebild, das aus den zugewiesenen Binärwerten aufgebaut ist, die Lücken, die signifikant sind, gegenüber den Lücken, die nicht signifikant sind, beibehalten werden; das Auswählen der Schwellenwerte das Definieren der Lücken umfasst, die insofern signifikant sind, als ihre absolute Größe größer als die ausgewählte Differenz zwischen dem unteren und dem oberen Schwellenwert ist; und das Auswählen der Schwellenwerte das Auswählen des oberen und des unteren Schwellenwertes in der Weise umfasst, dass eine Leistungsbewertungspunktzahl den größtmöglichen Wert erreicht, die für mehrere unterschiedliche Paare aus unterem und oberem Schwellenwert berechnet wird, wobei die Punktzahl mit der Anzahl von signifikanten Lücken, die in dem Ausgabebild durch die ausgewählten Schwellenwerte beibehalten werden, positiv korreliert und mit der Anzahl von nicht signifikanten Lücken, die in dem Ausgabebild durch die ausgewählten Schwellenwerte nicht beibehalten werden, negativ korreliert.
  2. Verfahren nach Anspruch 1, bei dem das Auswählen der Schwellenwerte das Wählen der Schwellenwerte ohne Abhängigkeit vom Typ des Bildmerkmals, zu dem die Informationen gehören, umfasst.
  3. Vorrichtung, die Mittel umfasst, die so beschaffen sind, dass sie alle Schritte des Verfahrens gemäß einem der vorhergehenden Verfahrensansprüche ausführen können.
  4. Computerprogramm, das Befehle zum Ausführen aller Schritte des Verfahrens gemäß einem der vorhergehenden Verfahrensansprüche umfasst, wenn das Computerprogramm auf einem Computersystem ausgeführt wird.
DE60132315T 2000-03-02 2001-02-21 Verbessertes verfahren zur bildbinarisierung Expired - Lifetime DE60132315T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US519446 1990-05-04
US09/519,446 US6351566B1 (en) 2000-03-02 2000-03-02 Method for image binarization
PCT/IL2001/000163 WO2001065465A2 (en) 2000-03-02 2001-02-21 Improved method for image binarization

Publications (2)

Publication Number Publication Date
DE60132315D1 DE60132315D1 (de) 2008-02-21
DE60132315T2 true DE60132315T2 (de) 2009-01-02

Family

ID=24068340

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60132315T Expired - Lifetime DE60132315T2 (de) 2000-03-02 2001-02-21 Verbessertes verfahren zur bildbinarisierung

Country Status (11)

Country Link
US (1) US6351566B1 (de)
EP (1) EP1269394B1 (de)
JP (1) JP3953817B2 (de)
AT (1) ATE383625T1 (de)
AU (1) AU2001235931A1 (de)
BR (2) BRPI0108856B8 (de)
CA (1) CA2397805C (de)
DE (1) DE60132315T2 (de)
IL (2) IL151545A0 (de)
MX (1) MXPA02008296A (de)
WO (1) WO2001065465A2 (de)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
US6587585B1 (en) * 2000-05-23 2003-07-01 Ncr Corporation Method of parameterizing a threshold curve for a binarization program and an apparatus therefor
US7417771B2 (en) * 2001-06-26 2008-08-26 Sharp Laboratories Of America, Inc. Error diffusion halftoning system
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US7136515B2 (en) * 2001-09-13 2006-11-14 Intel Corporation Method and apparatus for providing a binary fingerprint image
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
KR100484141B1 (ko) * 2002-06-05 2005-04-18 삼성전자주식회사 영상 이진화 장치 및 방법
KR100532275B1 (ko) * 2002-12-11 2005-11-29 삼성전자주식회사 이미지 압축방법
US7315398B2 (en) * 2003-12-19 2008-01-01 Xerox Corporation Multi-level error diffusion with color image data
US7295347B2 (en) * 2003-12-19 2007-11-13 Xerox Corporation Image processing method for generating multi-level data
JP2006309650A (ja) * 2005-05-02 2006-11-09 Calsonic Kansei Corp ナンバー認識装置及方法
US7724955B2 (en) * 2005-05-31 2010-05-25 Xerox Corporation Apparatus and method for auto windowing using multiple white thresholds
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
US20080005684A1 (en) * 2006-06-29 2008-01-03 Xerox Corporation Graphical user interface, system and method for independent control of different image types
US20080101703A1 (en) * 2006-10-30 2008-05-01 Lockheed Martin Corporation Systems and methods for recognizing shapes in an image
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8117134B2 (en) * 2008-10-16 2012-02-14 Xerox Corporation Neutral pixel correction for proper marked color printing
CN101727582B (zh) * 2008-10-22 2014-02-19 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
TWI463415B (zh) * 2009-03-06 2014-12-01 Omnivision Tech Inc 以物件為基礎之光學字元辨識之預處理演算法
US8406554B1 (en) 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
KR100977558B1 (ko) * 2009-12-22 2010-08-23 전자부품연구원 적외선 스크린 방식의 공간 터치 장치
JP5725276B2 (ja) * 2010-08-03 2015-05-27 富士ゼロックス株式会社 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
US8594446B2 (en) 2012-01-12 2013-11-26 Eastman Kodak Company Method for enhancing a digitized document
US8937749B2 (en) 2012-03-09 2015-01-20 Xerox Corporation Integrated color detection and color pixel counting for billing
JP5870826B2 (ja) * 2012-04-11 2016-03-01 コニカミノルタ株式会社 画像処理装置、画像処理方法、およびコンピュータプログラム
CN104346599B (zh) * 2013-07-23 2019-09-17 深圳市腾讯计算机系统有限公司 一种色彩边缘的检测方法及图像处理设备
KR102208893B1 (ko) 2013-12-30 2021-01-28 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 채널 맵 관리 방법
US9704057B1 (en) * 2014-03-03 2017-07-11 Accusoft Corporation Methods and apparatus relating to image binarization
US10127672B2 (en) * 2015-10-12 2018-11-13 International Business Machines Corporation Separation of foreground and background in medical images
US10416681B2 (en) * 2017-07-12 2019-09-17 Mitsubishi Electric Research Laboratories, Inc. Barcode: global binary patterns for fast visual inference
US10878596B2 (en) * 2018-11-29 2020-12-29 International Business Machines Corporation Object oriented image normalization

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4520505A (en) * 1981-12-23 1985-05-28 Mitsubishi Denki Kabushiki Kaisha Character reading device
US5067162A (en) 1986-06-30 1991-11-19 Identix Incorporated Method and apparatus for verifying identity using image correlation
US4832447A (en) 1987-12-04 1989-05-23 Board Of Trustees Operating Michigan State University Joint transform image correlation using a nonlinear spatial light modulator at the fourier plane
IL91220A (en) 1989-08-04 1995-03-30 Ibm Israel Compression of information
JPH07104921B2 (ja) * 1989-11-17 1995-11-13 松下電器産業株式会社 画像閾値決定方法
US5191525A (en) 1990-01-16 1993-03-02 Digital Image Systems, Corporation System and method for extraction of data from documents for subsequent processing
WO1995014348A1 (en) 1993-11-16 1995-05-26 International Business Machines Corporation Method and apparatus for alignment of images for template elimination
US5715325A (en) 1995-08-30 1998-02-03 Siemens Corporate Research, Inc. Apparatus and method for detecting a face in a video image

Also Published As

Publication number Publication date
AU2001235931A1 (en) 2001-09-12
US6351566B1 (en) 2002-02-26
JP3953817B2 (ja) 2007-08-08
DE60132315D1 (de) 2008-02-21
EP1269394A4 (de) 2006-11-22
EP1269394A2 (de) 2003-01-02
BRPI0108856B8 (pt) 2018-08-14
MXPA02008296A (es) 2002-12-09
BR0108856A (pt) 2005-01-11
ATE383625T1 (de) 2008-01-15
WO2001065465A2 (en) 2001-09-07
WO2001065465A3 (en) 2002-01-17
IL151545A (en) 2007-12-03
EP1269394B1 (de) 2008-01-09
CA2397805C (en) 2007-05-01
BRPI0108856B1 (pt) 2018-02-27
JP2003525560A (ja) 2003-08-26
IL151545A0 (en) 2003-04-10
CA2397805A1 (en) 2001-09-07

Similar Documents

Publication Publication Date Title
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE60308739T2 (de) Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik
DE69937530T2 (de) Verfahren zum automatischen Klassifizieren von Bildern nach Ereignissen
DE60114469T2 (de) Methode und Gerät zur Bestimmung von interessanten Bildern und zur Bildübermittlung
DE4413963C2 (de) Anordnung zur Erkennung von Fingerabdrücken
DE60111756T2 (de) Verfahren zum verbessern der kompressionsfähigkeit und der bildqualität von abgetasteten dokumenten
DE69828909T2 (de) Neue perzeptive lokale gradientenbasierte gratbestimmung
DE69735083T2 (de) Bildverarbeitungssystem und -verfahren
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE102007035884B4 (de) Linienrauschunterdrückungsvorrichtung, -verfahren und -programm
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE69822608T2 (de) Binarisierungsverfahren in einem Zeichenerkennungssystem
DE69728724T2 (de) Bildbereichs-Erkennungsverfahren und Bildverarbeitungsvorrichtung
DE60219918T2 (de) Klassifikation von bildblöcken basierend auf der entropie von pixeldifferenzen
DE2417282A1 (de) Vorrichtung zum erkennen eines musters
DE19634768A1 (de) Vorrichtung und Verfahren zur Erfassung eines Gesichts in einem Videobild
US6996277B2 (en) Image type classification using color discreteness features
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
KR100207426B1 (ko) 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
WO2001065470A1 (de) Verfahren zur analyse von fingerabdruckbildern
DE4102587C2 (de) Verfahren und Vorrichtung zur binären Bildverarbeitung
WO2010133204A1 (de) Vorrichtung und verfahren zur identifizierung des urhebers eines kunstwerkes
DE10303724B4 (de) Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder
DE102005025220B4 (de) Gerät, Verfahren und Programm zum Beseitigen von Poren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)