DE102012201024A1 - Verfahren zum Verarbeiten eines Bildes zur Verdeutlichung von Text in dem Bild - Google Patents

Verfahren zum Verarbeiten eines Bildes zur Verdeutlichung von Text in dem Bild Download PDF

Info

Publication number
DE102012201024A1
DE102012201024A1 DE102012201024A DE102012201024A DE102012201024A1 DE 102012201024 A1 DE102012201024 A1 DE 102012201024A1 DE 102012201024 A DE102012201024 A DE 102012201024A DE 102012201024 A DE102012201024 A DE 102012201024A DE 102012201024 A1 DE102012201024 A1 DE 102012201024A1
Authority
DE
Germany
Prior art keywords
pixels
pixel
luminance
neighborhood
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102012201024A
Other languages
English (en)
Other versions
DE102012201024B4 (de
Inventor
Michael R. Campanelli
John C. Handley
Dennis L. Venable
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of DE102012201024A1 publication Critical patent/DE102012201024A1/de
Application granted granted Critical
Publication of DE102012201024B4 publication Critical patent/DE102012201024B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30144Printing quality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

Eine Bilddatei, die zumindest einen Teil eines gedruckten Dokuments darstellt, wird verarbeitet, um die Unterschiede zwischen dem Vordergrundmaterial (beispielsweise Text oder andere Zeichen) von dem Hintergrund zu unterscheiden. Das Verfahren umfasst das Auswählen einer Nachbarschaft von Pixel, das Bestimmen eines gewichteten Mittelwerts eines Attributwerts (beispielsweise der Luminanz) für jedes Pixel und das Modifizieren des Wertes jedes Pixels auf der Grundlage des gewichteten Mittelwerts. Es werden eine Graustufenskalierung, eine Fehlerverteilung und eine Bitpegelkonversion ebenfalls ausgeführt, wobei jedes Pixel entweder einen ersten Attributwertpegel (beispielsweise eine Luminanz von Null) oder einen zweiten Attributwertpegel (beispielsweise eine Luminanz von 255) erhält.

Description

  • Die vorliegende Erfindung betrifft allgemein Bildverarbeitungsverfahren und Bildverarbeitungssysteme.
  • Viele kleine elektronische Geräte sind in der jetzigen Zeit mit Kameras versehen. Mobiltelefone, persönliche digitale Assistenten, Tablett-Geräte und andere Kommunikationseinrichtungen werden häufig verwendet, um Bilder aufzunehmen und diese schnell mittels elektronischer Post, Textnachrichten oder anderen Auslieferungsverfahren zu einem entfernten Ort zu senden. Gelegentlich werden derartige Geräte auch verwendet, um ein Dokument zu photographieren. Der Anwender des Geräts kann das Dokument einer dritten Partei als eine Bilddatei für die weitere Durchsicht zu senden, oder der Anwender kann die Bilddatei für eine spätere Betrachtung speichern.
  • Obwohl die Verbreitung derartiger Geräte die Möglichkeit für Anwender erhöht, Dokumentenbilder aufzunehmen, ist die Bildqualität, die sich aus einem Multifunktionselektronikgerät ergibt, häufig nicht so gut wie die Bildqualität einer speziellen Kamera. Des weiteren werden die Bilder typischerweise nicht unter Bedingungen aufgenommen, die für das Photographieren feiner Details ideal sind. Somit kann ein Text verschwommen, nicht vollständig aufgenommen, verdeckt oder anderweitig nicht klar sein, so dass es für eine Person schwierig ist, den Text zu lesen, der in dem Bild enthalten ist. Lichtschwankungen, Abschattung und andere Variablen können eine Umgebung schaffen, die selbst für eine spezielle Kamera anspruchsvoll ist, um ein klares Bild eines Textes in einem Dokument aufzunehmen.
  • In einer generellen Hinsicht offenbaren die Ausführungsformen der vorliegenden Erfindung ein Verfahren zum Verarbeiten eines Bildes. Das Verfahren umfasst das Zugreifen mittels einer Verarbeitungseinrichtung auf eine Bilddatei, die Daten enthält, die ein Bild zumindest eines Teils eines gedruckten Dokuments darstellen. Wenn optional das Bild ein Farbbild ist, umfasst das Verfahren das Umwandeln der Daten in Daten, die ein Graustufenbild darstellen. Das Verfahren umfasst das Auswählen einer Nachbarschaft von benachbarten Pixeln, wobei zumindest ein Bereich der Pixel in der Nachbarschaft mit dem Rasterinhalt in dem Bild verknüpft ist. Pixel in der Nachbarschaft besitzt einen Leuchtdichtewert bzw. Luminanzwert oder einen anderen Attributswert. Das Verfahren bestimmt einen gewichteten Durchschnitt der Attributwerte für die Pixel in der Nachbarschaft und modifiziert die Attributwerte zumindest einiger der Pixel in der Nachbarschaft gemäß dem gewichteten Durchschnitt. Es wird eine Graustufenskalierung auf die Pixel in der Nachbarschaft angewendet, um zu bestimmen, ob ein Pixel als ein Endbereichspixel klassifiziert werden soll. Für jedes klassifizierte Endbereichspixel, dessen Attributwert nicht gleich ist einem Endbereichspegel, modifiziert das Verfahren den Attributswert dieses Pixels derart, dass der Wert auf einen vollen Datenbereich der Attributwerte skaliert wird. Das Verfahren umfasst ferner das Anwenden einer Fehlerverteilung (etwa einer Floyd-Steinberg-Fehlerdiffusion) auf die Pixel in der Nachbarschaft, um die benachbarten Pixel über einen Bereich von Attributwertepegel zu verteilen, etwa über einen Bereich von 3 Pegeln bis 64 Pegeln, oder auf einen Bereich von 4 bis 8 Pegel. Das Verfahren umfasst das Ausführen einer Bit-Pegel-Konversion auf die Pixel in der Nachbarschaft derart, dass jedes Pixel mit einem Attributwert, der unter einem Mittelpunkt liegt, einem ersten Attributswertpegel zugeordnet wird, während jedes Pixel mit einem Attributwert, der über dem Mittelpunkt liegt, einem zweiten Attributswertpegel zugeordnet wird. Dies ergibt ein modifiziertes Bild, das als eine modifizierte Bilddatei gespeichert wird.
  • Optional kann bei Verwendung der Luminanz als anschaulichen Attributwert in der obigen Ausführungsform die Graustufenskalierung beinhalten: Ermitteln (i) einer Pixelgruppe, die die Pixel in der Nachbarschaft enthält und (ii) mehrerer Pixel, die benachbart zu den Pixeln in der Nachbarschaft sind. Das Verfahren kann ferner das Ermitteln einer oberen Gruppe aus Pixel in der Pixelgruppe umfassen, die eine Luminanz gleich oder größer als ein oberer Schwellwert besitzt, und kann das Bestimmen eines Wertes (avgmax) umfassen, der gleich ist der mittleren Luminanz der oberen Gruppe aus Pixel. Das Verfahren kann ferner das Ermitteln einer unteren Gruppe aus Pixel in der Pixelgruppe aufweisen, die eine Luminanz gleich oder kleiner einem unteren Schwellwert aufweist, und kann das Bestimmen eines Wertes (avgmin) aufweisen, der gleich ist der mittleren Luminanz der Pixel der unteren Gruppe ist. Das Verfahren kann ferner das Bestimmen einer Standardabweichung (etwa einer prozentualen Standardabweichung) für die Luminanzpegel der Pixel in der Pixelgruppe und auch das Bestimmen umfassen, ob die Standardabweichung größer ist als eine Differenz zwischen avgmax und avgmin. Wenn die Standardabweichung größer ist als eine Differenz zwischen avgmax und avgmin, dann kann der Luminanzpegel des Pixels in der oberen Gruppe auf einen oberen Endbereichspegel modifiziert werden und der Luminanzpegel jedes Pixels in der unteren Gruppe kann auf einen unteren Endbereichspegel modifiziert werden.
  • In jeder der obigen Ausführungsformen kann das Bestimmen des gewichteten Mittelwerts das Anwenden eines Filters an die Pixel in der Nachbarschaft umfassen. Nach dem Ausführen der Bitpegelkonversion kann das Verfahren das Entfernen von Graustufenflecken in den Pixeln in der modifizierten Bilddatei umfassen, um ein diskretes Pixelrauschen zu entfernen. Das Verfahren kann ferner umfassen: (i) Auswählen einer oder mehrerer zusätzlicher Nachbarschaften; (ii) Ausführen der Bestimmung des gewichteten Durchschnitts, der Graustufenskalierung, der Fehlerverteilung und der Bitpegelkonversion für jede der zusätzlichen Nachbarschaften; und (iii) die Entfernung von Graustufenflecken der Pixel in der modifizierten Bilddatei, um diskretes Pixelrauschen zu entfernen. Das Verfahren kann ferner umfassen: (a) Ausführen einer optischen Zeichenerkennung an der modifizierten Bilddatei; (b) Bestimmen einer Anzahl von Fehlern in den Zeichen, die in der optischen Zeichenerkennung verarbeitet wurden; und (c) in Reaktion darauf, dass die Anzahl der Fehler einen Schwellwert übersteigt, Auffordern eines Anwenders, das Bild erneut aufzunehmen.
  • Einige oder alle der zuvor beschriebenen Aktivitäten können von einem Prozessor ausgeführt werden. Ein prozessorlesbares Speichermedium, das mit dem Prozessor in Verbindung steht, kann einen oder mehrere Programmbefehle enthalten, die, wenn sie ausgeführt werden, den Prozessor veranlassen, derartige Aktivitäten auszuführen.
  • 1 zeigt eine anschauliche Matrix aus Pixel, die zu einem Bild gehört, wobei Luminanzpegel für jedes Pixel vorgesehen sind.
  • 2 zeigt Schritte, die ein Prozessor gemäß den hierin beschriebenen Ausführungsformen ausführen kann.
  • 3 zeigt eine anschauliche Nachbarschaft von Pixel und ihre entsprechenden Luminanzpegel.
  • 4 zeigt eine anschauliche Nachbarschaft nach der Fehlerverteilung.
  • 5 zeigt die Matrix aus 1 nach der Bildverarbeitung.
  • 6 zeigt diverse Ausführungsformen einer anschaulichen Recheneinrichtung zum Implementieren diverser Verfahren und hierin beschriebener Prozesse.
  • Die im Rahmen dieser Anmeldung verwendeten Singularformen „ein”, „eine”, „einer” und „der, die, das” sollen auch mehrere Referenzen bezeichnen, sofern dies nicht in klarer Weise anderweitig angegeben ist. Im hierin verwendeten Sinne hat der Begriff „mit bzw. umfassend” die Bedeutung von „einschließlich, ohne einschränkend darauf zu sein”.
  • Ein „Bild” oder eine „Bilddatei”, wie diese Begriffe in der vorliegenden Anmeldung verwendet sind, bezeichnen eine digitale Darstellung eines Bildes eines Dokuments, wobei das Bild von einer Kamera oder einer anderen Bildaufnahmeeinrichtung erzeugt wird. Das Bild kann Text, Graphik oder andere ähnliche Markierungen oder unterscheidbare Merkmale aufweisen.
  • Ein digitales Bild umfasst eine Matrix bzw. eine zweidimensionale Anordnung diskreter Bildelemente oder Pixel. Jedes Pixel besitzt einen oder mehrere zugehörige numerische Attributwerte und die digitale Datei enthält Daten, die eine Reihe von Attributen für jedes Pixel wiedergeben. Ein Datenpunkt bzw. ein Datum, den bzw. das die Datei für jedes Pixel enthält, ist ein Messwert einer Luminanz, die die visuelle wahrnehmbare Helligkeit des Pixels angibt. Beispielsweise kann eine JPEG-Datendatei Pixeldaten gemäß einem YcbCr-Farbraum speichern, wobei das Y einen Messwert des Attributwerts der Luminanz repräsentiert.
  • Luminanzpegel können in Abhängigkeit von einer vorbestimmten Skala variieren. Beispielsweise besitzen in einem 8-Bit-Graustufendigitalbild die Pixel Luminanzwerte, die im Bereich von 0 bis 255 liegen, wobei 0 die kleinste Luminanz bzw. Leuchtdichte (d. h. schwarz) und 255 die höchste Luminanz repräsentiert (d. h. weiß). In einem derartigen System repräsentieren die Luminanzwerte zwischen 0 und 255 diverse Schattierungen an Grau. Alternativ können die Lumianzpegel auf einem Prozentsatz beruhen, wobei 0% schwarz und 100% weiß repräsentieren. Andere Bereiche sind ebenfalls möglich. Die Bilddatei kann einen derartigen Datenpunkt als einen Helligkeitspegel oder als eine Graustufe oder Graupegel anstelle eines Luminanzpegels angeben. Folglich werden die Begriffe „Helligkeitspegel”, „Luminanzpegel” oder „Graupegel bzw. Graustufe” als zueinander Äquivalent im Rahmen der vorliegenden Anmeldung erachtet.
  • 1 zeigt eine anschauliche Pixelmatrix mit Luminanzpegeln, die auf einer Skala von 0 bis 255 dargestellt sind. In diesem Beispiel kann das Bild eines weißen Buchstabens „x” auf einem schwarzen Hintergrund vorgesehen sein (wobei die Pixel, die das „x” bilden, in 1 fettgedruckt gezeigt sind). Jedoch zeigen die in 1 dargestellten Daten, dass das Bild verschwommen ist, da nicht alle Elemente des „x” eine Luminanz von 255 besitzen und nicht alle Elemente des „x” einen Luminanzpegel von 0 besitzen.
  • In Ausführungsformen, die in der vorliegenden Anmeldung beschrieben sind, wird eine Bilddatei, die Daten enthält, etwa wie sie in 1 gezeigt sind, in einer Weise verarbeitet, in der eine Fehlerverteilung verwendet wird, um das Bild schärfer darzustellen und gewisse Rasterinhalte, etwa Text, vom Hintergrund zu unterscheiden. In einem derartigen Verfahren, wie das in 2 gezeigt ist, kann ein Prozessor auf eine Bilddatei 10 zugreifen, indem die Datei aus einem computerlesbaren Speicher abgerufen wird, oder indem die Bilddatei über einen Eingabeeinschluss empfangen wird. Die Bilddatei enthält Daten, die ein Bild darstellen, das Text (Buchstaben, Zahlen, Satzzeichen und/oder ähnliche Zeichen) enthält, und die Datei kann in einem beliebigen Format mit Pixel vorliegen, wozu beispielsweise gehören, ohne einschränkend zu sein, Bitmap (.bmp), JPEG (.jpg), TIFF (.tif), PNG (.png) oder andere Rasterformate. Die Bilddatei enthält Daten für eine Matrix aus Pixel, die das Bild erzeugen. Die Datei enthält einen Luminanzpegel für jedes Pixel oder Werte, aus denen eine Luminanz abgeleitet werden kann, zusammen mit anderen optionalen Datenpunkten.
  • Wenn optional die Bilddatei ein Farbbild ist, kann der Prozessor zuerst die Datei umwandeln, so dass diese ein Graubild 12 darstellt. Diese Umwandlung kann durch eine beliebige aktuell bekannte oder künftige Graustufentechnik auf Luminanzbasis oder eine absolute Graustufentechnik durchgeführt werden. Alternativ kann der Prozessor Pixelluminanzwerte aus RGB-formatierten Daten ableiten. In diesem Falle wird ein Prozentwert von R, G und B kombiniert, um einen Luminanzwert für jedes Pixel zu erzeugen.
  • Der Prozessor ist mit Instruktionen programmiert, die den Prozessor veranlassen, eine Nachbarschaft 14 aus benachbarten bzw. zusammenhängenden Pixel für das Bild auszuwählen. Zumindest ein Teil der Pixel in der Nachbarschaft stellt, wenn dieser Teil angezeigt wird, einen Teil des Textes dar, so dass die Pixel ein oder mehrere Zeichen in dem Bild enthalten. Wie beispielsweise in 3 gezeigt ist, ist eine 3 × 3 Pixelnachbarschaft um das Pixel herum angeordnet, das so gezeigt ist, dass es eine Luminanz von 100 besitzt, und es sind seine acht benachbarten Pixel dargestellt, so dass sie gemeinsam eine 3 × 3 Matrix bilden. Die gezeigte Größe der Nachbarschaft (3 × 3) ist anschaulich und es können auch andere Größen für die Nachbarschaft (etwa 5 × 5 oder 9 × 9) verwendet werden. Weiterhin muss die Nachbarschaft nicht quadratisch sein.
  • Die Breite und die Höhe können unterschiedlich sein und eine dieser beiden Größen muss nicht beschränkt sein.
  • Es sei nun wieder auf 2 verwiesen; Der Prozessor kann einen gewichteten Durchschnitt bzw. einen Mittelwert 16 der Luminanzpegel für die Pixel der Nachbarschaft ermitteln. Dann modifiziert er den Luminanzpegel 18 eines oder mehrerer der Pixel in der Nachbarschaft gemäß dem gewichteten Mittelwert. Beispielsweise beinhaltet die Bestimmung des gewichteten Mittelwerts die Verwendung eines Gaußschen Filters, oder eines anderen glättenden Filters, um das Rauschen in den Luminanzpegelwerten zu verringern und um benachbarte Pixel, die eine ähnliche – aber nicht identische – Luminanz zeigen, näher zusammenzubringen.
  • Der Prozessor kann dann eine Graustufenschwellwertbildung und eine Graustufenskalierung 20 an die Pixel in der Nachbarschaft anwenden, um Pixel zu ermitteln, die als ein Endbereichspixel einzustufen bzw. zu klassifizieren sind. Im hierin verwendeten Sinne und unter Anwendung des Attributwerts der Luminanz als Beispiel ist ein Endbereichspixel ein Pixel, das eine Luminanz besitzt, die um nicht mehr als einen vorbestimmten Betrag von dem oberen Ende des Luminanzbereichs oder dem unteren Ende des Luminanzbereichs entfernt ist. Für jedes klassifizierte Endbereichspixel, dessen Luminanz nicht gleich dem maximalen Wert des Bereich ist (beispielsweise schwarz oder weiß) kann der Prozessor die Luminanz dieses Pixels so modifizieren, dass es gleich ist dem anwendbaren Endbereichspegel. Beispielsweise wird in einem Luminanzpegelsystem von 0 bis 255 ein oberes Endbereichspixel eines sein, das einen Luminanzpegel besitzt, der um nicht mehr als 10% unterhalb von 255 liegt (d. h. nicht kleiner ist als 229,5), während ein unteres Endbereichspixel eines ist mit einem Luminanzpegel, der nicht mehr als 10% über Null liegt (d. h. nicht größer als 25,5). Der Prozessor kann dann die Luminanzpegel aller Pixel modifizieren, die keine Endbereichspixel sind, so dass sie auf die vollen Graustufenpegelbereiche, die von 0 bis 255 dargestellt sind, skaliert sind.
  • Innerhalb der Pixelnachbarschaft werden die mittleren minimalen (avgmin) und mittleren maximalen (avgmax) Luminanzwerte ermittelt. Der Prozessor kann eine erste Gruppe aus Pixel in der Nachbarschaft ermitteln, die Luminanzwerte über einem oberen Schwellwert aufweisen und eine zweite Gruppe aus Pixel ermitteln, die Luminanzwerte unterhalb eines unteren Schwellwerts besitzen. Optional kann avgmax der Mittelwert der oberen (ersten) Gruppe sein, während avgmin der Mittelwert der unteren (zweite) Gruppe ist. Der Prozessor bestimmt dann eine Standardabweichung (etwa eine prozentuale Abweichung) für die Luminanzpegel der Pixel in der Nachbarschaft. Wenn die Standardabweichung größer als die Differenz zwischen avgmin und avgmax, modifiziert der Prozessor den Luminanzwert jedes Pixels in der oberen Gruppe auf einen oberen Bereichspegel und modifiziert den Luminanzwert jedes Pixels in der unteren Gruppe auf den unteren Bereichspegel. Diese Werte werden zusammen mit dem in Frage stehenden Pixel verwendet, um die Luminanz proportional so zu ändern, dass ein neuer Graustufen skalierter Luminanzwert für das Pixel erzeugt wird, das gerade verarbeitet wird. Wenn beispielsweise der mittlere minimale Luminanzwert 56 und der mittlere maximale Luminanzwert 200 beträgt, und wenn ein Luminanzwert des Pixels, auf welchem gerade operiert wird, 120 beträgt, erhöht sich die Graustufenskalierung von 120 auf 153. Dies kann wie folgt hergeleitet werden: (aktueller Pixelluminanzpegel geteilt durch avgmin) geteilt durch (avgmax geteilt durch avgmin) multipliziert mit dem vollen Bereich von 255 Pegeln. Diese Werte bezeichnen Pixel, die in dem lokalen Nachbarschaftsbereich nicht Schwellwert-geeignet sind. Nach dieser Verarbeitung enthält das Rasterbild Pixel, die durch die Schwellwertbildung und die Graustufenskalierung modifiziert sind.
  • Als nächstes kann der Prozessor eine Fehlerverteilung 22 auf die Pixel in der Nachbarschaft anwenden, um die Pixel in der Nachbarschaft über eine begrenzte Anzahl oder über einen Bereich von Luminanzpegeln hinweg zu verteilen. Der Bereich kann 4 Pegel, von 4 Pegeln bis 8 Pegel, von 3 Pegeln bis 64 Pegel oder eine andere geeignete Anzahl, die größer als 2 Pegel ist, aufweisen. Eine Fehlerverteilung wird ggf. lediglich an den Pixel in der Nachbarschaft ausgeführt, oder optional an einer Gruppe aus Pixel, die die Nachbarschaft enthält, sowie an einer Gruppe aus Pixel, die zur Nachbarschaft benachbart angeordnet ist. Optional kann in diversen Ausführungsformen eine voreingestellte Fehlerverteilung auf das gesamte Bild angewendet werden.
  • In einer Ausführungsform und unter Bezugnahme auf die 4 werden Fehlerverteilungstechniken angewendet, die jene beinhalten, wie sie von R. W. Floyd & L. Steinberg beschrieben sind in „Adaptiver Algorithmus für räumliche Graustufen", in den Schriften der Gesellschaft für Informationsdarstellung, Band 17, Seiten 75–77 (1976) (generell als Floyd-Steinberg-Fehlerverteilung bekannt). Es können auch andere Verfahren, etwa die Pegelverteilung verwendet werden, oder es können solche Verfahren verwendet werden, die im US-Patent 7,565,027 von Mantell beschrieben sind, wobei diese Offenbarung hiermit durch Bezugnahme vollständig mit eingeschlossen ist.
  • In 4 werden durch die Fehlerverteilungstechnik die Pixel über sechs Luminanzpegel mit den Werten 0, 50, 100, 155, 205 und 255 hinweg verteilt. Beispielsweise kann die Technik bestimmen, ob die Luminanz jedes Pixels entsprechend einem Schwellwertbetrag über, unter oder über oder unter in Bezug auf jeden Pegel liegt, und wenn dies der Fall ist, wird die Luminanz des Pixels so modifiziert, dass es mit diesem Pegel übereinstimmt. Die Schwellwertbeträge können für jeden Pegel variieren, und diese können auf eine einzelne Richtung (d. h. rauf oder runter) für jeden Pegel beschränkt sein. Ein anschauliches Ergebnis einer derartigen Technik für die Nachbarschaft aus 3 ist in 4 gezeigt.
  • Es sei nun wieder auf 2 verwiesen; der Prozessor kann auch eine Bitpegelkonversion 24 an den Pixel in der Nachbarschaft so ausführen, dass jedes Pixel mit einer Luminanz, die unter einem Mittelpunktpegel liegt (d. h. 50% in einer 0% bis 100%-Skala, oder 128 in einer 0–255 Skala), einen ersten Luminanzpegel zugewiesen bekommt und derart, dass jedes Pixel mit einer Luminanz, die über dem Mittelpunkt liegt, einen zweiten Luminanzpegel zugeordnet bekommt, so dass ein modifiziertes Bild erhalten wird. Optional kann der erste Luminanzpegel der tiefste Pegel in dem Bereich (d. h. 0) sein, so dass die relevanten Pixel so modifiziert werden, dass sie schwarz werden, während der zweite Luminanzpegel der höchste Pegel in dem Bereich sein kann (d. h. 255 oder 100%), so dass die relevanten Pegel so modifiziert werden, dass sie weiß werden. Es können jedoch auch alternative Pegel verwendet werden, so dass das resultierende Bild aus Pixel aufgebaut ist, die ursprünglich ein oder zwei unterschiedliche Luminanzpegel besitzen, so dass eine visuelle Unterscheidung des Vordergrunds in Bezug zum Hintergrund möglich ist.
  • Die zuvor beschriebenen Verfahren können für mehrere Nachbarschaften wiederholt werden, so dass das gesamte (oder im Wesentlichen das gesamte) Bild verarbeitet wird. Das System kann eine Nachbarschaft um jedes Pixel herum in dem Bild auswählen, oder zumindest für eine durch Schwellwert festgesetzte Anzahl von Pixel. Die resultierende Luminanzmatrix für das Beispiel aus 1 ist in 5 gezeigt.
  • Es sei wieder auf 2 verwiesen; optional kann das resultierende Bild einer Graustufenfleckenverringerung 26 unterzogen werden, um ein diskretes „Pixelrauschen” zu entfernen. Dies kann unter Anwendung aktuell bekannter oder künftiger Fleckenunterdrückungstechniken durchgeführt werden, etwa wie sie im US-Patent 6,549,680 von Revankar offenbart sind, wobei die gesamte Offenbarung hiermit durch Bezugnahme mit eingeschlossen ist.
  • Der Prozessor kann dann das modifizierte Bild als modifizierte Bilddatei 28 speichern und kann veranlassen, dass das modifizierte Bild auf einer Anzeigeeinrichtung dargestellt wird.
  • Optional kann der Prozessor das Bild analysieren, um zu bestimmen, ob Fehler 30 erkannt werden. Beispielsweise kann der Prozessor eine aktuell bekannte oder künftig bekannte Zeichenerkennungstechnik anwenden, um die modifizierte Bilddatei zu analysieren und zu bestimmen, ob Fehler in dem Bild vorhanden sind. Zu Fehlern können beispielsweise Buchstaben gehören, die nicht vollständig oder in ungeeigneter Weise ausgebildet sind, vereinzelte Zeichen, nicht erkennbare Zeichen und/oder dergleichen. Wenn die Anzahl der erkannten Fehler einen Schwellwert übersteigt, kann das System das modifizierte Bild für den Anwender anzeigen und/oder kann den Anwender fragen oder auffordern, das Bild erneut abzutasten, so dass es als eine neue Bilddatei erneut bearbeitet werden kann.
  • 6 zeigt eine Blockansicht einer anschaulichen internen Gerätekonfiguration, die verwendet werden kann, um die zuvor erläuterten diversen Systeme einzurichten oder in denen diese Systeme enthalten sind, um die zuvor beschriebenen Prozesse auszuführen. Ein Bus 600 dient als die Hauptinformationsübertragungsroute, die die anderen dargestellten Komponenten der Gerätekonfiguration miteinander verbindet. Eine CPU 605 ist die zentrale Recheneinheit des Systems und führt Berechnungen und Logikoperationen aus, die zum Ausführen eines Programms erforderlich sind. Die CPU 605 ist alleine oder in Verbindung mit einem oder mehreren anderen Elementen, die in 6 gezeigt sind, eine anschauliche Verarbeitungseinrichtung, eine Recheneinrichtung oder ein Prozessor, wobei derartige Begriffe auch in der vorliegenden Anmeldung verwendet sind. Eine dingliche Speichereinrichtung, etwa ein Nur-Lese-Speicher (ROM) 610 und ein Speicher mit wahlfreiem Zugriff (RAM) 615 bilden anschauliche Speichereinrichtungen.
  • Eine Steuerung 620 dient als Bindeglied für eine oder mehrere optionale Speichereinrichtungen 625 zum Anschluss an den Systembus 600. Diese Speichereinrichtungen 625 können beispielsweise eine externe oder interne DVD-Einrichtung, eine CD-ROM-Einrichtung, eine Festplatte, einen Flash-Speicher, eine USB-Einrichtung oder dergleichen umfassen. Wie zuvor angegeben ist, können diese diversen Einrichtungen und Steuerungen optionale Einrichtungen sein. Des weiteren können die Speichereinrichtungen 625 ausgebildet sein, einzelne Dateien zu enthalten, um Softwaremodule oder Befehle, Hilfsdaten, gemeinsame Dateien zum Speichern von Gruppen von Ergebnissen oder von Hilfsergebnissen oder eine oder mehrere Datenbanken zum Speichern der Ergebnisinformation, zum Speichern von Hilfsdaten und zugehörigen Informationen, wie sie zuvor beschrieben sind, zu speichern.
  • Programmbefehle, Software oder interaktive Module zum Ausführen der zuvor erläuterten Prozesse können in dem ROM 610 und/oder dem RAM 615 abgelegt sein. Optional können die Programmbefehle auch auf einem gegenständlichen computerlesbaren Medium, etwa einer Kompaktdiskette, einer digitalen Diskette, einem Flash-Speicher, einer Speicherkarte, einer USB-Einrichtung, einem optischen Diskettenspeichermedium, etwa einer Blu-ray-Diskette und/oder einem anderen Aufzeichnungsmedium gespeichert sein.
  • Eine optionale Anzeigeschnittstelle 40 ermöglicht es, dass Information aus dem Bus 600 auf der Anzeige 654 in Audioform, visueller Form, als Graphik oder als ein alphanumerisches Format dargestellt wird. Die Kommunikation mit externen Geräten kann unter Anwendung diverser Kommunikationsanschlüsse 650 erfolgen. Ein anschaulicher Kommunikationsanschluss 650 kann mit einem Kommunikationsnetzwerk, etwa dem Internet oder einem Intranet verbunden sein.
  • Die Gerätekonfiguration kann auch eine Schnittstelle 655 aufweisen, die den Empfang von Daten ermöglicht, die von Eingabegeräten, etwa einer Tastatur 660 oder einem anderen Eingabegerät 655, etwa einer Maus, einem Joystick, einem Berührbildschirm, einer Fernsteuerung, einem Zeigergerät, einer Videoeingangseinrichtung und/oder einer Audioeingangseinrichtung stammen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 7565027 [0027]
    • US 6549680 [0031]
  • Zitierte Nicht-Patentliteratur
    • R. W. Floyd & L. Steinberg beschrieben sind in „Adaptiver Algorithmus für räumliche Graustufen”, in den Schriften der Gesellschaft für Informationsdarstellung, Band 17, Seiten 75–77 (1976) [0027]

Claims (7)

  1. Bildverarbeitungssystem mit: einem Prozessor; und einem von dem Prozessor lesbaren Speichermedium, das mit dem Prozessor in Verbindung steht, wobei das von dem Prozessor lesbare Speichermedium einen oder mehrere Programmbefehle enthält, die, wenn sie abgearbeitet werden, den Prozessor veranlassen, um: auf eine Bilddatei zuzugreifen, die Daten enthält, die ein Bild zumindest eines Teils eines gedruckten Dokuments repräsentieren; eine Nachbarschaft aus benachbarten Pixel auszuwählen, wobei zumindest ein Teil der Pixel in der Nachbarschaft mit einem Rasterinhalt in dem Bild in Beziehung steht und jedes Pixel in der Nachbarschaft einen Attributwert besitzt; einen gewichteten Mittelwert des Attributwerts für die Pixel in der Nachbarschaft zu bestimmen; einen Attributwert zumindest einiger der Pixel in der Nachbarschaft gemäß dem gewichteten Mittelwert zu modifizieren; eine Graustufenskalierung auf die Pixel in der Nachbarschaft anzuwenden, um zu bestimmen, ob ein Pixel als ein Endbereichspixel klassifiziert werden soll, und um für jedes klassifizierte Endbereichsbereichspixel, dessen Luminanz nicht gleich einem Endbereichspegel ist, den Attributwert dieses Pixel so zu modifizieren, dass er auf den vollen Datenbereich der Attributwerte skaliert ist; eine Fehlerverteilung auf die Pixel in der Nachbarschaft anzuwenden, um die benachbarten Pixel über einen Bereich von Attributwertpegeln zu verteilen; eine Bitpegelkonversation an den Pixel in der Nachbarschaft so auszuführen, dass jedes Pixel mit einem Attributwert, der unter einem Mittelpunkt liegt, einen ersten Attributwertpegel zugewiesen erhält, um jedes Pixel mit einem Attributwert, der über dem Mittelpunkt liegt, einen zweiten Attributwertpegel zugewiesen erhält, so dass ein modifiziertes Bild erhalten wird; und das modifizierte Bild als modifizierte Bilddatei zu speichern.
  2. System nach Anspruch 1, wobei der Attributwert einen Luminanzpegel umfasst und wobei die Befehle, die den Prozessor veranlassen, die Graustufenskalierung auszuführen, Befehle umfassen, die den Prozessor veranlassen, um: eine Pixelgruppe mit den Pixeln in der Nachbarschaft und mehrere Pixel, die benachbart zu den Pixeln der Nachbarschaft angeordnet sind, zu ermitteln; eine obere Gruppe aus Pixel in der Pixelgruppe zu ermitteln, die eine Luminenz gleich oder größer einem oberen Schwellwert besitzt, und einen Wert (avgmax) gleich der mittleren Luminanz der oberen Gruppe aus Pixel zu bestimmen; eine untere Gruppe aus Pixel in der Pixelgruppe zu bestimmen, die eine Luminanz gleich oder kleiner einem unteren Schwellwerts besitzt, und einen Wert (avgmin) gleich der mittleren Luminanz der unteren Gruppe aus Pixel zu bestimmen; eine Standardabweichung für die Luminanzpegel der Pixel in der Pixelgruppe zu bestimmen und auch zu bestimmen, ob die Standardabweichung größer ist als eine Differenz zwischen avgmax und avgmin; wenn die Standardabweichung größer ist als eine Differenz zwischen avgmax und avgmin, dann den Luminanzpegel für jedes Pixel in der oberen Gruppe auf einen oberen Endbereichspegel und den Luminanzpegel jedes Pegels in der unteren Gruppe auf einen unteren Endbereichspegel zu modifizieren.
  3. System nach einem der Ansprüche 1 bis 2, wobei die Befehle, wenn sie ausgeführt werden, den Prozessor ferner veranlassen, um: zu bestimmen, ob das Bild ein Farbbild ist, und die Farbbilddaten in Daten umzuwandeln, die ein Graustufenbild darstellen.
  4. System nach einem der Ansprüche 1 bis 3, wobei die Befehle, wenn sie ausgeführt werden, den Prozessor auch veranlassen, um nach dem Ausführen der Bitpegelkonversion, die Pixel in der modifizierten Bilddatei bezüglich einer Verringerung von Graustufenflecken zu bearbeiten, um ein diskretes Pixelrauschen zu entfernen.
  5. System nach einem der Ansprüche 1 bis 3, wobei die Befehle, wenn sie ausgeführt werden, den Prozessor auch veranlassen, um: mehrere weitere Nachbarschaften auszuwählen; die gewichtete Mittelwertbestimmung, die Graustufenskalierung, die Fehlerverteilung und die Bitpegelkonversion für jede der weiteren Nachbarschaften auszuführen; und die Pixel in der modifizierten Bilddatei bezüglich der Verringerung von Graustufenflecken zu bearbeiten, um diskretes Pixelrauschen zu entfernen.
  6. System nach einem der Ansprüche 1 bis 5, wobei die Befehle, wenn sie ausgeführt werden, den Prozessor auch veranlassen, um: mehrere weitere Nachbarschaft auszuwählen; die gewichtete Mittelwertbildung, die Graustufenskalierung, die Fehlerverteilung und die Bitpegelkonversion für jede der weiteren Nachbarschaften auszuführen; und die Pixel im Hinblick auf eine Verringerung von Graustufenflecken in der modifizierten Bilddatei zu bearbeiten, um diskretes Pixelrauschen zu entfernen.
  7. System nach einem der Ansprüche 1 bis 5, wobei die Befehle, wenn sie ausgeführt werden, den Prozessor auch veranlassen, um: eine optische Zeichenerkennung in der modifizierten Bilddatei auszuführen; eine Anzahl an Fehler in den Zeichen, die in der optischen Zeichenerkennung verarbeitet sind, zu bestimmen; und in Reaktion darauf, dass eine Anzahl der Fehler einen Schwellwert übersteigt, einen Anwender zu veranlassen, das Bild erneut aufzunehmen.
DE102012201024.6A 2011-01-26 2012-01-25 Verfahren zum Verarbeiten eines Bildes zur Verdeutlichung von Text in dem Bild Expired - Fee Related DE102012201024B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/013,890 2011-01-26
US13/013,890 US8705134B2 (en) 2011-01-26 2011-01-26 Method of processing an image to clarify text in the image

Publications (2)

Publication Number Publication Date
DE102012201024A1 true DE102012201024A1 (de) 2012-07-26
DE102012201024B4 DE102012201024B4 (de) 2016-09-22

Family

ID=46510989

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102012201024.6A Expired - Fee Related DE102012201024B4 (de) 2011-01-26 2012-01-25 Verfahren zum Verarbeiten eines Bildes zur Verdeutlichung von Text in dem Bild

Country Status (2)

Country Link
US (1) US8705134B2 (de)
DE (1) DE102012201024B4 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317760B2 (en) * 2014-04-14 2016-04-19 Xerox Corporation Methods and systems for determining assessment characters
JP6955147B2 (ja) * 2017-07-13 2021-10-27 富士通株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
US20190220956A1 (en) * 2018-01-12 2019-07-18 Megvii Technology Llc Image processing method, image processing device and nonvolatile storage medium
WO2020139039A1 (ko) * 2018-12-27 2020-07-02 인텔렉추얼디스커버리 주식회사 영상 부/복호화 방법 및 장치
US11715314B2 (en) * 2020-07-07 2023-08-01 Xerox Corporation Performance improvement with object detection for software based image path
US20230068848A1 (en) * 2021-08-25 2023-03-02 Argo AI, LLC Systems and methods for vehicle camera obstruction detection

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549680B1 (en) 1998-06-23 2003-04-15 Xerox Corporation Method and apparatus for deskewing and despeckling of images
US7565027B2 (en) 2005-10-07 2009-07-21 Xerox Corporation Countdown stamp error diffusion

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6922487B2 (en) 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
TW574820B (en) * 2002-09-11 2004-02-01 Veutron Corp Image calibration method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549680B1 (en) 1998-06-23 2003-04-15 Xerox Corporation Method and apparatus for deskewing and despeckling of images
US7565027B2 (en) 2005-10-07 2009-07-21 Xerox Corporation Countdown stamp error diffusion

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
R. W. Floyd & L. Steinberg beschrieben sind in "Adaptiver Algorithmus für räumliche Graustufen", in den Schriften der Gesellschaft für Informationsdarstellung, Band 17, Seiten 75-77 (1976)

Also Published As

Publication number Publication date
US20120188612A1 (en) 2012-07-26
US8705134B2 (en) 2014-04-22
DE102012201024B4 (de) 2016-09-22

Similar Documents

Publication Publication Date Title
DE102012201024B4 (de) Verfahren zum Verarbeiten eines Bildes zur Verdeutlichung von Text in dem Bild
DE69715076T2 (de) Vorrichtung zur Erzeugung eines Binärbildes
DE69734694T2 (de) Automatisches Bildbeschneiden
DE19842572B4 (de) Verfahren zur automatischen Entfernung von Bildfehlern
DE102013226164B4 (de) Bildverarbeitungsvorrichtung, Bildaufnahmevorrichtung, Bildverarbeitungsverfahren, Programm und Speichermedium
DE102018006247A1 (de) Digitalbildvervollständigung unter Verwendung des Deep Learning
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE112006001017B4 (de) Verfahren und Vorrichtung zum Eingliedern von Irisfarbe in eine Rotes-Auge-Korrektur
DE60127016T2 (de) Verfahren und Gerät zur Durchführung einer lokalen Farbkorrektur
US20210166015A1 (en) Certificate image extraction method and terminal device
DE102016121734A1 (de) Bildverarbeitungsvorrichtung, bildverarbeitungsverfahren und computerlesbares speichermedium
DE102009035927A1 (de) Verfahren zur Simulation der Belichtungskorrektur dunkler Bereiche mit einem Einzelbild und ein entsprechendes Bildverarbeitungsgerät
DE112008001052T5 (de) Bildsegmentierung und -Verbesserung
DE102011078662A1 (de) Erfassen und Erzeugen von Bildern mit hohem Dynamikbereich
DE102012016160A1 (de) Bilderfassung für eine spätere Nachfokussierung oder Fokusmanipulation
DE102008032989A1 (de) Vorrichtung und Verfahren zur Randbetonung
JP2008238590A5 (de)
DE112013004507T5 (de) Bildverarbeitungsvorrichtung, Bilderfassungsvorrichtung, Bildverarbeitungsverfahren, Programm und Aufzeichnungsmedium
DE112010001320T5 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren, Bilderverarbeitungsprogramm und Speichermedium
DE112020005864T5 (de) Verfahren und Einrichtung zur Verifizierung der Authentizität eines Produkts
CN113592776A (zh) 图像处理方法及装置、电子设备、存储介质
CN108710837A (zh) 吸烟行为识别方法、装置、计算机设备和存储介质
EP2433245A1 (de) Vorrichtung und verfahren zur identifizierung des urhebers eines kunstwerkes
DE10246102A1 (de) Verfahren und Vorrichtung zum Filtern von Rauschen von einem digatalen Bild
DE112010002677T5 (de) Verfahren und vorrichtung zum bestimmen einer formübereinstimmung in drei dimensionen

Legal Events

Date Code Title Description
R012 Request for examination validly filed

Effective date: 20131021

R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee