DE112006003272T5 - Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild - Google Patents

Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild Download PDF

Info

Publication number
DE112006003272T5
DE112006003272T5 DE112006003272T DE112006003272T DE112006003272T5 DE 112006003272 T5 DE112006003272 T5 DE 112006003272T5 DE 112006003272 T DE112006003272 T DE 112006003272T DE 112006003272 T DE112006003272 T DE 112006003272T DE 112006003272 T5 DE112006003272 T5 DE 112006003272T5
Authority
DE
Germany
Prior art keywords
noise
blobs
noise threshold
image
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE112006003272T
Other languages
English (en)
Other versions
DE112006003272B4 (de
Inventor
Dennis G. Atherton Nicholson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adobe Inc
Original Assignee
Adobe Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adobe Systems Inc filed Critical Adobe Systems Inc
Publication of DE112006003272T5 publication Critical patent/DE112006003272T5/de
Application granted granted Critical
Publication of DE112006003272B4 publication Critical patent/DE112006003272B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/164Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

Ein Verfahren zum Entfernen von Rauschen aus einem Bild, umfassend: Empfangen des Bildes;
Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt;
Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und
Entfernen von Klecksen, die kleiner als der Rauschen-Schwellenwert sind, aus dem Bild.

Description

  • HINTERGRUND
  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf Bildverarbeitung. Genauer bezieht sich die vorliegende Erfindung auf ein Verfahren und eine Vorrichtung zum Erleichtern des Entfernens von Rauschen aus einem digitalen Bild.
  • Stand der Technik
  • Da Geschäfte und andere Organisationen mehr und mehr von Computer durchsetzt werden, wird es mehr und mehr gebräuchlich, elektronische Versionen von Papierdokumenten auf Computersystemen zu speichern und vorzuhalten. Der Prozess des Speicherns eines Papierdokuments auf einem Computersystem umfasst typischerweise einen „Dokument-Abbildung"-Prozess, der eine Kopie des Papierdokuments in ein elektronisches Dokument umwandelt. Dieser Dokumentabbildungsprozess beginnt typischerweise mit einem Abbildungsschritt, bei dem Seiten-Bilder des Dokuments unter Verwendung eines Scanners, eines Kopierers, einer Kamera oder irgendeines anderen Abbildungsgeräts erzeugt werden. Diese Seiten-Bilder werden typischerweise analysiert und verbessert unter Verwendung eines Bildverarbeitungsprogramms, bevor sie in einem Dokumentbehälter zusammengestellt werden wie einer Portable-Dokument-Format-(PDF)-Datei.
  • Oft müssen Anwendungen in den eingescannten Seiten-Bildern Text erkennen, um die nachfolgenden Dokument-verarbeitenden Arbeitsschritte zu erleichtern. Dies wird typischerweise durch einen Prozess der optischen Zeichenerkennung (Optical Character Recognition, OCR) erreicht.
  • Leider kommt es sehr häufig vor, dass die Leistungsfähigkeit des OCR-Prozesses signifikant beeinträchtigt wird durch die Anwesenheit von Rauschen in den eingescannten Bildern. Viele Arten von Rauschen und rauschähnlichen Artefakten stammen aus den Druck- und Abbildungsprozessen. Beispiele für Rauschen und rauschähnliche Artefakte können Quantisierungsrauschen von den Lichtsensoren für das Abbilden, Schmutz in der Optik des Abbildungsgeräts, Tintenspritzer und Schmutzflecke des Toners umfassen.
  • Wegen dieses Problems werden gewöhnlich vor dem OCR-Prozess Arbeitsschritte zum Entfernen des Rauschens auf die Bilder angewendet. Zum Beispiel entfernt ein gewöhnlicher Arbeitsschritt zum Rauschen-Entfernen alle Kleckse, die kleiner als ein bestimmter Schwellenwert der Pixelanzahl sind. Jedoch kann es dazu führen, dass kleine Schriftzeichen wie ein „Satzpunkt" entfernt werden oder es kann verursachen, dass ein besonders großes Rauschartefakt erhalten bleibt. Selten ist ein fester Schwellenwert optimal für alle Schriftzeichengrößen. Folglich wird während des Rauschen-Entfernungsprozesses entweder zuviel Rauschen zurückgelassen oder Teile eines eingescannten Bildes werden unzulässigerweise entfernt.
  • Was demnach benötigt wird, ist ein Verfahren und eine Vorrichtung zum Entfernen von Rauschen aus einem Bild ohne die oben erwähnten Probleme.
  • ZUSAMMENFASSUNG
  • Eine Ausführungsform der vorliegenden Erfindung stellt ein System bereit, das Rauschen aus einem Bild entfernt. Während des Arbeitsschrittes identifiziert das System zuerst Kleckse in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schrift zeichens in dem Bild darstellen. Danach analysiert das System die Kleckse, um dynamisch einen „Rauschen-Schwellenwert" für die Kleckse zu bestimmen. Das System entfernt dann Kleckse aus dem Bild, die unterhalb der Rauschschwelle sind.
  • In einer Abwandlung dieser Ausführungsform umfasst das Analysieren der Kleckse das Analysieren von: die Größenverteilung der Kleckse, die Anzahl der Kleckse, die Lagen der Kleckse, die Dichte von Klecksen des Bildes oder des Bildbereichs und die Farbe der Kleckse.
  • In einer Abwandlung dieser Ausführungsform bestimmt das System den Rauschen-Schwellenwert dadurch, dass zuerst Text-Bereiche in dem Bild identifiziert werden und dann „Schlüssel-Schriftzeichen" in den Text-Bereichen bestimmt werden, wobei ein Schlüssel-Schriftzeichen ein kleines Schriftzeichen oder ein Teil eines Schriftzeichens ist wie ein Punkt, ein i-Punkt oder ein Komma. Als Nächstes berechnet das System die durchschnittliche Größe der identifizierten Schlüssel-Schriftzeichen und berechnet den Rauschen-Schwellenwert als einen Bruchteil dieser durchschnittlichen Größe.
  • In einer Abwandlung dieser Ausführungsform führt das System vor dem Analysieren der Kleckse einen anfänglichen Rauschen-Entfernungs-Arbeitsschritt durch, indem Kleckse aus dem Bild entfernt werden, die kleiner als ein anfänglicher Rauschen-Schwellenwert sind.
  • In einer Abwandlung dieser Ausführungsform wiederholt das System den Rauschen-Entfernungsprozess, wenn der bestimmte Rauschen-Schwellenwert von einem früheren Rauschen-Schwellenwert verschieden ist. Außerdem, wenn der bestimmte Rauschen-Schwellenwert gegenüber dem früheren Rauschen-Schwellenwert verringert ist, stellt das System die früher entfernten Kleckse wieder her, die kleiner als der frühere Rauschen-Schwellenwert sind, aber größer als der bestimmte Rauschen-Schwellenwert sind.
  • In einer Abwandlung dieser Ausführungsform wird ein Rauschen-Schwellenwert unabhängig für jeden identifizierten Text-Bereich bestimmt.
  • KURZE BESCHREIBUNG DER FIGUREN
  • 1 zeigt ein beispielhaftes Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung.
  • 2 zeigt verschiedene interessante Details in dem beispielhaften Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung.
  • 3 zeigt einen Rauschen-Entfernungsprozess im Einklang mit einer Ausführungsform der vorliegenden Erfindung.
  • 4 zeigt eine Computer-Umgebung im Einklang mit einer Ausführungsform der vorliegenden Erfindung.
  • 5 zeigt ein System zum Entfernen von Rauschen im Einklang mit einer Ausführungsform der vorliegenden Erfindung.
  • 6 zeigt ein System zur optischen Zeichenerkennung (OCR) im Einklang mit einer Ausführungsform der vorliegenden Erfindung.
  • 7 zeigt ein Flussdiagramm, das den Rauschen-Entfernungsprozess im Einklang mit einer Ausführungsform der vorliegenden Erfindung zeigt.
  • 8 zeigt ein Flussdiagramm, das den OCR-Prozess zeigt, der im Einklang mit einer Ausführungsform der vorliegenden Erfindung eine Verbesserung bezüglich des Rauschen-Entfernungsprozesses umfasst.
  • DETAILLIERTE BESCHREIBUNG
  • Die folgende Beschreibung wird gegeben, um es irgendeinem Fachmann zu ermöglichen, die Erfindung herzustellen und zu verwenden und wird im Kontext einer bestimmten Anmeldung und ihrer Erfordernisse gegeben. Verschiedene Modifikationen bezüglich der offenbarten Ausführungsformen werden den Fachleuten sogleich ersichtlich sein und die allgemeinen Prinzipien, die hier definiert werden, können auch auf andere Ausführungsformen und Anwendungen angewendet werden, ohne vom Geist und Umfang der vorliegenden Erfindung abzuweichen. Demnach ist die vorliegende Erfindung nicht beabsichtigt, auf die gezeigten Ausführungsformen begrenzt zu sein, sondern soll den weitesten Umfang enthalten, der mit den hier offenbarten Prinzipien und Merkmalen übereinstimmt.
  • Die Datenstrukturen und der Programmcode, der in dieser detaillierten Beschreibung beschrieben wird, wird typischerweise auf einem computerlesbaren Speichermedium gespeichert, welches irgendein Gerät oder Medium sein kann, das Programmcode und/oder Daten zum Gebrauch durch ein Computersystem speichern kann. Dies umfasst, aber ist nicht darauf begrenzt, magnetische und optische Speichergeräte wie Festplattenlaufwerke, magnetische Bänder, CDs (Compact Discs) und DVDs (Digital Versstile Discs oder Digital Video Discs).
  • Überblick
  • Die vorliegende Erfindung stellt eine Technik zum Entfernen von Rauschen aus einem Bild bereit und kann auf irgendein Dokument angewendet werden, das Rauschen oder irgendwelche anderen irrtümlichen Artefakte enthalten kann, die nicht beabsichtig sind, Teil des Originaldokuments zu sein. Obwohl die Ausführungsformen der vorliegenden Erfindung, die unten beschrieben werden, in Verbindung mit einem System von optischer Zeichenerkennung (Optical Character Recognition, OCR) arbeiten, kann die vorliegende Erfindung leicht modifiziert werden. um mit irgendeinem Rauschen-Entfernungssystem für digitale Bilder zu arbeiten, einschließlich Rauschen-Entfernungssystemen, die nicht mit optischer Zeichenerkennung assoziiert sind. Zum Beispiel können Ausführungsformen der vorliegenden Erfindung auf digitale Photographie angewendet werden.
  • Während des Betriebs empfängt eine Ausführungsform der vorliegenden Erfindung ein Bild in digitaler Form, welches sowohl Text als auch Bilder enthalten kann. Um den OCR-Prozess zu verbessern, ist es vorteilhaft, soviel Rauschen wie möglich von dem Bild zu entfernen. Der erste Schritt beim Entfernen dieses Rauschens ist es, „Kleckse" in dem Bild zu identifizieren. Ein „Klecks" wird definiert als ein Cluster von benachbarten Pixeln, die ein Schriftzeichen, ein Teil eines Schriftzeichens, ein Objekt innerhalb des Bildes, oder ein Rauschartefakt darstellen können. Nach dem Identifizieren von Klecksen in dem Bild analysiert das System die Kleckse, um einen „Rauschen-Schwellenwert" für die Kleckse zu bestimmen. (Zum Beispiel kann ein Rauschen-Schwellenwert eine minimale Anzahl von Pixeln in einem Klecks spezifizieren.) Als Nächstes entfernt das System alle Kleckse, die kleiner als der bestimmte Rauschen-Schwellenwert sind. Es wird angemerkt, dass ein größerer Rauschen-Schwellenwert mehr kleine Artefakte entfernen wird, aber auch Schriftzeichen (oder Teile von Schriftzeichen) entfernen kann wie Punkte oder i-Punkte (z. B. den punktförmigen Anteil des kleingeschriebenen „i"-Buchstabens). Im Gegensatz dazu wird ein kleinerer Rauschen-Schwellenwert Schriftzeichen (oder Teile von Schriftzeichen) nicht entfernen, aber er wird nicht so viele Rausch-Artefakte entfernen. Schließlich führt das System, nachdem die Kleckse entfernt werden, einen OCR-Prozess durch, um Buchstaben innerhalb der verbleibenden Kleckse zu identifizieren.
  • In einer Ausführungsform der vorliegenden Erfindung kann die Information, die aus der Analyse von Klecksen gewonnen wird, umfassen: Größe der Kleckse (die Zahl der Pixel in einem Klecks), Verteilung der Kleckse (die Zahl der Kleckse in einem digitalen Bild oder in einem Bereich eines digitalen Bildes) und Abstand zwischen Klecksen (die Zahl der Pixel zwischen Klecksen). Diese Information kann verwendet werden, um die Textgröße zu schätzen. Zusätzlich kann die Textgröße geschätzt werden durch Identifizieren von Schlüssel-Schriftzeichen in dem Bild und darauffolgendes Bestimmen der Größe dieser Schlüssel-Schriftzeichen. Schlüssel-Schriftzeichen sind kleine Schriftzeichen (oder Teile von Schriftzeichen) wie Punkte, i-Punkte. Kommas und Auslassungspunkte. Schlüssel- Schriftzeichen sind nützlich beim Bestimmen eines Schwellenwerts zum Rauschen-Entfernen, da sie typischerweise die kleinsten Schriftzeichen (oder Teile von Schriftzeichen) innerhalb einer Schriftart sind und sie demnach verwendet werden können, um zwischen Schriftzeichen (oder Teilen von Schriftzeichen) und Rauschen zu unterscheiden. Schlüssel-Schriftzeichen können auch Buchstaben und Zahlen umfassen, die ausgewählt werden, um beim Bestimmen der Textgröße zu helfen. Typischerweise sind der Basislinien-Abstand zwischen Klecksen und die Höhenverteilung der Kleckse gute Indikatoren für die Textgröße, die bestimmt werden kann, ohne den gesamten OCR-Prozess zu durchlaufen.
  • In einer Ausführungsform der vorliegenden Erfindung bestimmt das System den Rauschen-Schwellenwert, indem zuerst „Text-Bereiche" in dem Bild identifiziert werden und dann Schlüssel-Schriftzeichen innerhalb der Text-Bereiche identifiziert werden. Als Nächstes berechnet das System die durchschnittliche Größe der identifizierten Schlüssel-Schriftzeichen und berechnet den Rauschen-Schwellenwert als einen Bruchteil dieser durchschnittlichen Größe. Es wird angemerkt, dass die Liste von Schlüssel-Schriftzeichen vorbestimmt werden kann durch einen Benutzer oder Systemadministrator. Es wird ebenfalls angemerkt, dass die Schlüssel-Schriftzeichen verwendet werden können, um eine Schriftart zu identifizieren, die nachfolgend beim Unterscheiden zwischen Schriftzeichen und Rausch-Klecksen während der nachfolgenden OCR-Arbeitsschritte helfen kann.
  • In einer Ausführungsform der vorliegenden Erfindung ist der oben beschriebene Arbeitsgang iterativ. In dieser Ausführungsform startet das System mit einem „anfänglichen Rauschen-Schwellenwert". Der anfängliche Rauschen-Schwellenwert wird verwendet, um einen anfänglichen Rauschen-Entfernungsprozess durchzuführen, bei dem Kleckse, die kleiner als der anfängliche Rauschen-Schwellenwert sind, aus dem Bild entfernt werden. (Es ist anzumerken, dass es wünschenswert ist, diesen anfänglichen Rauschen-Schwellenwert kleiner zu machen als irgendein Schlüssel-Schriftzeichen in der kleinsten relevanten Schriftart.) Als Nächstes analysiert das System die Schlüssel-Schriftzeichen wie oben beschrieben, um einen neuen Rauschen-Schwellenwert zu bestimmen. Wenn der neue Rauschen- Schwellenwert verschieden von einem früheren Rauschen-Schwellenwert ist, wiederholt das System den Rauschen-Entfernungsprozess. Während des Wiederholens dieses Prozesses stellt das System, wenn der bestimmte Rauschen-Schwellenwert gegenüber einem früheren Rauschen-Schwellenwert verringert ist, die vorher entfernten Kleckse wieder her, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert.
  • In einer Ausführungsform der vorliegenden Erfindung wiederholt sich der oben beschriebene iterative Prozess, bis ein „befriedigendes" Schwellenwert-Niveau erreicht wird. Es wird angemerkt, dass ein Schwellenwert als „befriedigend" betrachtet werden kann, wenn: (1) der Schwellenwert sich zwischen Iterationen nicht ändert; (2) der Schwellenwert kleiner als ein vorherbestimmtes Rausch-Toleranzniveau ist; (3) die Veränderung bei den Schwellenwert-Niveaus innerhalb eines vorherbestimmten Bereichs ist; oder (4) das Rauschen-Entfernungssystem über eine vorherbestimmte Zeitspanne ausgeführt worden ist.
  • In einer Ausführungsform der vorliegenden Erfindung wird der Rauschen-Entfernungsprozess auf das gesamte abgebildete Dokument angewendet.
  • In einer anderen Ausführungsform der vorliegenden Erfindung wird der Rauschen-Entfernungsprozess von Seite zu Seite angewendet. In dieser Ausführungsform kann der Prozess auf jeder Seite unabhängig angewendet werden oder alternativ kann statistische Information zu jeder nachfolgenden Seite übertragen werden, um beim Bestimmen eines anfänglichen Rauschen-Schwellenwerts für jede nachfolgende Seite zu helfen.
  • In einer Ausführungsform der vorliegenden Erfindung wird eine Seite des abgebildeten Dokuments in Bereiche unterteilt und jeder Bereich wird unabhängig bearbeitet oder im Zusammenhang mit anderen Bereichen. Diese Ausführungsform liefert die höchste Flexibilität und in den meisten Fällen die besten Resultate, aber kann mehr Bearbeitungszeit benötigen.
  • In einer Ausführungsform der vorliegenden Erfindung werden entfernte Kleckse nicht wieder hergestellt während nachfolgender Iterationen des Rauschen-Entfernungsprozesses, unabhängig davon, wie sich der Schwellenwert des Rauschen-Entfernens ändert. Dies senkt wahrscheinlich die Genauigkeit des Rauschen-Entfernungsprozesses, da einige Kleckse, die Schriftzeichen (oder Teile von Schriftzeichen) sind, entfernt werden können. Jedoch ist es auch wahrscheinlich, dass die Geschwindigkeit des Rauschen-Entfernungsprozesses erhöht wird.
  • Beispielhaftes Dokument
  • 1 zeigt ein beispielhaftes Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung. Dieses beispielhafte Dokument umfasst: einen Header 101, einen Hauptteil 102 und eine Fußnote 103. Der Hauptteil 102 des beispielhaften Dokuments umfasst sowohl Text-Bereiche als auch ein Bild, welches Text enthält. Außerdem kann gesehen werden, dass verschiedene Artefakte 104 über das Dokument verteilt sind. Es wird angemerkt, dass dieses Bild 100 durch Einscannen eines Dokuments erzeugt wurde, das schon Rauschen enthielt. Jedoch ist es auch möglich, dass das Rauschen während des Einscann-Prozesses eingeführt wurde. Es ist auch anzumerken, dass die vorliegende Erfindung auf irgendein digitales Bild angewendet werden kann und nicht auf eingescannte Dokumente begrenzt ist.
  • Interessante Details
  • 2 zeigt verschiedene interessante Details in dem beispielhaften Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung. Genauer zeigt 2A einen Bereich des Headers 101 aus dem beispielhaften Dokument, das in 1 gezeigt wird. Drei interessante Details in 2A sind das Rausch-Artefakt 202, der Punkt 204 und der i-Punkt 206.
  • Das Auswählen eines anfänglichen Rauschen-Schwellenwerts führt zu einer von mehreren Möglichkeiten. Wenn der Rauschen-Schwellenwert zu fein ist, werden Rausch-Artefakt 202, Punkt 204 und i-Punkt 206 entfernt. Wenn der Rauschen-Schwellenwert zu grob ist, bleiben Rausch-Artefakt 202, Punkt 204 und i-Punkt 206. Da das Rausch-Artefakt 202 größer als einige der regulären Kleckse wie Punkt 204 und der i-Punkt 206 ist, gibt es keine Einstellung des anfänglichen Schwellenwerts, die den Rausch-Artefakt 202 entfernt und den Punkt 204 und den -Punkt 206 nicht entfernt. Dieses Beispiel verdeutlicht Probleme, die andere Schemata zum Rauschen-Entfernen haben und die von Ausgangsformen der vorliegenden Erfindung gelöst werden durch das Anpassen des Rauschen-Schwellenwertes während des OCR-Prozesses, wie unten in größerem Detail beschrieben wird.
  • 2B zeigt einen Bereich der Fußnote 103 aus dem beispielhaften Dokument, das in 1 gezeigt wird. Zwei interessante Details sind das Rauschartefakt 208 und der Punkt 210. Wenn ein Rauschen-Schwellenwert-Niveau irgendwo zwischen der Größe des Rausch-Artefakts 208 und des Punktes 210 gewählt wird, wird das Rausch-Artefakt 208 entfernt. Dies kann einfach in einer einzigen Iteration erreicht werden und ohne die Verbesserung, die während des (OCR-) Prozesses auftritt. In diesem Fall endet der Rauschen-Entfernungsprozess ohne weitere Verbesserung des Rauschen-Schwellenwertes und das OCR-System ist fähig, die verbleibenden Kleckse als gültige Schriftzeichen in einer Schriftart, die für das OCR-System erkennbar ist, zu identifizieren.
  • 2C zeigt einen Bereich des beispielhaften Dokuments, das in 1 gezeigt wird. Dieser Bereich umfasst das Rausch-Artefakt 212, das Bild 214 und den Text 216. Abhängig von dem Format der Datei und dem Format des Bereichs könnte der Bereich nicht dem Rauschen-Entfernungsprozess unterworfen sein. Die folgende Beschreibung nimmt an, dass der Bereich, der in 2C gezeigt wird, im Rauschen-Entfernungsprozess eingeschlossen wird. Wenn der anfängliche Rauschen-Schwellenwert auf ein Niveau gesetzt wird, bei dem das Rausch-Artefakt 212 entfernt wird, dann werden viele der Kleckse, die Teil des Bildes 214 sind, ebenfalls während des anfänglichen Rauschen-Entfernungsprozesses entfernt. Auf der anderen Seite wird, wenn der anfängliche Rauschen-Schwellenwert auf einem Niveau ist, bei dem das Bild 214 nicht verändert wird, der Rausch-Artefakt 212 nach dem Durchgang des anfänglichen Entfernens von Rauschen verbleiben. Eine Ausführungsform der vorliegenden Erfindung wählt einen anfänglichen Rauschen-Schwellenwert, der zum Entfernen von Rausch-Artefakten 212 führt, aber ohne das Bild 214 zu beeinträchtigen oder wählt alternativ einen Schwellenwert, der weder das Rausch-Artefakt 212 entfernt noch das Bild 214 beeinträchtigt. In der letzteren Situation wird das Rausch-Artefakt 212 während nachfolgenden Iterationen des OCR-Prozesses entfernt.
  • Eine Ausführungsform der vorliegenden Erfindung kann jede Seite eines Dokuments mit vielen Seiten entweder individuell oder zusammen bearbeiten. Es ist anzumerken, dass wenn jede Seite individuell verarbeitet wird, die vorliegende Erfindung statistische Information von vorher verarbeiteten Seiten übertragen kann, um beim Setzen des anfänglichen Rauschen-Schwellenwertes für nachfolgende Seiten zu helfen.
  • In einer anderen Ausführungsform der vorliegenden Erfindung werden die Gegenstände, die in 2A, 2B und 2C erscheinen, gemeinsam bearbeitet. Wegen der zahlreichen Rausch-Artefakte, die in ihrer Größe ähnlich zu legitimen Klecksen sind, werden die meisten der Rausch-Artefakte während des anfänglichen Rauschen-Entfernungsprozesses erhalten bleiben. Die verbleibenden Rausch-Artefakte werden entfernt werden durch das Anpassen des Rauschen-Schwellenwerts während nachfolgenden iterativen Arbeitsschritten.
  • Prozess-Übersicht
  • 3 zeigt einen Rauschen-Entfernungsprozess in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung. Während dieses Prozesses werden die abgebildeten Dokumente 304, 305 und 306 als Eingaben für den Rauschen-Entfernungsprozess 316 empfangen. Der Rauschen-Entfernungsprozess 316 produziert dann die Ausgabedokumente 324, 325 bzw. 326. Es ist anzumerken, dass Bereiche 309, 310, 311 und 312, die Text mit Rauschen enthalten, durch den Rau scheu-Entfernungsprozess 316 in Bereiche 307, 329, 330 und 331 umgewandelt werden, die Text ohne Rauschen enthalten. Nicht-Text-Bereiche 307 und 308 in den abgebildeten Bereichen 304, 305 werden nicht durch den Rauschen-Entfernungsprozess 316 bearbeitet und verbleiben als Nicht-Text-Bereiche 307 und 308 in den Ausgabedokumenten 324 bzw. 325.
  • Computer-Umgebung
  • 4 zeigt eine Computer-Umgebung 400 in Einklang mit einer Ausführungsform der vorliegenden Erfindung. Die Computer-Umgebung 400 umfasst einen Client 410 und ein Laptop 420. Der Client 410 und das Laptop 420 sind beide an ein Netzwerk 440 angekoppelt. Zusätzlich haben sowohl der Client 410 als auch das Laptop 420 die Fähigkeit, mit verschiedenen Geräten zu kommunizieren einschließlich eines Druckers 430, eines Scanners 450, eines Handys mit Kamera 460 und einer digitalen Kamera 470.
  • Der Client 410 und das Laptop 420 können im Allgemeinen irgendeinen Knoten auf einem Netzwerk einschließen einschließlich der Fähigkeit zum Berechnen und einschließlich eines Kommunikationsmechanismus über das Netzwerk 440.
  • Der Client 410 und das Laptop 420 können im Allgemeinen irgendeine Art von Computersystem umfassen einschließlich, aber nicht darauf begrenzt, eines Computersystems, das auf einem Mikroprozessor basiert, eines Mainframe-Computers, eines digitalen Signalprozessors, eines tragbaren Computergeräts, eines persönlichen Organisierers (Personal Organizer), eines Steuergeräts und einer Berechnungsfunktionseinheit innerhalb eines Geräts.
  • Der Drucker 430 kann im Allgemeinen irgendeine Art eines Druckers umfassen einschließlich, aber nicht darauf begrenzt, persönlichen Druckern, Netzwerkdruckern und Multifunktionsdruckern, die Kopierer, Scanner und Fax-Maschinen umfassen können.
  • Scanner 450 können im Allgemeinen irgendeine Art von digitalem Scanner umfassen einschließlich, aber nicht darauf begrenzt, selbstständigen Scanner und Multifunktionsscannern, die Kopierer, Drucker und Fax-Maschinen umfassen können.
  • Geräte wie der Drucker 430, der Scanner 450, das Handy mit Kamera 460 und die digitale Kamera 470 sind fähig, ein Bild eines Dokuments einzufangen oder ein Bild zu erzeugen, welches Text umfassen kann. Jedes dieser Geräte ist fähig, das Bild zu dem Client 410 oder dem Laptop 420 zu übertragen. In einer Ausführungsform der vorliegenden Erfindung sind sowohl der Client 410 als auch das Laptop 420 fähig, Rausch-Artefakte, die während des Abbildungsprozesses aufgetreten sein können, unter Verwendung des hier beschriebenen Entfernungsprozesses zu entfernen.
  • System zum Rauschen-Entfernen
  • 5 zeigt ein System zum Entfernen von Rauschen 500 in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung. Das System zum Entfernen von Rauschen 500 umfasst einen Klecks-Identifizierer 502, einen Klecks-Analysierer 504, einen Rauschen-Entferner 506, einen Rauschen-Wiederhersteller 508, ein OCR-System 510 und einen Speicher 520. Der Speicher 520 umfasst den Dokument-Speicher 522 (der eine Kopie der Bild-Dateien speichert), einen Rauschen-Speicher 524, einen statistischen Speicher 526 und Systemeinstellungen 528.
  • Der Klecks-Identifizierer 502 wird verwendet, um Kleckse innerhalb eines abgebildeten Dokuments zu identifizieren. Sobald die Kleckse identifiziert werden, analysiert der Klecks-Analysierer 504 die Kleckse, um den Rauschen-Schwellenwert zu bestimmen. Der Klecks-Analysierer 504 bestimmt den Rauschen-Schwellenwert auf der Grundlage von vielen Faktoren einschließlich, aber nicht darauf begrenzt, der Anzahl von Klecksen, der Verteilung von Klecksen, der Dichte der Kleckse in verschiedenen Bereichen, der Dichte von Klecksen ver schiedener Größen in verschiedenen Bereichen, der Lage der Kleckse, der Ausrichtung der Kleckse und der Farbe der Kleckse. Sobald die Analyse der Kleckse vollständig ist, wird die resultierende statistische Information im statistischen Speicher 526 gespeichert. Diese statistische Information kann nachfolgend dazu benutzt werden, um: die Systemeinstellungen weiter zu verfeinern; den Rauschen-Schwellenwert zu verfeinern; und den Rauschen-Entfernungsprozess für zusätzliche Bereiche des abgebildeten Dokuments und zusätzliche abgebildete Dokumente zu verfeinern.
  • Der Rauschen-Entferner 506 entfernt alle Kleckse, die als Rausch-Artefakte angesehen werden, auf der Grundlage des Rauschen-Schwellenwertes, der durch den Klecks-Analysierer 504 bestimmt wurde. Die entfernten Kleckse werden in dem Rauschen-Speicher 524 gespeichert für den Fall, dass der Rauschen-Schwellenwert geändert wird, so dass einige der entfernten Kleckse wiederhergestellt werden müssen. Wenn dies erfolgt, stellt der Rauschen-Wiederhersteller 508 einige oder alle der entfernten Kleckse wieder her. Das System kann durch Betrachten der Größe des Kleckses oder der Lage des Kleckses bestimmen, welche Kleckse wiederhergestellt werden sollen.
  • Das OCR-System 510 führt den OCR-Prozess durch, nachdem der anfängliche Rauschen-Entfernungsprozess abgeschlossen worden ist. Während dieses OCR-Prozesses wird das Entfernen des Rauschens weiter verbessert durch das Feineinstellen des Rauschen-Schwellenwertes, wie es unten in größerem Detail beschrieben wird.
  • Die Systemeinstellungen 528 enthalten Systemeinstellungen für den Rauschen-Entfernungsprozess. In einer Ausführungsform der vorliegenden Erfindung umfassen diese Einstellungen, aber sind nicht darauf begrenzt: eine Beschreibung der Information, die analysiert werden soll; einen Qualitätswert für den Rauschen-Entfernungsprozess; einen Indikator, der definiert, wann der Rauschen-Entfernungsprozess beendet werden soll; ein Flag, das anzeigt, ob irgendwelche Information auf die nächste Aufgabe zum Rauschen-Entfernen übertragen werden soll; Identifizierer für Schlüssel-Schriftzeichen; und einen Indikator, der bestimmt, ob der Prozess auf einer Datei, einer Seite oder einem Bereich einer Seite durchgeführt wird. Es ist anzumerken, dass die Qualität des Rauschen-Entfernungsprozesses in umgekehrter Beziehung zu der Geschwindigkeit des Rauschen-Entfernungsprozesses steht. Zusätzlich besteht eine direkte Beziehung zwischen der Qualität des Rauschen-Entfernungsprozesses mit der Speichergröße, die für den Rauschen-Entfernungsprozess verfügbar ist.
  • OCR-System
  • 6 zeigt ein System zur optischen Zeichenerkennung (OCR) 600 im Einklang mit einer Ausführungsform der vorliegenden Erfindung. Das OCR-System 600 umfasst einen Text-Finder 602, einen Text-Analysierer 604 und einen Kalibrator 606 für den Rauschen-Schwellenwert. Der Text-Finder 602 identifiziert Text-Bereiche innerhalb des abgebildeten Dokuments. Techniken zum Identifizieren von Text-Bereichen innerhalb von Dokumenten sind dem Fachmann wohlbekannt und werden hier nicht weiter beschrieben werden.
  • Sobald die Text-Bereiche identifiziert worden sind, analysiert der Text-Analysierer 604 die Text-Bereiche, um sowohl die Größe des Textes zu bestimmen als auch Schlüssel-Schriftzeichen innerhalb des Textes zu identifizieren.
  • Die Schlüssel-Schriftzeichen werden dann durch den Text-Analysierer 604 analysiert, um ihre Größe zu bestimmen (zum Beispiel als Anzahl von Pixeln). Wie oben erwähnt wurde, sind die Schlüssel-Schriftzeichen kleine Schriftzeichen (oder Teile von Schriftzeichen), die verwendet werden, um Schriftzeichen vom Rauschen zu unterscheiden. Die Schlüssel-Schriftzeichen können von Schriftart zu Schriftart variieren, aber umfassen im Allgemeinen Punkte, i-Punkte, Kommas, Auslassungspunkte und andere Schriftzeichen (oder Teile von Schriftzeichen), die kleiner als die anderen Schriftzeichen in der Schriftart sind. Die Information, die durch den Text-Analysierer 604 bestimmt wird (einschließlich zum Beispiel eines Rauschen-Schwellenwertes), wird im statistischen Speicher 526 abgespeichert.
  • Diese Information kann während nachfolgender Iterationen oder für andere Rauschentfernungsaufgaben verwendet werden. Wie unten beschrieben, wird die Ausgabe des Text-Analysierers 604 verwendet, um den Rauschen-Schwellenwert zu verfeinern.
  • Der Rauschen-Schwellenwert-Kalibrator 606 passt den Rauschen-Schwellenwert an. Wenn der Rauschen-Schwellenwert dahingehend bestimmt wird, dass er sich außerhalb des Toleranzbereiches, der in den Systemeinstellungen 528 spezifiziert ist, verändert hat, dann wird ein zusätzlicher Rauschentfernungsarbeitsschritt durchgeführt. Dieser zusätzliche Rauschentfernungsarbeitsschritt kann das Wiederherstellen von einigen oder allen vorher entfernten Klecksen beinhalten, wenn der Rauschen-Schwellenwert abgenommen hat.
  • Rauschentfernungsprozess
  • 7 zeigt ein Flussdiagramm, das den Rauschentfernungsprozess in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung zeigt. Der Prozess beginnt durch das Identifizieren von Klecksen in dem Bild (Schritt 702). Als Nächstes analysiert das System die Kleckse (Schritt 704) und speichert die resultierende Information im statistischen Speicher 526. Diese resultierende Information kann umfassen: durchschnittliche Klecksgröße, Information über Klecksdichte, Klecksfarbe und irgendeine andere Information, die nützlich zum Bestimmen eines Rauschen-Entfernungs-Schwellenwertes ist.
  • Unter Verwendung der Resultate aus Schritt 704 bestimmt das System den Rauschen-Schwellenwert (Schritt 706). In einer Ausführungsform der vorliegenden Erfindung ist der Rauschen-Schwellenwert ein Bruchteil der durchschnittlichen Klecksgröße bei Schlüssel-Schriftzeichen in dem Bild. Der Rauschen-Schwellenwert kann sich auch über verschiedene Bereiche einer gegebenen Seite unterscheiden. Zum Beispiel kann in einer Ausführungsform, wenn die oberen 33% der Seite eine durchschnittliche Klecksgröße für Schlüssel-Schriftzeichen von 15 Pixel hat, der Rauschen-Schwellenwert für die oberen 33% der Seite auf 5 Pixel gesetzt werden. Wenn jedoch die unteren 66% der Seite eine durchschnittliche Klecksgröße für Schlüssel-Schriftzeichen von 45 Pixel hat, kann der Rauschen-Schwellenwert für die unteren 66% der Seite auf 15 Pixel gesetzt werden. Andere Faktoren zusätzlich zur Klecksgröße können verwendet werden, um den Rauschen-Schwellenwert zu bestimmen. Wenn zum Beispiel die Systemeinstellungen 528 anzeigen, dass das Bild streng einfarbig ist, aber während des Abbildungsprozesses ein roter Artefakt in das Dokument eingeführt wurde, kann das System den roten Artefakt als Rauschen identifizieren und ihn aus dem Bild entfernen.
  • Nachdem der Rauschen-Schwellenwert festgelegt worden ist, entfernt das System alle Kleckse, die weniger Pixel als der Rauschen-Schwellenwert haben (Schritt 708). Schließlich beginnt das System den OCR-Prozess (Schritt 710).
  • OCR-Prozess
  • Der vorangegangene Abschnitt beschreibt einen schnellen und flexiblen Rauschen-Entfernungsprozess, der angepasst werden kann, um den Bedürfnissen des Benutzers zu entsprechen. In einer Ausführungsform der vorliegenden Erfindung wird der Prozess bei Schritt 712 abgeschlossen.
  • In einer anderen Ausführungsform der vorliegenden Erfindung wird der Rauschen-Entfernungsprozess während des OCR-Prozesses verfeinert. Diese Verfeinerung erzeugt ein Resultat höherer Qualität als die vorher beschriebene Ausführungsform.
  • 8 zeigt ein Flussdiagramm, das den OCR-Prozess darstellt, der eine Verbesserung bezüglich des Rauschentfernungsprozesses umfasst. in Einklang mit einer Ausführungsform der vorliegenden Erfindung. Während dieses Prozesses identifiziert das System zuerst Text-Bereiche innerhalb des abgebildeten Dokuments (Schritt 802). Es wird angemerkt, dass in einer Ausführungsform Text, welcher Teil von einer Figur oder einem Bild ist, typischerweise in diesem Schritt und bei allen zukünftigen Schritten des OCR-Prozesses ignoriert wird.
  • Sobald die Text-Bereiche identifiziert werden, werden die Text-Bereiche analysiert (Schritt 804). Diese Analyse kann zum Beispiel das Bestimmen der Textgröße, das Identifizieren von Schlüssel-Schriftzeichen und das Identifizieren der Schriftart, die für den Text verwendet wird, umfassen. Als Nächstes bewertet das System den Rauschen-Schwellenwert für das Bild neu auf der Grundlage der Resultate der Analyse (Schritt 806).
  • Das System bestimmt dann, ob sich der Rauschen-Schwellenwert geändert hat (Schritt 808). Wenn nicht, schließt das System den OCR-Prozess ab (Schritt 820). Wenn sich der Rauschen-Schwellenwert geändert hat, bestimmt das System, ob der neue Rauschen-Schwellenwert kleiner als der vorangegangene Rauschen-Schwellenwert ist (Schritt 810). Wenn ja, werden früher entfernte Kleckse, die größer als der neue Rauschen-Schwellenwert sind, aber kleiner als der anfängliche Rauschen-Schwellenwert, wiederhergestellt.
  • In einer Ausführungsform der vorliegenden Erfindung wird ein im Voraus spezifiziertes „Toleranzniveau" auch verwendet, um zu bestimmen, ob ein entfernter Klecks wiederhergestellt werden soll. Zum Beispiel wird bei einem Toleranzniveau von zwei Pixeln, wenn der alte Rauschen-Schwellenwert zwölf Pixel war und der neue Rauschen-Schwellenwert acht Pixel ist, ein Klecks Von neun Pixeln nicht wieder hergestellt werden. Das Toleranzniveau kann durch die Systemeinstellungen 528 angezeigt werden.
  • Nachdem die entfernten Kleckse wiederhergestellt worden sind (oder wenn der neue Rauschen-Schwellenwert nicht kleiner als der frühere Rauschen-Schwellenwert in Schritt 810 ist), wiederholt das System den Rauschen-Entfernungsprozess unter Verwendung des neuen Rauschen-Schwellenwertes (Schritt 814).
  • Als Nächstes bestimmt das System, ob der neue Rauschen-Schwellenwert befriedigend ist (Schritt 816). Diese Bestimmung kann auf Folgendem basiert werden: ob irgendwelche Kleckse entfernt worden sind; wie viele Kleckse entfernt worden sind; wie viele Male der Rauschen-Schwellenwert angepasst worden ist; oder in welcher Richtung der Rauschen-Schwellenwert angepasst worden ist. Wenn der neue Rauschen-Schwellenwert befriedigend ist, schließt das System den OCR-Prozess ab (Schritt 820). Auf der anderen Seite, wenn der neue Rauschen-Schwellenwert nicht befriedigend ist, wird der Rauschen-Entfernungsprozess wiederholt durch Zurückgehen zu Schritt 802.
  • In einer Ausführungsform der vorliegenden Erfindung verfeinert das System den Rauschen-Entfernungsprozess durch Anpassen der Systemeinstellungen 528, bevor es zu Schritt 802 zurückkehrt. Das kann das Anpassen von Folgendem umfassen: die Information, die analysiert werden soll; die Qualität des Rauschen-Entfernungsprozesses; wann der Rauschen-Entfernungsprozess beendet wird; ob irgendwelche Information auf die nächste Rauschentfernungsaufgabe übertragen wird; welche Schriftzeichen Schlüssel-Schriftzeichen sind; und ob der Prozess auf einem Dokument, einer Seite oder einem Bereich einer Seite ausgeführt wird.
  • Die vorangegangenen Beschreibungen von Ausführungsformen der vorliegenden Erfindung sind nur für Zwecke der Veranschaulichung und Beschreibung gegeben worden. Sie sind nicht beabsichtigt, ausschöpfend zu sein oder die vorliegende Erfindung auf die offenbarten Ausführungsformen zu begrenzen. Demgemäß werden viele Abwandlungen und Variationen Fachleuten offensichtlich sein. Außerdem ist die obige Offenbarung nicht beabsichtigt, die vorliegende Erfindung zu begrenzen. Der Umfang der vorliegenden Erfindung wird durch die angehängten Patentansprüche bestimmt.
  • ZUSAMMENFASSUNG
  • Eine Ausführungsform der vorliegenden Erfindung stellt ein System bereit, das Rauschen aus einem Bild entfernt. Während des Betriebs identifiziert das System zuerst Kleckse in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt. Als Nächstes analysiert das System die Kleckse, um einen „Rausch-Schwellenwert" für die Kleckse dynamisch zu bestimmen. Das System entfernt dann Kleckse aus dem Bild, die unterhalb des Rausch-Schwellenwertes sind.

Claims (21)

  1. Ein Verfahren zum Entfernen von Rauschen aus einem Bild, umfassend: Empfangen des Bildes; Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt; Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und Entfernen von Klecksen, die kleiner als der Rauschen-Schwellenwert sind, aus dem Bild.
  2. Das Verfahren nach Anspruch 1, wobei das Bestimmen des Rauschen-Schwellenwertes umfasst: Identifizieren eines Textbereiches in dem Bild; Identifizieren von Schlüssel-Schriftzeichen innerhalb der Textbereiche; Berechnen der durchschnittlichen Größe der identifizierten Schlüssel-Schriftzeichen; und Berechnen des Rauschen-Schwellenwertes als ein Bruchteil der durchschnittlichen Größe eines Schlüssel-Schriftzeichens.
  3. Das Verfahren nach Anspruch 2, wobei das Verfahren zum Entfernen von Rauschen aus dem Bild wiederholt wird. wenn der bestimmte Rauschen-Schwellenwert verschieden von einem höheren Rauschen-Schwellenwert ist.
  4. Das Verfahren nach Anspruch 3, wobei das Verfahren, wenn der bestimmte Rauschen-Schwellenwert bezüglich des früheren Rauschen- Schwellenwertes verringert ist, weiterhin das Wiederherstellen der früher entfernten Kleckse umfasst, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert.
  5. Das Verfahren nach Anspruch 1, wobei vor dem Analysieren der Kleckse das Verfahren das Durchführen eines anfänglichen Rauschentfernungsarbeitsschrittes umfasst, in dem Kleckse aus dem Bild entfernt werden, die unterhalb eines anfänglichen Rauschen-Schwellenwertes sind.
  6. Das Verfahren nach Anspruch 1, wobei das Analysieren der Kleckse das Analysieren von ein oder mehr des Folgenden umfasst: eine Größenverteilung der Kleckse; eine Anzahl der Kleckse; Lagen der Kleckse; eine Dichte der Kleckse innerhalb des Bildes oder des Bildbereichs; und Farben der Kleckse.
  7. Das Verfahren nach Anspruch 1, wobei ein Rauschen-Schwellenwert unabhängig für jeden Textbereich einer Mehrzahl von identifizierten Textbereichen bestimmt wird.
  8. Ein computerlesbares Speichermedium, das Anweisungen speichert, die bewirken, dass, wenn sie durch einen Computer ausgeführt werden, der Computer ein Verfahren zum Entfernen von Rauschen aus einem Bild durchführt, wobei das Verfahren umfasst: Empfangen des Bildes; Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder ein Teil eines Schriftzeichens in dem Bild darstellen; Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei die Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und Entfernen von Klecksen, die kleiner sind als der Rauschen-Schwellenwert, aus dem Bild.
  9. Das computerlesbare Medium nach Anspruch 8, wobei das Bestimmen des Rauschen-Schwellenwertes umfasst: Identifizieren eines Textbereiches in dem Bild; Identifizieren von Schlüssel-Schriftzeichen innerhalb der Textbereiche; das Berechnen der durchschnittlichen Größe der identifizierten Schlüssel-Schriftzeichen; und das Berechnen des Rauschen-Schwellenwertes als ein Bruchteil der durchschnittlichen Größe eines Schlüssel-Schriftzeichens.
  10. Das computerlesbare Speichermedium nach Anspruch 9, wobei das Verfahren zum Entfernen von Rauschen aus dem Bild wiederholt wird, wenn der bestimmte Rauschen-Schwellenwert verschieden von einem früheren Rauschen-Schwellenwert ist.
  11. Das computerlesbare Speichermedium nach Anspruch 10, wobei das Verfahren, wenn der bestimmte Rauschen-Schwellenwert gegenüber dem früheren Rauschen-Schwellenwert verringert ist, weiterhin das Wiederherstellen von früher entfernten Klecksen umfasst, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert.
  12. Das computerlesbare Speichermedium nach Anspruch 8, wobei vor dem Analysieren der Kleckse das Verfahren das Durchführen eines anfänglichen Rausch-Entfernungsarbeitsschrittes umfasst. indem Kleckse aus dem Bild entfernt werden, die unterhalb eines anfänglichen Rauschen-Schwellenwertes sind.
  13. Das computerlesbare Speichermedium nach Anspruch 8, wobei das Analysieren der Kleckse das Analysieren von ein oder mehr des Folgenden umfasst: eine Größenverteilung der Kleckse; eine Anzahl der Kleckse; die Lagen der Kleckse; eine Dichte der Kleckse innerhalb des Bildes oder des Bildbereiches; und die Farben der Kleckse.
  14. Das computerlesbare Speichermedium nach Anspruch 1, wobei ein Rauschen-Schwellenwert unabhängig für jeden Text-Bereich einer Mehrzahl von identifizierten Text-Bereichen bestimmt wird.
  15. Eine Vorrichtung, die Rauschen aus einem Bild entfernt, umfassend: einen Mechanismus zur Klecks-Identifikation, der konfiguriert ist, um Kleckse in dem Bild zu identifizieren, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt; einen Mechanismus zum Bestimmen eines Schwellenwertes, der konfiguriert ist, um die Kleckse zu analysieren zur Bestimmung eines Rauschen-Schwellenwertes, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und einen Mechanismus zum Entfernen von Klecksen, der konfiguriert ist, um Kleckse aus dem Bild zu entfernen, die kleiner als der Rauschen-Schwellenwert sind.
  16. Die Vorrichtung nach Anspruch 15, wobei der Mechanismus zur Bestimmung eines Schwellenwertes konfiguriert ist, um: einen Text-Bereich in dem Bild zu identifizieren; Schlüssel-Schriftzeichen innerhalb der Text-Bereiche zu identifizieren; die durchschnittliche Größe der identifizierten Schlüssel-Schriftzeichen zu berechnen; und den Rauschen-Schwellenwert als einen Bruchteil der durchschnittlichen Größe eines Schlüssel-Schriftzeichens zu berechnen.
  17. Das Verfahren nach Anspruch 16, wobei die Vorrichtung konfiguriert ist, den Rauschen-Entfernungsprozess zu wiederholen, wenn der bestimmte Rauschen-Schwellenwert verschieden von einem früheren Rauschen-Schwellenwert ist.
  18. Das Verfahren nach Anspruch 17, weiterhin umfassend einen Mechanismus zum Wiederherstellen von Klecksen, wobei der Mechanismus zum Wiederherstellen von Klecksen konfiguriert ist, früher entfernte Kleckse wiederherzustellen, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert, wenn der bestimmte Rauschen-Schwellenwert bezüglich des früheren Rauschen-Schwellenwertes definiert ist.
  19. Die Vorrichtung nach Anspruch 15, weiterhin umfassend einen anfänglichen Rausch-Entfernungsmechanismus, der konfiguriert ist, einen anfänglichen Rausch-Entfernungsarbeitsschritt durchzuführen, indem Kleckse aus dem Bild entfernt werden, die unterhalb eines anfänglichen Rauschen-Schwellenwertes sind.
  20. Die Vorrichtung nach Anspruch 15, wobei beim Analysieren der Kleckse der Mechanismus zum Bestimmen eines Schwellenwertes konfiguriert ist, um ein oder mehr des Folgenden zu analysieren: eine Größenverteilung der Kleckse; eine Anzahl der Kleckse; die Lagen der Kleckse; eine Dichte der Kleckse innerhalb des Bildes oder Bildbereichs; und die Farben der Kleckse.
  21. Die Vorrichtung nach Anspruch 15, wobei der Mechanismus zum Bestimmen des Schwellenwertes konfiguriert ist, um einen Rauschen-Schwellenwert unabhängig für jeden Text-Bereich einer Mehrzahl von identifizierten Text-Bereichen zu bestimmen.
DE112006003272.0T 2005-11-30 2006-11-28 Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild Active DE112006003272B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/291,552 US7660483B2 (en) 2005-11-30 2005-11-30 Method and apparatus for removing noise from a digital image
US11/291,552 2005-11-30
PCT/US2006/061294 WO2007065087A1 (en) 2005-11-30 2006-11-28 Method and apparatus for removing noise from a digital image

Publications (2)

Publication Number Publication Date
DE112006003272T5 true DE112006003272T5 (de) 2008-10-23
DE112006003272B4 DE112006003272B4 (de) 2022-08-18

Family

ID=37891666

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112006003272.0T Active DE112006003272B4 (de) 2005-11-30 2006-11-28 Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild

Country Status (4)

Country Link
US (2) US7660483B2 (de)
CN (1) CN101322154B (de)
DE (1) DE112006003272B4 (de)
WO (1) WO2007065087A1 (de)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090086275A1 (en) * 2007-09-28 2009-04-02 Jian Liang Processing a digital image of content
US8548267B1 (en) * 2007-09-28 2013-10-01 Amazon Technologies, Inc. Processing a digital image of content using content aware despeckling
US8731297B1 (en) 2007-09-28 2014-05-20 Amazon Technologies, Inc. Processing a digital image of content to remove border artifacts
US8838489B2 (en) 2007-12-27 2014-09-16 Amazon Technologies, Inc. On-demand generating E-book content with advertising
US9858604B2 (en) 2010-09-24 2018-01-02 Amazon Technologies, Inc. Vendor interface for item delivery via 3D manufacturing on demand
US8412588B1 (en) 2010-09-24 2013-04-02 Amazon Technologies, Inc. Systems and methods for fabricating products on demand
US9898776B2 (en) 2010-09-24 2018-02-20 Amazon Technologies, Inc. Providing services related to item delivery via 3D manufacturing on demand
US9672550B2 (en) 2010-09-24 2017-06-06 Amazon Technologies, Inc. Fulfillment of orders for items using 3D manufacturing on demand
US9684919B2 (en) 2010-09-24 2017-06-20 Amazon Technologies, Inc. Item delivery using 3D manufacturing on demand
CN102413338B (zh) * 2011-11-21 2014-04-30 晶门科技(深圳)有限公司 点状噪声的图像处理方法及装置
CN103454282A (zh) * 2013-08-30 2013-12-18 陕西科技大学 一种基于图像灰度梯度的印刷品墨斑测量方法
US9986387B2 (en) * 2015-11-24 2018-05-29 Fortinet, Inc. Associating position information collected by a mobile device with a managed network appliance
RU2634195C1 (ru) * 2016-12-06 2017-10-24 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr)
US10949957B2 (en) 2018-01-04 2021-03-16 Gingy Technology Inc. Biometric image processing method and electronic device thereof
US10832046B1 (en) * 2018-10-23 2020-11-10 Architecture Technology Corporation Systems and methods for processing document images
US10997463B2 (en) * 2018-11-08 2021-05-04 Adobe Inc. Training text recognition systems
CN111209912A (zh) * 2020-01-13 2020-05-29 昆明理工大学 一种中文文字图片长干扰线去除方法
US11330145B1 (en) * 2021-06-10 2022-05-10 Bank Of America Corporation Image processing edge device for document noise removal
JP2023030811A (ja) * 2021-08-24 2023-03-08 キヤノン株式会社 情報処理装置、抽出処理装置、画像処理システム、情報処理装置の制御方法、及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250787A (ja) 1987-04-08 1988-10-18 Fuji Electric Co Ltd 文字切出し方法
US4888812A (en) * 1987-12-18 1989-12-19 International Business Machines Corporation Document image processing system
US5195147A (en) * 1989-05-02 1993-03-16 Ricoh Company, Ltd. Image forming apparatus
US5457754A (en) * 1990-08-02 1995-10-10 University Of Cincinnati Method for automatic contour extraction of a cardiac image
US5337373A (en) * 1991-10-24 1994-08-09 International Business Machines Corporation Automatic threshold generation technique
US5542006A (en) * 1994-06-21 1996-07-30 Eastman Kodak Company Neural network based character position detector for use in optical character recognition
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置
US5471434A (en) * 1994-10-18 1995-11-28 The United States Of America As Represented By The Secretary Of The Navy System and method for rapidly tracking vehicles of special utility in low signal-to-noise environments
DE19517178C1 (de) 1995-05-09 1996-11-21 Ibm Hintergrundbereinigung bei elektronisch abgetasteten Bildern
DE19536170A1 (de) 1995-09-29 1997-04-03 Ibm Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
EP1056038A3 (de) 1999-05-28 2002-05-08 Computer Gesellschaft Konstanz Mbh Verfahren zur Aufbereitung von aus Zeichen und Zeichenfolgen generierten Bitmustern für die optische Zeichenerkennung
US7225082B1 (en) 1999-10-01 2007-05-29 Oxonica, Inc. Colloidal rod particles as nanobar codes
US6728401B1 (en) * 2000-08-17 2004-04-27 Viewahead Technology Red-eye removal using color image processing
CN1419680A (zh) * 2001-01-26 2003-05-21 皇家菲利浦电子有限公司 时空滤波器单元以及包括这种时空滤波器单元的图像显示设备
US7031548B2 (en) * 2001-10-04 2006-04-18 Hewlett-Packard Development Company, L.P. Method and apparatus for filtering noise from a digital image
DE10329339B4 (de) 2003-06-30 2007-04-26 OCé PRINTING SYSTEMS GMBH Verfahren und Vorrichtung zum Aufbereiten einer Bildpunktdatei
US7668376B2 (en) * 2004-06-30 2010-02-23 National Instruments Corporation Shape feature extraction and classification
WO2008060257A2 (en) * 2005-05-25 2008-05-22 Lau Daniel L Projectile tracking system
US7689016B2 (en) * 2005-05-27 2010-03-30 Stoecker & Associates, A Subsidiary Of The Dermatology Center, Llc Automatic detection of critical dermoscopy features for malignant melanoma diagnosis
US20070083114A1 (en) * 2005-08-26 2007-04-12 The University Of Connecticut Systems and methods for image resolution enhancement
KR100647402B1 (ko) * 2005-11-01 2006-11-23 매그나칩 반도체 유한회사 이미지 센서의 화질개선장치 및 그 방법

Also Published As

Publication number Publication date
CN101322154B (zh) 2011-02-16
US7660483B2 (en) 2010-02-09
DE112006003272B4 (de) 2022-08-18
US20100166307A1 (en) 2010-07-01
US20090022397A1 (en) 2009-01-22
WO2007065087A1 (en) 2007-06-07
US8064721B2 (en) 2011-11-22
CN101322154A (zh) 2008-12-10

Similar Documents

Publication Publication Date Title
DE112006003272T5 (de) Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild
DE69713941T2 (de) Bildverarbeitungssystem
DE69822545T2 (de) Bildverbesserung unter Benutzung einer Flächeninterpolation
DE60118240T2 (de) Methode zur bildanalyse
EP1310912B1 (de) Bildverarbeitungsverfahren, -vorrichtung und -system
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE69520411T2 (de) Iterative Kompression digitaler Bilder
DE69230629T2 (de) Verfahren und Vorrichtung zur Bildverbesserung
DE69826044T2 (de) Vektorkartenplanarisierung und -einfang
DE60111816T2 (de) Adaptives Filterverfahren und -vorrichtung zur Entrasterung abgetasteter Halbtonbilddaten
DE102007035884B4 (de) Linienrauschunterdrückungsvorrichtung, -verfahren und -programm
DE69712694T2 (de) Segmentierung und Hintergrundunterdrückung in JPEG-komprimierten Bildern mit Anwendung von Kodierungskostendaten
DE19530829C2 (de) Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Information
DE60020038T2 (de) Verfahren zum Verarbeiten eines numerischen Bildes
DE10308014A1 (de) System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt
DE112020006492T5 (de) Verfahren zum Erzeugen eines Quick-Response-Codes und Druckvorrichtung
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE69706802T2 (de) System und Verfahren zur Feststellung von weissen und schwarzen Punkte eines Farbbildes
DE60033479T2 (de) Bilderzeugungssystem und -verfahren
DE102005044133A1 (de) Bilderzeugungssystem und -verfahren einer optimalen Auflösung
DE69508941T2 (de) Automatische feststellung von leerseiten und grenzlinien für zweitonbilder
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
DE102006047436B4 (de) Verfahren und System zum automatischen Aufbereiten von Druckdaten für einen Druckvorgang
DE602004005647T2 (de) Bildverarbeitungsverfahren und Vorrichtung zur Änderung der Bildgrösse
DE10352395A1 (de) Speicherverwaltung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8125 Change of the main classification

Ipc: G06K 9/40 AFI20061128BHDE

R016 Response to examination communication
R082 Change of representative

Representative=s name: MUELLER-BORE & PARTNER PATENTANWAELTE PARTG MB, DE

R016 Response to examination communication
R081 Change of applicant/patentee

Owner name: ADOBE INC., SAN JOSE, US

Free format text: FORMER OWNER: ADOBE SYSTEMS, INC., SAN JOSE, CALIF., US

R082 Change of representative

Representative=s name: MUELLER-BORE & PARTNER PATENTANWAELTE PARTG MB, DE

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06K0009400000

Ipc: G06V0030164000

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final