DE112006003272T5 - Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild - Google Patents
Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild Download PDFInfo
- Publication number
- DE112006003272T5 DE112006003272T5 DE112006003272T DE112006003272T DE112006003272T5 DE 112006003272 T5 DE112006003272 T5 DE 112006003272T5 DE 112006003272 T DE112006003272 T DE 112006003272T DE 112006003272 T DE112006003272 T DE 112006003272T DE 112006003272 T5 DE112006003272 T5 DE 112006003272T5
- Authority
- DE
- Germany
- Prior art keywords
- noise
- blobs
- noise threshold
- image
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 230000008569 process Effects 0.000 claims description 79
- 230000007246 mechanism Effects 0.000 claims description 10
- 239000003086 colorant Substances 0.000 claims 3
- 230000007423 decrease Effects 0.000 claims 1
- 238000012015 optical character recognition Methods 0.000 description 36
- 238000003384 imaging method Methods 0.000 description 8
- 231100000566 intoxication Toxicity 0.000 description 6
- 230000035987 intoxication Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 231100000567 intoxicating Toxicity 0.000 description 1
- 230000002673 intoxicating effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
Ein
Verfahren zum Entfernen von Rauschen aus einem Bild, umfassend:
Empfangen des Bildes;
Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt;
Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und
Entfernen von Klecksen, die kleiner als der Rauschen-Schwellenwert sind, aus dem Bild.
Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt;
Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und
Entfernen von Klecksen, die kleiner als der Rauschen-Schwellenwert sind, aus dem Bild.
Description
- HINTERGRUND
- Gebiet der Erfindung
- Die vorliegende Erfindung bezieht sich auf Bildverarbeitung. Genauer bezieht sich die vorliegende Erfindung auf ein Verfahren und eine Vorrichtung zum Erleichtern des Entfernens von Rauschen aus einem digitalen Bild.
- Stand der Technik
- Da Geschäfte und andere Organisationen mehr und mehr von Computer durchsetzt werden, wird es mehr und mehr gebräuchlich, elektronische Versionen von Papierdokumenten auf Computersystemen zu speichern und vorzuhalten. Der Prozess des Speicherns eines Papierdokuments auf einem Computersystem umfasst typischerweise einen „Dokument-Abbildung"-Prozess, der eine Kopie des Papierdokuments in ein elektronisches Dokument umwandelt. Dieser Dokumentabbildungsprozess beginnt typischerweise mit einem Abbildungsschritt, bei dem Seiten-Bilder des Dokuments unter Verwendung eines Scanners, eines Kopierers, einer Kamera oder irgendeines anderen Abbildungsgeräts erzeugt werden. Diese Seiten-Bilder werden typischerweise analysiert und verbessert unter Verwendung eines Bildverarbeitungsprogramms, bevor sie in einem Dokumentbehälter zusammengestellt werden wie einer Portable-Dokument-Format-(PDF)-Datei.
- Oft müssen Anwendungen in den eingescannten Seiten-Bildern Text erkennen, um die nachfolgenden Dokument-verarbeitenden Arbeitsschritte zu erleichtern. Dies wird typischerweise durch einen Prozess der optischen Zeichenerkennung (Optical Character Recognition, OCR) erreicht.
- Leider kommt es sehr häufig vor, dass die Leistungsfähigkeit des OCR-Prozesses signifikant beeinträchtigt wird durch die Anwesenheit von Rauschen in den eingescannten Bildern. Viele Arten von Rauschen und rauschähnlichen Artefakten stammen aus den Druck- und Abbildungsprozessen. Beispiele für Rauschen und rauschähnliche Artefakte können Quantisierungsrauschen von den Lichtsensoren für das Abbilden, Schmutz in der Optik des Abbildungsgeräts, Tintenspritzer und Schmutzflecke des Toners umfassen.
- Wegen dieses Problems werden gewöhnlich vor dem OCR-Prozess Arbeitsschritte zum Entfernen des Rauschens auf die Bilder angewendet. Zum Beispiel entfernt ein gewöhnlicher Arbeitsschritt zum Rauschen-Entfernen alle Kleckse, die kleiner als ein bestimmter Schwellenwert der Pixelanzahl sind. Jedoch kann es dazu führen, dass kleine Schriftzeichen wie ein „Satzpunkt" entfernt werden oder es kann verursachen, dass ein besonders großes Rauschartefakt erhalten bleibt. Selten ist ein fester Schwellenwert optimal für alle Schriftzeichengrößen. Folglich wird während des Rauschen-Entfernungsprozesses entweder zuviel Rauschen zurückgelassen oder Teile eines eingescannten Bildes werden unzulässigerweise entfernt.
- Was demnach benötigt wird, ist ein Verfahren und eine Vorrichtung zum Entfernen von Rauschen aus einem Bild ohne die oben erwähnten Probleme.
- ZUSAMMENFASSUNG
- Eine Ausführungsform der vorliegenden Erfindung stellt ein System bereit, das Rauschen aus einem Bild entfernt. Während des Arbeitsschrittes identifiziert das System zuerst Kleckse in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schrift zeichens in dem Bild darstellen. Danach analysiert das System die Kleckse, um dynamisch einen „Rauschen-Schwellenwert" für die Kleckse zu bestimmen. Das System entfernt dann Kleckse aus dem Bild, die unterhalb der Rauschschwelle sind.
- In einer Abwandlung dieser Ausführungsform umfasst das Analysieren der Kleckse das Analysieren von: die Größenverteilung der Kleckse, die Anzahl der Kleckse, die Lagen der Kleckse, die Dichte von Klecksen des Bildes oder des Bildbereichs und die Farbe der Kleckse.
- In einer Abwandlung dieser Ausführungsform bestimmt das System den Rauschen-Schwellenwert dadurch, dass zuerst Text-Bereiche in dem Bild identifiziert werden und dann „Schlüssel-Schriftzeichen" in den Text-Bereichen bestimmt werden, wobei ein Schlüssel-Schriftzeichen ein kleines Schriftzeichen oder ein Teil eines Schriftzeichens ist wie ein Punkt, ein i-Punkt oder ein Komma. Als Nächstes berechnet das System die durchschnittliche Größe der identifizierten Schlüssel-Schriftzeichen und berechnet den Rauschen-Schwellenwert als einen Bruchteil dieser durchschnittlichen Größe.
- In einer Abwandlung dieser Ausführungsform führt das System vor dem Analysieren der Kleckse einen anfänglichen Rauschen-Entfernungs-Arbeitsschritt durch, indem Kleckse aus dem Bild entfernt werden, die kleiner als ein anfänglicher Rauschen-Schwellenwert sind.
- In einer Abwandlung dieser Ausführungsform wiederholt das System den Rauschen-Entfernungsprozess, wenn der bestimmte Rauschen-Schwellenwert von einem früheren Rauschen-Schwellenwert verschieden ist. Außerdem, wenn der bestimmte Rauschen-Schwellenwert gegenüber dem früheren Rauschen-Schwellenwert verringert ist, stellt das System die früher entfernten Kleckse wieder her, die kleiner als der frühere Rauschen-Schwellenwert sind, aber größer als der bestimmte Rauschen-Schwellenwert sind.
- In einer Abwandlung dieser Ausführungsform wird ein Rauschen-Schwellenwert unabhängig für jeden identifizierten Text-Bereich bestimmt.
- KURZE BESCHREIBUNG DER FIGUREN
-
1 zeigt ein beispielhaftes Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung. -
2 zeigt verschiedene interessante Details in dem beispielhaften Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung. -
3 zeigt einen Rauschen-Entfernungsprozess im Einklang mit einer Ausführungsform der vorliegenden Erfindung. -
4 zeigt eine Computer-Umgebung im Einklang mit einer Ausführungsform der vorliegenden Erfindung. -
5 zeigt ein System zum Entfernen von Rauschen im Einklang mit einer Ausführungsform der vorliegenden Erfindung. -
6 zeigt ein System zur optischen Zeichenerkennung (OCR) im Einklang mit einer Ausführungsform der vorliegenden Erfindung. -
7 zeigt ein Flussdiagramm, das den Rauschen-Entfernungsprozess im Einklang mit einer Ausführungsform der vorliegenden Erfindung zeigt. -
8 zeigt ein Flussdiagramm, das den OCR-Prozess zeigt, der im Einklang mit einer Ausführungsform der vorliegenden Erfindung eine Verbesserung bezüglich des Rauschen-Entfernungsprozesses umfasst. - DETAILLIERTE BESCHREIBUNG
- Die folgende Beschreibung wird gegeben, um es irgendeinem Fachmann zu ermöglichen, die Erfindung herzustellen und zu verwenden und wird im Kontext einer bestimmten Anmeldung und ihrer Erfordernisse gegeben. Verschiedene Modifikationen bezüglich der offenbarten Ausführungsformen werden den Fachleuten sogleich ersichtlich sein und die allgemeinen Prinzipien, die hier definiert werden, können auch auf andere Ausführungsformen und Anwendungen angewendet werden, ohne vom Geist und Umfang der vorliegenden Erfindung abzuweichen. Demnach ist die vorliegende Erfindung nicht beabsichtigt, auf die gezeigten Ausführungsformen begrenzt zu sein, sondern soll den weitesten Umfang enthalten, der mit den hier offenbarten Prinzipien und Merkmalen übereinstimmt.
- Die Datenstrukturen und der Programmcode, der in dieser detaillierten Beschreibung beschrieben wird, wird typischerweise auf einem computerlesbaren Speichermedium gespeichert, welches irgendein Gerät oder Medium sein kann, das Programmcode und/oder Daten zum Gebrauch durch ein Computersystem speichern kann. Dies umfasst, aber ist nicht darauf begrenzt, magnetische und optische Speichergeräte wie Festplattenlaufwerke, magnetische Bänder, CDs (Compact Discs) und DVDs (Digital Versstile Discs oder Digital Video Discs).
- Überblick
- Die vorliegende Erfindung stellt eine Technik zum Entfernen von Rauschen aus einem Bild bereit und kann auf irgendein Dokument angewendet werden, das Rauschen oder irgendwelche anderen irrtümlichen Artefakte enthalten kann, die nicht beabsichtig sind, Teil des Originaldokuments zu sein. Obwohl die Ausführungsformen der vorliegenden Erfindung, die unten beschrieben werden, in Verbindung mit einem System von optischer Zeichenerkennung (Optical Character Recognition, OCR) arbeiten, kann die vorliegende Erfindung leicht modifiziert werden. um mit irgendeinem Rauschen-Entfernungssystem für digitale Bilder zu arbeiten, einschließlich Rauschen-Entfernungssystemen, die nicht mit optischer Zeichenerkennung assoziiert sind. Zum Beispiel können Ausführungsformen der vorliegenden Erfindung auf digitale Photographie angewendet werden.
- Während des Betriebs empfängt eine Ausführungsform der vorliegenden Erfindung ein Bild in digitaler Form, welches sowohl Text als auch Bilder enthalten kann. Um den OCR-Prozess zu verbessern, ist es vorteilhaft, soviel Rauschen wie möglich von dem Bild zu entfernen. Der erste Schritt beim Entfernen dieses Rauschens ist es, „Kleckse" in dem Bild zu identifizieren. Ein „Klecks" wird definiert als ein Cluster von benachbarten Pixeln, die ein Schriftzeichen, ein Teil eines Schriftzeichens, ein Objekt innerhalb des Bildes, oder ein Rauschartefakt darstellen können. Nach dem Identifizieren von Klecksen in dem Bild analysiert das System die Kleckse, um einen „Rauschen-Schwellenwert" für die Kleckse zu bestimmen. (Zum Beispiel kann ein Rauschen-Schwellenwert eine minimale Anzahl von Pixeln in einem Klecks spezifizieren.) Als Nächstes entfernt das System alle Kleckse, die kleiner als der bestimmte Rauschen-Schwellenwert sind. Es wird angemerkt, dass ein größerer Rauschen-Schwellenwert mehr kleine Artefakte entfernen wird, aber auch Schriftzeichen (oder Teile von Schriftzeichen) entfernen kann wie Punkte oder i-Punkte (z. B. den punktförmigen Anteil des kleingeschriebenen „i"-Buchstabens). Im Gegensatz dazu wird ein kleinerer Rauschen-Schwellenwert Schriftzeichen (oder Teile von Schriftzeichen) nicht entfernen, aber er wird nicht so viele Rausch-Artefakte entfernen. Schließlich führt das System, nachdem die Kleckse entfernt werden, einen OCR-Prozess durch, um Buchstaben innerhalb der verbleibenden Kleckse zu identifizieren.
- In einer Ausführungsform der vorliegenden Erfindung kann die Information, die aus der Analyse von Klecksen gewonnen wird, umfassen: Größe der Kleckse (die Zahl der Pixel in einem Klecks), Verteilung der Kleckse (die Zahl der Kleckse in einem digitalen Bild oder in einem Bereich eines digitalen Bildes) und Abstand zwischen Klecksen (die Zahl der Pixel zwischen Klecksen). Diese Information kann verwendet werden, um die Textgröße zu schätzen. Zusätzlich kann die Textgröße geschätzt werden durch Identifizieren von Schlüssel-Schriftzeichen in dem Bild und darauffolgendes Bestimmen der Größe dieser Schlüssel-Schriftzeichen. Schlüssel-Schriftzeichen sind kleine Schriftzeichen (oder Teile von Schriftzeichen) wie Punkte, i-Punkte. Kommas und Auslassungspunkte. Schlüssel- Schriftzeichen sind nützlich beim Bestimmen eines Schwellenwerts zum Rauschen-Entfernen, da sie typischerweise die kleinsten Schriftzeichen (oder Teile von Schriftzeichen) innerhalb einer Schriftart sind und sie demnach verwendet werden können, um zwischen Schriftzeichen (oder Teilen von Schriftzeichen) und Rauschen zu unterscheiden. Schlüssel-Schriftzeichen können auch Buchstaben und Zahlen umfassen, die ausgewählt werden, um beim Bestimmen der Textgröße zu helfen. Typischerweise sind der Basislinien-Abstand zwischen Klecksen und die Höhenverteilung der Kleckse gute Indikatoren für die Textgröße, die bestimmt werden kann, ohne den gesamten OCR-Prozess zu durchlaufen.
- In einer Ausführungsform der vorliegenden Erfindung bestimmt das System den Rauschen-Schwellenwert, indem zuerst „Text-Bereiche" in dem Bild identifiziert werden und dann Schlüssel-Schriftzeichen innerhalb der Text-Bereiche identifiziert werden. Als Nächstes berechnet das System die durchschnittliche Größe der identifizierten Schlüssel-Schriftzeichen und berechnet den Rauschen-Schwellenwert als einen Bruchteil dieser durchschnittlichen Größe. Es wird angemerkt, dass die Liste von Schlüssel-Schriftzeichen vorbestimmt werden kann durch einen Benutzer oder Systemadministrator. Es wird ebenfalls angemerkt, dass die Schlüssel-Schriftzeichen verwendet werden können, um eine Schriftart zu identifizieren, die nachfolgend beim Unterscheiden zwischen Schriftzeichen und Rausch-Klecksen während der nachfolgenden OCR-Arbeitsschritte helfen kann.
- In einer Ausführungsform der vorliegenden Erfindung ist der oben beschriebene Arbeitsgang iterativ. In dieser Ausführungsform startet das System mit einem „anfänglichen Rauschen-Schwellenwert". Der anfängliche Rauschen-Schwellenwert wird verwendet, um einen anfänglichen Rauschen-Entfernungsprozess durchzuführen, bei dem Kleckse, die kleiner als der anfängliche Rauschen-Schwellenwert sind, aus dem Bild entfernt werden. (Es ist anzumerken, dass es wünschenswert ist, diesen anfänglichen Rauschen-Schwellenwert kleiner zu machen als irgendein Schlüssel-Schriftzeichen in der kleinsten relevanten Schriftart.) Als Nächstes analysiert das System die Schlüssel-Schriftzeichen wie oben beschrieben, um einen neuen Rauschen-Schwellenwert zu bestimmen. Wenn der neue Rauschen- Schwellenwert verschieden von einem früheren Rauschen-Schwellenwert ist, wiederholt das System den Rauschen-Entfernungsprozess. Während des Wiederholens dieses Prozesses stellt das System, wenn der bestimmte Rauschen-Schwellenwert gegenüber einem früheren Rauschen-Schwellenwert verringert ist, die vorher entfernten Kleckse wieder her, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert.
- In einer Ausführungsform der vorliegenden Erfindung wiederholt sich der oben beschriebene iterative Prozess, bis ein „befriedigendes" Schwellenwert-Niveau erreicht wird. Es wird angemerkt, dass ein Schwellenwert als „befriedigend" betrachtet werden kann, wenn: (1) der Schwellenwert sich zwischen Iterationen nicht ändert; (2) der Schwellenwert kleiner als ein vorherbestimmtes Rausch-Toleranzniveau ist; (3) die Veränderung bei den Schwellenwert-Niveaus innerhalb eines vorherbestimmten Bereichs ist; oder (4) das Rauschen-Entfernungssystem über eine vorherbestimmte Zeitspanne ausgeführt worden ist.
- In einer Ausführungsform der vorliegenden Erfindung wird der Rauschen-Entfernungsprozess auf das gesamte abgebildete Dokument angewendet.
- In einer anderen Ausführungsform der vorliegenden Erfindung wird der Rauschen-Entfernungsprozess von Seite zu Seite angewendet. In dieser Ausführungsform kann der Prozess auf jeder Seite unabhängig angewendet werden oder alternativ kann statistische Information zu jeder nachfolgenden Seite übertragen werden, um beim Bestimmen eines anfänglichen Rauschen-Schwellenwerts für jede nachfolgende Seite zu helfen.
- In einer Ausführungsform der vorliegenden Erfindung wird eine Seite des abgebildeten Dokuments in Bereiche unterteilt und jeder Bereich wird unabhängig bearbeitet oder im Zusammenhang mit anderen Bereichen. Diese Ausführungsform liefert die höchste Flexibilität und in den meisten Fällen die besten Resultate, aber kann mehr Bearbeitungszeit benötigen.
- In einer Ausführungsform der vorliegenden Erfindung werden entfernte Kleckse nicht wieder hergestellt während nachfolgender Iterationen des Rauschen-Entfernungsprozesses, unabhängig davon, wie sich der Schwellenwert des Rauschen-Entfernens ändert. Dies senkt wahrscheinlich die Genauigkeit des Rauschen-Entfernungsprozesses, da einige Kleckse, die Schriftzeichen (oder Teile von Schriftzeichen) sind, entfernt werden können. Jedoch ist es auch wahrscheinlich, dass die Geschwindigkeit des Rauschen-Entfernungsprozesses erhöht wird.
- Beispielhaftes Dokument
-
1 zeigt ein beispielhaftes Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung. Dieses beispielhafte Dokument umfasst: einen Header101 , einen Hauptteil102 und eine Fußnote103 . Der Hauptteil102 des beispielhaften Dokuments umfasst sowohl Text-Bereiche als auch ein Bild, welches Text enthält. Außerdem kann gesehen werden, dass verschiedene Artefakte104 über das Dokument verteilt sind. Es wird angemerkt, dass dieses Bild100 durch Einscannen eines Dokuments erzeugt wurde, das schon Rauschen enthielt. Jedoch ist es auch möglich, dass das Rauschen während des Einscann-Prozesses eingeführt wurde. Es ist auch anzumerken, dass die vorliegende Erfindung auf irgendein digitales Bild angewendet werden kann und nicht auf eingescannte Dokumente begrenzt ist. - Interessante Details
-
2 zeigt verschiedene interessante Details in dem beispielhaften Dokument im Einklang mit einer Ausführungsform der vorliegenden Erfindung. Genauer zeigt2A einen Bereich des Headers101 aus dem beispielhaften Dokument, das in1 gezeigt wird. Drei interessante Details in2A sind das Rausch-Artefakt202 , der Punkt204 und der i-Punkt206 . - Das Auswählen eines anfänglichen Rauschen-Schwellenwerts führt zu einer von mehreren Möglichkeiten. Wenn der Rauschen-Schwellenwert zu fein ist, werden Rausch-Artefakt
202 , Punkt204 und i-Punkt206 entfernt. Wenn der Rauschen-Schwellenwert zu grob ist, bleiben Rausch-Artefakt202 , Punkt204 und i-Punkt206 . Da das Rausch-Artefakt202 größer als einige der regulären Kleckse wie Punkt204 und der i-Punkt206 ist, gibt es keine Einstellung des anfänglichen Schwellenwerts, die den Rausch-Artefakt202 entfernt und den Punkt204 und den -Punkt206 nicht entfernt. Dieses Beispiel verdeutlicht Probleme, die andere Schemata zum Rauschen-Entfernen haben und die von Ausgangsformen der vorliegenden Erfindung gelöst werden durch das Anpassen des Rauschen-Schwellenwertes während des OCR-Prozesses, wie unten in größerem Detail beschrieben wird. -
2B zeigt einen Bereich der Fußnote103 aus dem beispielhaften Dokument, das in1 gezeigt wird. Zwei interessante Details sind das Rauschartefakt208 und der Punkt210 . Wenn ein Rauschen-Schwellenwert-Niveau irgendwo zwischen der Größe des Rausch-Artefakts208 und des Punktes210 gewählt wird, wird das Rausch-Artefakt208 entfernt. Dies kann einfach in einer einzigen Iteration erreicht werden und ohne die Verbesserung, die während des (OCR-) Prozesses auftritt. In diesem Fall endet der Rauschen-Entfernungsprozess ohne weitere Verbesserung des Rauschen-Schwellenwertes und das OCR-System ist fähig, die verbleibenden Kleckse als gültige Schriftzeichen in einer Schriftart, die für das OCR-System erkennbar ist, zu identifizieren. -
2C zeigt einen Bereich des beispielhaften Dokuments, das in1 gezeigt wird. Dieser Bereich umfasst das Rausch-Artefakt212 , das Bild214 und den Text216 . Abhängig von dem Format der Datei und dem Format des Bereichs könnte der Bereich nicht dem Rauschen-Entfernungsprozess unterworfen sein. Die folgende Beschreibung nimmt an, dass der Bereich, der in2C gezeigt wird, im Rauschen-Entfernungsprozess eingeschlossen wird. Wenn der anfängliche Rauschen-Schwellenwert auf ein Niveau gesetzt wird, bei dem das Rausch-Artefakt212 entfernt wird, dann werden viele der Kleckse, die Teil des Bildes214 sind, ebenfalls während des anfänglichen Rauschen-Entfernungsprozesses entfernt. Auf der anderen Seite wird, wenn der anfängliche Rauschen-Schwellenwert auf einem Niveau ist, bei dem das Bild214 nicht verändert wird, der Rausch-Artefakt212 nach dem Durchgang des anfänglichen Entfernens von Rauschen verbleiben. Eine Ausführungsform der vorliegenden Erfindung wählt einen anfänglichen Rauschen-Schwellenwert, der zum Entfernen von Rausch-Artefakten212 führt, aber ohne das Bild214 zu beeinträchtigen oder wählt alternativ einen Schwellenwert, der weder das Rausch-Artefakt212 entfernt noch das Bild214 beeinträchtigt. In der letzteren Situation wird das Rausch-Artefakt212 während nachfolgenden Iterationen des OCR-Prozesses entfernt. - Eine Ausführungsform der vorliegenden Erfindung kann jede Seite eines Dokuments mit vielen Seiten entweder individuell oder zusammen bearbeiten. Es ist anzumerken, dass wenn jede Seite individuell verarbeitet wird, die vorliegende Erfindung statistische Information von vorher verarbeiteten Seiten übertragen kann, um beim Setzen des anfänglichen Rauschen-Schwellenwertes für nachfolgende Seiten zu helfen.
- In einer anderen Ausführungsform der vorliegenden Erfindung werden die Gegenstände, die in
2A ,2B und2C erscheinen, gemeinsam bearbeitet. Wegen der zahlreichen Rausch-Artefakte, die in ihrer Größe ähnlich zu legitimen Klecksen sind, werden die meisten der Rausch-Artefakte während des anfänglichen Rauschen-Entfernungsprozesses erhalten bleiben. Die verbleibenden Rausch-Artefakte werden entfernt werden durch das Anpassen des Rauschen-Schwellenwerts während nachfolgenden iterativen Arbeitsschritten. - Prozess-Übersicht
-
3 zeigt einen Rauschen-Entfernungsprozess in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung. Während dieses Prozesses werden die abgebildeten Dokumente304 ,305 und306 als Eingaben für den Rauschen-Entfernungsprozess316 empfangen. Der Rauschen-Entfernungsprozess316 produziert dann die Ausgabedokumente324 ,325 bzw.326 . Es ist anzumerken, dass Bereiche309 ,310 ,311 und312 , die Text mit Rauschen enthalten, durch den Rau scheu-Entfernungsprozess316 in Bereiche307 ,329 ,330 und331 umgewandelt werden, die Text ohne Rauschen enthalten. Nicht-Text-Bereiche307 und308 in den abgebildeten Bereichen304 ,305 werden nicht durch den Rauschen-Entfernungsprozess316 bearbeitet und verbleiben als Nicht-Text-Bereiche307 und308 in den Ausgabedokumenten324 bzw.325 . - Computer-Umgebung
-
4 zeigt eine Computer-Umgebung400 in Einklang mit einer Ausführungsform der vorliegenden Erfindung. Die Computer-Umgebung400 umfasst einen Client410 und ein Laptop420 . Der Client410 und das Laptop420 sind beide an ein Netzwerk440 angekoppelt. Zusätzlich haben sowohl der Client410 als auch das Laptop420 die Fähigkeit, mit verschiedenen Geräten zu kommunizieren einschließlich eines Druckers430 , eines Scanners450 , eines Handys mit Kamera460 und einer digitalen Kamera470 . - Der Client
410 und das Laptop420 können im Allgemeinen irgendeinen Knoten auf einem Netzwerk einschließen einschließlich der Fähigkeit zum Berechnen und einschließlich eines Kommunikationsmechanismus über das Netzwerk440 . - Der Client
410 und das Laptop420 können im Allgemeinen irgendeine Art von Computersystem umfassen einschließlich, aber nicht darauf begrenzt, eines Computersystems, das auf einem Mikroprozessor basiert, eines Mainframe-Computers, eines digitalen Signalprozessors, eines tragbaren Computergeräts, eines persönlichen Organisierers (Personal Organizer), eines Steuergeräts und einer Berechnungsfunktionseinheit innerhalb eines Geräts. - Der Drucker
430 kann im Allgemeinen irgendeine Art eines Druckers umfassen einschließlich, aber nicht darauf begrenzt, persönlichen Druckern, Netzwerkdruckern und Multifunktionsdruckern, die Kopierer, Scanner und Fax-Maschinen umfassen können. - Scanner
450 können im Allgemeinen irgendeine Art von digitalem Scanner umfassen einschließlich, aber nicht darauf begrenzt, selbstständigen Scanner und Multifunktionsscannern, die Kopierer, Drucker und Fax-Maschinen umfassen können. - Geräte wie der Drucker
430 , der Scanner450 , das Handy mit Kamera460 und die digitale Kamera470 sind fähig, ein Bild eines Dokuments einzufangen oder ein Bild zu erzeugen, welches Text umfassen kann. Jedes dieser Geräte ist fähig, das Bild zu dem Client410 oder dem Laptop420 zu übertragen. In einer Ausführungsform der vorliegenden Erfindung sind sowohl der Client410 als auch das Laptop420 fähig, Rausch-Artefakte, die während des Abbildungsprozesses aufgetreten sein können, unter Verwendung des hier beschriebenen Entfernungsprozesses zu entfernen. - System zum Rauschen-Entfernen
-
5 zeigt ein System zum Entfernen von Rauschen500 in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung. Das System zum Entfernen von Rauschen500 umfasst einen Klecks-Identifizierer502 , einen Klecks-Analysierer504 , einen Rauschen-Entferner506 , einen Rauschen-Wiederhersteller508 , ein OCR-System510 und einen Speicher520 . Der Speicher520 umfasst den Dokument-Speicher522 (der eine Kopie der Bild-Dateien speichert), einen Rauschen-Speicher524 , einen statistischen Speicher526 und Systemeinstellungen528 . - Der Klecks-Identifizierer
502 wird verwendet, um Kleckse innerhalb eines abgebildeten Dokuments zu identifizieren. Sobald die Kleckse identifiziert werden, analysiert der Klecks-Analysierer504 die Kleckse, um den Rauschen-Schwellenwert zu bestimmen. Der Klecks-Analysierer504 bestimmt den Rauschen-Schwellenwert auf der Grundlage von vielen Faktoren einschließlich, aber nicht darauf begrenzt, der Anzahl von Klecksen, der Verteilung von Klecksen, der Dichte der Kleckse in verschiedenen Bereichen, der Dichte von Klecksen ver schiedener Größen in verschiedenen Bereichen, der Lage der Kleckse, der Ausrichtung der Kleckse und der Farbe der Kleckse. Sobald die Analyse der Kleckse vollständig ist, wird die resultierende statistische Information im statistischen Speicher526 gespeichert. Diese statistische Information kann nachfolgend dazu benutzt werden, um: die Systemeinstellungen weiter zu verfeinern; den Rauschen-Schwellenwert zu verfeinern; und den Rauschen-Entfernungsprozess für zusätzliche Bereiche des abgebildeten Dokuments und zusätzliche abgebildete Dokumente zu verfeinern. - Der Rauschen-Entferner
506 entfernt alle Kleckse, die als Rausch-Artefakte angesehen werden, auf der Grundlage des Rauschen-Schwellenwertes, der durch den Klecks-Analysierer504 bestimmt wurde. Die entfernten Kleckse werden in dem Rauschen-Speicher524 gespeichert für den Fall, dass der Rauschen-Schwellenwert geändert wird, so dass einige der entfernten Kleckse wiederhergestellt werden müssen. Wenn dies erfolgt, stellt der Rauschen-Wiederhersteller508 einige oder alle der entfernten Kleckse wieder her. Das System kann durch Betrachten der Größe des Kleckses oder der Lage des Kleckses bestimmen, welche Kleckse wiederhergestellt werden sollen. - Das OCR-System
510 führt den OCR-Prozess durch, nachdem der anfängliche Rauschen-Entfernungsprozess abgeschlossen worden ist. Während dieses OCR-Prozesses wird das Entfernen des Rauschens weiter verbessert durch das Feineinstellen des Rauschen-Schwellenwertes, wie es unten in größerem Detail beschrieben wird. - Die Systemeinstellungen
528 enthalten Systemeinstellungen für den Rauschen-Entfernungsprozess. In einer Ausführungsform der vorliegenden Erfindung umfassen diese Einstellungen, aber sind nicht darauf begrenzt: eine Beschreibung der Information, die analysiert werden soll; einen Qualitätswert für den Rauschen-Entfernungsprozess; einen Indikator, der definiert, wann der Rauschen-Entfernungsprozess beendet werden soll; ein Flag, das anzeigt, ob irgendwelche Information auf die nächste Aufgabe zum Rauschen-Entfernen übertragen werden soll; Identifizierer für Schlüssel-Schriftzeichen; und einen Indikator, der bestimmt, ob der Prozess auf einer Datei, einer Seite oder einem Bereich einer Seite durchgeführt wird. Es ist anzumerken, dass die Qualität des Rauschen-Entfernungsprozesses in umgekehrter Beziehung zu der Geschwindigkeit des Rauschen-Entfernungsprozesses steht. Zusätzlich besteht eine direkte Beziehung zwischen der Qualität des Rauschen-Entfernungsprozesses mit der Speichergröße, die für den Rauschen-Entfernungsprozess verfügbar ist. - OCR-System
-
6 zeigt ein System zur optischen Zeichenerkennung (OCR)600 im Einklang mit einer Ausführungsform der vorliegenden Erfindung. Das OCR-System600 umfasst einen Text-Finder602 , einen Text-Analysierer604 und einen Kalibrator606 für den Rauschen-Schwellenwert. Der Text-Finder602 identifiziert Text-Bereiche innerhalb des abgebildeten Dokuments. Techniken zum Identifizieren von Text-Bereichen innerhalb von Dokumenten sind dem Fachmann wohlbekannt und werden hier nicht weiter beschrieben werden. - Sobald die Text-Bereiche identifiziert worden sind, analysiert der Text-Analysierer
604 die Text-Bereiche, um sowohl die Größe des Textes zu bestimmen als auch Schlüssel-Schriftzeichen innerhalb des Textes zu identifizieren. - Die Schlüssel-Schriftzeichen werden dann durch den Text-Analysierer
604 analysiert, um ihre Größe zu bestimmen (zum Beispiel als Anzahl von Pixeln). Wie oben erwähnt wurde, sind die Schlüssel-Schriftzeichen kleine Schriftzeichen (oder Teile von Schriftzeichen), die verwendet werden, um Schriftzeichen vom Rauschen zu unterscheiden. Die Schlüssel-Schriftzeichen können von Schriftart zu Schriftart variieren, aber umfassen im Allgemeinen Punkte, i-Punkte, Kommas, Auslassungspunkte und andere Schriftzeichen (oder Teile von Schriftzeichen), die kleiner als die anderen Schriftzeichen in der Schriftart sind. Die Information, die durch den Text-Analysierer604 bestimmt wird (einschließlich zum Beispiel eines Rauschen-Schwellenwertes), wird im statistischen Speicher526 abgespeichert. - Diese Information kann während nachfolgender Iterationen oder für andere Rauschentfernungsaufgaben verwendet werden. Wie unten beschrieben, wird die Ausgabe des Text-Analysierers
604 verwendet, um den Rauschen-Schwellenwert zu verfeinern. - Der Rauschen-Schwellenwert-Kalibrator
606 passt den Rauschen-Schwellenwert an. Wenn der Rauschen-Schwellenwert dahingehend bestimmt wird, dass er sich außerhalb des Toleranzbereiches, der in den Systemeinstellungen528 spezifiziert ist, verändert hat, dann wird ein zusätzlicher Rauschentfernungsarbeitsschritt durchgeführt. Dieser zusätzliche Rauschentfernungsarbeitsschritt kann das Wiederherstellen von einigen oder allen vorher entfernten Klecksen beinhalten, wenn der Rauschen-Schwellenwert abgenommen hat. - Rauschentfernungsprozess
-
7 zeigt ein Flussdiagramm, das den Rauschentfernungsprozess in Übereinstimmung mit einer Ausführungsform der vorliegenden Erfindung zeigt. Der Prozess beginnt durch das Identifizieren von Klecksen in dem Bild (Schritt702 ). Als Nächstes analysiert das System die Kleckse (Schritt704 ) und speichert die resultierende Information im statistischen Speicher526 . Diese resultierende Information kann umfassen: durchschnittliche Klecksgröße, Information über Klecksdichte, Klecksfarbe und irgendeine andere Information, die nützlich zum Bestimmen eines Rauschen-Entfernungs-Schwellenwertes ist. - Unter Verwendung der Resultate aus Schritt
704 bestimmt das System den Rauschen-Schwellenwert (Schritt706 ). In einer Ausführungsform der vorliegenden Erfindung ist der Rauschen-Schwellenwert ein Bruchteil der durchschnittlichen Klecksgröße bei Schlüssel-Schriftzeichen in dem Bild. Der Rauschen-Schwellenwert kann sich auch über verschiedene Bereiche einer gegebenen Seite unterscheiden. Zum Beispiel kann in einer Ausführungsform, wenn die oberen 33% der Seite eine durchschnittliche Klecksgröße für Schlüssel-Schriftzeichen von 15 Pixel hat, der Rauschen-Schwellenwert für die oberen 33% der Seite auf 5 Pixel gesetzt werden. Wenn jedoch die unteren 66% der Seite eine durchschnittliche Klecksgröße für Schlüssel-Schriftzeichen von 45 Pixel hat, kann der Rauschen-Schwellenwert für die unteren 66% der Seite auf 15 Pixel gesetzt werden. Andere Faktoren zusätzlich zur Klecksgröße können verwendet werden, um den Rauschen-Schwellenwert zu bestimmen. Wenn zum Beispiel die Systemeinstellungen528 anzeigen, dass das Bild streng einfarbig ist, aber während des Abbildungsprozesses ein roter Artefakt in das Dokument eingeführt wurde, kann das System den roten Artefakt als Rauschen identifizieren und ihn aus dem Bild entfernen. - Nachdem der Rauschen-Schwellenwert festgelegt worden ist, entfernt das System alle Kleckse, die weniger Pixel als der Rauschen-Schwellenwert haben (Schritt
708 ). Schließlich beginnt das System den OCR-Prozess (Schritt710 ). - OCR-Prozess
- Der vorangegangene Abschnitt beschreibt einen schnellen und flexiblen Rauschen-Entfernungsprozess, der angepasst werden kann, um den Bedürfnissen des Benutzers zu entsprechen. In einer Ausführungsform der vorliegenden Erfindung wird der Prozess bei Schritt
712 abgeschlossen. - In einer anderen Ausführungsform der vorliegenden Erfindung wird der Rauschen-Entfernungsprozess während des OCR-Prozesses verfeinert. Diese Verfeinerung erzeugt ein Resultat höherer Qualität als die vorher beschriebene Ausführungsform.
-
8 zeigt ein Flussdiagramm, das den OCR-Prozess darstellt, der eine Verbesserung bezüglich des Rauschentfernungsprozesses umfasst. in Einklang mit einer Ausführungsform der vorliegenden Erfindung. Während dieses Prozesses identifiziert das System zuerst Text-Bereiche innerhalb des abgebildeten Dokuments (Schritt802 ). Es wird angemerkt, dass in einer Ausführungsform Text, welcher Teil von einer Figur oder einem Bild ist, typischerweise in diesem Schritt und bei allen zukünftigen Schritten des OCR-Prozesses ignoriert wird. - Sobald die Text-Bereiche identifiziert werden, werden die Text-Bereiche analysiert (Schritt
804 ). Diese Analyse kann zum Beispiel das Bestimmen der Textgröße, das Identifizieren von Schlüssel-Schriftzeichen und das Identifizieren der Schriftart, die für den Text verwendet wird, umfassen. Als Nächstes bewertet das System den Rauschen-Schwellenwert für das Bild neu auf der Grundlage der Resultate der Analyse (Schritt806 ). - Das System bestimmt dann, ob sich der Rauschen-Schwellenwert geändert hat (Schritt
808 ). Wenn nicht, schließt das System den OCR-Prozess ab (Schritt820 ). Wenn sich der Rauschen-Schwellenwert geändert hat, bestimmt das System, ob der neue Rauschen-Schwellenwert kleiner als der vorangegangene Rauschen-Schwellenwert ist (Schritt810 ). Wenn ja, werden früher entfernte Kleckse, die größer als der neue Rauschen-Schwellenwert sind, aber kleiner als der anfängliche Rauschen-Schwellenwert, wiederhergestellt. - In einer Ausführungsform der vorliegenden Erfindung wird ein im Voraus spezifiziertes „Toleranzniveau" auch verwendet, um zu bestimmen, ob ein entfernter Klecks wiederhergestellt werden soll. Zum Beispiel wird bei einem Toleranzniveau von zwei Pixeln, wenn der alte Rauschen-Schwellenwert zwölf Pixel war und der neue Rauschen-Schwellenwert acht Pixel ist, ein Klecks Von neun Pixeln nicht wieder hergestellt werden. Das Toleranzniveau kann durch die Systemeinstellungen
528 angezeigt werden. - Nachdem die entfernten Kleckse wiederhergestellt worden sind (oder wenn der neue Rauschen-Schwellenwert nicht kleiner als der frühere Rauschen-Schwellenwert in Schritt
810 ist), wiederholt das System den Rauschen-Entfernungsprozess unter Verwendung des neuen Rauschen-Schwellenwertes (Schritt814 ). - Als Nächstes bestimmt das System, ob der neue Rauschen-Schwellenwert befriedigend ist (Schritt
816 ). Diese Bestimmung kann auf Folgendem basiert werden: ob irgendwelche Kleckse entfernt worden sind; wie viele Kleckse entfernt worden sind; wie viele Male der Rauschen-Schwellenwert angepasst worden ist; oder in welcher Richtung der Rauschen-Schwellenwert angepasst worden ist. Wenn der neue Rauschen-Schwellenwert befriedigend ist, schließt das System den OCR-Prozess ab (Schritt820 ). Auf der anderen Seite, wenn der neue Rauschen-Schwellenwert nicht befriedigend ist, wird der Rauschen-Entfernungsprozess wiederholt durch Zurückgehen zu Schritt802 . - In einer Ausführungsform der vorliegenden Erfindung verfeinert das System den Rauschen-Entfernungsprozess durch Anpassen der Systemeinstellungen
528 , bevor es zu Schritt802 zurückkehrt. Das kann das Anpassen von Folgendem umfassen: die Information, die analysiert werden soll; die Qualität des Rauschen-Entfernungsprozesses; wann der Rauschen-Entfernungsprozess beendet wird; ob irgendwelche Information auf die nächste Rauschentfernungsaufgabe übertragen wird; welche Schriftzeichen Schlüssel-Schriftzeichen sind; und ob der Prozess auf einem Dokument, einer Seite oder einem Bereich einer Seite ausgeführt wird. - Die vorangegangenen Beschreibungen von Ausführungsformen der vorliegenden Erfindung sind nur für Zwecke der Veranschaulichung und Beschreibung gegeben worden. Sie sind nicht beabsichtigt, ausschöpfend zu sein oder die vorliegende Erfindung auf die offenbarten Ausführungsformen zu begrenzen. Demgemäß werden viele Abwandlungen und Variationen Fachleuten offensichtlich sein. Außerdem ist die obige Offenbarung nicht beabsichtigt, die vorliegende Erfindung zu begrenzen. Der Umfang der vorliegenden Erfindung wird durch die angehängten Patentansprüche bestimmt.
- ZUSAMMENFASSUNG
- Eine Ausführungsform der vorliegenden Erfindung stellt ein System bereit, das Rauschen aus einem Bild entfernt. Während des Betriebs identifiziert das System zuerst Kleckse in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt. Als Nächstes analysiert das System die Kleckse, um einen „Rausch-Schwellenwert" für die Kleckse dynamisch zu bestimmen. Das System entfernt dann Kleckse aus dem Bild, die unterhalb des Rausch-Schwellenwertes sind.
Claims (21)
- Ein Verfahren zum Entfernen von Rauschen aus einem Bild, umfassend: Empfangen des Bildes; Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt; Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und Entfernen von Klecksen, die kleiner als der Rauschen-Schwellenwert sind, aus dem Bild.
- Das Verfahren nach Anspruch 1, wobei das Bestimmen des Rauschen-Schwellenwertes umfasst: Identifizieren eines Textbereiches in dem Bild; Identifizieren von Schlüssel-Schriftzeichen innerhalb der Textbereiche; Berechnen der durchschnittlichen Größe der identifizierten Schlüssel-Schriftzeichen; und Berechnen des Rauschen-Schwellenwertes als ein Bruchteil der durchschnittlichen Größe eines Schlüssel-Schriftzeichens.
- Das Verfahren nach Anspruch 2, wobei das Verfahren zum Entfernen von Rauschen aus dem Bild wiederholt wird. wenn der bestimmte Rauschen-Schwellenwert verschieden von einem höheren Rauschen-Schwellenwert ist.
- Das Verfahren nach Anspruch 3, wobei das Verfahren, wenn der bestimmte Rauschen-Schwellenwert bezüglich des früheren Rauschen- Schwellenwertes verringert ist, weiterhin das Wiederherstellen der früher entfernten Kleckse umfasst, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert.
- Das Verfahren nach Anspruch 1, wobei vor dem Analysieren der Kleckse das Verfahren das Durchführen eines anfänglichen Rauschentfernungsarbeitsschrittes umfasst, in dem Kleckse aus dem Bild entfernt werden, die unterhalb eines anfänglichen Rauschen-Schwellenwertes sind.
- Das Verfahren nach Anspruch 1, wobei das Analysieren der Kleckse das Analysieren von ein oder mehr des Folgenden umfasst: eine Größenverteilung der Kleckse; eine Anzahl der Kleckse; Lagen der Kleckse; eine Dichte der Kleckse innerhalb des Bildes oder des Bildbereichs; und Farben der Kleckse.
- Das Verfahren nach Anspruch 1, wobei ein Rauschen-Schwellenwert unabhängig für jeden Textbereich einer Mehrzahl von identifizierten Textbereichen bestimmt wird.
- Ein computerlesbares Speichermedium, das Anweisungen speichert, die bewirken, dass, wenn sie durch einen Computer ausgeführt werden, der Computer ein Verfahren zum Entfernen von Rauschen aus einem Bild durchführt, wobei das Verfahren umfasst: Empfangen des Bildes; Identifizieren von Klecksen in dem Bild, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder ein Teil eines Schriftzeichens in dem Bild darstellen; Analysieren der Kleckse, um einen Rauschen-Schwellenwert zu bestimmen, wobei die Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und Entfernen von Klecksen, die kleiner sind als der Rauschen-Schwellenwert, aus dem Bild.
- Das computerlesbare Medium nach Anspruch 8, wobei das Bestimmen des Rauschen-Schwellenwertes umfasst: Identifizieren eines Textbereiches in dem Bild; Identifizieren von Schlüssel-Schriftzeichen innerhalb der Textbereiche; das Berechnen der durchschnittlichen Größe der identifizierten Schlüssel-Schriftzeichen; und das Berechnen des Rauschen-Schwellenwertes als ein Bruchteil der durchschnittlichen Größe eines Schlüssel-Schriftzeichens.
- Das computerlesbare Speichermedium nach Anspruch 9, wobei das Verfahren zum Entfernen von Rauschen aus dem Bild wiederholt wird, wenn der bestimmte Rauschen-Schwellenwert verschieden von einem früheren Rauschen-Schwellenwert ist.
- Das computerlesbare Speichermedium nach Anspruch 10, wobei das Verfahren, wenn der bestimmte Rauschen-Schwellenwert gegenüber dem früheren Rauschen-Schwellenwert verringert ist, weiterhin das Wiederherstellen von früher entfernten Klecksen umfasst, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert.
- Das computerlesbare Speichermedium nach Anspruch 8, wobei vor dem Analysieren der Kleckse das Verfahren das Durchführen eines anfänglichen Rausch-Entfernungsarbeitsschrittes umfasst. indem Kleckse aus dem Bild entfernt werden, die unterhalb eines anfänglichen Rauschen-Schwellenwertes sind.
- Das computerlesbare Speichermedium nach Anspruch 8, wobei das Analysieren der Kleckse das Analysieren von ein oder mehr des Folgenden umfasst: eine Größenverteilung der Kleckse; eine Anzahl der Kleckse; die Lagen der Kleckse; eine Dichte der Kleckse innerhalb des Bildes oder des Bildbereiches; und die Farben der Kleckse.
- Das computerlesbare Speichermedium nach Anspruch 1, wobei ein Rauschen-Schwellenwert unabhängig für jeden Text-Bereich einer Mehrzahl von identifizierten Text-Bereichen bestimmt wird.
- Eine Vorrichtung, die Rauschen aus einem Bild entfernt, umfassend: einen Mechanismus zur Klecks-Identifikation, der konfiguriert ist, um Kleckse in dem Bild zu identifizieren, wobei ein Klecks eine Menge von benachbarten Pixeln ist, die möglicherweise ein Schriftzeichen oder einen Teil eines Schriftzeichens in dem Bild darstellt; einen Mechanismus zum Bestimmen eines Schwellenwertes, der konfiguriert ist, um die Kleckse zu analysieren zur Bestimmung eines Rauschen-Schwellenwertes, wobei Kleckse, die kleiner als der Rauschen-Schwellenwert sind, wahrscheinlich Rauschen sind; und einen Mechanismus zum Entfernen von Klecksen, der konfiguriert ist, um Kleckse aus dem Bild zu entfernen, die kleiner als der Rauschen-Schwellenwert sind.
- Die Vorrichtung nach Anspruch 15, wobei der Mechanismus zur Bestimmung eines Schwellenwertes konfiguriert ist, um: einen Text-Bereich in dem Bild zu identifizieren; Schlüssel-Schriftzeichen innerhalb der Text-Bereiche zu identifizieren; die durchschnittliche Größe der identifizierten Schlüssel-Schriftzeichen zu berechnen; und den Rauschen-Schwellenwert als einen Bruchteil der durchschnittlichen Größe eines Schlüssel-Schriftzeichens zu berechnen.
- Das Verfahren nach Anspruch 16, wobei die Vorrichtung konfiguriert ist, den Rauschen-Entfernungsprozess zu wiederholen, wenn der bestimmte Rauschen-Schwellenwert verschieden von einem früheren Rauschen-Schwellenwert ist.
- Das Verfahren nach Anspruch 17, weiterhin umfassend einen Mechanismus zum Wiederherstellen von Klecksen, wobei der Mechanismus zum Wiederherstellen von Klecksen konfiguriert ist, früher entfernte Kleckse wiederherzustellen, die kleiner sind als der frühere Rauschen-Schwellenwert, aber größer als der bestimmte Rauschen-Schwellenwert, wenn der bestimmte Rauschen-Schwellenwert bezüglich des früheren Rauschen-Schwellenwertes definiert ist.
- Die Vorrichtung nach Anspruch 15, weiterhin umfassend einen anfänglichen Rausch-Entfernungsmechanismus, der konfiguriert ist, einen anfänglichen Rausch-Entfernungsarbeitsschritt durchzuführen, indem Kleckse aus dem Bild entfernt werden, die unterhalb eines anfänglichen Rauschen-Schwellenwertes sind.
- Die Vorrichtung nach Anspruch 15, wobei beim Analysieren der Kleckse der Mechanismus zum Bestimmen eines Schwellenwertes konfiguriert ist, um ein oder mehr des Folgenden zu analysieren: eine Größenverteilung der Kleckse; eine Anzahl der Kleckse; die Lagen der Kleckse; eine Dichte der Kleckse innerhalb des Bildes oder Bildbereichs; und die Farben der Kleckse.
- Die Vorrichtung nach Anspruch 15, wobei der Mechanismus zum Bestimmen des Schwellenwertes konfiguriert ist, um einen Rauschen-Schwellenwert unabhängig für jeden Text-Bereich einer Mehrzahl von identifizierten Text-Bereichen zu bestimmen.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/291,552 US7660483B2 (en) | 2005-11-30 | 2005-11-30 | Method and apparatus for removing noise from a digital image |
US11/291,552 | 2005-11-30 | ||
PCT/US2006/061294 WO2007065087A1 (en) | 2005-11-30 | 2006-11-28 | Method and apparatus for removing noise from a digital image |
Publications (2)
Publication Number | Publication Date |
---|---|
DE112006003272T5 true DE112006003272T5 (de) | 2008-10-23 |
DE112006003272B4 DE112006003272B4 (de) | 2022-08-18 |
Family
ID=37891666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE112006003272.0T Active DE112006003272B4 (de) | 2005-11-30 | 2006-11-28 | Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild |
Country Status (4)
Country | Link |
---|---|
US (2) | US7660483B2 (de) |
CN (1) | CN101322154B (de) |
DE (1) | DE112006003272B4 (de) |
WO (1) | WO2007065087A1 (de) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090086275A1 (en) * | 2007-09-28 | 2009-04-02 | Jian Liang | Processing a digital image of content |
US8548267B1 (en) * | 2007-09-28 | 2013-10-01 | Amazon Technologies, Inc. | Processing a digital image of content using content aware despeckling |
US8731297B1 (en) | 2007-09-28 | 2014-05-20 | Amazon Technologies, Inc. | Processing a digital image of content to remove border artifacts |
US8838489B2 (en) | 2007-12-27 | 2014-09-16 | Amazon Technologies, Inc. | On-demand generating E-book content with advertising |
US9858604B2 (en) | 2010-09-24 | 2018-01-02 | Amazon Technologies, Inc. | Vendor interface for item delivery via 3D manufacturing on demand |
US8412588B1 (en) | 2010-09-24 | 2013-04-02 | Amazon Technologies, Inc. | Systems and methods for fabricating products on demand |
US9898776B2 (en) | 2010-09-24 | 2018-02-20 | Amazon Technologies, Inc. | Providing services related to item delivery via 3D manufacturing on demand |
US9672550B2 (en) | 2010-09-24 | 2017-06-06 | Amazon Technologies, Inc. | Fulfillment of orders for items using 3D manufacturing on demand |
US9684919B2 (en) | 2010-09-24 | 2017-06-20 | Amazon Technologies, Inc. | Item delivery using 3D manufacturing on demand |
CN102413338B (zh) * | 2011-11-21 | 2014-04-30 | 晶门科技(深圳)有限公司 | 点状噪声的图像处理方法及装置 |
CN103454282A (zh) * | 2013-08-30 | 2013-12-18 | 陕西科技大学 | 一种基于图像灰度梯度的印刷品墨斑测量方法 |
US9986387B2 (en) * | 2015-11-24 | 2018-05-29 | Fortinet, Inc. | Associating position information collected by a mobile device with a managed network appliance |
RU2634195C1 (ru) * | 2016-12-06 | 2017-10-24 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) |
US10949957B2 (en) | 2018-01-04 | 2021-03-16 | Gingy Technology Inc. | Biometric image processing method and electronic device thereof |
US10832046B1 (en) * | 2018-10-23 | 2020-11-10 | Architecture Technology Corporation | Systems and methods for processing document images |
US10997463B2 (en) * | 2018-11-08 | 2021-05-04 | Adobe Inc. | Training text recognition systems |
CN111209912A (zh) * | 2020-01-13 | 2020-05-29 | 昆明理工大学 | 一种中文文字图片长干扰线去除方法 |
US11330145B1 (en) * | 2021-06-10 | 2022-05-10 | Bank Of America Corporation | Image processing edge device for document noise removal |
JP2023030811A (ja) * | 2021-08-24 | 2023-03-08 | キヤノン株式会社 | 情報処理装置、抽出処理装置、画像処理システム、情報処理装置の制御方法、及びプログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63250787A (ja) | 1987-04-08 | 1988-10-18 | Fuji Electric Co Ltd | 文字切出し方法 |
US4888812A (en) * | 1987-12-18 | 1989-12-19 | International Business Machines Corporation | Document image processing system |
US5195147A (en) * | 1989-05-02 | 1993-03-16 | Ricoh Company, Ltd. | Image forming apparatus |
US5457754A (en) * | 1990-08-02 | 1995-10-10 | University Of Cincinnati | Method for automatic contour extraction of a cardiac image |
US5337373A (en) * | 1991-10-24 | 1994-08-09 | International Business Machines Corporation | Automatic threshold generation technique |
US5542006A (en) * | 1994-06-21 | 1996-07-30 | Eastman Kodak Company | Neural network based character position detector for use in optical character recognition |
JP3027321B2 (ja) * | 1994-09-27 | 2000-04-04 | 財団法人工業技術研究院 | 拘束のない手書き英数字のオンライン認識の方法及び装置 |
US5471434A (en) * | 1994-10-18 | 1995-11-28 | The United States Of America As Represented By The Secretary Of The Navy | System and method for rapidly tracking vehicles of special utility in low signal-to-noise environments |
DE19517178C1 (de) | 1995-05-09 | 1996-11-21 | Ibm | Hintergrundbereinigung bei elektronisch abgetasteten Bildern |
DE19536170A1 (de) | 1995-09-29 | 1997-04-03 | Ibm | Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen |
EP1056038A3 (de) | 1999-05-28 | 2002-05-08 | Computer Gesellschaft Konstanz Mbh | Verfahren zur Aufbereitung von aus Zeichen und Zeichenfolgen generierten Bitmustern für die optische Zeichenerkennung |
US7225082B1 (en) | 1999-10-01 | 2007-05-29 | Oxonica, Inc. | Colloidal rod particles as nanobar codes |
US6728401B1 (en) * | 2000-08-17 | 2004-04-27 | Viewahead Technology | Red-eye removal using color image processing |
CN1419680A (zh) * | 2001-01-26 | 2003-05-21 | 皇家菲利浦电子有限公司 | 时空滤波器单元以及包括这种时空滤波器单元的图像显示设备 |
US7031548B2 (en) * | 2001-10-04 | 2006-04-18 | Hewlett-Packard Development Company, L.P. | Method and apparatus for filtering noise from a digital image |
DE10329339B4 (de) | 2003-06-30 | 2007-04-26 | OCé PRINTING SYSTEMS GMBH | Verfahren und Vorrichtung zum Aufbereiten einer Bildpunktdatei |
US7668376B2 (en) * | 2004-06-30 | 2010-02-23 | National Instruments Corporation | Shape feature extraction and classification |
WO2008060257A2 (en) * | 2005-05-25 | 2008-05-22 | Lau Daniel L | Projectile tracking system |
US7689016B2 (en) * | 2005-05-27 | 2010-03-30 | Stoecker & Associates, A Subsidiary Of The Dermatology Center, Llc | Automatic detection of critical dermoscopy features for malignant melanoma diagnosis |
US20070083114A1 (en) * | 2005-08-26 | 2007-04-12 | The University Of Connecticut | Systems and methods for image resolution enhancement |
KR100647402B1 (ko) * | 2005-11-01 | 2006-11-23 | 매그나칩 반도체 유한회사 | 이미지 센서의 화질개선장치 및 그 방법 |
-
2005
- 2005-11-30 US US11/291,552 patent/US7660483B2/en active Active
-
2006
- 2006-11-28 CN CN2006800450420A patent/CN101322154B/zh active Active
- 2006-11-28 DE DE112006003272.0T patent/DE112006003272B4/de active Active
- 2006-11-28 WO PCT/US2006/061294 patent/WO2007065087A1/en active Application Filing
-
2009
- 2009-12-28 US US12/648,250 patent/US8064721B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN101322154B (zh) | 2011-02-16 |
US7660483B2 (en) | 2010-02-09 |
DE112006003272B4 (de) | 2022-08-18 |
US20100166307A1 (en) | 2010-07-01 |
US20090022397A1 (en) | 2009-01-22 |
WO2007065087A1 (en) | 2007-06-07 |
US8064721B2 (en) | 2011-11-22 |
CN101322154A (zh) | 2008-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112006003272T5 (de) | Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild | |
DE69713941T2 (de) | Bildverarbeitungssystem | |
DE69822545T2 (de) | Bildverbesserung unter Benutzung einer Flächeninterpolation | |
DE60118240T2 (de) | Methode zur bildanalyse | |
EP1310912B1 (de) | Bildverarbeitungsverfahren, -vorrichtung und -system | |
DE69226846T2 (de) | Verfahren zur Bestimmung von Wortgrenzen im Text | |
DE69520411T2 (de) | Iterative Kompression digitaler Bilder | |
DE69230629T2 (de) | Verfahren und Vorrichtung zur Bildverbesserung | |
DE69826044T2 (de) | Vektorkartenplanarisierung und -einfang | |
DE60111816T2 (de) | Adaptives Filterverfahren und -vorrichtung zur Entrasterung abgetasteter Halbtonbilddaten | |
DE102007035884B4 (de) | Linienrauschunterdrückungsvorrichtung, -verfahren und -programm | |
DE69712694T2 (de) | Segmentierung und Hintergrundunterdrückung in JPEG-komprimierten Bildern mit Anwendung von Kodierungskostendaten | |
DE19530829C2 (de) | Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Information | |
DE60020038T2 (de) | Verfahren zum Verarbeiten eines numerischen Bildes | |
DE10308014A1 (de) | System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt | |
DE112020006492T5 (de) | Verfahren zum Erzeugen eines Quick-Response-Codes und Druckvorrichtung | |
DE19956158A1 (de) | Bild-Binärisierungsverfahren auf Bereichsbasis | |
DE69706802T2 (de) | System und Verfahren zur Feststellung von weissen und schwarzen Punkte eines Farbbildes | |
DE60033479T2 (de) | Bilderzeugungssystem und -verfahren | |
DE102005044133A1 (de) | Bilderzeugungssystem und -verfahren einer optimalen Auflösung | |
DE69508941T2 (de) | Automatische feststellung von leerseiten und grenzlinien für zweitonbilder | |
JP2004336282A (ja) | 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体 | |
DE102006047436B4 (de) | Verfahren und System zum automatischen Aufbereiten von Druckdaten für einen Druckvorgang | |
DE602004005647T2 (de) | Bildverarbeitungsverfahren und Vorrichtung zur Änderung der Bildgrösse | |
DE10352395A1 (de) | Speicherverwaltung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8125 | Change of the main classification |
Ipc: G06K 9/40 AFI20061128BHDE |
|
R016 | Response to examination communication | ||
R082 | Change of representative |
Representative=s name: MUELLER-BORE & PARTNER PATENTANWAELTE PARTG MB, DE |
|
R016 | Response to examination communication | ||
R081 | Change of applicant/patentee |
Owner name: ADOBE INC., SAN JOSE, US Free format text: FORMER OWNER: ADOBE SYSTEMS, INC., SAN JOSE, CALIF., US |
|
R082 | Change of representative |
Representative=s name: MUELLER-BORE & PARTNER PATENTANWAELTE PARTG MB, DE |
|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06K0009400000 Ipc: G06V0030164000 |
|
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final |