DE60308739T2 - Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik - Google Patents

Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik Download PDF

Info

Publication number
DE60308739T2
DE60308739T2 DE60308739T DE60308739T DE60308739T2 DE 60308739 T2 DE60308739 T2 DE 60308739T2 DE 60308739 T DE60308739 T DE 60308739T DE 60308739 T DE60308739 T DE 60308739T DE 60308739 T2 DE60308739 T2 DE 60308739T2
Authority
DE
Germany
Prior art keywords
image
noise
binary
threshold
index value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60308739T
Other languages
English (en)
Other versions
DE60308739D1 (de
Inventor
c/o Eastman Kodak Company Yongchun Rochester Lee
c/o Eastman Kodak Company George O. Rochester Simmons
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of DE60308739D1 publication Critical patent/DE60308739D1/de
Application granted granted Critical
Publication of DE60308739T2 publication Critical patent/DE60308739T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und ein System zur Automatisierung der Bildqualitätsprüfung und -korrektur für gescannte Dokumente, wofür bislang ein Bediener notwendig war. Das Verfahren und das System für jedes gescannte und schwellenwertverarbeitete Bild führt eine automatische Bewertung mithilfe eines binären Bildqualitätserkennungssystems durch, das einen Bildrauschindex erzeugt, der die Menge der Bildartefakte oder des Bildverlusts anzeigt. Wenn eine in schlechter Qualität gescannte Seite erkannt wird, die beispielsweise zuviel Specklerauschen enthält, wird das Graustufenbild abgerufen oder das Bild als Graustufenbild neu gescannt. Das Graustufenbild wird dann automatisch einem Bildqualitätskorrekturprozess unterzogen, um ein sauberes, lesbares Binärbild zu erzeugen.
  • In einer Abtastproduktionsumgebung wird die digitale Ausgabe eines gescannten Papierdokuments wegen der größeren Effizienz bei der Speicherung und Übertragung häufig in binärer (schwarzweißer) Form dargestellt und gespeichert, insbesondere bei Textbildern. Die Erfassung eines Binärbildes setzt voraus, dass in einem Scanner ein Bildschwellenwertprozess installiert ist, der die von einem CCD-Sensor erfassten digitalen Graustufensignale (normalerweise 8 Bit je Pixel) in Binärsignale (1 Bit je Pixel) umsetzt. Da ein Bildschwellenwertprozess ein Bilddatenreduktionsprozess ist, führt dieser Prozess häufig zu unerwünschten Bildartefakten oder Bildinformationsverlusten, wie Specklerauschen im Dokumenthintergrund oder Verlust kontrastschwacher Zeichen. In der Technik sind bislang zahlreiche adaptive Schwellenwerttechniken bekannt, beispielsweise wie in US-A-5,583,659 und in DE 195 36 170 A beschrieben, um ein Binärbild in optimaler Qualität zu erstellen. Aufgrund von Abweichungen im Papierhintergrund und -inhalt wurde bislang aber noch keine adaptive Schwellenwerttechnik gefunden, die automatisch ein sauberes, lesbares Binärbild für jedes erfasste Graustufenbild in einem Stapel aus Papierdokumenten erzeugt. US-A-5,915,037 erzeugt ein optimales Binärbild durch Analyse mehrerer Binärbilder, die mittels adaptiver Schwellenwertverfahren unter Änderung der Schwellenwertempfindlichkeiten abgeleitet wurden. Das Verfahren bedarf jedoch der Auswahl eines Bereichs von Interesse. Der Bereich von Interesse muss Text- und Hintergrundrauschen enthalten. Das Merkmal (S) – das Verhältnis von Schwarzpixelzahl zu Übergangspixelzahl, welches in der Technik bisher verwendet wird, ist nicht zur Ermittlung optimaler Binärbilder bei fehlendem Text- oder Hintergrundrauschen in dem ausgewählten Bereich von Interesse geeignet. Zudem ist es nicht zur Bewertung der Bildqualität in der Lage, beispielsweise der Rauschmenge. Unter Berücksichtigung dieser Einschränkungen ist die bisherige Technik nur auf bestimmte Domänen in einem Dokumentbild anwendbar. Daher bedarf es beim Dokumentscannen in der Produktion häufig aufwändiger Arbeiten in Form einer visuellen Bildqualitätsuntersuchung, um zu gewährleisten, dass jedes erfasste Binärbild lesbar ist.
  • Es besteht Bedarf nach einem verbesserten Abtastsystem und -verfahren, das ein sauberes, lesbares Binärbild oder einen Text oder ähnliches zu erzeugen vermag, ohne dass eine visuelle Bildprüfung erforderlich wäre. Idealerweise sollte ein derartiges System und Verfahren ausreichend kompatibel mit derzeit verfügbaren Abtastkomponenten sein, um die Verwendung des Systems auf derzeit gebräuchlichen Scannern zu ermöglichen und die Notwendigkeit zur Konstruktion und Fertigung neuer Komponenten zu minimieren.
  • Die Erfindung ist ein Bildverarbeitungssystem und Verfahren zur Automatisierung der Bildqualitätsprüfung und -korrektur, die bislang von einem Bediener durchgeführt wurde. Die Bildqualität von jedem gescannten und schwellenwertverarbeiteten Bild wird automatisch mit einem binären Bildqualitäts-Erfassungssystem bewertet, das einen Bildrauschindex für jedes Bild erzeugt. Wenn der Bildrauschindex ein schlechtes Bild anzeigt, das etwa zu viel Specklerauschen im Hintergrund aufweist, wird das Graustufenbild abgerufen, oder das Dokument wird als Graustufenbild erneut gescannt. Auf das Graustufenbild wird automatisch ein Bildqualitätskorrekturverfahren angewandt, um ein korrigiertes, sauberes und lesbares Binärbild zu erzeugen.
  • Der vorliegenden Erfindung liegt die Aufgabe zugrunde, einen Bildrauschpegel für ein schwellenwertverarbeitetes Bild automatisch zu indizieren, wozu eine Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes mittels lokaler Bildeigenschaften in Echtzeit dient. Für jedes schwellenwertverarbeitete Bild, das einen hohen Bildrauschindex aufweist, wird das Bildqualitätskorrekturschema auf das problematische Dokument angewandt, worauf in der Nachverarbeitung ein Binärbild in optimaler Qualität erstellt wird. Die Auslegung des Systems ermöglicht die Durchführung einer Bildqualitätsprüfung mit hoher Geschwindigkeit, wobei eine optimale Bildqualitätsausgabe ohne betriebliche Unterbrechungen der Hochgeschwindigkeits-Dokumentabtastumgebung erzeugt wird.
  • Das Bildverarbeitungssystem umfasst zwei Bildverarbeitungskomponenten: eine Komponente zur Prüfung der Binärbildqualität zur Bewertung des Bildrauschpegels und eine Komponente zur mehrfach bildadaptiven Schwellenwertverarbeitung zur Korrektur der Bildqualität. Die Komponente zur Prüfung der Binärbildqualität bewertet den Rauschpegel eines schwellenwertverarbeiteten Bildes und zieht den Rauschpegel als Index für die Bildqualität heran. Wenn der Rauschpegel größer als ein angegebener Schwellenwert ist, gilt das Bild als von schlechter Bildqualität. Für jedes schwellenwertverarbeitete Bild wird das originale Graustufenbild abgerufen, soweit vorhanden, ansonsten wird das Originaldokument als Graustufenbild neu erfasst. Die Korrektur der Bildqualität erfolgt durch Anlegen des Graustufenbildes an einen mehrfach adaptiven Schwellenwertprozessor. Die mehrfach adaptive Schwellenwerttechnik umfasst zwei iterative Bildverarbeitungsschritte: die bildadaptive Schwellenwertverarbeitung und die binäre Bildanalyse. Die Iteration schreitet fort, bis ein optimales Binärbild erzielt wird. Mit einem optimalen Binärbild ist ein Bild gemeint, das einen sauberen Hintergrund und lesbaren Text aufweist.
  • Die Erfindung und deren Aufgaben und Vorteile werden in der detaillierten Beschreibung des nachstehenden bevorzugten Ausführungsbeispiels deutlicher.
  • Die Erfindung wird im folgenden anhand in der Zeichnung dargestellter Ausführungsbeispiele näher erläutert.
  • Es zeigen:
  • 1 ein Blockdiagramm der Bildverarbeitung zur automatischen Bildqualitätsprüfung und -korrektur in einem Abtastsystem.
  • 2A das Blockdiagramm der Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes anhand lokaler Bildeigenschaften.
  • 2B die Bildqualität eines schwellenwertverarbeiteten Bildes, wie durch die eingegebenen Schwellenwertparameter gesteuert (Kontrastschwellenwert (CT), Intensitätsschwellenwert (IT)).
  • 2C die Beziehung der beiden Eingabeparameter (Kontrastschwellenwert, Intensitätsschwellenwert) und die Empfindlichkeit der Schwellenwertverarbeitung.
  • 3A die Bildverarbeitungsschritte einer automatischen Bildqualitätsprüfung für ein Zweitonbild.
  • 3B die Nachbarschaftsoperation bei der Binärbildabschwächung.
  • 3C ein Beispiel von Rauschpunktstrukturen vor der Bildabschwächung in einem Binärbild.
  • 3D die Rauschpunktstrukturen aus 3C nach Bildabschwächung.
  • 3E das Bildverarbeitungsblockdiagramm zur Extraktion der Rauschmerkmale.
  • 3F ein Beispiel einer Rauschmerkmalsberechnung in einem binären Bild.
  • 4A das Blockdiagramm der Bildverarbeitung für die automatische Bildqualitätskorrektur.
  • 4B das Blockdiagramm der Bildverarbeitung für mehrfach bildadaptive Schwellenwertverarbeitung.
  • 4C die Tabelle mit den berechneten Rauschpegeln für die verschiedenen schwellenwertverarbeiteten Bilder, wie durch verschiedene Eingabeparameter (Kontrastschwellenwert (CT), Intensitätsschwellenwert (IT)) erzeugt.
  • 4D ein Ablaufdiagramm der Rauschpegelanalyse zum Auffinden des optimalen Kontrastschwellenwerts und des optimalen Intensitätsschwellenwerts.
  • 4E das erste Beispiel einer Rauschindexverteilung (R(CT,IT)) mit konstantem Intensitätsschwellenwert (IT) bei 70 und mehreren Kontrastschwellenwerten (CT) zwischen 60 und 15.
  • 4F das zweite Beispiel einer Rauschindexverteilung (R(CT,IT)) mit konstantem Intensitätsschwellenwert (IT) bei 70 und mehreren Kontrastschwellenwerten (CT) zwischen 60 und 15.
  • 4G das dritte Beispiel einer Rauschindexverteilung (R(CT,IT)) mit konstantem Intensitätsschwellenwert (IT) bei 70 und mehreren Kontrastschwellenwerten (CT) zwischen 60 und 15.
  • 4H ein Beispiel einer Rauschindexverteilung (R(CT,IT)) mit konstantem Intensitätsschwellenwert (IT) bei 60 und mehreren Kontrastschwellenwerten (CT) zwischen 70 und 220.
  • 4I ein Beispiel einer Rauschindexverteilung (R(CT,IT)) mit konstantem Intensitätsschwellenwert (IT) bei 60 und mehreren Kontrastschwellenwerten (CT) zwischen 70 und 220.
  • 1 zeigt das Blockdiagramm eines digitalen Bildverarbeitungssystems, das die Bildqualität jedes schwellenwertverarbeiteten Bildes automatisch prüft. Wenn die Bildqualitätsprüfung ergibt, dass das schwellenwertverarbeitete Bild von schlechter Qualität ist, wird ein Bildqualitätskorrekturprozess veranlasst, um optimale Schwellenwertparameter für die Erstellung eines lesbaren und sauberen Binärbildes zu suchen. Das Bildverarbeitungsverfahren umfasst folgende Schritte: (1) ein Papierdokument wird digital als Graustufenbild erfasst, das üblicherweise 8 Bit je Pixel umfasst; (2) das erfasste Graustufenbild (G) wird an einen bildadaptiven Schwellenwertmodul angelegt, um das Graustufenbild in ein Binärbild umzuwandeln (B); (3) das Binärbild wird einer Bildqualitätsprüfung unterzogen, und aus der Prüfung wird ein Bildrauschindex (INI) erzeugt; (4) der INI-Wert bestimmt den Grad der Bildqualität, und die Bildqualität wird als schlecht eingestuft, wenn der INI-Wert größer als ein vorbestimmter Schwellenwert (ITH) ist; (5) bei einem Bild von niedriger Qualität wird eine Bildqualitätskorrektur auf das Graustufenbild angewandt, um ein lesbares, sauberes Binärbild zu erhalten. Nachstehend werden die Einzelheiten jedes Bildverarbeitungsmoduls beschrieben:
  • Bildadaptive Schwellenwertverarbeitung
  • Die Mehrfenstertechnik für die Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften, wie in US-A-5,583,659 beschrieben, wird auf die Umwandlung eines Graustufenbildes in ein Binärbild angewandt. Die Schwellenwertverarbeitungstechnik berechnet den Schwellenwert für jedes Pixel in einem Bild anhand der lokalen Bildeigenschaften, die das Pixel umgeben. Der Schwellenwert wird dann angewandt, um das Graustufenbild eines Pixels in einen binären Wert (schwarz oder weiß) umzuwandeln. Das Blockdiagramm der Schwellenwertverarbeitungstechnik ist in 2A zusammenfassend dargestellt. Für diese Technik muss ein Benutzer einen Kontrastschwellenwert (CT) und einen Intensitätsschwellenwert (IT) bereitstellen, wie in 2B gezeigt. Die Bildqualität eines schwellenwertverarbeiteten Bildes wird durch die Eingabe der beiden Schwellenwerte (CT und IT) bestimmt. Ein schwellenwertverarbeitetes Bild (CT, IT), wie in 2B gezeigt, bedeutet, dass die Bildqualität eines derartigen Bildes eine Funktion von (CT, IT) ist. Die Bildqualität eines schwellenwertverarbeiteten Bildes wird anhand von zwei Faktoren bewertet: Textlesbarkeit (kein Bildinformationsverlust) und Glätte des weißen Hintergrunds (rauschfreier Bildhintergrund). Der CT-Wert steuert die Empfindlichkeit der Erkennung dünner, heller Textzeichen und Strichvorlagen, während der IT-Wert die Schwelle eines gleichmäßigen Graubereichs berücksichtigt. Es sei angenommen, der CT-Wert wird auf die Werte im Bereich von 0 bis 100 normalisiert und der IT-Wert auf den Bereich zwischen 0 und 255, wie in 2C gezeigt. Der CT-Wert ist häufig so gewählt, dass er empfindlich genug ist, um alle Bildinformationen zu extrahieren, wie hellen Text, dünne Linie .... usw., während der IT-Wert so eingestellt ist, dass gleichmäßig hellgraue Bereiche in weißen Hintergrund umgewandelt werden. Die Schwellenwerte bei (CT = 60, IT = 90), wie in 2C gezeigt, werden als eine geeignete Einstellung zur Extraktion aller Bildinformationsdetails erachtet. Allerdings kann die Einstellung der Schwellenwerte auf (CT = 60, IT = 90) bei einigen Dokumenten aufgrund der Rauheit der Dokumentpapiere zu einer zu hohen Empfindlichkeit führen und bewirkt die Erzeugung unerwünschten Specklerauschens im Hintergrund der schwellenwertverarbeiteten Bilder. Der folgende Abschnitt beschreibt das Verfahren der automatischen Bildrauschprüfung.
  • Automatische Bildrauschprüfung
  • Wie vorstehend erwähnt, wird der an die Schwellenwertverarbeitungstechnik übergebene CT-Wert stets auf eine ausreichende Empfindlichkeit eingestellt, um alle Bildinformationsdetails zu extrahieren, so dass die Textlesbarkeit bei der Bewertung der Bildqualität kein Problem mehr darstellt. Die Bewertung der Bildqualität wird auf die Erkennung von Hintergrundrauschen in dem schwellenwertverarbeiteten Bild vereinfacht.
  • 3A zeigt die Verarbeitungsschritte zur Erkennung des Rauschpegels für ein schwellenwertverarbeitetes Bild. Auf das Binärbild (B) wird eine Bildabschwächungsoperation angewandt, welche ein neues Binärbild (B1) erzeugt. Von dem abgeschwächten Binärbild (B1) werden drei Rauschmerkmale gemessen. Der normalisierte Rauschbereich (R) wird als Bildrauschindex (INI) des Binärbildes (B) herangezogen. Es folgt eine detaillierte Beschreibung der in 3A gezeigten Verarbeitungsschritte.
  • Es sei angenommen, dass in einem Binärbild das schwarze Pixel mit „1" und das weiße Pixel mit „0" markiert ist. Die Bildabschwächungsoperation wird von einer lokalen Nachbarschaftsoperation auf den Bereich der schwarzen Punkte erweitert, wie in 3B gezeigt. Das mittlere Pixel "o" auf der Ausgabeseite wird nur auf "0" gesetzt, wenn alle benachbarten Pixel XI in einem 3×3 großen Fenster, wobei I = 1, ...8, mit der 3×3 Nullmaske abgestimmt sind. Andernfalls wird das mittlere Pixel „o" auf der Ausgabeseite mit dem schwarzen Pixel „1" markiert. Die Abschwächungsoperation ist erforderlich, weil einige Dokumente des Textes als Punktmatrix gedruckt sind. Die Abschwächungsoperation verbindet die benachbarten kleinen Punkte zu Liniensegmenten, so dass die Rauschpunkte und die Punkte, die zu den Punktmatrixzeichen gehören, unterscheidbar sind. Ein grafisches Beispiel wird in 3C und 3D gezeigt. 3C zeigt ein Binärbild vor der Bildabschwächung. Die Zahl und Größe der schwarzen Punkte auf der linken Seite des Bildes ist mit der auf der rechten Seite identisch. Wenn die Zahl (oder der Bereich) der Rauschpunkte als Merkmal herangezogen wird, um den Rauschpegel zu bewerten, kann dieses Merkmal die Bildmuster auf beiden Seiten nicht differenzieren. Nach Anwendung der Bildabschwächung wird das Originalpunktmuster jedoch in zwei gerade Liniensegmente auf der linken Seite umgewandelt, wie in 3D gezeigt. Die dispergierten Rauschmuster auf der rechten Seite des Bildes bleiben mit Ausnahme der vergrößerten Rauschpunkte gleich. Somit wird die Zahl der Rauschpunkte ein ver wertbares Merkmal zur Extraktion von realen Rauschpunkten zur Bewertung des Rauschpegels in dem abgeschwächten Binärbild.
  • Die zufällig verteilten kleinen Punkte, die keine Bildinformationen in einem Binärbild enthalten, sind als Rauschen definiert. Die Rauschmessung erfordert es, die Zahl und den Bereich der kleinen Punkte in einem Binärbild zu zählen. 3E zeigt die Verarbeitungsschritte zur Rauschmessung an einem abgeschwächten Binärbild. Zunächst wird ein Konturenverfolgungsverfahren angewandt, um die Umrisse jedes Objekts in dem abgeschwächten Binärbild zu extrahieren. Die Konturenpixel werden entweder im Uhrzeigersinn oder im Gegenuhrzeigersinn extrahiert. Die im Uhrzeigersinn extrahierten Konturen sind die Außenkonturen (oder die schwarzen Objektkonturen), während es sich bei den im Gegenuhrzeigersinn extrahierten Konturen um die Innenkonturen (oder die weißen Objektkonturen) handelt. Es wird eine Größenschwelle (Ts) angewandt, um die großen Konturenkomponenten zurückzuweisen, die zu groß sind, um als Rauschpunkte zu gelten. Die Anzahl der verbleibenden kleinen Konturen wird für die schwarzen Rauschpunkte (NB) bzw. für die weißen Rauschpunkte (NW) gezählt, und der gesamte Rauschbereich (NA) für die schwarzen Rauschpunkte wird berechnet. Der normalisierte Rauschbereich (R) ist das Verhältnis des NA-Werts über dem Dokumentbereich (DA) und wird als Bildrauschindex (INI) herangezogen. Die NB- und NW-Werte werden zur Differenzierung des weißen Hintergrunds von dem schwarzen Hintergrund verwendet. Wenn der NB-Wert größer als der NW-Wert ist, weist das darauf hin, dass das Bild einen weißen Hintergrund hat. Ein großer NW-Wert weist darauf hin, dass der Hintergrund schwarz ist. Dies tritt auf, wenn in dem Dokument ein Halbtonbild oder ein großer, dunkler Graubereich vorhanden ist. 3F zeigt ein Beispiel der Berechnung der Rauschmerkmale. Es werden 20 schwarze Rauschpunkte gezählt. Der NB-Wert beträgt somit 20. Die Zahl der weißen Rauschpunkte (NW) beträgt 10. wenn der mittlere Bereich jedes Rauschens als Na berechnet wird, beträgt der gesamte Rauschbereich (NA) das Zwanzigfache von Na, und der Bildrauschindex (INI) ist NA/DA.
  • Der Bildrauschindex (INI) wird zur Beurteilung des Rauschpegels eines Binärbildes herangezogen. Wenn der INI-Wert unter einem angegebenen Schwellenwert (ITH) liegt, gilt das Bild als gutes Binärbild. Das bedeutet, dass das Binärbild lesbar und dass der Hintergrund sauber ist. Wenn der INI-Wert über dem ITH-Wert liegt, wird es als verrauschtes Binärbild eingestuft. Das Dokument muss dann neu gescannt oder das Graustufenbild muss – sofern verfügbar – abgerufen werden, um eine automatische Bildkorrektur durchzuführen.
  • Automatische Bildqualitätskorrektur
  • 4A zeigt das Blockdiagramm der Bildverarbeitung für die automatische Bildqualitätskorrektur. Ein mehrfacher bildadaptiver Schwellenwertprozess wird angewandt, um (N+M) Binärbilder durch systematische Änderung der N verschiedenen Kontrast- und der M verschiedenen Intensitätsschwellenwertparameter zu erzeugen. Der Rauschpegel jedes Binärbildes in dem (N+M) schwellenwertverarbeiteten Bild wird entsprechend berechnet. Die optimalen Schwellenwertparameter werden aus dem (N+M) Paar an Schwellenwerten durch Analyse der Korrelation der (N+M) Rauschpegel und der (N+M) Paare aus Kontrast- und Intensitätswerten erhalten.
  • Die Grundverarbeitungsschritte der mehrfachen adaptiven Schwellenwertverarbeitung sind die gleichen wie in 2A, ausgenommen der mehrfachen Eingabe von Schwellenwerten (CT, IT). Die eingegebenen Werte (CT, IT) werden in Dekrementen zu 5 Einheiten für den CT-Wert und in Inkrementen zu 30 Einheiten für den IT-Wert in der Reihenfolge (60,70), (55,70), (50,70), (45,70), (40,70), (35,70), (30,70), (25,70), (20,70), (15,70), (60,100), (60,130), (60,160), (60,190) und (60,220) geändert. Die 15 Paare der Schwellenwerte werden an den adaptiven Schwellenwertverarbeitungsprozess nacheinander übergeben und erzeugen 15 verschiedene Binärbilder. Durch getrennte Anwendung des Prozesses der Rauschmerkmalsextraktion auf die 15 verschiedenen Bilder, wie in 3A gezeigt, ergeben sich 15 Rauschwerte R(CT,IT), wie in 4C gezeigt. 4C zeigt Rauschpegel in verschiedener Kombination von (CT, IT).
  • Die Aufgabe der Korrelationsanalyse des Rauschens und der Werte (CT,IT) besteht darin, die Schwellenwerte (CT,IT) zu bestimmen, die in dem adaptiven Schwellenwertverarbeitungsprozess zur Erzeugung des kleinstmöglichen Hintergrundrauschens bei Erhalt sämtlicher Bildinformationen in einem schwellenwertverarbeiteten Bild verwendet werden. 4D zeigt das Blockdiagramm der Datenanalyse zur Auswahl der optimalen Schwellenwerte. Zunächst wird der Satz der Rauschwerte R(CT(I),70) durchlaufen, wobei I = 1,...,10, wenn der Zustand (A): R(CT(I),70) > Rth für alle CT(I) erfüllt ist, wobei Rth ein vorbestimmter Rauschschwellenwert (Rth) ist, wie in 4E gezeigt. Dies zeigt, dass die Rauschpegel aller schwellenwertverarbeiteten Bilder hoch sind und in keiner Beziehung zur Änderung des Kontrastschwellenwerts stehen. Somit bedarf es bei der Suche nach dem optimalen Intensitätsschwellenwert der Änderung des Intensitätsschwellenwerts (IT). Wenn andererseits der Zustand (A) nicht erfüllt ist, bedarf es bei der Suche nach dem optimalen Kontrastschwellenwert der Änderung des Kontrastschwellenwerts (CT).
  • Wenn bei der Suche nach dem optimalen Kontrastschwellenwert Zustand (B) gilt, dass alle Rauschwerte R(CT(I),70), I = 1,...,10 kleiner sind als der Rauschschwellenwert (Rth), wie in 4E gezeigt, weist dies darauf hin, dass die Ausgangsschwellenwerteinstellung bei (CT,IT) = (60,70) wenig Hintergrundrauschen erzeugt, und die endgültigen Schwellenwerte (CTF,ITF) = (60,70) werden als optimale Schwellenwerte herangezogen. Andernfalls gilt bei Untersuchung des Arrays der Daten R(CT(I),70), wenn Zustand (C) gilt, dass R(CT(I),70) > R(CT(I+1),70), I-1,..., 9 erfüllt ist, werden die endgültigen Schwellenwerte (CTF,ITF) = (CT(I),70) dort ausgewählt, wo CT(I) den Zustand R(CT(I),70) < Rth und R(CT(I+1),70) > Rth erfüllt. Wie das in 4F gezeigte Beispiel deutlich macht, wird der Wert CT(I) bei 35 gewählt und die endgültigen Schwellenwerte (CTF,ITF) = (35, 70). Wenn die Prüfung die Bedingung (C) nicht erfüllt, werden die endgültigen Schwellenwerte (CTF,ITF) = (CT(I),70) dort gewählt, wo CT(I) die Bedingung: R(CT(I),70) < R(CT(I-1),70) erfüllt. Wie das in 4G gezeigte Beispiel deutlich macht, wird der Wert CT(I) bei 40 gewählt und die endgültigen Schwellenwerte (CTF,ITF) = (40, 70).
  • Wenn bei der Suche nach dem optimalen Intensitätsschwellenwert der Zustand (D) gilt, dass R(60,IT(J)) > Rth für alle IT(J),J = 1,...,6 erfüllt ist, weist dies darauf hin, dass die Rauschpegel aller schwellenwertverarbeiteten Bilder hoch sind und nicht in Beziehung zur Änderung des Intensitätsschwellenwerts stehen, wie das Beispiel in 4H zeigt. Diese endgültigen Schwellenwerte (CTF,ITF) werden auf (60, 70) gesetzt, also auf die Ausgangseinstellung. Dies impliziert, dass keine optimalen Schwellenwerte ermittelt wurden, und dass die endgültigen Schwellenwerte den Ausgangseinstellungen (CTF,ITF) = (60, 70) zugeordnet werden. Wenn andererseits der Zustand (D) nicht erfüllt wird, dann wird (CTF,ITF) = (60,IT(J)) ausgewählt, wo R(60, IT(J-1)) > Rth und R(60, IT(J)) < Rth. Wie das Beispiel in 4I zeigt, wird der Wert IT(J) bei 130 ausgewählt. Dies weist darauf hin, dass der Intensitätsschwellenwert bei IT(J-1) = 100 nahe an der Hintergrundintensität liegt und keine Schwellenwertverarbei tung der Intensitätspegel der Hintergrundpixel durchzuführen vermag, was zur Erzeugung einer großen Menge an Hintergrundrauschen führt.

Claims (3)

  1. Bebilderungsverfahren zur Erzeugung eines sauberen, lesbaren binären Bildes von einem gescannten Dokument mit folgenden Schritten: a) digitales Erfassen eines Dokuments als Graustufenbild (G); b) Durchführen eines bildadaptiven Schwellenwertprozesses mit Schwellenwertparametern (CT, IT) zur Umwandlung des Graustufenbildes in ein binäres Bild (B); c) Berechnen eines Bildrauschindexwertes (INI), der ein Verhältnis des Rauschbereichs (NA) über dem Dokumentbereich (DA) ist, welcher die Menge des unerwünschten Bildrausches in dem binären Bild anzeigt und wobei der Rauschbereich bezugnehmend auf den Bereich zufällig verteilter kleiner Punkte berechnet wird. d) Ermitteln, ob der Bildrauschindex gleich oder größer als ein vorbestimmter Schwellenwert (ITH) ist; e) wenn der Bildrauschindexwert (INI) gleich oder kleiner als ein vorbestimmter Schwellenwert (ITH) ist, Setzen des binären Bildes (B) als sauberes, lesbares, binäres Bild und Anhalten des Vorgangs; und f) wenn der Bildrauschindexwert (INI) größer als ein vorbestimmter Schwellenwert ist, Reduzieren der Empfindlichkeit der Schwellenwertparameter um einen festen Betrag und Wiederholen der Schritte b.) bis d.), bis die Bedingung in Schritt e.) erfüllt ist.
  2. Bebilderungsverfahren zur Erzeugung eines sauberen, lesbaren binären Bildes nach Anspruch 1, das zudem das Speichern des Graustufenbildes und das Bildkorrekturverfahren umfasst, das das Abrufen des Graustufenbildes aus dem Speicher umfasst, gefolgt von einem Wiederholen der Schritte b.)–e.), bis der Bildrauschindexwert auf oder unter den vorbestimmten Schwellenwert fällt.
  3. Bebilderungsverfahren zur Erzeugung eines sauberen, lesbaren binären Bildes nach Anspruch 1, worin der Ermittlungsschritt das Vergleichen des Bildrauschindexwerts für ein Bild mit einem vorbestimmten Schwellenwert umfasst, der derart ausgewählt ist, dass das geringste Hintergrundrauschen entsteht, während sämtliche Bildinformationen auf dem Graustufenbild erhalten bleiben, worin für den Fall, dass der Bildrauschindexwert über dem vorbestimmten Schwellenwert liegt, das Graustufenbild als ein verrauschtes, binäres Bild ermittelt wird, das einer Korrektur bedarf.
DE60308739T 2002-01-16 2003-01-06 Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik Expired - Lifetime DE60308739T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US50206 1998-03-30
US10/050,206 US6970606B2 (en) 2002-01-16 2002-01-16 Automatic image quality evaluation and correction technique for digitized and thresholded document images

Publications (2)

Publication Number Publication Date
DE60308739D1 DE60308739D1 (de) 2006-11-16
DE60308739T2 true DE60308739T2 (de) 2007-08-23

Family

ID=21963943

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60308739T Expired - Lifetime DE60308739T2 (de) 2002-01-16 2003-01-06 Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik

Country Status (4)

Country Link
US (1) US6970606B2 (de)
EP (1) EP1330111B1 (de)
JP (1) JP2003219184A (de)
DE (1) DE60308739T2 (de)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040100426A1 (en) * 2002-11-21 2004-05-27 Madhukar Gaganam Field emission display brightness uniformity compensation system and method
FR2851357B1 (fr) * 2003-02-19 2005-04-22 Solystic Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images
KR100573668B1 (ko) * 2004-01-19 2006-04-26 삼성전자주식회사 스캔이미지 보정장치 및 그 보정방법
US7528989B2 (en) * 2004-07-08 2009-05-05 Fuji Xerox Co., Ltd Image processing apparatus and image processing method
KR20060050746A (ko) * 2004-08-31 2006-05-19 엘지전자 주식회사 카메라로 촬영된 문서 영상 처리 방법
KR20060050729A (ko) * 2004-08-31 2006-05-19 엘지전자 주식회사 카메라로 촬영된 문서 영상 처리 방법과 장치
WO2007086059A2 (en) * 2006-01-25 2007-08-02 Equivio Ltd. Determining near duplicate 'noisy' data objects
US7936484B2 (en) * 2006-06-14 2011-05-03 Ronald Gabriel Roncal Internet-based synchronized imaging
US7689004B2 (en) * 2006-09-12 2010-03-30 Seiko Epson Corporation Method and apparatus for evaluating the quality of document images
US20080084584A1 (en) * 2006-10-04 2008-04-10 Nokia Corporation Emphasizing image portions in an image
US8331721B2 (en) * 2007-06-20 2012-12-11 Microsoft Corporation Automatic image correction providing multiple user-selectable options
US8116585B2 (en) * 2007-08-09 2012-02-14 Xerox Corporation Background noise detection on rendered documents
US8054501B2 (en) * 2007-11-07 2011-11-08 Final Print Assurance Inc. System and method for analyzing print quality
US10043201B2 (en) 2008-01-31 2018-08-07 Bill.Com, Inc. Enhanced invitation process for electronic billing and payment system
US8073284B2 (en) 2008-04-03 2011-12-06 Seiko Epson Corporation Thresholding gray-scale images to produce bitonal images
TW201027407A (en) * 2009-01-13 2010-07-16 Quanta Comp Inc Light compensation method
US8520920B2 (en) * 2009-11-11 2013-08-27 Siemens Corporation System for dynamically improving medical image acquisition quality
KR101058726B1 (ko) * 2009-11-11 2011-08-22 삼성전자주식회사 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법
US8819789B2 (en) 2012-03-07 2014-08-26 Bill.Com, Inc. Method and system for using social networks to verify entity affiliations and identities
CN104272728B (zh) 2012-04-13 2017-12-01 Red.Com有限责任公司 视频投影器系统
US9025086B2 (en) 2012-04-13 2015-05-05 Red.Com, Inc. Video projector system
CN102663390B (zh) * 2012-04-28 2014-04-30 长春迪瑞医疗科技股份有限公司 一种流式细胞显微图像二值化方法
US9148644B2 (en) * 2012-12-14 2015-09-29 Tektronix, Inc. System for detecting structured artifacts in video sequences
US10417674B2 (en) 2013-03-14 2019-09-17 Bill.Com, Llc System and method for sharing transaction information by object tracking of inter-entity transactions and news streams
US10115137B2 (en) 2013-03-14 2018-10-30 Bill.Com, Inc. System and method for enhanced access and control for connecting entities and effecting payments in a commercially oriented entity network
US10410191B2 (en) * 2013-03-14 2019-09-10 Bill.Com, Llc System and method for scanning and processing of payment documentation in an integrated partner platform
CN103268591A (zh) * 2013-04-20 2013-08-28 江苏新瑞峰信息科技有限公司 一种高速扫描自动纠偏系统
US10572921B2 (en) 2013-07-03 2020-02-25 Bill.Com, Llc System and method for enhanced access and control for connecting entities and effecting payments in a commercially oriented entity network
CN103886579B (zh) * 2013-12-11 2017-02-08 西安交通大学 面向在线铁谱图像自动识别的磨粒链自适应分割方法
KR20150089832A (ko) 2014-01-28 2015-08-05 삼성전자주식회사 Esd 인가 시 스캔 데이터를 처리하는 장치 및 방법
CN104112134A (zh) * 2014-07-09 2014-10-22 宁波摩视光电科技有限公司 一种基于aoi的子弹表观缺陷检测系统的图像二值化分割方法
CN104318571A (zh) * 2014-10-29 2015-01-28 兰州理工大学 一种基于背景非显著度的图像显著性算法评价方法
CN104574399A (zh) * 2015-01-06 2015-04-29 天津大学 基于多尺度视觉显著性与梯度幅值的图像质量评价方法
CN104899893B (zh) * 2015-07-01 2019-03-19 电子科技大学 基于视觉注意力的图像质量检测方法
CN105426912B (zh) * 2015-11-12 2018-08-10 河南师范大学 一种置换混叠图像的盲分离方法
CN105374047B (zh) * 2015-12-15 2018-04-17 西安电子科技大学 基于改进的双边滤波与聚类的sar图像变化检测方法
CN113240630B (zh) * 2021-04-16 2022-07-12 深圳市安思疆科技有限公司 散斑图像质量评估方法、装置、终端设备及可读存储介质
WO2022253227A1 (en) * 2021-05-31 2022-12-08 Shanghai United Imaging Healthcare Co., Ltd. Systems and methods for image correction
CN115423808B (zh) * 2022-11-04 2023-03-24 合肥的卢深视科技有限公司 散斑投射器的质量检测方法、电子设备和存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4982294A (en) * 1987-07-24 1991-01-01 Eastman Kodak Company Apparatus for enhancing and thresholding scanned microfilm images and methods for use therein
US5208871A (en) * 1990-10-19 1993-05-04 Xerox Corporation Pixel quantization with adaptive error diffusion
US5185674A (en) * 1992-04-03 1993-02-09 Eastman Kodak Company Binary resolution decimation method and apparatus
US5832140A (en) * 1993-12-14 1998-11-03 Staplevision Inc. Automated quality assurance image processing system
DE4411248C1 (de) * 1994-03-31 1995-10-26 Licentia Gmbh Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
DE19536170A1 (de) 1995-09-29 1997-04-03 Ibm Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5974199A (en) * 1997-03-31 1999-10-26 Eastman Kodak Company Method for scanning and detecting multiple photographs and removing edge artifacts
US6674900B1 (en) * 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images

Also Published As

Publication number Publication date
US6970606B2 (en) 2005-11-29
EP1330111A3 (de) 2004-12-08
EP1330111B1 (de) 2006-10-04
EP1330111A2 (de) 2003-07-23
JP2003219184A (ja) 2003-07-31
DE60308739D1 (de) 2006-11-16
US20030133623A1 (en) 2003-07-17

Similar Documents

Publication Publication Date Title
DE60308739T2 (de) Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE3881392T2 (de) System und Verfahren für automatische Segmentierung.
DE4445386C1 (de) Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
DE69427567T2 (de) Verfahren zum Auffinden eines Histogrammbereichs von Interesse für die verbesserte Grauskalenwiedergabe von Röntgenbildern
DE69511507T2 (de) Verfahren und Vorrichtung zur automatischen Bildsegmentierung unter Verwendung von Standardvergleichsmustern
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE3686821T2 (de) Halbtonbildverarbeitungseinrichtung.
DE3789717T2 (de) Verfahren und Vorrichtung zum Erzeugen von binären Bilddaten hoher Auflösung in bezug auf lineare Ränder.
DE69526469T2 (de) Bildumsetzungsverfahren und -system unter Verwendung von dynamischer Fehlerdiffusion
DE3446880C2 (de)
DE69620302T2 (de) Verfahren und Vorrichtung zur Verbesserung eines digitalen Bildes
DE69109935T2 (de) Verfahren zum Überprüfen von Abdrücken.
DE69230629T2 (de) Verfahren und Vorrichtung zur Bildverbesserung
DE69736938T2 (de) Detektion und Wiedergabe von Text in gerasterten Bildbereichen
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
DE69521184T2 (de) Gerät zur Bildverarbeitung gemäss einem lokal ermittelten Bildregionentyp
DE69306847T2 (de) Bildverarbeitungssystem und -methode unter Anwendung adaptiver Abtastung von Halbtonvorlagen um besser druckbare Bilder zu erzeugen
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE10311715A1 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Speichermedium für das Bildverarbeitungsprogramm
DE4001613A1 (de) Binaerumsetzungsverfahren
DE69728724T2 (de) Bildbereichs-Erkennungsverfahren und Bildverarbeitungsvorrichtung
DE69209866T2 (de) Verfahren zur Bildverarbeitung und Abtastsystem/Ausdrucksystem zur Durchführung dieses Verfahrens
DE60219918T2 (de) Klassifikation von bildblöcken basierend auf der entropie von pixeldifferenzen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition