DE19956158A1 - Bild-Binärisierungsverfahren auf Bereichsbasis - Google Patents

Bild-Binärisierungsverfahren auf Bereichsbasis

Info

Publication number
DE19956158A1
DE19956158A1 DE19956158A DE19956158A DE19956158A1 DE 19956158 A1 DE19956158 A1 DE 19956158A1 DE 19956158 A DE19956158 A DE 19956158A DE 19956158 A DE19956158 A DE 19956158A DE 19956158 A1 DE19956158 A1 DE 19956158A1
Authority
DE
Germany
Prior art keywords
image
images
binary
photographic images
photographic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19956158A
Other languages
English (en)
Inventor
Yongchun Lee
Peter Rudak
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kodak Alaris Inc
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of DE19956158A1 publication Critical patent/DE19956158A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

Bei einem Bild-Binärisierungsverfahren auf Bereichsbasis wird ein adaptiver Schwellenwertprozeß (15a) und ein Bildwiedergabeverfahren auf ein Grauskalenbild (G) angewendet, um erste (B1) und zweite (B2) Binärbilder zu erzeugen. Das Grauskalenbild (G) kann auch mit niedriger Abtastrate abgetastet werden, um ein niedrig aufgelöstes Bild zu erfassen, wobei dann die Positionen fotografischer Bilder im niedrig aufgelösten Bild identifiziert werden. Außerdem werden fotografische Bilder jener erkannten fotografischen Bilder (16), die eine rechteckige Form (17) aufweisen, identifiziert, und es wird eine Klassifizierungs-Matrix (18) erzeugt, die zwischen Pixeln in den fotografischen Bildern rechteckiger Form und den übrigen Bildern unterscheidet. Anschließend kann ein endgültiges Binärbild (19) auf der Grundlage der Klassifizierungs-Matrix aus dem ersten (B1) und dem zweiten (B2) Binärbild erzeugt werden. Das erfindungsgemäße Binärisierungssystem ist effektiv einsetzbar zumm Erfassen des Grauskalenbildes eines Dokuments, das mindestens fotografische und Textteile enthält.

Description

Die Erfindung bezieht sich auf ein Bild-Binärisierungsverfahren auf Bereichsbasis für gemischte Dokumente, das eine optimale Binärbildqualität sicherstellt.
Gedruckte Bilder in Zeitschriften enthalten oftmals Fotografien, Text, Strichzeich­ nungen und Grafiken in gemischter Anordnung. Wird die Seite mittels eines Scanners elektronisch erfaßt, ist ein Binärisierungsprozeß erforderlich, um das Grauton-Bild in eine Zweiton-Wiedergabe des Bildes umzuwandeln. Es gibt zwei gebräuchliche Kategorien von Bild-Binärisierungstechniken. Zum einen die soge­ nannte adaptive Schwellenwerttechnik, die sich gut für Dokumente eignet, die im wesentlichen Text und Strichzeichnungen enthalten. Zum anderen eine Raster- oder Fehlerdiffusionstechnik, die Grauschattierungen in Form eines binären For­ mats wiedergibt. Diese Technik eignet sich zum Binärisieren fotografischer Bilder. Bei gemischten Dokumenten, bei denen das erfaßte Vorlagenbild Text und foto­ grafische Bilder enthält, kann keines der beiden Binärisierungsverfahren sowohl beim Text als auch bei den fotografischen Bildern eine gute Bildqualität erzeugen. Eine bekannte Lösung des Problems besteht darin, das erfaßte digitale Bild in Foto- und Textbereiche zu segmentieren, so daß auf die verschiedenen Bereiche unterschiedliche Binärisierungsverfahren angewendet werden können, um eine optimale Bildqualität zu erhalten.
Bei einem bekannten Segmentierungsverfahren wird ein gemischtes Dokument in 4 × 4-Blöcke unterteilt, jeder der Blöcke als Text oder Bild klassifiziert und die Klassifizierung dann durch Ausscheiden von in geringer Zahl vorliegenden Blöcken verbessert (siehe z. B. US-A-4.668.995). Nach dem Klassifizieren der Bildzeilen-Blöcke wendet man dann die verschiedenen Binärisierungsverfahren entsprechend an. Bei einem weiteren bekannten Verfahren wird ein Bild in der Weise segmentiert, daß man je Abtastzeile Lauflängen extrahiert und aus den Lauflängen Rechtecke konstruiert, die Rechtecke dann als Text oder Nichttext klassifiziert und schließlich zusammenhängende Textblöcke zu Textbereichen zusammenführt (siehe z. B. US-A-5.335.290).
Bei den beiden vorstehend genannten Segmentierungsverfahren handelt es sich um von unten nach oben fortschreitende Verfahren, die mit pixelweisen oder blockweisen Informationssegmenten beginnen und dann zu Bereichen fortschreiten. Diese Verfahren sind weniger robust und anfälliger für Klassifizierungsfehler, weil die Klassifizierung zwischen Text und Nichttext ausschließlich auf örtlicher Bildinformation beruht.
Aufgabe der Erfindung ist es nun, ein von oben nach unten fortschreitendes Segmentierungsverfahren anzugeben, das fotografische Bildbereiche aufgrund des umfassenden Pixelzusammenhangs lokalisiert und ein Binärisierungssystem auf Bereichsbasis angibt, das ein Segmentierungsergebnis zur Erzielung einer optimalen Binärbildqualität verwendet.
Die Erfindung bezieht sich auf ein Binärisierungssystem auf Bereichsbasis, das durch einzelne Anwendung adaptiver Schwellenwertverfahren und Bildwiedergabeverfahren, wie der Fehlerdiffusionstechnik (oder Rastertechnik) aus einem Grauskalenbild zwei binäre Bilder erzeugt, die Position der fotografischen Bilder im gering aufgelösten Bild feststellt, jene fotografischen Bilder ermittelt, die eine rechteckige Form oder Umgrenzung aufweisen, eine Klassifizierungs-Matrix erzeugt, in der ein fotografisches Pixel mit "1", ein nicht fotografisches Pixel mit "0" bezeichnet ist, und das endgültige Binärbild in der Klassifizierungs-Matrix aus den beiden gespeicherten Binärbildern zusammensetzt.
Ein Prozeß zum Erkennen fotografischer Bilder umfaßt die Schritte: Umwandeln des niedrig aufgelösten Grauskalenbildes in ein Binärbild unter Anwendung eines Schwellenwertverfahrens für das gesamte Bild, Durchführen eines binären Bild­ bereinigungsprozesses zum Entfernen feiner Linien und der Mehrzahl der Zei­ chen, Durchführen einer Analyse nach verbundenen Teilen, um die Objekte zu identifizieren, und Anwenden eines Größenfilters, um kleine Objekte auszuson­ dern. Die Positionen großer Objekte werden als Positionen fotografischer Bilder angesehen.
Die Erfindung bezieht sich auf einen Binärisierungsprozeß auf Bereichsbasis, der die folgenden Schritte umfaßt: Umwandeln eines Graustufenbildes in ein erstes und zweites Binärbild, Erfassen von Bereichen mit fotografischen Bildern in dem Graustufenbild, Identifizieren von fotografischen Bildern mit einer rechteckigen Umgrenzung unter den erfaßten fotografischen Bildern, Erzeugen einer Klassifizierungsmatrix, die Pixel in den fotografischen Bildern mit einer rechteckigen Umgrenzung von den übrigen Pixeln unterscheidet, und Erzeugen eines endgültigen Binärbildes aus dem ersten und zweiten Binärbild auf der Grundlage der Klassifizierungs-Matrix.
Die Erfindung bezieht sich ferner auf Binärisierungsverfahren auf Bereichsbasis mit den folgenden Schritten: Erfassen eines Bildes, Identifizieren der Position fotografischer Bilder in dem erfaßten Bild, Identifizieren von fotografischen Bildern mit einer rechteckigen Umgrenzung unter den erfaßten fotografischen Bildern, Erzeugen einer Klassifizierungs-Matrix, die Pixel in den fotografischen Bildern mit einer rechteckigen Umgrenzung von nichtfotografischen Pixeln unterscheidet, und Erzeugen eines endgültigen Binärbildes auf der Grundlage der Klassifizierungs- Matrix.
Ferner bezieht sich die Erfindung auf eine Bilderfassungseinheit mit: Einem Bilderfassungsteil zum Erfassen eines Bildes, einem Umwandlungsteil zum Umwandeln des erfaßten Bildes in das erfaßte Bild wiedergebende digitale Bildinformation und einem Verarbeitungsteil, der die digitale Bildinformation verarbeitet und die Position fotografischer Bilder im erfaßten Bild feststellt, fotografische Bilder mit einer rechteckigen Umgrenzung unter den festgestellten fotografischen Bildern identifiziert und eine Klassifizierungs-Matrix erzeugt, die zwischen Pixeln in fotografischen Bildern mit einer rechteckigen Umgrenzung und den übrigen Pixeln unterscheidet.
Die Erfindung wird im folgenden anhand eines in der Zeichnung dargestellten Ausführungsbeispiels näher erläutert.
Es zeigen:
Fig. 1a ein Flußdiagramm der Schritte eines Binärisierungsverfahrens auf Bereichsbasis bei einem gemischten Dokument;
Fig. 1b eine schematische Darstellung einer erfindungsgemäßen Vorrichtung;
Fig. 2a ein Flußdiagramm der Schritte eines fotografischen Erfassungsprozesses;
Fig. 2b ein Flußdiagramm der Schritte zum Erfassen fotografischer Bilder mit rechteckiger Form oder Umgrenzung;
Fig. 3 ein Beispiel einer digital gedruckten, gemischten Grauskalenvorlage (G);
Fig. 4 ein Bild (B1) nach Anwendung eines adaptiven Schwellenwertverfahrens auf das Bild (G) gemäß Fig. 3;
Fig. 5 ein Bild (B2) nach Anwendung eines Fehlerdiffusionsprozesses auf das Bild (G) gemäß Fig. 3;
Fig. 6 ein mit geringer Auflösung abgetastetes Bild (Gs) des Bildes (G) gemäß Fig. 3 in einer 4 : 1-Verkleinerung;
Fig. 7 ein Bild (Bs) nach Anwendung eines festen Schwellenwertverfahrens auf das Bild (Gs) gemäß Fig. 6;
Fig. 8 ein nach einem Bildbereinigungsverfahren aus dem Bild (Bs) gemäß Fig. 7 erhaltenes Binärbild (Es);
Fig. 9 die ermittelten Umgrenzungsrahmen großer Objekte des Binärbildes (E) in Fig. 8;
Fig. 10 die ermittelten Positionen fotografischer Bilder im Bild (B1) in Fig. 4;
Fig. 11 ein Beispiel eines Text enthaltenden Umgrenzungsrahmens bei einem nicht rechteckigen fotografischen Bild;
Fig. 12 eine Matrix, aus der die identifizierten Bereiche der rechteckigen fotografischen Bilder hervorgehen; und
Fig. 13 das endgültige binäre Bild nach dem erfindungsgemäßen Verfahren.
In den Zeichnungen, in denen gleiche oder entsprechende Teile in allen Figuren mit denselben Bezugsziffern gekennzeichnet sind, zeigt Fig. 1a ein Blockdiagramm eines Bild-Binärisierungsverfahrens auf Bereichsbasis. Ausgehend von einer digitalen Grauskalen-Bilddateneingabe arbeitet das Verfahren wie folgt: Mittels eines adaptiven Schwellenwertverfahrens (Schritt 15a) wird das Grauskalenbild (G) in ein Binärbild (B1) umgewandelt, das bei Text und Strichzeichnungen eine gute Bildqualität ergibt. Dann wird auf dasselbe Grauskalenbild (G) ein Bildwiedergabeverfahren, wie zum Beispiel ein Fehlerdiffusions- oder Rasterverfahren (Schritt 15b) angewendet, um eine Binärbildwiedergabe (B2) zu erhalten, die in den fotografischen Bereichen des Bildes eine gute Bildqualität ergibt. Im Schritt 15c wird das Grauskalenbild mit niedriger Abtastrate abgetastet, um ein niedrig aufgelöstes Bild (Gs) zu erhalten. Im Schritt 16 werden die Positionen rechteckiger fotografischer Bilder in dem niedrig aufgelösten Bild (Gs) identifiziert, während im Schritt 17 fotografische Bilder mit rechteckiger Form oder Umgrenzung identifiziert werden. Im Schritt 18 folgt dann die Erzeugung einer Klassifizierungs-Matrix, in der Pixel in rechteckigen fotografischen Bildern mit "1" und andere Pixel mit "0" gekennzeichnet sind, und das endgültige Binärbild (B) ergibt sich dann aus der Zusammenführung der beiden Binärbilder B1 und B2 auf der Grundlage der erzeugten Klassifizierungs-Matrix. Wenn ein Pixel in der Position (ij) in der erzeugten Klassifizierungs-Matrix mit "1" gekennzeichnet ist, wodurch das Pixel als fotografisches Pixel ausgewiesen wird, wird das Pixel an der Position (ij) im Bild B2 in das Binärbild B kopiert. Wenn andererseits das Pixel an der Position (ij) in der Klassifizierungsmatrix mit "0" gekennzeichnet ist, wodurch das Pixel als Text ausgewiesen wird, ist das Pixel an der Position (ij) im Bild B eine Kopie des Binärbildes B1.
Fig. 1b zeigt eine schematische Darstellung einer Bilderfassungseinheit 300, die erfaßte Bilder entsprechend den beschriebenen Merkmalen der Erfindung verarbeitet. Bei der Bilderfassungseinheit 300 kann es sich um einen Scanner handeln, der einen Bilderfassungsteil 301 zum Beispiel in Form einer bilderfassenden CCD und einen Umwandlungsteil 303 zum Beispiel in Form eines A/D-Wandlers umfaßt, der das erfaßte Bild in das erfaßte Bild wiedergebende digitale Information umwandelt. Die digitale Information wird an einen Bildprozessor 305 übermittelt, der die digitale Information in der unter Bezugnahme auf Fig. 1a beschriebenen Weise verarbeitet, wie dies im einzelnen noch unter Bezugnahme auf Fig. 2a und 2b beschrieben wird.
Die Besonderheiten der Identifizierung fotografischer Bilder in einem gemischten Dokument (Schritt 16) sind in Fig. 2a dargestellt. Zunächst wird das Grauskalen­ bild im Abtastschritt (15c in Fig. 1) mit geringer Abtastrate im Abstand von N Pixeln und N Abtastzeilen abgetastet, um ein niedrig aufgelöstes Grauskalenbild (Gs) zu erhalten. Um das Grauskalenbild (Gs) in ein Binärbild (Bs) umzuwandeln, wird ein fester Schwellenwert (globales Schwellenwertverfahren) (Schritt 20) vor­ gegeben. Je Pixel des Binärbildes wird ein 3 × 3-Binärbereinigungsprozeß (Schritt 21) angewendet, um feine Linien und andere feine Objekte, einschließlich Zei­ chen, zu entfernen. Das nach dem Bildbereinigungsprozeß erhaltene Bild wird als Bild (Es) gespeichert. Dann wird auf das Bild (Es) eine Analyse nach verbunde­ nen Teilen (Schritt 22) angewendet, um verbundene Pixel zu gruppieren. Jede Gruppe verbundener Pixel wird als Objekt betrachtet. Die Umgrenzungs-Koordi­ naten eines Objekts bestimmen die Position des Objekts. Anhand eines Größen­ filters (Schritt 23) wird ein Objekt, dessen Umgrenzung größer ist als ein Größen- Schwellenwert, als fotografisches Bild angesehen. Der Größenfilter kann zum Beispiel abhängig sein von der Abtast-Auflösung.
Fig. 3 zeigt einen Druck einer abgetasteten gemischten Vorlagenseite einer Zeit­ schrift, die Text, Linien, rechteckige fotografische Bilder und nicht rechteckige Grafiken (Darstellung einer Sonnenbrille) aufweist. Durch Anwendung eines ad­ aptiven Schwellwertverfahrens (Schritt 15a, Fig. 1) auf das Grauskalenbild gemäß Fig. 3 erhält man ein Binärbild (B1). Das Binärbild (B1) in Fig. 4 zeigt klare und scharfe Zeichen und Linien, die Details in dem Schatten des fotografischen Bildes sind jedoch verschwunden. Nach Anwendung einer Fehlerdiffusionstechnik (Schritt 15b, Fig. 1) auf dasselbe Grauskalenbild zeigt das erhaltene Binärbild (B2) - siehe Fig. 5 -, daß die Bilddetails in den Bereichen fotografischer Bilder er­ halten geblieben sind und der realen fotografischen Qualität näher kommen. Das Textbild erscheint jetzt jedoch verschwommen. Der Vergleich der beiden Binärbil­ der (B1) und (B2) führt zu dem Ergebnis, daß man, um ein gutes Binärbild eines gemischten Dokuments zu erhalten, eine Kombination aus adaptiver Schwellen­ werttechnik für Textbereiche und Fehlerdiffusionstechnik für fotografische Bildbe­ reiche anwenden muß. Hierzu ist es erforderlich, die fotografischen Bereiche zu identifizieren.
Im Zuge des Identifizierungsprozesses (Schritt 16 in Fig. 1a und Flußdiagramm der Fig. 2a) wird zunächst das Grauskalenbild mit niedriger Abtastrate abgetastet, um ein kleineres Grauskalenbild (Gs) zu erzeugen, wie dies in Fig. 6 dargestellt ist. Anschließend wird auf das Grauskalenbild (Gs) ein Schwellenwertverfahren mit einem festen Schwellenwert angewendet (Schritt 20, Fig. 2a), um ein Binärbild (Bs) zu erzeugen. Das erhaltene Binärbild (Bs) ist in Fig. 7 dargestellt. Durch Anwendung eines Binärbild-Bereinigungsverfahrens (Schritt 21, Fig. 2a) erhält man das Bild (Es), in dem kleine Zeichen und feine Linien entfernt wurden und die meisten der übrigen schwarzen Pixel innerhalb der Bereiche fotografischer Bilder liegen, wie dies in Fig. 8 dargestellt ist. Die Umgrenzungsfelder jedes Objekts des Bildes (Es) werden durch eine Analyse nach verbundenen Teilen (Schritt 22, Fig. 2a) identifiziert, bei der verbundene schwarze Pixel eines Binärbilds zu einem einzelnen Objekt gruppiert werden (siehe z. B. USSN 08/739.076). Unter Ausschluß der kleinen Objekte (Schritt 23, Fig. 2a) sind die Umgrenzungsfelder 100 der potentiellen fotografischen Bilder in Fig. 9 dargestellt. Die Umgrenzungskoordinaten werden in volle Auflösung umgewandelt und sind in Fig. 10 dargestellt. Die vier Umgrenzungsfelder 100 stellen die Positionen identifizierter fotografischer Bilder dar. Die fotografischen Bilder in den identifizierten Umgrenzungsfeldern müssen nicht alle eine rechteckige Form aufweisen.
Als nächstes werden rechteckige fotografische Objekte (Schritt 17 in Fig. 1a) in den Positionen der vier Umgrenzungsfelder 100 identifiziert. Dies erfolgt durch Untersuchung von Zeichen, die eventuell innerhalb eines identifizierten Umgrenzungsfeldes im Binärbild (B1) in Fig. 3 vorhanden sind. Wenn Zeichen in einem Umgrenzungsfeld vorhanden sind, wird das fotografische Bild innerhalb des Umgrenzungsfeldes als nicht rechteckig klassifiziert. Wenn andererseits keine Zeichen in einem Umgrenzungsfeld festgestellt werden, wird das fotografische Bild innerhalb des Umgrenzungsfeldes als rechteckiges fotografisches Bild identifiziert. Bei dem beschriebenen Beispiel gibt es Zeichen innerhalb des Umgrenzungsfeldes 100' der Brillengrafik - s. Fig. 11. Infolgedessen wird die Brillengrafik als nicht rechteckiges fotografisches Bild klassifiziert. Die übrigen drei Umgrenzungsfelder enthalten keine Zeichen, so daß die in ihnen enthaltenen fotografischen Bilder als rechteckige Bilder klassifiziert werden. Die Besonderheiten der Identifizierung fotografischer Bilder rechteckiger Form oder Umgrenzung (Schritt 17, Fig. 1a) sind in Fig. 2b dargestellt. Wie aus Fig. 2b ersichtlich ist, werden bezüglich der Analyse nach verbundenen Teilen (Schritt 30) Informationen, die Umgrenzungskoordinaten der potentiellen fotografischen Bilder betreffen, sowie das Binärbild (B1) berücksichtigt. Im Schritt 30 wird eine Analyse nach verbundenen Teilen durchgeführt, um in den einzelnen Umgrenzungsfeldern Objekte zu extrahieren. Dabei ist zu beachten, daß das größte Objekt als bildhafte Abbildung und die kleinen Objekte als Zeichen oder Rauschen klassifiziert werden. Im Schritt 33 wird geprüft, ob ein kleines Objekt (ein Zeichen) vorliegt, das nicht geometrisch außerhalb der Umgrenzung des größten Objekts liegt. Ist die Antwort im Schritt 33 ja, handelt es sich bei den Objekten um fotografische Bilder mit nicht rechteckiger Umgrenzung. Ist die Antwort im Schritt 33 nein, sind die Objekte fotografische Bilder mit rechteckiger Umgrenzung.
Jetzt wird die Klassifizierungsmatrix dadurch erzeugt (Schritt 18, Fig. 1a), daß in den Umgrenzungsbereichen dreier rechteckiger fotografischer Bilder schwarze Pixel eingefügt werden, s. Fig. 12. Das endgültige Binärbild (B) wird auf der Grundlage der Klassifizierungsmatrix aus den Binärbildern (B1) und (B2) zusam­ mengesetzt. Das Pixel im Bild (B) ist eine Kopie des Bildes (B1) in den Textberei­ chen der Klassifizierungs-Matrix, und in den fotografischen Bereichen (schwarze Bereiche der Klassifizierungs-Matrix) ist das Bild (B) eine Kopie des Bildes (B2). Das Ergebnis ist in Fig. 13 dargestellt.

Claims (9)

1. Bild-Binärisierungsverfahren auf Bereichsbasis, gekennzeichnet durch fol­ gende Schritte:
  • - Umwandeln eines Graustufenbildes in ein erstes und zweites Binärbild unter Verwendung jeweils unterschiedlicher Binärisierungsverfahren;
  • - Erfassen von Bereichen mit fotografischen Bildern in dem Graustufenbild;
  • - Identifizieren von fotografischen Bildern mit einer rechteckigen Umgren­ zung aus den erfaßten fotografischen Bildern;
  • - Erzeugen einer Klassifizierungsmatrix, die Pixel in den fotografischen Bil­ dern mit einer rechteckigen Umgrenzung von den übrigen Pixeln unter­ scheidet; und
  • - Erzeugen eines endgültigen Binärbildes aus dem ersten und zweiten Bi­ närbild auf der Grundlage der Klassifizierungsmatrix.
2. Verfahren nach Anspruch 1, gekennzeichnet durch folgenden zusätzlichen Schritt:
  • - Abtasten des Graustufenbildes mit niedriger Abtastrate, um ein niedrig auf­ gelöstes Bild zu erhalten, so daß bei dem Erfassungsschritt das Erfassen der Bereiche mit fotografischen Bildern in dem niedrig aufgelösten Bild er­ folgt.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Graustufenbild aus einem Dokument erfaßt wird, welches mindestens fotografische und Textteile enthält.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Umwand­ lungsschritt folgende Schritte umfaßt:
  • - Anwenden eines adaptiven Schwellenwertverfahrens auf das Graustufen­ bild, um eines der ersten und zweiten Binärbilder zu erhalten; und
  • - Anwenden eines Bildumwandlungsverfahrens auf das Graustufenbild, um das andere der ersten und zweiten Binärbilder zu erhalten.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß das Bildumwand­ lungsverfahren ein Fehlerdiffusionsprozeß ist.
6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß das Bildumwand­ lungsverfahren ein Rasterprozeß ist.
7. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß das mit niedriger Abtastrate abgetastete Bild ein Bild mit geringer Auflösung ist.
8. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß der Erfassungs­ schritt folgende Schritte umfaßt:
  • - Umwandeln des mit niedriger Abtastrate abgetasteten Bildes in ein zusätz­ liches Binärbild;
  • - Entfernen von feinen Linien und Zeichen aus dem zusätzlichen Binärbild;
  • - Durchführen einer Analyse nach verbundenen Teilen in dem zusätzlichen Binärbild, um verbundene Pixel in dem zusätzlichen Binärbild zu gruppie­ ren, wobei Gruppen verbundener Pixel als Objekt in dem zusätzlichen Bi­ närbild identifiziert werden; und
  • - Kennzeichnen der Objekte als fotografische Bilder, welche in dem zusätzli­ chen Binärbild eine Größe aufweisen, die größer als ein vorbestimmter Schwellenwert ist.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß der Kennzeich­ nungsschritt folgenden Schritt umfaßt:
  • - Verwenden eines Größenfilters, um Objekte als fotografische Bilder zu kennzeichnen, die größer als der Schwellenwert sind, und um Objekte aus­ zuschließen, die kleiner als der Schwellenwert sind.
DE19956158A 1998-12-04 1999-11-23 Bild-Binärisierungsverfahren auf Bereichsbasis Withdrawn DE19956158A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/205,948 US6393150B1 (en) 1998-12-04 1998-12-04 Region-based image binarization system

Publications (1)

Publication Number Publication Date
DE19956158A1 true DE19956158A1 (de) 2000-06-08

Family

ID=22764334

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19956158A Withdrawn DE19956158A1 (de) 1998-12-04 1999-11-23 Bild-Binärisierungsverfahren auf Bereichsbasis

Country Status (3)

Country Link
US (1) US6393150B1 (de)
JP (1) JP4261005B2 (de)
DE (1) DE19956158A1 (de)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7031543B2 (en) * 2002-01-02 2006-04-18 Xerox Corporation Grayscale image de-speckle algorithm
US7092584B2 (en) 2002-01-04 2006-08-15 Time Warner Entertainment Company Lp Registration of separations
US6947607B2 (en) * 2002-01-04 2005-09-20 Warner Bros. Entertainment Inc. Reduction of differential resolution of separations
US6993185B2 (en) * 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
US7382903B2 (en) * 2003-11-19 2008-06-03 Eastman Kodak Company Method for selecting an emphasis image from an image collection based upon content recognition
US7379594B2 (en) * 2004-01-28 2008-05-27 Sharp Laboratories Of America, Inc. Methods and systems for automatic detection of continuous-tone regions in document images
US7701614B2 (en) * 2004-03-31 2010-04-20 Fujifilm Corporation Image processing method, apparatus, and program with selective error diffusion among a pluraity of pixel groups withing a digital image
KR20060050729A (ko) * 2004-08-31 2006-05-19 엘지전자 주식회사 카메라로 촬영된 문서 영상 처리 방법과 장치
KR20060050746A (ko) * 2004-08-31 2006-05-19 엘지전자 주식회사 카메라로 촬영된 문서 영상 처리 방법
US7672539B2 (en) * 2005-12-15 2010-03-02 General Instrument Corporation Method and apparatus for scaling selected areas of a graphics display
US20070253615A1 (en) * 2006-04-26 2007-11-01 Yuan-Hsiang Chang Method and system for banknote recognition
US20090116757A1 (en) * 2007-11-06 2009-05-07 Copanion, Inc. Systems and methods for classifying electronic documents by extracting and recognizing text and image features indicative of document categories
US8073284B2 (en) * 2008-04-03 2011-12-06 Seiko Epson Corporation Thresholding gray-scale images to produce bitonal images
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8213735B2 (en) * 2008-10-10 2012-07-03 Accusoft Corporation Methods and apparatus for performing image binarization
US9241128B2 (en) 2013-02-14 2016-01-19 Warner Bros. Entertainment Inc. Video conversion technology
EP2806374B1 (de) * 2013-05-24 2022-07-06 Tata Consultancy Services Limited Verfahren und system zur automatischen auswahl von einem oder mehreren bildverarbeitungsalgorithmen
CN103345747A (zh) * 2013-06-26 2013-10-09 公安部第三研究所 一种基于平面坐标优化的图像形状特征提取和结构化描述装置以及方法
US9704057B1 (en) 2014-03-03 2017-07-11 Accusoft Corporation Methods and apparatus relating to image binarization
CN106455974B (zh) 2014-06-20 2018-12-14 拉姆伯斯公司 用于有透镜和无透镜的光学感测的系统和方法
US10136103B2 (en) 2015-11-23 2018-11-20 Lexmark International, Inc. Identifying consumer products in images
US9990561B2 (en) * 2015-11-23 2018-06-05 Lexmark International, Inc. Identifying consumer products in images
CN106228555A (zh) * 2016-07-22 2016-12-14 湖南文理学院 基于Masi熵测度的灰度图像阈值分割方法
CN106327497A (zh) * 2016-08-29 2017-01-11 湖南文理学院 基于超广延熵的灰度图像阈值分割方法
CN106408586A (zh) * 2016-08-30 2017-02-15 湖南文理学院 基于非广延高斯熵测度的灰度图像分割方法
US10607101B1 (en) * 2016-12-14 2020-03-31 Revenue Management Solutions, Llc System and method for patterned artifact removal for bitonal images
US10909406B2 (en) * 2018-01-08 2021-02-02 Newgen Software Technologies Limited Image processing system and method
CN110309060B (zh) * 2019-05-24 2021-08-17 平安科技(深圳)有限公司 识别算法更新的检测方法、装置、存储介质及计算机设备
CN110335198B (zh) * 2019-07-08 2021-06-08 威创集团股份有限公司 一种图像处理方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4668995A (en) 1985-04-12 1987-05-26 International Business Machines Corporation System for reproducing mixed images
JPH01295570A (ja) * 1988-05-23 1989-11-29 Mitsubishi Electric Corp 画像処理装置
US5617485A (en) * 1990-08-15 1997-04-01 Ricoh Company, Ltd. Image region segmentation system
US5335290A (en) 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
ATE171808T1 (de) * 1992-07-31 1998-10-15 Canon Kk Anzeigesteuergerät
US5872864A (en) * 1992-09-25 1999-02-16 Olympus Optical Co., Ltd. Image processing apparatus for performing adaptive data processing in accordance with kind of image
US5568571A (en) * 1992-12-14 1996-10-22 University Microfilms, Inc. Image enhancement system
DE69332750T2 (de) * 1993-01-11 2003-10-16 Canon Kk Gerät und Verfahren zur Bildverarbeitung
JPH07131641A (ja) * 1993-11-08 1995-05-19 Canon Inc 画像処理装置

Also Published As

Publication number Publication date
US6393150B1 (en) 2002-05-21
JP2000175038A (ja) 2000-06-23
JP4261005B2 (ja) 2009-04-30

Similar Documents

Publication Publication Date Title
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE60308739T2 (de) Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik
DE69832411T2 (de) Speicherverwaltungssystem für bilddokumenten-datenbank
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE4445386C1 (de) Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
DE69432585T2 (de) Verfahren und Gerät zur Auswahl von Text und/oder Non-Text-Blöcken in einem gespeicherten Dokument
DE60303202T2 (de) System und verfahren zum identifizieren und extrahieren von zeichenketten aus erfassten bilddaten
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE19842572B4 (de) Verfahren zur automatischen Entfernung von Bildfehlern
DE3633743C2 (de)
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
DE60114469T2 (de) Methode und Gerät zur Bestimmung von interessanten Bildern und zur Bildübermittlung
DE69629888T2 (de) Bildverarbeitungsverfahren und Bilderkennungs- und Pixelverarbeitungssystem
DE112006003272B4 (de) Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild
DE60020038T2 (de) Verfahren zum Verarbeiten eines numerischen Bildes
DE19953608B4 (de) Vorrichtung und Verfahren zum Erkennen eines Fonts eines Textes in einem Dokumentenverarbeitungssystem
DE4311172A1 (de) Verfahren und Einrichtung zum Korrigieren der Schräge eines Vorlagenbildes sowie Vorlagensegmentierungssystem
DE19530829C2 (de) Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Information
DE112007002904T5 (de) Vorrichtung und Verfahren zum Erzeugen photorealistischer Bild-Thumbnails
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
EP0402868B1 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE112021000371T5 (de) Digitale bildbearbeitung
DE102021201767A1 (de) Computerimplementiertes Verfahren zur Verbesserung der Erkennung von Randdefekten und anderen Defekten in opthalmischen Linsen

Legal Events

Date Code Title Description
8128 New person/name/address of the agent

Representative=s name: WAGNER & GEYER PARTNERSCHAFT PATENT- UND RECHTSANW

8110 Request for examination paragraph 44
R016 Response to examination communication
R016 Response to examination communication
R082 Change of representative

Representative=s name: WAGNER & GEYER PARTNERSCHAFT PATENT- UND RECHT, DE

R081 Change of applicant/patentee

Owner name: KODAK ALARIS INC., ROCHESTER, US

Free format text: FORMER OWNER: EASTMAN KODAK CO., ROCHESTER, N.Y., US

Effective date: 20141028

R082 Change of representative

Representative=s name: WAGNER & GEYER PARTNERSCHAFT PATENT- UND RECHT, DE

Effective date: 20141028

Representative=s name: WAGNER & GEYER PARTNERSCHAFT MBB PATENT- UND R, DE

Effective date: 20141028

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee