DE10303724B4 - Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder - Google Patents

Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder Download PDF

Info

Publication number
DE10303724B4
DE10303724B4 DE10303724A DE10303724A DE10303724B4 DE 10303724 B4 DE10303724 B4 DE 10303724B4 DE 10303724 A DE10303724 A DE 10303724A DE 10303724 A DE10303724 A DE 10303724A DE 10303724 B4 DE10303724 B4 DE 10303724B4
Authority
DE
Germany
Prior art keywords
threshold
pixel
image
intensity
thresholds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10303724A
Other languages
English (en)
Other versions
DE10303724A1 (de
Inventor
Oscar A. Ft. Collins Zuniga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of DE10303724A1 publication Critical patent/DE10303724A1/de
Application granted granted Critical
Publication of DE10303724B4 publication Critical patent/DE10303724B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

Verfahren zum Segmentieren eines Bildes, das folgende Schritte aufweist:
Auswählen eines Schwellwerts aus einer Mehrzahl von Schwellwerten für jedes Pixel, das in dem Bild einem Schwellwertverfahren unterzogen werden soll, basierend auf den relativen Größen der Schwellwerte; und
Zuordnen jedes Pixels zu einer von zwei Klassen gemäß dem Wert seiner Intensität relativ zu dem ausgewählten Schwellwert für das Pixel.

Description

  • Diese Erfindung bezieht sich allgemein auf eine automatisierte Bildanalyse und insbesondere auf die Segmentierung von Bildern durch Schwellwertverfahren.
  • Die Bildsegmentierung ist ein Prozeß des Aufteilens eines Bildes in Regionen von Interesse und umfaßt die Unterscheidung von Objekten in einem Bild von einem Hintergrund. Das Schwellwertverfahren ist eine Technik für die Segmentierung. Bei dem Zweipegel-Schwellwertverfahren ist jedes Bildpixel einer von zwei Klassen zugeordnet, abhängig davon, ob seine Intensität (Graupegel oder Farbe) größer oder geringer ist als eine spezifizierte Schwelle, was zu einem Binärbild führt. Bei dem Mehrpegel-Schwellwertverfahren wird das gesamte Bild mehrere Male mit einem Schwellwert verglichen, jedesmal mit einer unterschiedlichen konstanten Schwelle, was zu mehreren Binärbildern führt.
  • Eine übliche Anwendung ist die optische Zeichenerkennung (OCR = optical character recognition), bei der Bildpixel üblicherweise durch Schwellwertverfahren in Zeichen segmentiert werden. Es wird zum Beispiel von einem Bild aus schwarzem Text auf einem weißen Hintergrund ausgegangen. Ein Histogramm aller Intensitätswerte in dem Bild weist zwei dominante Spitzen auf: eine Spitze, die dem Intensitätswert des schwarzen Textes entspricht, und eine zweite Spitze, die dem Intensitätswert des weißen Hintergrunds entspricht. Wenn eine Schwelle bei einem Intensitätswert gesetzt wird, der am untersten Punkt des Tales zwischen den zwei Spitzen liegt, dann kann ein Pixel, das einen Intensitätswert aufweist, der dunkler ist als die Schwelle, dem Text zugeordnet werden, und ein Pixel, das einen Intensitätswert heller als die Schwelle aufweist, kann dem Hintergrund zugeordnet werden.
  • In dem Fall von schwarzem Text auf einem weißen Hintergrund kann eine konstante Globalschwelle aus einem Intensitätswerthistogramm des Gesamtbildes bestimmt werden. Viele Bilder von Interesse sind jedoch komplexer als einfach schwarzer Text auf einem weißen Hintergrund. Ein Bild kann zum Beispiel Farbblöcke umfassen (das heißt der Hintergrund kann variieren), der Text kann Blöcke unterschiedlicher Farben überlappen und der Text kann heller sein als der lokale Hintergrund. Bei komplexen Bildern kann die Schwelle dynamisch sein, und abhängig von der Position des Pixels von Interesse innerhalb des Bildes variieren. Eine dynamische Schwelle kann von den Intensitätswertdaten über einer Region eines Bildes abhängen oder eine dynamische Schwelle kann von Pixel zu Pixel variieren. Siehe zum Beispiel Joan S. Weszka, „A Survey of Threshold Selection Techniques", Computer Vision, Graphics, and Image Processing 7, 259–265 (1978) und Sahoo u.a., „A Survey of Thresholding Techniques", Computer Vision, Graphics, and Image Processing 41, 233–260 (1988).
  • Bestimmte Probleme bei dem Schwellwertverfahren umfassen die Bestimmung einer geeigneten Schwelle an den Grenzen von Objekten, die Bestimmung einer geeigneten Schwelle für dünne Objekte (wo wenige Objektintensitätswerte in dem Histogramm vorliegen) und die Bestimmung einer geeigneten Schwelle, wenn Bereiche von Interesse vorliegen, die heller sind als der Hintergrund.
  • Aus der EP 04 24 854 B1 ist eine Bildverarbeitungsvorrichtung mit adaptiver Entscheidungsschwelle zur Erzeugung von Binärdaten aus Halbtonbildern bekannt. Die Vorrichtung vergleicht einen Bildsignalpegel, der der Dichte eines Pixels des Bildsignals entspricht, mit einem Schwellenwert. Der Schwellenwert entspricht entweder dem Schwellenwert eines vorherigen Pixels, oder das System verwendet einen Schwellenwert, der als der Mittelwert von Dichtepegeln in der Nähe des Pixels berechnet wurde, abhängig davon, ob ein dif ferenzierter Pixeldichtewert zwischen zwei anderen Schwellen liegt.
  • In der EP 03 56 225 A2 ist eine Bildverarbeitungsvorrichtung beschrieben, bei der eine Schwelle, die zur Binarisierung verwendet wird, abhängig davon, ob ein Abschnitt, in dem sich Eingangspixeldaten befinden, in der Nähe eines Kantenabschnitts des Bilds liegt, ausgewählt wird. Wenn ein Pixel sich in der Nähe eines Kantenabschnitts eines Bilds befindet, wird eine Binarisierung mit der festen Schwelle ausgeführt, während, wenn sich das Pixel in keinem Kantenabschnitt befindet, eine variable Schwelle verwendet wird, die von der Dichte des Eingangspixels abhängt.
  • Es ist die Aufgabe der vorliegenden Erfindung, Verfahren und Vorrichtungen zu schaffen, die eine verbesserte Segmentierung komplexer Bilder unter Verwendung eines Zweipegel-Schwellwertverfahrens ermöglichen.
  • Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1, 5 oder 7 ein Bildverarbeitungssystem gemäß Anspruch 8 und ein computerlesbares Medium gemäß Anspruch 9 gelöst.
  • Für jedes Pixel wird eine Schwelle aus einem Satz von Schwellen ausgewählt. Bei einem ersten Ausführungsbeispiel ist zumindest eine Schwelle variabel und eine Schwelle ist ein konstanter Wert.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
  • 1 ein Grauskalenbild mit Regionen von Interesse, um ein Zweipegel-Schwellwertverfahren darzustellen, die aus mehreren beispielhaften Schwellwertverfahren resultiert;
  • 2 ein binäres Bild, das das Ergebnis des Anwendens eines Zweipegel-Schwellwertverfahrens auf das Bild aus 1 darstellt, unter Verwendung einer dynamischen Schwelle, die innerhalb von Blöcken (oder Zellen, oder Kacheln) konstant ist;
  • 3 ein binäres Bild, das das Ergebnis des Anwendens eines Zweipegel-Schwellwertverfahrens auf das Bild aus 1 darstellt, unter Verwendung einer dynamischen Schwelle, die sich von Pixel zu Pixel ändert; und
  • 4 ein binäres Bild, das das Ergebnis des Anwendens eines Zweipegel-Schwellwertverfahrens auf das Bild aus 1 darstellt, unter Verwendung eines Satzes von Schwellen gemäß einem Ausführungsbeispiel der Erfindung.
  • 1 stellt ein Bild dar, das einen einheitlichen grauen Hintergrund (dargestellt durch Querschraffur) mit einem durchgehenden schwarzen Bereich 100, einem durchgehenden weißen Bereich 102 und einer relativ dünnen schwarzen Linie 104 in der Nähe des durchgehenden weißen Bereichs 102 auf weist. Es wird darauf hingewiesen, daß der weiße Bereich 102 keinen schwarzen Linienrand um denselben aufweist; er ist einfach ein weißer Bereich innerhalb des umgebenden schwarzen Hintergrunds. Bei der nachfolgenden Erörterung werden zwei bekannte Verfahren zum Zweipegel-Schwellwertbestimmen an ein Bild wie in 1 mit einem einheitlichen grauen Hintergrund angelegt, und die resultierenden Binärbilder werden dargestellt (2 und 3). Dann wird ein beispielhaftes Ausführungsbeispiel eines Verfahrens gemäß der Erfindung an ein Bild ähnlich 1 mit einem einheitlichen grauen Hintergrund angelegt, und das resultierende Binärbild wird dargestellt (4). Es ist wichtig darauf hinzuweisen, daß aufgrund von Einschränkungen darüber, was für Patentdarstellungen zulässig ist, der graue Hintergrund aus 1 nicht einheitlich ist und durch Querschraffur simuliert ist. Die 24 stellen das Ergebnis des Anwendens verschiedener Zweipegel-Schwellwertverfahrensalgorithmen auf ein Bild ähnlich 1 dar, das jedoch einen einheitlichen grauen Hintergrund aufweist, und dieselben stellen nicht das Ergebnis des Anwendens derselben Schwellwertverfahrensalgorithmen auf 1 dar, mit dessen simuliertem grauen Hintergrund.
  • Es wird bei der nachfolgenden Erörterung ferner darauf hingewiesen, daß angenommen wird, daß die Niedrigintensitätspixel niedrige numerische Intensitätswerte aufweisen und daß Hochintensitätspixel hohe numerische Intensitätswerte aufweisen. Dies kann umgekehrt werden, so daß niedrige Intensitäten durch hohe Anzahlen dargestellt werden und umgekehrt, wobei in diesem Fall die MAX-Funktionen zu MIN-Funktionen werden, die Vorzeichen umgekehrt werden und so weiter.
  • 2 ist ein Binärbild, das das Ergebnis des Anwendens eines Zweipegel-Schwellwertverfahrens auf das Bild aus 1 darstellt (mit einem einheitlichen Hintergrund), unter Verwendung eines Schwellwertverfahrens, das typisch für eine handelsüblich erhältliche OCR-Software ist. Das Nachfol gende ist eine vereinfachte Beschreibung des allgemeinen Typs eines Schwellwertverfahrens, die beim Erzeugen von 2 umfaßt ist, und entspricht einer bestimmten handelsüblich erhältlichen Software möglicherweise nicht genau. Ein zusätzliches Beispiel kann man in dem US-Patent Nr. 5,651,077 finden.
  • Bei dem Verfahren, das in 2 dargestellt ist, ist das Gesamtbild aus 1 in Blöcke (ebenfalls genannt Zellen oder Kacheln) partitioniert, zum Beispiel Quadratblöcke aus 64 × 64 Pixel. Eine Gleich-Auftritts-Matrix (Co-Occurrence-Matrix) wird für jeden Block berechnet. Für eine einfache Darstellung wird davon ausgegangen, daß Grauebenen nur 4 Bits aufweisen (Grauebenen 0–15). Die Gleich-Auftritts-Matrix kann zum Beispiel ein 16 × 16-Array sein. Ein Eintrag in das Array für die Position (i, j) ist die Häufigkeit des Auftretens von benachbarten Pixeln mit Graupegeln i und j. Ein Histogramm wird aus der Gleich-Auftritts-Matrix erzeugt, das nur jene Einträge umfaßt, die in der Nähe der Diagonale sind. Bei Blöcken mit unterschiedlichen Bimodalhistogrammen (z.B. dunkler Text auf einem hellen Hintergrund) wird die Schwelle derart berechnet, daß dieselbe in der Nähe des Histogrammtales liegt. Bei Blöcken ohne ein unterschiedliches Bimodalhistogramm kann zum Beispiel ein Unimodalhistogramm für einen Block innerhalb eines Hintergrundbereichs einer Schwelle ähnlich zu einem nahen Block zugeordnet sein, mit einem ähnlichen Hintergrund und einer vorangehend berechneten Schwelle.
  • Wenn eine Schwelle für einen Block berechnet wird, kann sich die Schwelle bedeutend von einem Block zu dem nächsten ändern, was manchmal zu blockgroßen Artefakten führt. Blöcke, die Teile eines weißen Bereichs 102 in 1 umfassen, weisen eine höhere Intensitätsschwelle relativ zu Blöcken auf, die nur den Hintergrundgraupegel aufweisen. Folglich kann die Schwelle in der Nähe des weißen Bereichs 102 höher sein als die Intensität des grauen Hintergrunds, so daß die Graupegel in den Bereichen in der Nähe des weißen Bereichs 102 in 1 auf schwarz in dem Binärbild schnappen können, wie durch die breiten schwarzen Bereiche um den Bereich 202 in 2 dargestellt ist. Folglich wird ein breiter schwarzer Rahmen als ein Artefakt in 2 erzeugt, und die schwarze Linie 104 in 1 geht in dem Binärbild von 2 vollständig verloren.
  • 3 ist ein Binärbild, das das Ergebnis des Anwendens eines Zweiebenen-Schwellwertverfahrens auf das Bild aus 1 (mit einem einheitlichen Hintergrund) darstellt, unter Verwendung eines Schwellwertverfahrens, das die Schwelle auf einer Pixel-für-Pixel-Basis variiert. Für das bestimmte Beispiel aus 3 ist die Schwelle für jedes Pixel der maximale Intensitätswert unter dem K × K umgebenden Pixeln minus einen konstanten Versatz. Diese Technik setzt die Schwelle unter den Hintergrund für jedes Pixel. Zusätzlich dazu verhält sich die Technik als ein Hochpaßfilter oder ein Kantendetektor. Dies hat sowohl Vorteile als auch Nachteile. Die Vorteile umfassen: (1) helle Bereiche werden als relativ schmale schwarze Rahmen mit weißem Innenraum bewahrt, ohne die Artefakte von blockbasierten Verfahren, und (2) dünne Objekte, wie zum Beispiel Linien, werden bewahrt. Ein Nachteil ist, daß große dunkle Bereiche auf Rahmen mit weißem Innenraum reduziert werden und nicht als dunkle Bereiche bewahrt werden.
  • Man betrachtet zum Beispiel die Pixel in der Nähe des Bereichs 102 in 1. Zuerst wird ein Pixel betrachtet, bei dem der K × K umgebende Bereich nur graue Hintergrundpixel umfaßt. Die Schwelle wird auf einen Versatz unter der Intensität des Hintergrund gesetzt, und das betrachtete Pixel schnappt auf weiß. Es wird nun ein Pixel betrachtet, das eine Hintergrundpegelintensität aufweist, aber der K × K umgebende Bereich umfaßt einen Teil des Bereichs 102. Jetzt wird die Schwelle auf einen Versatz direkt unter weiß gesetzt, und das betrachtete Pixel schnappt auf schwarz. Schließlich wird ein Pixel betrachtet, bei dem der umgebende K × K-Bereich nur die weißen Pixel des Bereichs 102 um faßt. Die Schwelle ist wiederum ein Versatz direkt unter weiß, und das betrachtete Pixel schnappt auf weiß. Folglich schnappt der Hintergrund in 3 auf weiß, und eine schwarze Linie resultiert bei jedem Übergang von grau zu weiß und umgekehrt, wodurch der Bereich 302 innerhalb des weißen Hintergrunds in 3 unterschieden wird. Es wird ferner darauf hingewiesen, daß die Linie 304 in 3, die der Linie 104 in 1 entspricht, ebenfalls unterschieden wird.
  • Nun werden Pixel in der Nähe des Bereichs 100 in 1 betrachtet. Der Hintergrund schnappt wiederum auf weiß. Es wird ein Pixel direkt innerhalb des Bereichs 100 betrachtet, wo ein Teil des grauen Hintergrunds in dem umgebenden K × K-Bereich umfaßt ist. Die Schwelle wird auf einen Versatz direkt unter dem schwarzen Hintergrund gesetzt, und das betrachtete schwarze Pixel schnappt auf schwarz. Es wird nun ein Pixel innerhalb des Bereichs 100 betrachtet, wo der umgebende K × K-Bereich nur schwarze Pixel umfaßt. Die Schwelle wird auf einen Versatz unter schwarz (oder auf ein Niedrigintensitätslimit) gesetzt, und das betrachtete schwarze Pixel schnappt auf weiß. Folglich wird ein durchgehen schwarzer Bereich 100 in 1 als schwarzer Rahmen mit einem weißen Innenraum in 3 aufbereitet. Für bestimmte Segmentierungsanforderungen kann es bevorzugt werden, große dunkle Bereiche in dem Graupegelbild als schwarze Bereiche in dem segmentierten Binärbild aufzubereiten.
  • 4 ist ein Binärbild, das das Ergebnis des Anwendens eines Zweiebenen-Schwellwertverfahrens auf das Bild aus 1 (mit einem einheitlichen Hintergrund) darstellt, unter Verwendung eines Schwellwertverfahrens gemäß einem beispielhaften Ausführungsbeispiel der Erfindung. Bei dem beispielhaften Ausführungsbeispiel, das durch 4 dargestellt wird, wird die Schwelle auf einer Pixel-für-Pixel-Basis bestimmt. Die Schwelle wird aus mehreren Schwellen ausgewählt, wobei zumindest eine derselben dynamisch ist. Das Schwellwertverfahren weist bestimmte Vorteile bei OCR auf, ist jedoch nicht auf OCR beschränkt. Bei dem beispielhaften Ausführungsbeispiel, das durch 4 dargestellt ist, wird die Schwelle T für ein Pixel in der Zeile w, Spalte c, gemäß der nachfolgenden Gleichung bestimmt: T(r, c) = MAX[MAXK(r, c) – T1, T2] Gleichung 1wobei:
  • MAXK(r, c)
    der Maximalintensitätswert der K × K-Pixel ist, die das Pixel (r, c) umgeben.
    T1
    ein Intensitätsversatzwert ist, der ein konstanter Wert sein kann.
    T2
    ein Intensitätswert ist, der ein konstanter Wert für ein gesamtes Bild sein kann.
  • Es wird darauf hingewiesen, daß bei dem Beispiel aus Gleichung 1 die Schwelle T aus der höchsten Intensität von zwei Schwellen ausgewählt wird, wobei eine derselben dynamisch ist und eine derselben konstant ist.
  • Es wird die Anwendung von Gleichung 1 auf 1 (mit einem einheitlichen Hintergrund) betrachtet. Es wird angenommen, daß T2 eine Intensität ist, die niedriger ist als die Hintergrundintensität minus T1. Für die gesamte 1 außer dem Innenbereich 100 ist die variable Schwelle (MAXK(r, c) – T1) immer höher als T2. Es wird darauf hingewiesen, daß außer bei dem Innenbereich 100 die variable Schwelle entweder die Hintergrundintensität minus T1 oder die Weißintensität minus T1 ist. Innerhalb des Bereichs 100, bei Pixeln, bei denen die umgebenden K × K-Pixel alle schwarz sind, ist die variable Schwelle weniger als T2, und T wird ausgewählt, um T2 zu sein. Dementsprechend schnappen schwarze Pixel innerhalb des Bereichs 100 auf schwarz und das resultierende Binärbild sieht aus, wie in 4 dargestellt ist.
  • Wenn die Gleichung 1 verwendet wird, sind die Rahmen in dem segmentierten Binärbild um helle Bereiche ungefähr K Pixel breit. K kann so klein sein wie K = 2. Wenn die Eingangsabtastrate 300 Pixel pro 2,54 Zentimeter (1 Zoll) ist, ist ein geeigneter Beispielwert für K für OCR K = 7. T1 oder T2 kann nach Region oder Block variieren, bleibt jedoch innerhalb einer Region oder eines Blocks konstant. Es besteht jedoch ein Risiko von Artefakten an Blockgrenzen. T1 muß groß genug sein, um sicherzustellen, daß [MAXK(r, c) – T1] weit unter dem Hintergrund liegt, um ein Rauschen zu minimieren. Dementsprechend ist ein geeigneter Beispielwert für T1 ungefähr 30 % des Intensitätsbereichs für das Gesamtbild. Ein genauerer Lösungsansatz ist es, T1 zu einer Funktion der Ausdehnung des Hintergrunds zu machen. Bei einem Histogramm des Gesamtbildes kann zum Beispiel eine Spitze in dem dunklen Bereich vorliegen, die durch den Hintergrund verursacht wird. T1 kann dann zum Beispiel zu einem mehrfachen der Standardabweichung der Daten bei der Spitze in dem dunklen Bereich gemacht werden, zum Beispiel zweimal die Standardabweichung. T2 kann basierend auf dem Gesamtbild bestimmt werden, unter Verwendung einer der bekannten Techniken zum Bestimmen einer einzelnen Schwelle.

Claims (9)

  1. Verfahren zum Segmentieren eines Bildes, das folgende Schritte aufweist: Auswählen eines Schwellwerts aus einer Mehrzahl von Schwellwerten für jedes Pixel, das in dem Bild einem Schwellwertverfahren unterzogen werden soll, basierend auf den relativen Größen der Schwellwerte; und Zuordnen jedes Pixels zu einer von zwei Klassen gemäß dem Wert seiner Intensität relativ zu dem ausgewählten Schwellwert für das Pixel.
  2. Verfahren gemäß Anspruch 1, das ferner folgenden Schritt aufweist: Auswählen aus zumindest einem Schwellwert, der dynamisch ist, und einem Schwellwert, der konstant ist.
  3. Verfahren gemäß Anspruch 1 oder 2, das ferner folgenden Schritt aufweist: Auswählen eines Schwellwerts gemäß dem höchsten Intensitätswert aus der Mehrzahl von Schwellwerten.
  4. Verfahren gemäß einem der Ansprüche 1 bis 3, das ferner folgenden Schritt aufweist: Auswählen des Schwellwerts, der die größte Größe aufweist, aus der Mehrzahl von Schwellwerten.
  5. Verfahren zum Bestimmen eines Schwellwerts, das folgende Schritte aufweist: Berechnen von zumindest einem Schwellwert, der dynamisch ist, für jedes Pixel eines Bildes, das einem Schwellwertverfahren unterzogen werden soll; Berechnen eines Schwellwerts, der konstant ist, für zumindest eine Region des Bildes; und Auswählen von entweder dem dynamischen oder dem konstanten Schwellwert für jedes Pixel des Bildes, das einem Schwellwertverfahren unterzogen werden soll, wobei der Schwellwert, der einer höchsten Intensität entspricht, ausgewählt wird.
  6. Verfahren gemäß Anspruch 5, das ferner folgenden Schritt aufweist: Berechnen des dynamischen Schwellwerts als einen Versatz von einer höchsten Intensität des Bildes in einer Region um ein Pixel des Bildes, das einem Schwellwertverfahren unterzogen werden soll.
  7. Verfahren zum Identifizieren von Zeichen in einem Bild, das folgende Schritte aufweist: Berechnen von zumindest einem variablen Schwellwert für jedes Pixel; Berechnen eines konstanten Schwellwerts für zumindest eine Region des Bildes; Auswählen des Schwellwerts entsprechend der höchsten Intensität unter dem zumindest einen variablen Schwellwert und dem konstanten Schwellwert für jedes Pixel; Vergleichen einer Intensität für jedes Pixel mit dem ausgewählten Schwellwerts und Zuordnen eines Pixels zu einer Zeichenklasse, wenn eine Intensität für das Pixel geringer ist als der ausgewählte Schwellwert für das Pixel.
  8. Bildverarbeitungssystem, das folgende Merkmale aufweist: einen Prozessor, der einen Eingang zum Empfangen eines digitalen Bildes aufweist; ein Speichermedium, das durch den Prozessor lesbar ist, das ein Programm aufweist, um den Prozessor anzuweisen, das folgende Verfahren durchzuführen: Auswählen eines Schwellwerts aus einer Mehrzahl von Schwellwerten basierend auf den relativen Größen der Schwellwerte; und, Zuordnen jedes Pixels in dem digitalen Bild zu einer von zwei Klassen gemäß dem Wert seiner Intensität relativ zu dem ausgewählten Schwellwert für das Pixel.
  9. Computerlesbares Medium, das ein Programm zum Durchführen der folgenden Schritte enthält: Auswählen eines Schwellwerts aus einer Mehrzahl von Schwellwerten für jedes Pixel in einem digitalen Bild, basierend auf den relativen Größen der Schwellwerte; und Zuordnen jedes Pixels in dem digitalen Bild zu einer von zwei Klassen gemäß dem Wert seiner Intensität relativ zu dem ausgewählten Schwellwert für das Pixel.
DE10303724A 2002-01-31 2003-01-30 Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder Expired - Fee Related DE10303724B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/062,250 2002-01-31
US10/062,250 US7088857B2 (en) 2002-01-31 2002-01-31 Dynamic bilevel thresholding of digital images

Publications (2)

Publication Number Publication Date
DE10303724A1 DE10303724A1 (de) 2003-08-14
DE10303724B4 true DE10303724B4 (de) 2007-06-28

Family

ID=22041209

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10303724A Expired - Fee Related DE10303724B4 (de) 2002-01-31 2003-01-30 Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder

Country Status (3)

Country Link
US (1) US7088857B2 (de)
DE (1) DE10303724B4 (de)
GB (1) GB2385187B (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8215556B2 (en) * 2004-06-28 2012-07-10 Konica Minolta Laboratory U.S.A., Inc. Color barcode producing, reading and/or reproducing method and apparatus
US7533817B2 (en) * 2004-08-09 2009-05-19 Konica Minolta Systems Laboratory, Inc. Color barcode producing method and apparatus, color barcode reading method and apparatus and color barcode reproducing method and apparatus
US7669769B2 (en) 2005-03-28 2010-03-02 Konica Minolta Systems Laboratory, Inc. Systems and methods for preserving and maintaining document integrity
WO2008030104A1 (en) * 2006-09-07 2008-03-13 Lumex As Relative threshold and use of edges in optical character recognition process
US7766241B2 (en) * 2006-09-29 2010-08-03 Konica Minolta Systems Laboratory, Inc. Barcode for two-way verification of a document
US7628330B2 (en) * 2006-09-29 2009-12-08 Konica Minolta Systems Laboratory, Inc. Barcode and decreased-resolution reproduction of a document image
US7873214B2 (en) 2007-04-30 2011-01-18 Hewlett-Packard Development Company, L.P. Unsupervised color image segmentation by dynamic color gradient thresholding
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US8073284B2 (en) * 2008-04-03 2011-12-06 Seiko Epson Corporation Thresholding gray-scale images to produce bitonal images
JP2011172101A (ja) * 2010-02-19 2011-09-01 Panasonic Corp 画像符号化方法、画像符号化装置及び撮像システム
CN102423837A (zh) * 2011-09-13 2012-04-25 中煤北京煤矿机械有限责任公司 用于大型结构件坡面焊接的单轴变位机
TW201715472A (zh) * 2015-10-26 2017-05-01 原相科技股份有限公司 影像分區門檻值決定方法、手勢判斷方法、影像感測系統以及手勢判斷系統
US11847771B2 (en) * 2020-05-01 2023-12-19 Samsung Electronics Co., Ltd. Systems and methods for quantitative evaluation of optical map quality and for data augmentation automation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0356225A2 (de) * 1988-08-24 1990-02-28 Canon Kabushiki Kaisha Bildverarbeitungsgerät
EP0424854B1 (de) * 1989-10-23 1996-06-19 Sharp Kabushiki Kaisha Bildverarbeitungsvorrichtung mit adaptiver Entscheidungsschwelle zur Erzeugung von Binärdaten aus Halbtonbilddaten
US5651077A (en) * 1993-12-21 1997-07-22 Hewlett-Packard Company Automatic threshold determination for a digital scanner

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3665326A (en) * 1970-03-30 1972-05-23 Us Navy Automatic threshold detector with selectable percentage of threshold crossings
US4933869A (en) * 1988-11-18 1990-06-12 Gareis Ronald E Programmable threshold data detection system
US5093871A (en) 1989-10-10 1992-03-03 Unisys Corporation Method and apparatus for effecting background suppression of image data
US5201014A (en) 1990-02-08 1993-04-06 Hewlett-Packard Company Method and apparatus for establishing threshold level in a binary mode document scanner
JP2750226B2 (ja) 1991-02-19 1998-05-13 大日本スクリーン製造株式会社 二値化閾値の設定方法
US5280367A (en) 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
US5179599A (en) 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US5982944A (en) * 1991-09-27 1999-11-09 E. I. Du Pont De Nemours And Company Adaptive vision system using dual thresholding
US5454049A (en) * 1993-06-21 1995-09-26 Sony Electronics, Inc. Automatic threshold function for machine vision
CA2144793C (en) * 1994-04-07 1999-01-12 Lawrence Patrick O'gorman Method of thresholding document images
WO1996002897A2 (en) 1994-07-14 1996-02-01 Philips Electronics N.V. Mass detection in digital x-ray images using multiple threshold levels to discriminate spots
KR0136067B1 (ko) * 1994-08-12 1998-04-27 김광호 이치화상 프로세서
US5621815A (en) * 1994-09-23 1997-04-15 The Research Foundation Of State University Of New York Global threshold method and apparatus
AU4375296A (en) 1994-12-05 1996-06-26 E.I. Du Pont De Nemours And Company Adaptive vision system using dual thresholding
US5649025A (en) 1995-02-03 1997-07-15 Xerox Corporation Multithresholding for document image segmentation
US5878163A (en) * 1995-10-11 1999-03-02 Raytheon Company Likelihood-based threshold selection for imaging target trackers
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
US6593961B1 (en) * 1998-10-30 2003-07-15 Agilent Technologies, Inc. Test efficient method of classifying image quality of an optical sensor using three categories of pixels

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0356225A2 (de) * 1988-08-24 1990-02-28 Canon Kabushiki Kaisha Bildverarbeitungsgerät
EP0424854B1 (de) * 1989-10-23 1996-06-19 Sharp Kabushiki Kaisha Bildverarbeitungsvorrichtung mit adaptiver Entscheidungsschwelle zur Erzeugung von Binärdaten aus Halbtonbilddaten
US5651077A (en) * 1993-12-21 1997-07-22 Hewlett-Packard Company Automatic threshold determination for a digital scanner

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SAHOO u.a.: A surrey of Thresholding Techniques. Computer Vis., Graphics, and Image Proc. 41, 1988, S. 233-260
SAHOO u.a.: A surrey of Thresholding Techniques. Computer Vis., Graphics, and Image Proc. 41, 1988,S. 233-260 *
WESZKA, J.S.: A surrey of Threshold Selection Techniques. Computer Vis., Graphics, and Image Proc. 7, 1978, S. 259-265 *

Also Published As

Publication number Publication date
GB2385187B (en) 2005-07-20
GB0301945D0 (en) 2003-02-26
US20030142866A1 (en) 2003-07-31
DE10303724A1 (de) 2003-08-14
GB2385187A (en) 2003-08-13
US7088857B2 (en) 2006-08-08

Similar Documents

Publication Publication Date Title
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE69828909T2 (de) Neue perzeptive lokale gradientenbasierte gratbestimmung
DE60111756T2 (de) Verfahren zum verbessern der kompressionsfähigkeit und der bildqualität von abgetasteten dokumenten
DE69734855T2 (de) Vorrichtung und Verfahren zur Extraktion eines Objektes in einem Bild
DE10303724B4 (de) Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder
DE69906403T2 (de) Verfahren und Gerät zum Detektieren eines gesichtsähnlichen Gebiets
DE69736938T2 (de) Detektion und Wiedergabe von Text in gerasterten Bildbereichen
DE60003032T2 (de) Verfahren zur bildsegmentation
DE4001613C2 (de) Binärumsetzungsverfahren
WO1996019778A1 (de) Verfahren zur trennung einer vordergrundinformation von einer hintergrundinformation in einer vorlage
DE69822608T2 (de) Binarisierungsverfahren in einem Zeichenerkennungssystem
DE19744898A1 (de) Signaladaptives Filterverfahren und signaladaptives Filter
DE112008001052T5 (de) Bildsegmentierung und -Verbesserung
WO1994024634A1 (de) Verfahren zur detektion von änderungen in bewegtbildern
DE60302946T2 (de) Bildsegmentierungsverfahren und -vorrichtung zur MRC-basierten Darstellung von Dokumenten
EP2028605A1 (de) Detektionsverfahren für symmetrische Muster
DE102011102002A1 (de) Verfahren zur Rauschentfernung und Nachtsichtsystem unter Verwendung desselben
DE60219918T2 (de) Klassifikation von bildblöcken basierend auf der entropie von pixeldifferenzen
DE19883010B4 (de) Verfahren und Vorrichtung zum Erkennen eines sich bewegenden Objekts in einer Abfolge von Farbvollbildern
DE60023837T2 (de) Vorrichtung und verfahren zur filterung
DE102012201024B4 (de) Verfahren zum Verarbeiten eines Bildes zur Verdeutlichung von Text in dem Bild
DE69938473T2 (de) Verfahren zum umgekehrten Halbtonzittern niedriger Komplexität und Speicherung
DE102019204602B4 (de) Verfahren und Vorrichtung zur Maskierung von in einem Bild enthaltenen Objekten
EP3655920B1 (de) Verfahren und vorrichtung zur bewertung von bildausschnitten für eine korrespondenzbildung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: HEWLETT-PACKARD DEVELOPMENT CO., L.P., HOUSTON, TE

8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee