-
Die Erfindung bezieht sich allgemein
auf eine Bildverarbeitung und insbesondere auf Systeme und Verfahren
zum Verarbeiten des Durchscheinens bei abgetasteten Bildern.
-
Das elektronische Erfassen und Verarbeiten von
Bildern, egal ob Text, Graphik, monochrom und/oder Farbe, wurde
viele Jahre weitläufig
verwendet. Personalcomputersysteme mit optischen Abtastvorrichtungen,
die an dieselben angebracht sind, die z.B. unter der Steuerung eines
Bildabtast- und/oder Bildverarbeitungs-Anwendungsprogramms wirksam sind,
wurden für
geschäftliche
und private Nutzung weitläufig
erhältlich.
Papierdokumente werden in elektronische Dokumente umgewandelt, durch
die Verwendung einer Abtastvorrichtung, wie z.B. einer Desktopabtastvorrichtung,
einer Digitalkamera, einer Alles-in-Einem-Vorrichtung etc. Dem Abtasten
folgen häufig
Text- oder Bild-Verarbeitungsschritte,
wie z.B. die optische Zeichenerkennung (OCR; OCR = optical character
recognition) für
die Umwandlung von bitabgebildetem Text (bitmapped text) in ASCII/Unicode-Text,
oder die Vektorisierung von Graphiken (z.B. in ein Bezier-Format
oder ein skalierbares Vektorgraphikformat (SVG-Format)).
-
Die Technik jedoch, die beim Erfassen
und Verarbeiten solcher Bilder implementiert wird, ist häufig nicht
ohne Nachteil. Abgetastete Bilder umfassen häufig Anomalien in dem elektronischen
Bild, die in einer abgetasteten Originalkopie nicht vorhanden sind
oder die die abgetastete Originalkopie nicht genau repräsentieren.
Ein elektronisches Bild, das z.B. unter Verwendung eines typischen
personalcomputerbasierten Scanners erfaßt wird, kann anomale Bits umfassen,
die dem Phänomen
des „Durchscheinens" zugeordnet sind,
was dazu führt,
daß ein
elektronisches Bild die abgetastete Originalkopie nicht genau repräsentiert.
Das Durchscheinen resultiert aus Bildern auf der Rückseite
eines Dokuments, die während
des Abtastens der Vorderseite des Dokuments sichtbar oder teilweise
sichtbar sind. Dementsprechend kann ein gespiegelter „Geist" des Bildes von der
Rückseite
des Dokuments in dem abgetasteten Vorderbild des Dokuments als Ergebnis
des Durchscheinens erscheinen. Üblicherweise
ist das Geistbild besonders in „Hintergrund"-Bereichen des abgetasteten
Vorderbildes vorherrschend. Ein solches Geistbild entspricht jedoch üblicherweise
nicht direkt dem Bild von der Hinterseite des Dokuments, aufgrund
von Dingen wie Streuung (Lichtdispersion, die dem Dokumentmedium
zugeordnet ist), Dunkelheitspegel des Rückseitenbildes, Dunkelheitspegel
des Vorderseitenpegels, Unregelmäßigkeiten
in dem Dokumentmedium und ähnlichem.
-
Das Vorhandensein und/oder das Ausmaß des Durchscheinens,
das in einer bestimmten Situation vorhanden ist, kann durch eine
Anzahl von Variablen beeinflußt
werden. Die Qualität
und/oder Dicke des Papiers, das das Dokument aufweist, die bestimmten
Optiken, die beim Abtasten des Dokuments verwendet werden, die Lichtintensität, die das
Dokument für
die Abtastung beleuchtet und der Lichtwinkel können alle das Ausmaß beeinflussen,
zu dem ein Durchscheinen in einem bestimmten abgetasteten Bild vorhanden
ist.
-
In der Vergangenheit war das Bildabtasten zentral
für die
Benutzerschnittstelle. Das heißt,
das Abtasten wurde üblicherweise
dadurch erreicht, daß ein
Benutzer ein Blatt eines Dokuments, das abgetastet werden sollte,
auf eine Abtastvorrichtung plazierte und der Benutzer Abtastparameter
für das
spezifische Bild auswählte,
das abgetastet werden sollte. Der Benutzer kann z.B. die Region
oder die Regionen auswählen,
die abgetastet werden sollen, den Bildtyp, der abgetastet werden
soll, den Intensitätspegel
der Abtastung etc. Nachdem ein Bild erworben wurde, kann der Benutzer
das abgetastete Bild weiter handhaben, um ein gewünschtes
Ergebnis zu liefern, wie z.B. ungewünschte Bildbereiche abschneiden.
In extremen Situationen kann der Benutzer auswählen, das abgetastete Bild
zu verwerfen und erneut zu versuchen, ein abgetastetes Bild zu erwerben,
wie z.B. durch Einstellen von einem oder mehreren der zuvor genannten
Abtastparameter.
-
Ein derartiges benutzerschnittstellenzentrisches
Abtasten kann für
viele Situationen in der Vergangenheit akzeptabel sein. Da sich
die Bildverarbeitungstechnik jedoch über das letzte Jahrzehnt hinweg
weiterentwickelt hat, wurde ein handelsübliches, hochvoluminöses und/oder
weiter automatisiertes Abtasten immer mehr wünschenswert. Es ist z.B. nicht
unüblich,
daß ein
Dokumentabtasten den Bedarf umfaßt, eine große Anzahl
von Seiten zu einer Zeit abzutasten, wie z.B. bei einem Verlagbetrieb. Dementsprechend,
wenn ein Abtasten in einem angemessenen Zeitraum und zu vernünftigen
Kosten erreicht werden soll, ist es wünschenswert, den Prozeß zu automatisieren,
wodurch der Pegel der Benutzereingabe im Hinblick auf spezifische
individuelle Dokumente, die gescannt werden sollen, reduziert wird.
Ferner erfordern die Verwendungen, für die solche abgetastete Bilder
benutzt werden sollen, häufig zuverlässige Hochqualitätsabtastungen,
wie z.B., um eine genaue optische Zeichenerkennung zu liefern und/oder
um den Bedarf nach einer grundlegenden Prüfung/Handhabung eines abgetasteten
Bildes durch eine Bedienperson zu vermeiden.
-
Es wurden Versuche durchgeführt, ein Durchscheinen
automatisch zu erfassen, das in abgetasteten Bildern vorhanden ist.
Es ist jedoch sehr schwierig zu bestimmen, was Durchscheinen ist
und was nicht. Eine Bestimmung darüber, welche Abschnitte eines
abgetasteten Bildes das Ergebnis von Durchscheinen sind, kann auf
jenen Bereichen des Bildes basieren, die Pixel eines bestimmten
Intensitätsbereichs,
d. h. Grauskalawerte, enthalten. Durchscheinbestimmungen, ausschließlich basierend
auf solchen Kriterien, werden häufig
dazu führen,
daß gewünschte Abschnitte
des abgetasteten Bildes, d. h. des Bildes von der Vorderseite des
Dokuments, die ähnliche
Intensitätscharakteristika
aufweisen, als ein Durchscheinen identifiziert werden. Ein Durchscheindetektor,
der z.B. auf dieser Technik basiert, kann Hintergrundmerkmale des
Vorderseitenbildes fälschlich
als Durchscheinen identifizieren. Auf ähnliche Weise können Pixel,
die einem Übergang
von einem Merkmal in einem Bild zu einem anderen Merkmal in dem
Bild zugeordnet sind, fälschlich
als Durchscheinen identifiziert werden, da üblicherweise kein augenblicklicher Übergang
von einem Merkmal in einem Bild zu einem anderen Merkmal in einem
Bild vorliegt.
-
Die Verwendung der oben erwähnten Durchscheinbestimmungstechniken
bei einer automatisierten Handhabung des abgetasteten Bildes können zu unerwünschten
Ergebnissen führen.
Pixel z.B., die Textzeichen umgeben, bei denen eine Zeichenkante in
einen Bildhintergrund übergeht,
können
als Durchscheinen identifiziert werden und daher entfernt und durch
weiße
oder leere Pixel ersetzt werden. Es hat sich jedoch herausgestellt,
daß dies
dazu führt,
daß die
Zeichen durch weiß umgeben
sind, was einen Effekt liefert, bei dem die Zeichen erscheinen,
als ob sie ausgeschnitten und in das Bild eingesetzt worden wären, so
wie bei einer Lösegeldforderung.
-
Andere Techniken zum Entfernen von
Durchscheinen weisen ebenfalls weniger wünschenswerte Ergebnisse auf.
Wenn z.B. ein Bild ausschließlich Textzeichen
umfaßt,
kann es möglich
sein, das Bild zu binarisieren, um ein Durchscheinen zu entfernen. Genauer
gesagt kann ein Bild dadurch binarisiert werden, daß dasselbe
vollständig
schwarz und weiß gemacht
wird, ohne grau, d. h. eine Bittiefe von 1 anstelle von 8 oder 24.
Wenn ein Bild binarisiert ist, außer das Originaldokument stellt
besonders schlechte Durchscheincharakteristika dar, wie z.B. eine
Zeitschriftenseite, wird im wesentlichen das gesamte Durchscheinen
in weiß umgewandelt.
-
Die grauen Informationen, wie z.B.
die Übergangsbereiche
entlang der Kanten der Textzeichen, gehen jedoch verloren, was häufig unerwünschte Ergebnisse
liefert, z.B. kann die Binarisierung dazu führen, daß dünne Zeichenattribute zusammen
mit dem Durchscheinen entfernt werden. Wenn z.B. der Buchstabe „T" in dem abgetasteten
Bild erschienen ist, kann eine Binarisierung zu dem Verlust des
Querbalkens führen
und somit kann das Zeichen durch eine OCR-Anwendung als die Zahl „1" identifiziert werden oder
als eine Kleinbuchstabenaufbereitung des Buchstabens „L".
-
Es ist die Aufgabe der vorliegenden
Erfindung, ein Verfahren zum Identifizieren von Durchscheinen in
einem Bild, ein Verfahren zum Verarbeiten von Durchscheinen in einem
Bild, ein Verfahren zum Entfernen von Durchscheinen in einem Bild,
ein Computerprogrammprodukt und ein System zum Entfernen von Durchscheinen
aus einem Bild mit verbesserten Charakteristika zu schaffen.
-
Diese Aufgabe wird durch ein Verfahren
zum Identifizieren von Durchscheinen in einem Bild gemäß Anspruch
1, ein Verfahren zum Verarbeiten von Durchscheinen in einem Bild
gemäß Anspruch
11, ein Verfahren zum Entfernen von Durchscheinen aus einem Bild
gemäß Anspruch
20, ein Computerprogrammprodukt gemäß Anspruch 32 und ein System zum
Entfernen von Durchscheinen aus einem Bild gemäß Anspruch 42 gelöst.
-
Ein Ausführungsbeispiel der vorliegenden Erfindung
schafft ein Verfahren zum Identifizieren von Durchscheinen in einem
Bild, das folgende Schritte aufweist: Bestimmen eines Referenztonpunkts
eines ersten Bildes, Identifizieren vermeintlicher Durchscheinpixel
in dem ersten Bild als eine Funktion des Referenztonpunkts, Abbilden
der vermeintlichen Durchscheinpixel in eine vermeintliche Durchscheindarstellung
des ersten Bildes und Analysieren der vermeintlichen Durchscheinpixelabbildung,
um zu bestimmen, ob ein Durchscheinen in dem ersten Bild vorhanden
ist.
-
Ausführungsbeispiele der vorliegenden
Erfindung schaffen ein Verfahren zum Verarbeiten von Durchscheinen
in einem Bild, das folgende Schritte aufweist: Identifizieren von
vermeintlichen Durchscheinpixeln in dem ersten Bild, Abbilden der
vermeintlichen Durchscheinpixel in eine vermeintliche Durchscheindarstellung
des ersten Bildes und Verarbeiten der vermeintlichen Durchscheinpixelabbildung,
um Falsch-Positiv-Durchscheinpixel aus derselben zu entfernen.
-
Ausführungsbeispiele der vorliegenden
Erfindung schaffen ein Verfahren zum Entfernen eines Durchscheinens
aus einem Bild, das folgende Schritte aufweist: Abtasten eines Dokuments,
um ein elektronisches erstes Bild zu liefern, Abtasten des Dokuments,
um ein elektronisches zweites Bild zu liefern, wobei das erste und
das zweite Bild gegenüberliegenden
Seiten des Dokuments zugeordnet sind, Erzeugen einer vermeintlichen
Durchscheinpixelabbildung für
das erste Bild, Verarbeiten der vermeintlichen Durchscheinpixelabbildung
unter Verwendung von Informationen im Hinblick auf das zweite Bild
und Ersetzen der Pixel des ersten Bildes, die den vermeintlichen
Durchscheinpixeln der Abbildung entsprechen.
-
Ein Computerprogrammprodukt, das
ein computerlesbares Medium aufweist, das auf demselben eine aufgezeichnete
Computerprogrammlogik aufweist, zum Entfernen von Durchscheinen
aus einem Bild, wird gemäß einem
Ausführungsbeispiel der
vorliegenden Erfindung geschaffen, das folgende Merkmale aufweist:
einen Code zum Erzeugen einer vermeintlichen Durchscheinpixelabbildung
für ein erstes
Bild, einen Code zum Verarbeiten der vermeintlichen Durchscheinpixelabbildung
unter Verwendung von Informationen im Hinblick auf ein zweites Bild,
wobei das erste Bild und das zweite Bild gegenüberliegenden Seiten eines Dokuments
zugeordnet sind, und einen Code zum Ersetzen von Pixeln des ersten
Bildes, die vermeintlichen Durchscheinpixeln der Abbildung entsprechen.
-
Ausführungsbeispiele der vorliegenden
Erfindung schaffen ein System zum Entfernen eines Durchscheinens
aus einem Bild, das folgende Merkmale aufweist: eine Einrichtung
zum Erzeugen einer vermeintlichen Durchscheinpixelabbildung für ein erstes
Bild, eine Einrichtung zum Vergleichen von Informationen im Hinblick
auf ein zweites Bild mit der vermeintlichen Durchscheinpixelabbildung,
und eine Einrichtung zum Ersetzen von Pixeln des ersten Bildes,
die den vermeintlichen Durchscheinpixeln der Abbildung entsprechen,
unter Verwendung von Ersetzungspixeln.
-
Bevorzugte Ausführungsbeispiele der vorliegenden
Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden
Zeichnungen näher
erläutert.
Es zeigen:
-
1A bis 1C eine Vorder- und Hinter-Ansicht
eines Dokuments und eine Durchscheinerscheinung in einem abgetasteten
Bild der Vorderseite des Dokuments;
-
2 ein
System zum Abtasten eines Dokuments, wie das, das in den 1A und 1B gezeigt ist, das gemäß einem
Ausführungsbeispiel
der vorliegenden Erfindung angepaßt ist;
-
3 ein
Flußdiagramm
der Operation gemäß einem
Ausführungsbeispiel
der vorliegenden Erfindung; und
-
4 ein
auseinandergezogenes Diagramm eines Computersystems, wie z.B. dem,
das in 2 gezeigt ist,
das gemäß einem
Ausführungsbeispiel der
vorliegenden Erfindung angepaßt
ist.
-
Die vorliegende Erfindung richtet
sich auf das Verarbeiten von abgetasteten Bildern, um ein Durchscheinen
in einem abgetasteten Bild einzuschränken oder zu beseitigen. Dementsprechend verwendet
ein Ausführungsbeispiel
der vorliegenden Erfindung zweiseitige Abtasttechniken, bei denen nicht
nur die Vorderseite eines Dokuments, das ein gewünschtes Bild aufweist, das
abgetastet wird, sondern auch die Hinterseite des Dokuments abgetastet wird,
um Informationen im Hinblick darauf zu liefern, wo ein Durchscheinen
in dem abgetasteten Bild der Vorderseite des Dokuments vorliegen
könnte.
Die Informationen im Hinblick darauf, wo ein Durchscheinen in dem
abgetasteten Bild vorliegen kann, können bei solchen Ausführungsbeispielen
mit anderen Durchscheinkriterien verwendet werden, wie z.B. einem
Bereich von Durchscheinwerten, die aus dem abgetasteten Bild bestimmt
werden, um individuelle Durchschein-Pixel oder -Bits gemäß einem
Ausführungsbeispiel
der Erfindung zu identifizieren. Nachfolgend können die Durchschein-Pixel
oder -Bits durch Pixel oder Bits ersetzt werden, die mit dem abgetasteten
Originalbild besser übereinstimmen.
Das Ersetzen derartiger Pixel oder Bits gemäß einem Ausführungsbeispiel
der Erfindung verwendet eine Pseudo-Randomisierung von Ersetzungen,
um ein „natürlicheres" Erscheinen in dem
resultierenden Bild zu präsentieren.
-
Es sollte darauf hingewiesen werden,
daß keine
Einschränkung
im Hinblick auf eine bestimmte Dokumentausrichtung bei der Verwendung
der vorliegenden Erfindung vorliegt, obwohl hierin Bezug auf eine „Vorderseite" und eine „Hinterseite" eines Dokuments
genommen wird. Dementsprechend sind Bezugnahmen auf eine Vorderseite
oder eine Rückseite eines
Dokuments ausschließlich
relative Ausdrücke und
sollen in keinerlei Hinsicht einschränkend sein.
-
Unter Betrachtung der 1A und 1B sind die zwei Seiten eines Beispieldokuments 100 gezeigt.
Genauer gesagt weist das Dokument 100 eine Vorderseite 110 (1A) und eine Rückseite 120 (1B) auf. Das Bild, das auf
der Vorderseite 110 erscheint, umfaßt Text 111 und Graphik 112.
Auf ähnliche
Weise umfaßt
das Bild, das auf der Rückseite 120 erscheint,
Text 121 und Graphik 122. Das Dokument 100 kann
abgetastet werden, um ein elektronisches Bild der Vorderseite 110 zu
erhalten, wie z.B. unter Verwendung eines Personalcomputers 210 und einer
der Abtastvorrichtungen, die in 2 gezeigt sind,
d. h. eines Flachbettscanners 220, eines Scanners mit automatischer
Duplexdokumentzuführvorrichtung 230 und
eines doppelseitigen Scanners 240 oder anderer Scanner,
die bereits bekannt sind oder später
entwickelt werden. Das resultierende abgetastete Bild kann als ein
Bild 130 (1C)
erscheinen, das nicht nur den Text und die Graphik der Vorderseite 110 umfaßt, sondern
ferner ein Durchscheinen 131 und 132, das dem
Text 121 und der Graphik 122 oder Abschnitten
derselben von der Hinterseite 120 entspricht.
-
Es sollte darauf hingewiesen werden,
daß das
Identifizieren von Durchscheinen, das innerhalb eines abgetasteten
Bildes der Vorderseite eines Dokuments erscheint, unter Verwendung
von Informationen im Hinblick auf ein Bild, das auf der Rückseite des
Dokuments erscheint, nicht durch einen Seite-an-Seite-Vergleich der Bilder erreicht
werden kann. Ein abgetastetes Bild der Rückseite des Dokuments müßte „gespiegelt" werden oder entlang
einer Achse gedreht werden, um eine ordnungsgemäße Ausrichtung für eine vergleichende
Analyse des Durchscheinens von Kandidatenabschnitten des abgetasteten
Bildes der Vorderseite des Dokuments zu liefern. Eine weitere Handhabung
der Informationen im Hinblick auf das Bild, das auf der Rückseite
des Dokuments erscheint, kann jedoch nützlich sein, gemäß Ausführungsbeispielen
der vorliegenden Erfindung.
-
Informationen im Hinblick auf ein
Bild, das auf der Rückseite
eines Dokuments erscheint, werden häufig dem Durchscheinen nicht
direkt entsprechen, das innerhalb des abgetasteten Bildes der Vorderseite
des Dokuments erscheint, aus einer Anzahl von Gründen. Eine Streuung, die z.B.
dem Medium des Dokuments selbst zugeordnet ist, führt häufig zu einer
Verzerrung des Bildes von der Rückseite
des Dokuments aus der Sicht des Durchscheinens. Die Streuung resultiert
daraus, daß das
Dokument eine begrenzte Dicke aufweist, die eine leichte Fehlausrichtung
davon verursacht, wo ein Bild auf der Rückseite des Dokuments erscheint
und wo das entsprechende Durchscheinen in dem abgetasteten Bild
der Vorderseite des Dokuments erscheint. Anders ausgedrückt ist
das Geisterbild, das auf der Vorderseite des Dokuments erscheint,
leicht unterschiedlich von dem Bild, das auf der Rückseite
des Dokuments erscheint. Das Ausmaß der Auswirkungen der Streuung
hängt von
Variablen ab, wie z.B. der Dicke des Dokumentmediums, der Dichte
des Dokumentmediums, der Undurchsichtigkeit des Dokumentmediums, dem
Lichtwinkel, den verwendeten Optiken etc. Allgemein ausgedrückt jedoch,
wenn ein Dokument ein relativ dickes Papier aufweist, ist das Durchscheinen, das
in dem abgetasteten Bild der Vorderseite erscheint, etwas größer als
das entsprechende Bild auf der Hinterseite, aufgrund der Lichtstreuung
durch die Seite.
-
Ein anderer Grund dafür, daß Informationen im
Hinblick auf ein Bild, das auf der Rückseite eines Dokuments erscheint,
häufig
nicht direkt dem Durchscheinen entsprechen, das innerhalb des abgetasteten
Bildes der Vorderseite des Dokuments erscheint, umfaßt eine
Fehlausrichtung der abgetasteten Bilder der Vorderseite des Dokuments
und der Hinterseite des Dokuments. Eine solche Fehlausrichtung kann einer
schlechten Orientierung zwischen den zwei abgetasteten Bildern zugeordnet
sein, Versatzdifferenzen zwischen den abgetasteten Bildern und ähnlichem.
-
Dementsprechend adressieren Ausführungsbeispiele
der vorliegenden Erfindung eine Fehlausrichtung des Bildes, das
auf der Rückseite des
Dokuments erscheint, zu dem Durchscheinen, das in dem abgetasteten
Bild der Vorderseite des Dokuments erscheint, durch Analysieren
von Ausrichtung und Versatz. Eine derartige Fehlausrichtungsanalyse
kann eine Analyse von Pixeln und/oder Gruppen von Pixeln umfassen,
um die Pixel so genau wie möglich
von einer Seite des Dokuments zu der anderen aufzureihen, und daß dieselben
denselben Versatz aufweisen. Ein Ausführungsbeispiel der vorliegenden
Erfindung wirkt z.B., um ein abgetastetes Bild der Vorderseite eines
Dokuments und ein abgetastetes Bild der Rückseite des Dokuments zu erhalten, wobei
das Bild der Rückseite
des Dokuments gehandhabt wurde, z.B. gespiegelt, um einem potentiellen
Durchscheinen zu entsprechen, das in dem abgetasteten Bild der Vorderseite
des Dokuments erscheint, und analysiert wird, um Ausrichtung und
Versatz zu korrigieren. Nachfolgend werden diese Informationen als
eine Anleitung verwendet, um zu verifizieren, daß die Regionen, die als Durchscheinkandidaten
identifiziert wurden, z.B. jene Bereiche mit Pixel- oder Bit-Werten
innerhalb eines Durchscheinbereichs, tatsächlich ein Durchscheinen sind.
-
Abgetastete Bilder der Vorder- und Rück-Seite
eines Dokuments können
auf eine Anzahl von Weisen gemäß der vorliegenden
Erfindung erhalten werden. Eine erste Seite des Dokuments kann z.B.
abgetastet werden, und dann kann eine zweite Seite des Dokuments
abgetastet werden. Dies kann manuell erreicht werden, wie z.B. dadurch,
daß eine Bedienperson
das Dokument in einem Flachbettscanner 220 umdreht, oder
automatisch, wie z.B. durch eine automatische Dokumentzuführvorrichtung 231,
die ein Dokumentduplexen in der Abtastvorrichtung bzw. dem Scanner 230 implementiert.
Alternativ können
doppelseitige Optiken verwendet werden, wie z.B. jene von doppelseitigen
Abtastvorrichtungen 240, um abgetastete Bilder der Vorder-
und der Rück-Seite des Dokuments
zu erhalten. Das doppelseitige Abtasten eines Dokuments, wie z.B.
durch Verwenden einer Doppelseitenabtastvorrichtung 240,
wird weniger wahrscheinlich Versatz- und Ausrichtungs-Fehler erfahren.
Ferner können
bestimmte Ausführungsbeispiele
der vorliegenden Erfindung eine relativ schlechte Qualität verwenden,
z.B. eine niedrige Auflösung,
für das
abgetastete Bild der Rückseite
des Dokuments, beim Identifizieren und Reduzieren oder Entfernen
von Durchscheinen. Eine wirtschaftliche Doppelseitenabtastvorrichtung,
die gemäß den Lehren
der vorliegenden Erfindung verwendet wird, kann z.B. bereitgestellt
sein, in der ein Hochauflösungsabtasten
für eine
erste Seite eines Dokuments verwendet wird und ein Niedrigauflösungsabtasten
für die
andere Seite des Dokuments verwendet wird.
-
Gemäß Ausführungsbeispielen der vorliegenden
Erfindung wird ein abgetastetes Bild der Rückseite eines Dokuments verwendet,
um Informationen im Hinblick darüber
zu liefern, wo ein Durchscheinen in dem abgetasteten Bild der Vorderseite des
Dokuments vorliegen könnte.
Dementsprechend, obwohl eine relativ hohe Auflösung beim Abtasten der Vorderseite
des Dokuments erwünscht sein
könnte,
wie z.B. im Bereich von 300 ppi, um eine zuverlässige OCR oder detaillierte
Bilder zu liefern, kann eine relativ niedrige Auflösung, wie
z.B. im Bereich von 75 ppi, beim Abtasten der Rückseite des Dokuments verwendet
werden, um ausreichend Informationen im Hinblick darauf zu liefern,
wo ein Durchscheinen auftreten könnte.
Es sollte darauf hingewiesen werden, daß, zusätzlich zu dem Verwenden weniger
komplizierter optischer Systeme zum Bereitstellen des Abtastens
mit niedrigerer Auflösung der
Rückseite
des Dokuments, derartige Ausführungsbeispiele
die Verwendung von anderen Ressourcen optimieren, wie z.B. Speicher-
und Verarbeitungszyklen, beim Erwerben und Verarbeiten abgetasteter
Bilder der Rückseite
des Dokuments, während
weiterhin gewünschte
Ergebnisse entsprechend der vorliegenden Erfindung geliefert werden.
-
Wo unterschiedliche Auflösungen im
Hinblick auf die abgetasteten Bilder der Vorder- und Rückseite
eines Dokuments verwendet werden, skalieren bestimmte Ausführungsbeispiele
der vorliegenden Erfindung die höhere
Auflösung
nach unten, um der der niedrigeren Auflösung für eine Durchscheinanalyse zu
entsprechen, da es sich herausgestellt hat, daß die Durchscheinregionen sogar
bei solch niedrigen Auflösungen
mit akzeptabler Genauigkeit identifiziert werden können. Genauer
gesagt wirken Ausführungsbeispiele
der Erfindung, um die Kandidatenbereiche eines Durchscheinens auf
der Vorderseite des Dokuments mit dem physikalischen Vorhandensein
von Tinte auf der Rückseite
des Dokuments zu korrelie ren. Dementsprechend ist die bestimmte
Größe des Pixels,
das beim Bestimmen der Korrelation verwendet wird, eine Entwurfsauswahl, die
basierend auf solchen Berücksichtigungen
wie einer Pixelgröße getroffen
werden kann, die bestimmt wird, um ausreichende Informationen zu
liefern, um ein Durchscheinen gemäß Ausführungsbeispielen der vorliegenden
Erfindung zu identifizieren.
-
Unter Bezugnahme auf 3 erläutert
ein Flußdiagramm 300 die
Operation eines Ausführungsbeispiels
der vorliegenden Erfindung, um ein Durchscheinen in einem abgetasteten
Bild zu identifizieren und zu entfernen. Es sollte darauf hingewiesen
werden, daß die
Schritte des Flußdiagramms 300 in
der Form von Abtastvorrichtungs-Firmware und/oder -Software implementiert
sein können,
wie dieselben innerhalb prozessorbasierter Systeme anwendbar sind,
wie z.B. Personalcomputer 210 (2), Computer 400 (4) und/oder Abtastvorrichtungen 220–240 (2). Zusätzlich oder alternativ dazu können die
Schritte des Flußdiagramms 300 als Firmware
und/oder Software implementiert sein, die entfernt zu einer Abtastvorrichtung
betreibbar ist, die die Bilder erhält, wie z.B. ein Netzwerkanschluß, ein Internet-Webserver oder ähnliches.
-
Das dargestellte Ausführungsbeispiel
der Erfindung beginnt bei Schritt 301. Die Initiierung
der Schritte des Flußdiagramms 300 kann
z.B. manuell durch einen Benutzer initiiert werden oder kann automatisch
durch eine Abtast- oder Bild-Verarbeitungsoperation initiiert werden.
-
Bei Schritt 302 werden die
abgetasteten Bilder der Vorderseite eines Dokuments (z.B. Vorderseite 110)
und der Rückseite
eines Dokuments (z.B. Rückseite 120)
erhalten. Abgetastete Bilder der Vorder- und Rück-Seite des Dokuments können z.B. gleichzeitig
durch eine Abtastvorrichtung erhalten werden, die mit zweiseitigen
Optiken ausgerüstet
ist, wie z.B. die Abtastvorrichtung 240, die zwei CCD-Arrays aufweist,
eines angeordnet über
und eines unter dem Papierweg, mit zugehörigen Optiken. Alternativ können die
abgetasteten Bilder der Vorder- und Rück-Seite des Dokuments sequentiell
durch eine Abtastvorrichtung erhalten werden, die ausgerüstet ist,
um ein doppelseitiges Abtasten zu liefern, wie z.B. die Abtastvorrichtung 230,
die eine automatische Dokumentzuführvorrichtung aufweist, die
einen Papierrichtweg bereitstellt, der die Seite zwischen aufeinanderfolgenden
Durchläufen
umdreht. Auf ähnliche Weise
können
abgetastete Bilder der Vorder- und Rück-Seite des Dokuments sequentiell
durch eine Abtastvorrichtung erhalten werden, die ausgerüstet ist,
um ein einzelseitiges Abtasten zu liefern, wie z.B. die Abtastvorrichtung 220,
wobei eine Bedienperson manuell beide Seiten des Dokuments zum Abtasten vorlegt.
-
Ausführungsbeispiele der vorliegenden
Erfindung können
als eine alleinstehende Anwendung oder als Teil einer anderen Anwendung
implementiert sein, um eine verbesserte Funktionalität für eine Bildverarbeitungsanwendung
zu liefern. Dementsprechend kann eine gewünschte Auflösung, Bittiefe, Größe etc.,
die beim Abtasten der Bilder verwendet wird, automatisch durch eine
zugehörige
Abtastsoftware bestimmt werden, die für diese Aufgabe entworfen ist.
-
Die abgetasteten Bilder von Schritt 302 können durch
Auslösen
eines Abtastprozesses oder mehrerer Abtastprozesse unter der Steuerung
der vorliegenden Erfindung erhalten werden. Zusätzlich oder alternativ dazu
können
Ausführungsbeispiele der
vorliegenden Erfindung abgetastete Bilder verwenden, die vorangehend
erhalten wurden, wie z.B. für
einen anderen Zweck. Wenn der gesamte Inhalt einer Arbeit z.B. für ein Digitalisieren
abgetastet wird, können
abgetastete Bilder von sowohl der Vorderseite als auch der Rückseite
der Seiten derselben für eine
Digitalisierung vorgelegt werden. Vorzugsweise werden Informationen
im Hinblick darauf, welche Bilder einer Vorderseite und einer Rückseite
einer Seite zugeordnet sind, bereitgestellt oder können bestimmt werden.
Ausführungsbeispiele
der vorliegen den Erfindung können
die abgetasteten Bilder bei der Identifizierung und/oder Entfernung
eines Durchscheinens verwenden, wie hierin beschrieben wird.
-
Es sollte darauf hingewiesen werden,
daß die
Auflösung
von sowohl des Vorderseiten- als auch Rückseiten-Bildes hoch sein kann,
wie z.B. um die OCR beider Seiten unterzubringen, wenn abgetastete
Vorderseiten- und Rückseiten-Bilder
für andere Zwecke
erworben werden. Wie vorangehend beschrieben wurde, sind abgetastete
Hochauflösungsbilder
jedoch beim Bestimmen des Durchscheinens mit einer akzeptablen Sicherheit
gemäß der vorliegenden
Erfindung nicht erforderlich. Dementsprechend, obwohl die Auflösung der
erhaltenen Bilder dieselbe sein kann, können Ausführungsbeispiele der vorliegenden
Erfindung die Auflösung
der Bilder reduzieren, wie dieselben gemäß Aspekten der Durchscheinbestimmung
verarbeitet werden, wie z.B. um eine Speicherverwendung zu minimieren und/oder
ein Prozessorverhalten zu optimieren. Wenn z.B. ein „automatischer" Durchscheinanalysemodus
(der z.B. wenig oder keine Benutzereingabe bei der Durchscheinanalyse
akzeptiert) ausgewählt wird,
kann die Auflösung
der abgetasteten Bilder für die
Durchscheinanalyse gemäß der vorliegenden
Erfindung verringert werden, wie z.B. auf 75 ppi, obwohl eine höhere Abtastauflösung, wie
z.B. 300 ppi, im Hinblick auf die Bildverarbeitung zu anderen Zwecken
verwendet wird, wie z.B. für
die OCR-Verarbeitung. In Situationen jedoch, in denen Bildvorschauen einem
Benutzer für
die Durchscheinanalyse vorgelegt werden, kann die Originalabtastauflösung gemäß der vorliegenden
Erfindung verwendet werden.
-
Die abgetasteten Bilder entsprechender
Vorder- und Rück-Seiten des Dokuments
können
mit ihren relevanten Metadaten gespeichert werden. Derartige Metadaten
können
Informationen im Hinblick auf die Höhe, Breite, Bittiefe, x-Achsen- und y-Achsen-Auflösung und/oder ähnliches
umfassen. Ausführungsbeispiele
der vorliegenden Erfindung verwenden solche Daten beim Vergleichen
oder anderweitigen Verarbeiten der Bilddaten. Die Metadaten können z.B.
beim Reduzieren der Auflösung
eines Bildes verwendet werden, um der des anderen Bildes für eine Durchscheinpixelanalyse
zu entsprechen.
-
Schritt 303 des dargestellten
Ausführungsbeispiels
vergleicht die Auflösung
der entsprechenden Vorderseiten- und Rückseiten-Bildabtastungen. Ein
Vergleich der Auflösung
kann einen Vergleich in sowohl der x-Achsen- als auch der y-Achsen-Richtung
umfassen. Obwohl der Vergleich von Schritt 303 gemäß der vorliegenden
Erfindung optional ist, d. h. das Ausführungsbeispiel kann automatisch
dieselbe Auflösung
für die
Vorderseiten- und Rückseiten-Abtastungen
verwenden, ist derselbe in dem dargestellten Ausführungsbeispiel
umfaßt,
um unterschiedliche Auflösungen
für die
Vorderseiten- und Rückseiten-Abtastungen
unterzubringen.
-
Die Verwendung von unterschiedlichen
Auflösungen
bei den zwei Abtastungen kann gemäß bestimmten Ausführungsbeispielen
der Erfindung wünschenswert
sein. Die Optiken können
sich z.B. auf den zwei Seiten der Abtastvorrichtung unterscheiden (und
können
tatsächlich
auf einer Seite vereinfacht werden, wobei nur eine geringe Auflösung geliefert wird,
wenn die Abtastung der zweiten Seite nur zum Zweck dieser Erfindung
verwendet wird), wobei verhindert wird, daß die zweite Seite dieselbe
Auflösung erreicht
wie die erste Seite. Ferner wird eine Speicherverwendung dadurch
gespart, daß die
Rückseitenabtastung
nicht mit einer genauso hohen Auflösung (und/oder Bittiefe) wie
der Vorderseite durchgeführt
wird, insbesondere wenn dieselbe nicht zu dem Zweck dieser Erfindung
verwendet werden soll (d. h., die tatsächlichen Daten auf der Rückseite
sind für den
Benutzer nicht interessant). Dementsprechend kann jede Situation,
in der das abgetastete Bild der Rückseite eines Dokuments nur
für eine
mögliche Durchschein-Erfassung
und -Entfernung verwendet werden soll, potentiell von der Verwendung
von Niedrigauflösungsabtastungen
desselben profitieren.
-
Zusätzlich dazu kann eine Abtastvorrichtung entsprechende
abgetastete Bilder unterschiedlicher Auflösung liefern, in Situationen,
in denen die abgetasteten Bilder der zwei Seiten unterschiedliche
Datentypen enthalten, die an unterschiedlichen Zielorten oder bei
unterschiedlichen Endanwendungen etc. verwendet werden sollen. Die
zweite Seite eines Dokuments kann z.B. ein Photo aufweisen und die
erste Seite kann Text aufweisen (d. h. unterschiedliche Datentypen).
Entsprechend können
sich die zwei Seiten in ihren „optimalen" Abtasteinstellungen
unterscheiden, wobei hier die erste Seite allgemein größere Pixel
pro Zoll erfordert als die zweite Seite, und die zweite Seite allgemein
eine größere Bittiefe
erfordert als die erste Seite.
-
Wenn beide entsprechenden abgetasteten Bilder
nicht dieselbe Auflösung
aufweisen, fährt
das Verarbeiten gemäß dem dargestellten
Ausführungsbeispiel
mit Schritt 304 fort. Wenn jedoch beide entsprechenden
abgetasteten Bilder dieselbe Auflösung aufweisen, fährt das
Verarbeiten gemäß dem dargestellten
Ausführungsbeispiel
mit Schritt 305 fort.
-
Bei Schritt 304 wird das
abgetastete Bild mit der höheren
Auflösung
(höchste
ppi) nach unten skaliert, um mit der Auflösung des abgetasteten Bildes mit
der niedrigen Auflösung
(niedrigere ppi) überein zu
stimmen oder derselben näherungsweise
zu entsprechen. Das Nach-Unten-Skalieren der Auflösung des
abgetasteten Bildes mit höherer
Auflösung
wird gemäß dem dargestellten
Ausführungsbeispiel durchgeführt, da
es z.B. schneller und/oder weniger prozessorintensiv ist, zwei kleinere
Dateien als zwei größere Dateien
zu vergleichen. Zusätzlich
dazu kann das Nach-Unten-Skalieren
auf eine solche Weise erreicht werden, um einen Glättungsschritt
bereitzustellen, wodurch es weniger wahrscheinlich ist, unerwünschte Artefakte
einzubringen, die aus dem Nach-Oben-Skalieren resultieren würden. Eine „Nächster-Nachbar"-Transformation (Mittelwertbildung
aus den Pixeln oder aus Teilen der Pixel, die das skalierte Pixel bilden)
kann z.B. verwendet werden, um eine Skalierung zu liefern, die das
Bild mit höherer
Auflösung
glättet.
-
Es sollte darauf hingewiesen werden,
daß die
vorliegende Erfindung vorzugsweise keine Informationen im Hinblick
auf das Bild verliert, obwohl das Nach-Unten-Skalieren eines Bildes
höherer
Auflösung
gemäß dem dargestellten
Ausführungsbeispiel erörtert wird.
Das Bild höherer
Auflösung
des Dokuments wird z.B. gesichert, und das Bild mit nach unten skalierter
Auflösung
wird für
eine Durchscheinpixelidentifizierung gemäß einem Ausführungsbeispiel der
vorliegenden Erfindung hergestellt. Nachdem die Durchscheinpixel
gemäß der vorliegenden
Erfindung identifiziert wurden, kann dann eine Durchscheinpixelabbildung
aufwärts
zu der Auflösung
des Originalbildes skaliert werden, für eine Entfernung und ein Ersetzen
der Durchscheinpixel.
-
Bei Schritt 305 des dargestellten
Ausführungsbeispiels
werden das eine oder die mehreren abgetasteten Bilder auf ein Durchscheinen
hin getestet. Die Vorderseite oder beide Seiten, wenn jede Seite
für eine
Verwendung über
die vorliegende Erfindung hinaus vorgesehen ist, kann bei Schritt 305 bewertet
werden, um zu bestimmen, ob ein Durchscheinen in dem Bild vorhanden
ist. Algorithmen der vorliegenden Erfindung können z.B. wirken, um abgetastete
Bilder zu untersuchen, um Informationen für eine Bestimmung im Hinblick
auf das Vorhandensein von Durchscheinen zu liefern. Dementsprechend können Pixelmuster
analysiert werden, um ein Vorhandensein eines bestimmten Verhältnisses
von Pixeln zu erfassen, die ein Attribut aufweisen, wie z.B. Intensität, Grauskalapegel,
Zufallsplazierungsmuster etc., die in dem abgetasteten Bild vorhanden
sind. Gemäß einem
Ausführungsbeispiel
können
Durchscheinkandidatenseiten oder Abschnitte von Seiten automatisch
identifiziert werden, durch Identifizieren eines weißen Punktes
in dem abgetasteten Bild, Bestimmen einer Anzahl oder eines Prozentsatzes
von Pixeln, die eine Intensität
oder einen Grauskalawert innerhalb eines vorbestimmten Bereichs
dieses weißen
Punk tes aufweisen, und wenn diese Anzahl oder dieser Prozentsatz
eine Schwelle überschreitet,
derartiges Bezeichnen des abgetasteten Bildes, daß dasselbe
potentiell ein Durchscheinen umfaßt.
-
Ein Histogramm (Array mit so vielen
Elementen, wie es die Bittiefe ermöglicht, 2N Elemente,
wobei N = Anzahl der Bits der Tiefe ist; z.B. 256 für ein 8-Bit-Abtasten)
der Intensitäten
(Werte, die den „Weißgrad" darstellen) der
Pixel in dem abgetasteten Bild können
z.B. erhalten werden. Genauer gesagt kann ein Histogramm, das eine
Bitzählung
der Anzahl von Bits liefert, die jeden Intensitätspegel aufweisen, gebildet
werden.
-
Ein weißer Punkt für das abgetastete Bild kann
durch eine Analyse dieses Histogramms gefunden werden. Der weiße Punkt
kann z.B. derart bestimmt sein, daß er die Pixelintensität oder der
Weißgradpegel
ist, der dem Histogrammelement entspricht, bei dem 95% oder ein
anderer Abschnitt der Histogrammpixel dunkler sind und 5% oder ein
anderer Abschnitt der Histogrammpixel heller sind. Auf ähnliche
Weise kann ein schwarzer Punkt für
das abgetastete Bild durch eine Analyse des Histogramms gefunden
werden. Der schwarze Punkt kann z.B. so bestimmt sein, daß er die
Pixelintensität
ist, die dem Punkt entspricht, bei dem 5% oder ein anderer Abschnitt
der Histogrammpixel dunkler sind und 95% oder ein anderer Abschnitt
der Histogrammpixel heller sind.
-
Wenn der weißeste Punkt 2N-1
ist (z.B. 255 für
8 Bit-Tiefe-Pixel)
und der schwärzeste
Punkt 0 ist, kann ein typischer oben identifizierter weißer Punkt bei
85–99
dieses Bereichs liegen (z.B. zwischen 217–252, wenn eine 8-Bit-Tiefe
verwendet wird). Ein typischer oben identifizierter schwarzer Punkt
kann bei 0–40%
dieses Bereichs identifiziert sein (z.B. zwischen 0 und 102, wenn
eine 8-Bit-Tiefe
verwendet wird). Ein typischer schwarzer Punkt liegt allgemein näher an 0,
wenn Photos auf der Seite vorliegen, und näher an 100, wenn nur ein durchschnittliche
dimensionierter Text auf der Seite vorliegt.
-
Es sollte darauf hingewiesen werden,
daß Autobelichtungstechniken
falls erwünscht
an das Histogramm angewendet werden können. Wenn ein Bild z.B. unterbelichtet
ist, was dazu führt,
daß der weiße Punkt
bei einer Pixelintensität
von 200 liegt und der schwarze Punkt bei einer Pixelintensität von 100
liegt (in einem 8 Bit-Tiefe-Bereich von 0–225), können Autobelichtungstechniken
angewendet werden, um den Bereich von dem weißen Punkt zu dem schwarzen
Punkt zu strecken, um sich von 50 bis 225 zu erstrecken und dadurch
einen etwas normalisierten weißen
Punkt und/oder schwarzen Punkt zu liefern.
-
Nachdem ein weißer Punkt in dem abgetasteten
Bild identifiziert wurde, kann eine „Spitze" in dem Histogramm um den weißen Punkt
erhalten werden, um eine Grenze für eine Identifizierung von Durchscheinpixeln
zu errichten. Das Histogramm kann z.B. „geglättet" werden (z.B. unter Verwendung eines
Bewegungsdurchschnittsfilters) und das resultierende geglättete Histogramm
kann analysiert werden, um Krümmungspunkte
zu lokalisieren, die den weißen
Punkt umgeben. Eine Weißspitze
kann zwischen den zwei Krümmungspunkten
definiert sein. Zusätzlich
oder alternativ dazu kann ein schwarzer Punkt, der in dem abgetasteten
Bild identifiziert ist, verwendet werden, um eine „Spitze" in dem Histogramm
für eine
Identifizierung von Durchscheinpixeln zu erhalten, im wesentlichen
wie im Hinblick auf den weißen
Punkt beschrieben wurde. Solche weißen und schwarzen Punkte werden
hierin ebenfalls als Referenztonpunkte bezeichnet.
-
Ein Glätten des Histogramms wird gemäß bestimmten
Ausführungsbeispielen
der vorliegenden Erfindung verwendet, da Histogramme, insbesondere
jene, die abgetasteten Bildern aus Niedrigqualitätsabtastvorrichtungen zugeordnet
sind, dazu neigen, grob oder „choppy" zu sein. Genauer
gesagt neigt ein Histogramm dazu, eine große Anzahl von Pixeln bei einem
Pixelwert aufzuweisen, keines oder sehr wenige Pixel für mehrere
Pixelwerte, eine große Anzahl
von Pixeln bei einem anderen Pixelwert usw. Eine derartige Histogrammgrobheit
resultiert häufig daraus,
daß eine
Niedrigqualitäts-Abtastvorrichtung die
Abtastung von einer niedrigen Anzahl von Bits nach oben skaliert,
wie z.B. von 4 oder 5 Bits zu einer größeren Anzahl von Bits, wie
z.B. 8 Bits. Das Glätten
gemäß Ausführungsbeispielen
der vorliegenden Erfindung verteilt die Bitzählungen unter den Pixelwerten
gleichmäßiger, um
zu einem Histogramm zu führen,
das leichter nach Spitzen analysiert werden kann.
-
Eine „Spitze" in dem Histogramm, die einem Durchscheinen
entspricht, kann identifiziert werden, wie z.B. eine Spitze in dem
Histogramm direkt unter der Weißspitze.
Durchscheinspitzen werden gemäß Ausführungsbeispielen
der vorliegenden Erfindung in dem oberen Viertel des Bereichs zwischen
dem schwarzen Punkt und dem unteren Ende der Weißspitze gesucht, z.B. innerhalb
von 25% der Weißspitze.
Wenn die Weißspitze
z.B. von 230–245
reicht (in einem 8 Bit-Tiefe-Histogramm) und der schwarze Punkt
80 beträgt,
dann ist der Durchscheinsuchbereich unter 230, aber weit über 80.
Dementsprechend kann ein Durchsuchen des oberen Viertels des Schwarzpunkt-
zu dem unteren Weißspitzenpunkt-Bereich,
oder 192–230,
für eine „Durchschein"-Spitze gemäß einem Ausführungsbeispiel der
vorliegenden Erfindung angemessen sein. Es sollte darauf hingewiesen
werden, daß das
niedrige Ende dieses Suchbereichs angemessen ist, da, wenn ein Durchscheinen
tatsächlich
dunkler ist als das niedrigere Ende dieses Bereichs, wird es schwierig
sein, das Durchscheinen ohne ein nachteiliges Beeinflussen von Textqualität oder anderer
Bildattribute zu entfernen. Ein derartiges Durchscheinausmaß ist selten,
das aus Papier von schlechter Qualität, übermäßig leistungsstarker Abtastbelichtung
etc. resultiert. Ferner verhindert ein Setzen dieses niedrigeren
Endes des Bereichs bei 75% der Distanz hin zu dem weißen Punkt
von dem schwarzen Punkt ein Identifizieren von hellem Text als Durchscheinen,
wie er bei ungefähr
einem Drittel bis einer Hälfte
des Wegs zwischen den weißen
und den schwarzen Punkten erscheinen kann, aufgrund eines Abtastens mit
sehr schnellem Durchsatz. Das obere Ende des Suchbereichs ist angemessen,
da ein Durchscheinen unter der Weißspitze liegen sollte.
-
In der Praxis hat es sich herausgestellt,
daß viele
Durchscheinspitzen teilweise oder vollständig durch die Weißspitze
verdeckt sind. Wenn somit keine Durchscheinspitze identifiziert
wird, können
andere Techniken verwendet werden, um einen Durchscheinbereich zu
errichten. Der Bereich für
die Durchscheinsuche kann z.B. auf die Breite der Weißspitze
gesetzt werden, aber um die Hälfte
des Weißspitzenbereichs
dunkler versetzt, gemäß einem
Ausführungsbeispiel
der Erfindung. Dementsprechend, wenn der weiße Bereich 230–245 ist
und keine Durchscheinspitze gefunden wird, kann der Durchscheinbereich
auf 222–237
gesetzt werden.
-
Sobald ein Durchscheinbereich entweder identifiziert
oder berechnet wurde, kann jedes der Pixel, dessen Intensitätswert in
den Durchscheinbereich fällt,
in eine separate Darstellung (oder „Abbildung") des abgetasteten Bildes abgebildet
werden, gemäß einem
Ausführungsbeispiel
der vorliegenden Erfindung. Eine solche Abbildung kann eine einfache (z.B.
binäre)
Matrixdarstellung des Abschnitts des abgetasteten Bildes darstellen,
wo vermeintliche Durchscheinbits lokalisiert sind. Die Abbildung
des abgetasteten Bildes, das von einem Speicherstandpunkt und einem
Verhaltensstandpunkt aus in dem Speicher sehr wenig Raum einnimmt,
kann analysiert werden, um zu bestimmen, ob ein Durchscheinen gemäß Ausführungsbeispielen
der vorliegenden Erfindung existiert.
-
Bei Schritt 306 des dargestellten
Ausführungsbeispiels
wird eine Bestimmung darüber
durchgeführt,
ob das abgetastete Bild ein Durchscheinen umfaßt. Eine Untersuchung hat erge ben,
daß die
zuvor genannten Abbildungen von vermeintlichen Durchscheinpixeln
häufig
erkennbare Attribute liefern, wenn ein Durchscheinen tatsächlich vorhanden ist.
Die Durchscheinpixel der Abbildung neigen dazu, in größeren Regionen
zusammengruppiert zu sein, wo durchgehende Regionen, wie z.B. ein
großer Block
aus Text oder einem Photo, auf der Rückseite des Dokuments durchschienen.
Zusätzlich
dazu neigen die Durchscheinpixel der Abbildung dazu, einen großen Prozentsatz
der Pixel in dem Histogramm darzustellen, wo tatsächlich ein
Durchscheinen vorhanden ist, wie z.B. wo Text von der Rückseite
konsistent durchgeschienen hat.
-
Dementsprechend analysieren Ausführungsbeispiele
der vorliegenden Erfindung die zuvor genannte Abbildung auf verschiedene
Weisen, um ein Durchscheinen zu erkennen, das verschiedenen Situationen
zugeordnet ist. Durch Verwenden der Abbildung, die durch Schritt 305 bereitgestellt
wird, der oben beschrieben ist, kann gefolgert werden, daß ein Durchscheinen
in dem abgetasteten Bild vorliegt, wenn die Pixel der Abbildung
dazu neigen, sich in relativ großen Regionen zu gruppieren,
wie z.B. Regionen größer als
von einer zufälligen
Verteilung erwartet wird. Zusätzlich
oder alternativ dazu, wenn die Pixel der Abbildung einen beträchtlichen
Prozentsatz der Pixel in dem Histogramm darstellen (z.B. > 2,5% der Pixel in
der Seite) , dann kann gefolgert werden, daß ein Durchscheinen in dem
abgetasteten Bild vorliegt. Obwohl ein Schwellbetrag gemäß der vorliegenden
Erfindung beim Bestimmen des Vorhandenseins von Durchscheinen verwendet
werden kann, wurde empirisch bestimmt, daß 2,5% üblicherweise weit unter dem
Betrag des Durchscheinens liegen, der von einer Rückseite
resultiert, die im wesentlichen nur Text ist. In einer solchen Situation, wenn
weniger als ungefähr
2,5% von vermeintlichen Durchscheinpixeln in dem abgetasteten Bild
der Vorderseite des Dokuments vorliegen, liegt wahrscheinlich kein
bedeutender Betrag von Durchscheinen vor, aber die Grauwerte und Übergänge von
schwarz zu weiß auf
der Vorderseite wurden als vermeintliche Durchscheinpixel identifiziert.
-
Es sollte darauf hingewiesen werden,
daß die
Implementierung der Algorithmen, die oben im Hinblick auf die Schritte 305 und 306 beschrieben wurden,
eine Bestimmung des Vorhandenseins von Durchscheinen ohne Benutzerintervention
liefern (d. h. „automatische" Bestimmungen liefern)
und besonders nützlich
sein können,
wenn der Benutzer ein Durchscheinen auf Seiten entfernen möchte, die
ein beträchtliches
Durchscheinen aufweisen und folglich wahrscheinlich eine schlechte
visuelle Qualität.
Die vorliegende Erfindung ist jedoch nicht auf die Verwendung der
oben beschriebenen bestimmten Methodik beschränkt. Dementsprechend können verschiedene
Methoden und Kombinationen derselben zum Testen und/oder Bestimmen
des Vorhandenseins von Durchscheinen gemäß der vorliegenden Erfindung
verwendet werden.
-
Gemäß Ausführungsbeispielen der Erfindung
kann eine Bedienperson bestimmte abgetastete Bilder als Durchscheinkandidaten
identifizieren. Ein Vorschau-/Revisions-Fenster kann z.B. einer
Bedienperson vorgelegt werden, um die abgetasteten Bilder zu betrachten
und zu bestimmen, ob ein Durchscheinen vorhanden ist. Es sollte
darauf hingewiesen werden, daß viele
Seiten mit Durchscheinen nur geringe Durchscheinauswirkungen auf
das Erscheinen haben und wenig bis keine Auswirkung auf Aufgaben,
wie z.B. OCR. Dementsprechend kann eine Bedienpersoneingabe nützlich sein,
um aus einer Vielzahl von Prozessen auszuwählen, die auf das Bild angewendet
werden können,
abhängig
von den Umständen.
Eine solche Bedienpersoneingabe kann alternativ zu den zuvor genannten
Algorithmen für eine
automatisierte Bestimmung des Durchscheinens verwendet werden oder
in Kombination mit derselben. Die Werte, die bei der automatisierten
Bestimmung verwendet werden, können
z.B. angepaßt sein,
um zu übermäßig einschließenden Bestimmungen
im Hinblick auf Durchscheinen zu führen, und einer Bedienperson
können
abgetastete Bilder vorgelegt werden, von denen bestimmt wurde, daß dieselben
Durchscheinkandidaten für
eine abschließende Bestimmung
sind. Alternativ können
einer Bedienperson alle abgetasteten Bilder für eine Durchscheinbestimmung
vorgelegt werden, falls erwünscht.
-
Alternativ kann jede Seite als ein
Durchscheinkandidat gekennzeichnet oder voreingestellt sein, um
sicherzustellen, daß Durchschein-Identifizierungs-
und -Entfernungs-Schritte
an jedes abgetastete Bild angewendet werden. Dies kann in Situationen
bevorzugt werden, in denen das Entfernen des Durchscheinens höchst erwünscht ist.
-
Unabhängig davon, wie eine Bestimmung
im Hinblick auf ein Durchscheinen in einem abgetasteten Bild bei
Schritt 306 durchgeführt
wird (z.B. ob dasselbe durch automatische Algorithmen, Bedienpersoneingabe
oder Voreinstellung bestimmt wird), fährt ein Verarbeiten im Hinblick
auf ein abgetastetes Bild, das Durchscheinen aufweist, mit den Schritten 307–309 gemäß dem dargestellten
Ausführungsbeispiel
fort. Ein Verarbeiten im Hinblick darauf, daß kein Durchscheinen in einem
abgetasteten Bild vorliegt, wie bei Schritt 306 bestimmt
wurde, fährt
mit Schritt 310 fort.
-
Bei Schritt 307 werden zwei
entsprechende abgetastete Bilder, z.B. ein Vorderseitenbild und
ein entsprechendes Rückseitenbild
im Hinblick aufeinander so gehandhabt, daß die Pixel auf der Rückseite, die
möglicherweise
ein Durchscheinen auf die Vorderseite verursachen, ausgerichtet
werden. Üblicherweise
umfaßt
dies zumindest ein „Umdrehen" des Rückseitenbildes
(Drehen desselben um dessen y-Achse, wenn die Optiken eine Richtung
des Lichts bereits korrigiert haben), so daß die Rückseite als ein „Spiegelbild" lesbar wäre, das
dem Abschnitt der Rückseite
entspricht, der auf das Vorderseitenbild durchgezeigt wird.
-
Eine zusätzliche Handhabung der abgetasteten
Bilder kann verwendet werden, um Fehler auszugleichen, die einer
Ausrichtung, einem Versatz, einer Brechung etc. zugeordnet sind.
In dem Fall einer gleichzeitigen Abtastung können die Pixel bereits ausreichend
ausgerichtet sein und somit ist möglicherweise keine Verarbeitung
im Hinblick auf Ausrichtung und/oder Versatz nötig. Wenn die zwei abgetasteten
Bilder jedoch unabhängig
abgetastet wurden (d. h. nicht gleichzeitig), dann kann ein Dokument
falsch (d. h. dessen x- und/oder y-Ursprung sind unterschiedlich)
im Hinblick auf das andere ausgerichtet sein. Die Abtastung des
Dokuments beginnt z.B. möglicherweise
nicht an demselben Punkt für jede
Seite des Dokuments, wie z.B. aufgrund dessen, daß das Dokument
in der Abtastvorrichtung von Abtastung zu Abtastung nicht auf dieselbe
Weise plaziert wird, was zu einer Fehlausrichtung von Seite zu Seite
führt.
Auf ähnliche
Weise kann die Abtastsoftware, die beim Erhalten der abgetasteten
Bilder verwendet wird, die Daten ausrichten, die von der Seite kommen,
derart, daß ein
Spiegelbild des abgetasteten Rückseitenbildes
nicht ordnungsgemäß mit dem abgetasteten
Bild der Vorderseite ausgerichtet ist. Ferner kann ein Dokument
im Hinblick auf das andere versetzt sein. Eine Zuführrolle
kann das Dokument z.B. schieben oder fangen, das gescannt wird,
was dazu führt,
daß das
Dokument durch die Abtastvorrichtung nicht im rechten Winkel entlang
einer der Achsen des Dokuments zugeführt wird. Dementsprechend liefern
Ausführungsbeispiele
der vorliegenden Erfindung eine Korrektur für Ausrichtungs- und Versatz-Fehler.
-
Unterschiedlicher Versatz und Fehlausrichtungen
können
gemäß Ausführungsbeispielen
der vorliegenden Erfindung unter Verwendung eines Nachweises für Durchscheinen
korrigiert werden, wie für
eines der abgetasteten Bilder bestimmt wurde. Eine Abbildung (z.B.
eine Binärpixelabbildung
derselben Dimensionen wie der zwei Bilder) der vermeintlichen Durchscheinpixel
kann z.B. für
eines der abgetasteten Bilder durchgeführt werden (z.B. abhängig davon,
welches abgetastete Bild den „besten
Nachweis" für Durchscheinen
aufweist). Die Pixel der Durchscheinabbildung können mit einer Pixelabbildung
von der entsprechenden Seite ausgerichtet werden, um eine relative
Position zu identifizieren, die eine höchste Korrelation aufweist.
Eine Schwarzpixelabbildung (Schwellenabbildung der Pixel unter dem
Durchscheinbereich, z.B 0–221
bei dem obigen Beispiel) von dem abgetasteten Bild der Rückseite kann
mit der Durchscheinabbildung von dem abgetasteten Bild der Vorderseite
verglichen werden, um Versatz und Ausrichtung zu korrigieren.
-
Es sollte darauf hingewiesen werden,
daß die
Abbildung der Durchscheinpixel, wie dieselbe gemäß diesem Ausführungsbeispiel
der vorliegenden Erfindung verwendet wird, bereits von dem Testen des
abgetasteten Bildes bezüglich
Durchscheinen verfügbar
sein kann, wie oben im Hinblick auf Schritt 305 des dargestellten
Ausführungsbeispiels
erörtert wurde.
Dementsprechend kann eine Pixelanalyse, wie z.B. die, die oben im
Hinblick auf Schritt 305 beschrieben wurde, weiterhin implementiert
werden, obwohl dieselbe vielleicht nicht verwendet wird, um zu bestimmen,
ob ein Durchscheinen in den zuvor genannten Ausführungsbeispielen der Bestimmung von
Benutzereingabe und eines Standarddurchscheinens vorliegt.
-
Projektionsprofilverfahren (wie in
der Technik bekannt ist), bei denen Pixel eines bestimmten Attributs,
die jedem der entsprechenden abgetasteten Bilder zugeordnet sind,
in der X- und Y-Richtung gezählt
und aufgereiht werden, können
für eine
Versatzkorrektur und Ausrichtung gemäß der vorliegenden Erfindung
verwendet werden. Ein Versatz kann z.B. über den Bereich von -5 bis
+5 Grad getestet werden, wie z.B. in Inkrementen von 0,1 oder 0,2
Grad. Natürlich
können
andere Versatz- und Ausrichtungs-Techniken gemäß der vorliegenden Erfindung
verwendet werden, wie z.B. Hough-Transformationen,
falls erwünscht.
Die höchste
Korrelation zwischen den Abbildungen der zwei abgetasteten Bilder
entspricht der Tatsache, wann dieselben am besten bezüglich Versatz
korrigiert sind und wann dieselben am besten ausgerichtet sind.
-
Wenn keine akzeptable Korrelation
auftritt (z.B. es liegt keine offensichtliche „Spitze" in dem Korrelationskoeffizienten um
die „besten" versatzkorrigierten
und Ausrichtungs-Werte vor), ist dies eine Anzeige dafür, daß kein Durchscheinen
zum Korrigieren vorliegt. Entsprechend sollte darauf hingewiesen
werden, daß die
Operation der Schritte des dargestellten Ausführungsbeispiels eine Prüfung für die Durchscheinbestimmungen
liefert, die in denselben ausgeführt
wurden.
-
Nach dem Anwenden der oben beschriebenen
Techniken Bezug nehmend auf den Schritt 307 des dargestellten Ausführungsbeispiels
wird jedes Pixel (x, y) in dem abgetasteten Vorderseitenbild mit dem
Pixel ausgerichtet, das demselben auf dem abgetasteten Rückseitenbild
zugrunde liegt. Es sollte darauf hingewiesen werden, daß eine exakte
Ausrichtung aufgrund solcher Dinge wie Streuung vielleicht nicht
erreicht werden kann. Die Ausführungsbeispiele
der vorliegenden Erfindung liefern jedoch eine Korrektur der relativen
Ausrichtung von jeder der entsprechenden Seiten unter Verwendung
einer höchsten
Korrelation, die statistisch gesehen Fehler verringert, die einer
Streuung zugeordnet sind. Ferner vermindert die Verwendung der Auflösung auf
unterer Ebene zum Vergleich der entsprechenden Bilder, wie oben
beschrieben, die Auswirkungen der Streuung weiter. Dementsprechend
wirken die hierin beschriebenen Ausführungsbeispiele der vorliegenden
Erfindung, um einen Ausgleich für
die Auswirkungen der Streuungen in dem Endresultat zu liefern.
-
Bei Schritt 308 liefert das dargestellte
Ausführungsbeispiel
eine Identifizierung von Durchscheinpixeln für ein nachfolgendes Ersetzen,
um eine bessere visuelle Qualität
zu liefern. Für
das abgetastete Bild der Vorderseite des Dokuments können z.B.
alle Pixel in dem Durchscheinbereich (z.B. 222–237 in dem obigen Beispiel)
in einer Durchscheinabbildung markiert werden (hierin bezeichnet als 1), die möglicherweise
bereits in Zuordnung mit den Techniken erzeugt wurde, die bei Schritt
305 implementiert wurden, wie oben beschrieben. Für das abgetastete
Bild der Rückseite
des Dokuments können
alle Pixel, die dunkler sind als der Durchscheinbereich (z.B. 0–221), in
einer Versatz- und Ausrichtungs-korrigierten Rückseitenabbildung markiert
werden (hierin bezeichnet als 2).
Pixelpositionen in 1 (der
Durchscheinabbildung), die derart markiert sind, daß sie vermeintliche
Durchscheinpixel enthalten, die nicht auch in 2 (der Rückseitenabbildung) markiert
sind, werden aus 1 gelöscht, gemäß Ausführungsbeispielen
der vorliegenden Erfindung, da diese Pixel „falschen Positiven" für das Durchscheinen
entsprechen. Solche falschen Positive erscheinen häufig innerhalb
von Bildern oder an den Kanten von Text und Zeichnungen in dem abgetasteten
Bild der Vorderseite, da solche Bereiche oft Übergangspixel umfassen (z.B. Graupixel,
die die Skala zwischen schwarz und weiß der Kante durchqueren).
-
Obwohl die Durchscheinabbildung,
die aus der obigen Technik resultiert, eine relativ genaue Darstellung
von Durchscheinpixeln liefert, sollte darauf hingewiesen werden,
daß dieselbe
nicht alle potentiellen Quellen von falschen Positiven darstellt.
Bereiche, in denen das Vorderseitenbild Informationen umfaßt, die
Pixel innerhalb des Durchscheinpixelwerts aufweisen, an einer Position,
die einem Bereich auf der Rückseite
entspricht, wo Informationen vorhanden sind, können zu falschen Positiven
führen. Dementsprechend
verarbeiten Ausführungsbeispiele der
vorliegenden Erfindung die Pixel von 1 weiter,
um das Auftreten der Identifizierung von Falsch-Positiv-Durchscheinpixeln
weiter zu beseitigen.
-
Ein solcher weiterer Prozeß identifiziert
Regionen, wie z.B. Polygonalregionen, die unter Verwendung von Kasteneingrenzungstechniken
identifiziert werden, wobei Regionen, die kleiner sind als ein Schwellenwert,
aus der 1 gelöscht werden. Dies
führt dazu,
daß kleine
Regionen ignoriert werden (d. h. aus 1 entfernt
werden und daher nicht ersetzt werden müssen), wie sie z.B. geringen
Abweichungen beim Abtasten-, Staub, kleinen Schmutzpartikeln, Kopiermaschinenmarkierungen etc.
zugeordnet sind, von denen es unwahrscheinlich ist, daß dieselben
groß genug
sind, um Textregionen zu sein, und es daher unwahrscheinlich ist,
daß dieselben
eine nachteilige Auswirkung auf den visuellen Eindruck haben. Wenn
z.B. 75 × 75
ppi beim Analysieren der abgetasteten Bilder verwendet werden, können Bereiche
von weniger als 4 Pixel mal 4 Pixel (Bereiche von weniger als 16
Pixel) als falsche Positive und/oder Bereiche von unwesentlichem
Durchscheinen gelöscht
werden.
-
Ein anderer Prozeß kann wirken, um bestimmte
oder alle der verbleibenden Regionen von Durchscheinpixeln in 1 auszudünnen. Regionen, die weniger
als eine vorbestimmte Anzahl von Pixeln breit sind (in der X- oder
Y-Richtung) können z.B.
in ihrer Dicke reduziert werden, wie z.B. um einen Faktor der vorbestimmten
Anzahl von Pixeln (z.B. ein Viertel, ein Halb, drei Viertel), oder
sogar vollständig
gelöscht
werden. Bei dem hierin verwendeten Beispiel von 75 × 75 ppi
kann die vorbestimmte Anzahl von Pixeln 2 sein, so daß eine Region
von Durchscheinpixeln oder ein Abschnitt derselben in 1 von weniger als 2 Pixel,
wenn die Lauflänge betrachtet
wird, aus der Abbildung entfernt wird. Diese Technik ist nützlich beim
Verhindern, daß falsche Positive,
die Übergängen an
Kanten von Bildmerkmalen zugeordnet sind, z.B. Graupixeln, an der
Kante von Textzeichen erscheinen, die in den Durchscheinbereich
fallen, obwohl dieselben nicht einem Durchscheinen zugeordnet sind,
und ist besonders nützlich
beim Vermeiden der oben beschriebenen Auswirkung der „Lösegeldforderung".
-
Ein anderer Prozeß kann die Anzahl von Durchscheinpixel-Regionen und/oder
-Bereichen bestimmen, die den Durchscheinpixeln zugeordnet sind,
wie z.B. nachdem die oben erwähnten
Prozesse 1 verarbeitet
haben. Wenn in 1 sehr wenig
Regionen identifiziert werden (z.B.
-
weniger als 50 Regionen und/oder
weniger als 0,5 Quadratzoll insgesamt für die Regionen für ein Bild
der Größe Letter),
kann daraus gefolgert werden, daß kein oder im wesentlichen
kein Durchscheinen in dem abgetasteten Bild vorhanden ist und daher
kann 1 (die Durchscheinpixelabbildung) vollständig von
Pixeln entleert werden (d. h. es wird kein Durchscheinpixel-Entfernen/-Ersatz
stattfinden).
-
Gemäß dem dargestellten Ausführungsbeispiel
werden in 1 verbleibende
Pixel als Durchscheinpixel identifiziert und unterliegen einem Ersetzen
durch die Operation von Schritt 309. Dementsprechend, wenn
Durchscheinpixel in 1 verbleiben,
kann 1 und die Durchscheinpixel
nach oben zu der Originalauflösung
des abgetasteten Dokuments skaliert werden (Pixel-pro-Zoll), für einen
Ersatz gemäß Ausführungsbeispielen
der Erfindung. Vor einer Nach-Oben-Skalierung und einem Ersatz der
Durchscheinpixel machen Ausführungsbeispiele der
Erfindung die Durchscheinpixelregionen „fett", um die visuelle Auswirkung ihres Ersatzes
zu verringern. Jede Pixelregion, die in 1 verbleibt, oder ein Teilsatz derselben,
wie z.B. jene, die einen Bereich aufweisen, der eine vorbestimmte
Anzahl von Pixeln überschreitet,
werden verarbeitet, um Pixel zu denselben hinzuzufügen. Gemäß einem
Ausführungsbeispiel,
bei dem 75 × 75
ppi verwendet werden, werden Durchscheinpixelregionen der 1 gemäß der vorliegenden Erfindung
durch Hinzufügen von
einem Pixel-zu jeder Kante der Region fett gemacht. Dementsprechend
würde eine
4×4-Pixelregion
gemäß diesem
Ausführungsbeispiel
der Erfindung zu einer 6×6-Pixelregion
fett gemacht. Diese Erweiterung der Durchscheinpixelregionen stellt
sicher, daß Grenzpixel,
die zwischen den Durchschein- und den Nichtdurchschein-Bereichen übergehen,
obwohl dieselben vielleicht nicht in den oben errichteten Durchscheinbereich
fallen, ebenfalls gemäß der vorliegenden
Erfindung ersetzt werden, wodurch die Erscheinung einer dünnen Kontur
verhindert wird, wenn ein Übergang
von der Durchscheinersetzung zu der Nichtdurchscheinersetzung auftritt.
-
Bei Schritt 309 des dargestellten
Ausführungsbeispiels
können
Durchscheinpixel, wie z.B. jene, die in 1 identifiziert sind, durch weiße Quasizufallspixel
ersetzt werden, wie z.B. weiße
Pixel, die quasi zufällig
aus der Wahrscheinlichkeitsverteilung für die Weißspitze ausgewählt werden
(z.B. 230–245
in dem obigen Beispiel). Die „Quasizufälligkeit" eines
Ausführungsbeispiels
des obigen Lösungsansatzes
resultiert aus derselben Verteilung (Mittel-, Standard-Abweichung
etc.), die im Hinblick auf die ersetzten Pixel verwendet wird, wie
sie in den weißen
Pixeln der Weißspitze
angetroffen werden.
-
Es sollte darauf hingewiesen werden,
daß andere
Techniken für
einen Durchscheinpixelersatz gemäß der vorliegenden
Erfindung implementiert werden können.
Ausführungsbeispiele
der Erfindung können
die ersetzten Pixel leicht schwarz skalieren, wenn sich dieselben
schwarzen Pixeln außerhalb des
Durchscheinbereichs annähern,
und leicht weiß, wenn
sich dieselben weißen
Pixeln außerhalb
des Durchscheinbereichs nähern.
-
Auf ähnliche Weise besteht keine
Einschränkung,
daß die
vorliegende Erfindung nur verwendet wird, um ein Durchscheinen in
Bereichen von Weiß zu
entfernen oder mit Monochrombildern verwendet werden soll. Ausführungsbeispiele
der vorliegenden Erfindung sind wirksam, um Durchscheinpixel durch Pixel
zu ersetzen, die für
den Hintergrund darstellend sind, über dem dieselben liegen. Das
abgetastete Bild kann z.B. analysiert werden, um die Hintergrundfarbe
in einem Bereich zu bestimmen, in dem Durchscheinpixel ersetzt werden
sollen, um angemessen gefärbte
Pixel als Ersetzungen zu liefern. Gemäß einem Ausführungsbeispiel
der Erfindung wird ein Verzonungsalgorithmus oder Seitenanalysealgorithmus verwendet,
um Informationen im Hinblick auf eine Hintergrundfarbe eines abgetasteten
Bildes unter Verwendung einer Verzonungsmaschine zu liefern, die
einheitliche Hintergründe
identifizieren kann, die nicht weiß sind. Die Verwendung eines
solchen Verzonungsalgorithmus kann in Situationen nützlich sein,
in denen z.B. ein Kasten mit einem nichtweißen Hintergrund einen Textabschnitt
in dem abgetasteten Bild umgibt. Andere Techniken zum Ersetzen von Durchscheinpixeln
durch angemessen gefärbte
Pixel, die gemäß der vorliegenden
Erfindung nützlich sind,
können
die Analyse der Nachbarschaft um ein Durchscheinpixel nach Durchschnitts-
und Standard-Abweichung von Pixeln umfassen, unter Verwendung dieser
Informationen, um die Ersetzungspixelbestimmung zu treiben.
-
Bei Schritt 310 des dargestellten
Ausführungsbeispiels
wird eine Bestimmung darüber
durchgeführt,
ob zusätzliche
Dokumente für
eine Durchscheinpixelentfernung gemäß der vorliegenden Erfindung
verarbeitet werden sollen. Wenn die vorliegende Erfindung im Hinblick
auf zusätzliche
Dokumente betrieben werden soll, kann das Verarbeiten zu Schritt 302 zurückkehren,
für eine
Durchscheinpixel-Identifizierung und -Entfernung, wie oben beschrieben
wurde. Wenn jedoch keine zusätzlichen Dokumente
vorhanden sind, kann das Verarbeiten bei Schritt 311 enden.
-
Wenn diese in Software implementiert
sind, sind die Elemente der vorliegenden Erfindung im wesentlichen
die Codesegmente oder Logik, um die notwendigen Aufgaben durchzuführen, wie
z.B. die Schritte des oben erörterten
Flußdiagramms 300.
Die Programm- oder Code-Segmente können in einem prozessorlesbaren
oder computerlesbaren Medium gespeichert oder durch ein Computerdatensignal übertragen
werden, das in einer Trägerwelle
verkörpert
ist, oder ein Signal, das durch einen Träger moduliert ist, über ein Übertragungsmedium.
Das „prozessorlesbare
Medium" kann ein
Medium umfassen, das Informationen speichern oder übertragen
kann. Beispiele des prozessorlesbaren Mediums umfassen eine elektronische
Schaltung, eine Halbleiterspeichervorrichtung, einen ROM, einen
Flash-Speicher, einen löschbaren ROM
(EROM), eine Diskette, eine CD-Platten-CD-ROM, eine optische Platte,
eine Festplatte, ein Faseroptikmedium, eine Hochfrequenzverbindung
(HF-Verbindung) etc. Das Computerdatensignal kann ein Signal umfassen,
das sich über
ein Übertragungsmedium
ausbreiten kann, wie z.B. elektronische Netzwerkkanäle, optische
Fasern, Luft, Elektromagneten, HF-Verbindungen etc. Die Codesegmente oder
Logik können über Computernetzwerke
heruntergeladen werden, wie z.B. das Internet, das Intranet etc.
-
4 stellt
ein Computersystem 400 dar, das z.B. dem Personalcomputer 210 aus 2 entsprechen kann, das
an eine Verwendung der vorliegenden Erfindung angepaßt ist.
Eine zentrale Verarbeitungseinheit (CPU; CPU = central processing
unit) 401 ist mit dem Systembus 402 gekoppelt.
Die CPU 401 kann eine Allzweck-CPU sein, wie z.B. eine Hewlett-Packard
PA-8500 oder ein Intel Pentium Prozessor. Die vorliegende Erfindung
ist jedoch durch die Architektur der CPU 401 nicht eingeschränkt, solange
die CPU 401 die erfinderischen Operationen unterstützt, die
hierin beschrieben sind. Der Bus 402 ist mit dem Direktzugriffsspeicher
(RAM; RAM = random access memory) 403 gekoppelt, der ein
SRAM, DRAM oder SDRAM sein kann. Der ROM 404 ist ebenfalls
mit dem Bus 402 gekoppelt, der ein PROM, ein EPROM oder
EEPROM sein kann. Der RAM 403 und der ROM 404 halten
Benutzer- und System-Daten und -Programme, wie in der Technik bekannt
ist.
-
Der Bus 402 ist ferner mit
der Eingabe-/Ausgabe-Steuerkarte 405 (I/O-Steuerkarte),
der Kommunikationsadapterkarte 411, der Benutzerschnittstellenkarte 408 und
der Anzeigekarte 409 gekoppelt. Die I/O-Adapterkarte 405 verbindet
Speicherungsvorrichtungen 406, wie z.B. mindestens entweder eine
Festplatte, ein CD-Laufwerk, ein Diskettenlaufwerk, ein Bandlaufwerk,
mit dem Computersystem. Der I/O-Adapter 405 ist ferner
mit dem Drucker 414 verbunden, der es dem System ermöglichen
würde, Papierkopien
von Informationen zu drucken, wie z.B. Dokumente, Photographien,
Artikel etc. Es wird darauf hingewiesen, daß der Drucker 414 ein
Drucker (z.B. Punktmatrix, Laser etc.), eine Faxmaschine oder eine
Kopiermaschine sein kann. Der I/O-Adapter 405 ist ferner
mit einem Scanner 417 verbunden, der es dem System ermöglichen
würde,
digitale Bilder und/oder Informationen von gedruckten Papierkopien
von Informationen, wie z.B. Dokumenten, Photographien, Artikeln
etc., zu erwerben. Es wird darauf hingewiesen, daß der Scanner
in verschiedenen Ausführungsbeispielen
bereitgestellt sein kann, die einen Blattzuführscanner, einen Flachbettscanner,
einen Handhaltescanner, eine digitale Kamera und eine Videokamera
umfassen, wie sie z.B. den Scannern 220–240 aus 2 entsprechen können. Die
Kommunikationskarte 411 ist angepaßt, um das Computersystem 400 mit
einem Netzwerk 412 zu koppeln, das mindestens entweder
ein Telefonnetzwerk, ein lokales (LAN) und/oder ein weites (WAN) Netzwerk,
ein Ethernet-Netzwerk und/oder das Internet-Netzwerk sein kann.
Die Benutzerschnittstellenkarte 408 koppelt Benutzereingabevorrichtungen, wie
z.B. eine Tastatur 413, eine Zeigevorrichtung 407 und
ein Mikrophon 416, mit dem Computersystem 400.
Die Benutzerschnittstellenkarte 408 liefert ferner eine
Geräuschausgabe
an einen Benutzer über
einen oder mehrere Lautsprecher 415. Die Anzeigekarte 409 wird
durch die CPU 401 getrieben, um die Anzeige auf der Anzeigevorrichtung 410 zu
steuern.
-
Es sollte darauf hingewiesen werden,
daß die
Erfindung nicht auf die beschriebenen Ausführungsbeispiele beschränkt ist,
obwohl bestimmte Ausführungsbeispiele
hierin beschrieben wurden, um das Verständnis der Konzepte der vorliegenden
Erfindung zu unterstützen.
Es wurde z.B. Bezug auf die Entfernung von Durchscheinpixeln genommen,
die innerhalb des Bildes einer Vorderseite eines Dokuments auftreten,
unter Verwendung von Informationen im Hinblick auf die Rückseite
des Dokuments. Es besteht jedoch keine Einschränkung auf die Verwendung der
vorliegenden Erfindung mit einer Seite eines Dokuments. Dementsprechend
können
Ausführungsbeispiele
der vorliegenden Erfindung beim Entfernen von Durchscheinen in Bildern
verwendet werden, die einer Rückseite
eines Dokuments zugeordnet sind, sowie sowohl der Vorder- als auch
der Rück-Seite
eines Dokuments.
-
Auf ähnliche Weise wurden hierin
Ausführungsbeispiele
Bezug nehmend auf Bilder mit einer Auflösung von 75 ppi beschrieben.
Durchschnittsfachleute auf dem Gebiet werden jedoch leicht erkennen,
daß die
Konzepte der vorliegenden Erfindung für eine Anwendung auf Bilder
mit unterschiedlichen Auflösungen
gut geeignet sind, wie z.B. 150 ppi, 300 ppi, 600 ppi etc. Gemäß einem
Ausführungsbeispiel der
vorliegenden Erfindung können
Werte, die hierin Bezug nehmend auf Bilder von 75 ppi beschrieben wurden,
skaliert werden, um eine ähnliche
Operation im Hinblick auf Bilder zu liefern, die eine unterschiedliche
Auflösung
aufweisen. Beispielsweise und nicht einschränkend kann das Verarbeiten
von Regionen von vermeintlichen Durchscheinpixeln, um zu bestimmen,
ob dieselben aus der Durchscheinpixelabbildung (1) entfernt werden sollten, wie oben
erörtert
wurde, von Regionen kleiner als 4 Pixel mal 4 Pixel für 75 ppi
auf 8 Pixel mal 8 Pixel für
150 ppi skaliert werden.
-
Es sollte ferner darauf hingewiesen
werden, daß die
vorliegende Erfindung nicht auf die Schritte beschränkt ist,
die in dem dargestellten Ausführungsbeispiel
erläutert
sind. Dementsprechend können
zusätzliche
oder alternative Schritte beim Bereitstellen von Merkmalen und Funktionalität gemäß der vorliegenden
Erfindung implementiert werden. Das bestimmte Dokument, das abgetastet
wird, z.B. Qualität des
Papiermaterials, Typ des Dokuments, Format des Dokuments etc., kann
das Durchscheinen beeinflussen, das aus einem Abtasten resultiert.
Ausführungsbeispiele
der vorliegenden Erfindung können eine
Bedienperson im Hinblick auf das Dokument abfragen, das abgetastet
wird, um eine gewünschte Durchschein-Identifizierung
und -Entfernung zu liefern. Vorab eingerichtete Präferenzen,
wie z.B. Durchscheinbereich relativ zu weiß/schwarzem Punkt, Anzahl und/oder
Typ von zusätzlichen
Prozessen, die für
eine Durchscheinpixel- Identifizierung eines
falschen Positivs verwendet werden, Größe der Durchscheinregionen,
die ignoriert werden sollen, Prozentsatz der Durchscheinpixel in
einem Dokument, die ohne Entfernung akzeptiert werden sollen, Anzahl
von Pixeln, die fett gemacht werden sollen, und ähnliches, kann im Hinblick
auf bestimmte Dokumenttypen und/oder Inhalt verwendet werden. Natürlich können solche
Präferenzen
automatisch basierend auf einer Analyse des Dokuments und/oder von
dessen Inhalt ausgewählt
werden, wie z.B. optische Qualitäten,
Gewicht, Dicke, Lichtundurchlässigkeit
und/oder Formaterfassungseinrichtung, falls erwünscht.