-
HINTERGRUND
DER ERFINDUNG
-
1.
Bereich der Erfindung
-
Die
vorliegende Erfindung betrifft eine Bildverarbeitungstechnologie,
die eine bestimmte Verarbeitung von normal-orthogonal-transformierten
Bildern wie z.B. JPEG-Bildern (Joint Photographic Experts Group) durchführt.
-
2. Beschreibung des Stands
der Technik
-
Drucker
und ähnliches
sind als Ausgabevorrichtungen für
Dinge wie z.B. Bilder, die von einem Netzwerk herunter geladen werden,
Bilder, die unter Verwendung einer Digitalkamera geschossen werden,
und Bilder, die unter Verwendung eines Computers erzeugt werden,
bekannt. Drucker drucken Bilder durch Ausdrucken von Punkten auf
ein Druckmedium unter Verwendung von Tinte, etc., so dass normalerweise
nur zwei Abstufungen für
jeden Pixel ausgedrückt
werden, d.h. Punkt ein bzw. vorhanden oder aus bzw. nicht vorhanden.
Somit wird zum Ausdrücken
der Abstufung eines Bildes, bei dem eine Punktstreuung verwendet
wird, eine sog. Halbtonverarbeitung für das zu druckende Bild verwendet.
-
Unterdessen
sind seit den letzten Jahren die meisten Bilder wie beispielsweise
Bilder, die von einem Netzwerk herunter geladen werden, oder Bilder,
die unter Verwendung einer Digitalkamera geschossen werden, datenkomprimierte
Bilder, und die meisten von diesen sind JPEG-Bilder. JPEG (Joint
Photographic Experts Group) ist ein Standbildkompressionsverfahren,
das von der ISO (International Standardization Organization) und
der ITU-TS (International Telecommunication Union Telecommunication
Standardization Sector) bestimmt wird und für Vollfarben oder Grautöne verwendet
wird, und ein Schlüsselmerkmal
besteht darin, dass trotz des hohen Kompressionsniveaus die Verschlechterung
der Bildqualität
minimal ist.
-
Daher
ist es z.B., wenn ein JPEG-Bild, das von einem Netzwerk herunter
geladen wird, unter Verwendung eines Druckers gedruckt wird, notwendig,
eine Halbtonverarbeitung zu verwenden. In einem derartigen Fall
wurde in der Vergangenheit zuerst das herunter geladene JPEG-Bild
auf einem Computer expandiert, und danach wurde die Halbtonverarbeitung
des expandierten Bildes durchgeführt,
wonach es zum Drucker gesendet wurde.
-
Insbesondere
JPEG-Bilder sind Bilder, die einer diskreten Cosinustransformation
unterzogen werden, so dass, wenn ein JPEG-Bild expandiert wird,
eine umgekehrte diskrete Cosinustransformation dieses Bildes durchgeführt wird,
und nach dem Expandieren in räumliche
Koordinaten wird eine Halbtonverarbeitung des expandierten Bildes
durchgeführt.
Als Halbtonverarbeitung wird beispielsweise, wenn das Dither-Verfahren
verwendet wird, eine Dither-Matrix für das organisierte Dither-Verfahren
eingeführt,
und als ein Schwellenwert für eine
jeweilige Matrix wird ein Vergleich mit dem entsprechenden Koordinatenpunktpixelwert
(Pixelkonzentration) durchgeführt,
und dieser wird binärisiert.
-
Wenn
jedoch das herkömmliche
Verfahren verwendet wird, wird bei der Halbtonverarbeitung im Vergleich
zu einem Bild mit großem
Datenvolumen, das in die Raumkoordinaten expandiert wird, eine Binärisierung
durchgeführt,
während
die Koordinatenposition und der entsprechende Matrixwert für jeden
Pixel aufeinander folgend gesteuert werden, was zu dem Problem einer übermäßigen Belastung
für die
CPU und zu einer sehr langen Verarbeitungszeit führt.
-
Außerdem wird
das Bilddatenvolumen durch die Durchführung der Halbtonverarbeitung
erneut erhöht, und
um unter Verwendung des Druckers zu drucken, erhöht sich, wenn ein Drucksteuerbefehl
dem Bild hinzugefügt
wird, das Datenvolumen noch weiter. Daher ist es z.B., wenn der
Drucker mit einem Computer über
ein Netzwerk oder eine öffentliche
Leitung, etc. verbunden ist, notwendig, dieses Bild mit einem großen Datenvolumen
von dem Computer über
ein Netzwerk über
eine öffentliche
Leitung zum Drucker zu senden, was zu dem Problem führt, dass
die Kommunikationszeit lang ist, und zu Verkehrsproblemen führt.
-
Das
Dokument US-A-5 809 139 beschreibt ein digitales Verfahren und eine
digitale Vorrichtung zum Versehen mit einem Wasserzeichen, die die
Markierung eines digitalen Videosignals mit einem Wasserzeichen in
komprimierter Form erlaubt. Ein Videosignal wird transformationscodiert,
vorzugsweise mit einer diskreten Cosinustransformation, und ein
Wasserzeichensignal, das unter Verwendung desselben Typs von Transformation
transformationscodiert wurde, wird zum codierten Videosignal addiert.
Das Wasserzeichensignal selbst wird durch Wasserzeichenbits bestimmt,
die durch Wiederholung gemäß den Chipratenprinzip
gestreut werden, um eine Streufolge zu erhalten. Die Streufolge
wird mit einem Verstärkungsfaktor
verstärkt
und mit einer binären
Pseudo-Zufallsrauschfolge moduliert, um ein moduliertes Wasserzeichensignal
zu erhalten. Das somit modulierte Wasserzeichensignal wird dann
transformationscodiert. Das Wasserzeichensignal wird zu einem Empfänger übertragen.
Das empfangene Signal wird von einem Decodierer dekodiert, der die
umgekehrten Funktionen des Codierers, der für die Transformationscodierung
verwendet wird, durchführt.
-
Das
Dokument EP-A-0 766 468 beschreibt ein digitales Versehen mit einem
Wasserzeichen von Audio-, Bild-, Video- oder Multimediadaten, das
durch Einfügen
des Wasserzeichens in die wahrnehmbar signifikanten Komponenten
einer Aufspaltung von Daten derart erzielt wird, dass es visuell
nicht wahrgenommen wird. Eine Fouriertransformation der Daten wird
erhalten. Ein Wasserzeichen wird in wahrnehmbare signifikante Komponenten
des Frequenzspektrumbildes eingefügt. Das resultierende Wasserzeichenspektrumbild
wird einer umgekehrten Fouriertransformation unterzogen, um Daten
mit einem Wasserzeichen zu erzeugen.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Daher
ist es Aufgabe der vorliegenden Erfindung, die zuvor genannten Probleme
des Stands der Technik zu lösen,
eine Bildverarbeitungstechnologie bereitzustellen, die die Belastung
der CPU nicht erhöht
und einen äquivalenten
Prozess zur Halbtonverarbeitung eines normal-orthogonal-transformierten Bildes
durchführen
und dieses über
einen Kommunikationspfad mit minimalen Datenvolumen übertragen
kann.
-
Die
Aufgabe wird durch die Merkmale der unabhängigen Ansprüche gelöst. Die
abhängigen
Ansprüche
sind auf bevorzugte Ausführungsformen
der Erfindung gerichtet.
-
Auf
diese Weise addiert die Rauschaddiereinheit bestimmtes Rauschen
zu einem normal-orthogonal-transformierten Bild, wonach eine umgekehrte
Normal-Orthogonaltransformation, die eine umgekehrte Transformation
der zuvor genannten Normal-Orthogonaltransformation ist, des Bildes
durchgeführt,
und durch Binarisieren unter Verwendung eines bestimmten Schwellenwertes
ist es möglich,
eine Halbtonverarbeitung von etwa demselben Niveau wie die eines
gestreuten Dither (dispersed dither) zu realisieren.
-
Außerdem wird
durch Addieren von Rauschen zum normal-orthogonal-transformierten Bild
Rauschen ohne Expandieren des Bildes in die Raumkoordinaten zur
Ortsfrequenz addiert, so dass der Prozess für die Rauschaddiereinheit einfach
sein kann, und daher ist sogar dann, wenn die Rauschaddiereinheit
beispielsweise durch die Verwendung der CPU realisiert wird, die
Belastung für
die CPU sehr gering, und die Verarbeitungszeit ist ebenfalls kurz.
Außerdem
ist es aufgrund dessen ausreichend, eine CPU mit einer niedrigen
Verarbeitungskapazität
zu verwenden. Außerdem
ist es sogar dann, wenn eine zweckgebundene Hardware als die Rauschaddiereinheit
anstelle einer CPU verwendet wird, leicht, diese Hardware zu erstellen.
-
Außerdem ist
sogar dann, wenn ein rauschaddiertes Bild (Bild, zu dem Rauschen
addiert wurde) über einen
Kommunikationspfad zu einer anderen Vorrichtung transferiert wird,
das Bild selbst ein Bild, das einer Normal-Orthogonaltransformation unterzogen
wurde, so dass das Datenvolumen des Bildes relativ gering ist, und
daher kann die Kommunikationszeit sehr kurz sein, und es sind sogar
Datenpfade mit geringer Datenkapazität ausreichend, um derartige
Bilder zu handhaben.
-
Hinsichtlich
des Rauschens ist es durch Addieren dieser Art von Rauschen, das
von einer Dither-Matrix erhalten wird, möglich, die Qualität des letztendlich
erhaltenen Bildes zu verbessern. Außerdem ist es durch geeignetes Ändern der
Amplituden- oder Frequenzkomponenten, etc. des Rauschens, das zu
dem Bild addiert wird, möglich,
die Bildqualität
zu steuern, aber wie es oben beschrieben wurde, ist es unter Verwendung
von Rauschen, das von einer im Voraus bekannten Dither-Matrix erhalten
wird, als das Rauschen möglich,
diese Art von Bildqualitätssteuerung
noch genauer und noch leichter durchzuführen.
-
Es
ist vorteilhaft, wenn die Matrix eine Bayer-Matrix ist.
-
Dieses
kommt daher, dass die Bayer-Matrix typischerweise als die Dither-Matrix
für eine
Halbtonverarbeitung verwendet wird.
-
Es
ist vorteilhaft, wenn die Normal-Orthogonaltransformation eine diskrete
Cosinustransformation ist.
-
Dieses
kommt daher, dass eine diskrete Cosinustransformation breite Verwendung
als ein Verfahren findet, für
das eine hocheffiziente Bildkodierung möglich ist, und als eine Normal-Orthogonaltransformation
zur Bildverarbeitung geeignet ist.
-
Das
Bild, das der Normal-Orthogonaltransformation unterzogen wurde,
ist vorzugsweise ein JPEG-Bild.
-
Ein
JPEG-Bild ist ein datenkomprimiertes Bild und findet breite Verwendung
für beispielsweise
Internet-Homepages, Digitalkameras und Farbfaxgeräte, da ein
starker Bedarf nach einer Bildverarbeitung durch den Nutzer besteht.
Dieses kommt daher, dass JPEG-Bildexpansionsverfahren vorhanden
sind und diese Verfahren auf leichte Weise sogar dann verwendet
werden können,
wenn rauschaddierte JPEG-Bilder expandiert werden.
-
Die
Art von Umkehrtransformationseinheit und Binärisierungseinheit können eine
von der Bildverarbeitungsvorrichtung, die beispielsweise mit der
Rauschaddiereinheit ausgerüstet
ist, getrennte Vorrichtung sein, aber wie es oben beschrieben wurde,
können
sie ebenfalls in derselben Bildverarbeitungsvorrichtung vorgesehen
sein. Auf diese Weise kann, wenn in derselben Bildverarbeitungsvorrichtung
vorgesehen sind, unter alleiniger Verwendung dieser Bildverarbeitungsvorrichtung
die gesamte Halbtonverarbeitung vollendet und ein halbtonverarbeitetes
Bild erhalten werden.
-
Der
Schwellenwert kann ein bestimmter Wert sein.
-
Durch
Binärisieren
unter Verwendung eines bestimmten Schwellenwertes kann auf diese
Weise der Binärisierungsprozess
selbst leicht durchgeführt
werden.
-
Eine
Ausführungsform
der vorliegenden Erfindung enthält
vorzugsweise außerdem
eine Ausgabeeinheit, die das binärisierte
Bild durch Anzeigen oder Drucken ausgibt.
-
Durch
Ausrüsten
der Bildverarbeitungsvorrichtung mit dieser Art von Einheit ist
es möglich,
dem Nutzer auf geeignete Weise ein halbtonverarbeitetes Bild bereitzustellen.
-
Eine
andere Ausführungsform
führt eine
bestimmte Verarbeitung eines Bildes durch, dessen Hochfrequenzkomponenten
entfernt wurden.
-
Für datenkomprimierte
Bilder wie beispielsweise JPEG-Bilder werden normalerweise zum Komprimieren
von Daten Hochfrequenzkomponenten, für die das menschliche Auge
nicht sehr empfindlich ist, entfernt. Somit ist es durch Hinzufügen von
bestimmtem Rauschen zu einem Bild, bei dem diese Art von Hochfrequenzkomponente
entfernt ist, wenn die zuvor genannte umgekehrte Normal-Orthogonaltransformation
oder die Binärisierungsverarbeitung
danach mit dem Bild durchgeführt
wird, möglich,
eine Halbtonverarbeitung ähnlich wie
zuvor beschrieben zu realisieren.
-
Unter
Verwendung von Rauschen, das von einer Dither-Matrix erhalten wird,
als das Rauschen ist es möglich,
die Qualität
des letztendlich erhaltenen Bildes zu verbessern und die Bildqualität noch genauer
und leichter zu steuern.
-
Gemäß einer
anderen Ausführungsform
addiert die Rauschaddiereinheit bestimmtes Rauschen zum normal-orthogonal-transformierten
Bild, und die Sendeeinheit sendet dieses Bild über einen Kommunikationspfad,
während
im Hinblick auf die Empfangsvorrichtung die Empfangseinheit das
ge sendete Bild empfängt,
die Umkehrtransformationseinheit eine umgekehrte Normal-Orthogonaltransformation
des Bildes durchführt,
und die Binärisierungseinheit
das Bild unter Verwendung eines bestimmten Schwellenwerts binärisiert.
Durch die Durchführung
dieser Art von Verarbeitung ist es möglich, dasselbe Niveau der
Halbtonverarbeitung wie mit einem gestreuten Dither durchzuführen.
-
Außerdem wird
hinsichtlich der Empfangsvorrichtung eine Halbtonverarbeitung einfach
durch die Durchführung
einer umgekehrten Normal-Orthogonaltransformation
und einer Binärisierung
mit einem bestimmten Schwellenwert mit dem Bild, das von der Sendevorrichtung
gesendet wird (mit anderen Worten ein rauschaddiertes Bild), vollendet,
so dass die Verarbeitungszeit für
die Halbtonverarbeitung kurz ist. Außerdem fügen sogar dann, wenn die Umkehrtransformationseinheit
oder die Binärisierungseinheit
beispielsweise unter Verwendung einer CPU realisiert werden, die
Durchführung
der Bildumkehrtransformation und die Binärisierung selbst keine zusätzliche
Belastung der CPU hinzu.
-
Wenn
das Bild, das zur Empfangsvorrichtung über einen Kommunikationspfad
von der Sendevorrichtung transferiert wird, ein Bild ist, das mit
einer Normal-Orthogonaltransformation so belassen wird wie es ist, so
dass das Datenvolumen des Bildes relativ gering ist, ist die Kommunikationszeit
sehr kurz, und sogar wenn die Kommunikationspfaddatenkapazität niedrig
ist, reicht diese aus, um derartige Bilder zu handhaben.
-
Bei
der Speichervorrichtung einer anderen Ausführungsform der vorliegenden
Erfindung speichert die erste Speichereinheit das normal-orthogonal-transformierte
Bild, und die zweite Speichereinheit speichert eine Dither-Matrix
oder Rauschen, das durch Durchführen
derselben Transformation wie die Normal-Orthogonaltransformation
mit der Dither-Matrix erhalten wird.
-
Daher
ist es bei der Speichervorrichtung der vorliegenden Erfindung durch
Speichern der Dither-Matrix, die verwendet wird, wenn Rauschen hinzugefügt wird,
oder das Rauschen selbst in der Speichervorrichtung zum Speichern
von Bildern möglich,
auf leichte Weise Rauschen zu einem Bild zu addieren, ohne eine Dither-Matrix
oder Rauschen auf der Bildverarbeitungsvorrichtung vorzubereiten.
-
Das
computerlesbare Medium der vorliegenden Erfindung ist ein Medium,
das ein Bild speichert, das durch Addieren von bestimmtem Rauschen
zu einem normal-orthogonal-transformierten Bild erhalten wird.
-
Dadurch,
dass der Computer die zuvor genannten Bilder von einem derartigen
Medium liest und durch Durchführen
der zuvor genannten umgekehrten Normal-Orthogonaltransformation
und der Binärisierungsverarbeitung
ist es leicht, halbtonverarbeitete Bilder zu erhalten.
-
Für die vorliegende
Erfindung ist es ebenfalls möglich,
eine andere Form wie unten erwähnt
zu verwenden. Mit anderen Worten enthält die Form außerdem eine
Multiwerteinheit, die Multiwerte bzw. Mehrfachwerte für ein Bild
vergibt, das einer umgekehrten Normal-Orthogonaltransformation unterzogen
wird, unter Verwendung der Umkehrtransformationseinheit, die zwei
oder mehr unterschiedliche Schwellenwerte verwendet. Mit dieser
Form ist es möglich,
ein halbtonverarbeitetes Mehrfachwertbild zu erhalten.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
Es
zeigen:
-
1 ein
Blockdiagramm, das die summarische Struktur der Bildverarbeitungsvorrichtung
und des Bildverarbeitungssystems als eine erste bevorzugte Ausführungsform
der vorliegenden Erfindung zeigt,
-
2 ein
Flussdiagramm, das den Prozessfluss für das Bildverarbeitungssystem
der 1 zeigt,
-
3 eine
erläuternde
Figur, die das zweidimensionale Signal x(n, m) zeigt, das N × M Pixel
aufweist,
-
4A eine
erläuternde
Figur, die den DCT-Koeffizienten für eine zweidimensionale diskrete
Cosinustransformation zeigt,
-
4B eine
erläuternde
Figur, die das Grundbild für
eine zweidimensionale diskrete Cosinustransformation zeigt,
-
5 ein
Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit dem
Computer 100 und dem Drucker 200 der 1 ausgerüstet ist,
-
6 ein
Blockdiagramm, das ein spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt,
-
7 ein
Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt,
-
8 ein
Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt,
-
9 einer
erläuternde
Figur, die den Zustand eines Bildes zeigt, das einer diskreten Cosinustransformation
unterzogen wurde, wobei weißes
Rauschen dem Hochfrequenzbereich hinzugefügt wurde,
-
10A ein Blockdiagramm, das eine Variation der
Bildverarbeitungsvorrichtung der 1 zeigt,
-
10B ein Blockdiagramm, das eine Speichervorrichtung
zeigt, die mit der Bildverarbeitungsvorrichtung der 10A verbunden werden kann,
-
11 ein
Blockdiagramm, das die summarische Struktur einer Bildverarbeitungsvorrichtung
als eine zweite bevorzugte Ausführungsform
der vorliegenden Erfindung zeigt, und
-
12 ein
Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit dem
Computer 150 der 11 ausgerüstet ist.
-
BESCHREIBUNG
DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
-
(1) Struktur der ersten
bevorzugten Ausführungsform
-
Im
Folgenden wird ein bevorzugter Aspekt der vorliegenden Erfindung
auf der Grundlage einer bevorzugten Ausführungsform erläutert. 1 ist
ein Blockdiagramm, das die summarische Struktur einer Bildverarbeitungsvorrichtung
und eines Bildverarbeitungssystems gemäß einer ersten bevorzugten
Ausführungsform der
vorliegenden Erfindung zeigt.
-
Der
Computer 100 bildet die Bildverarbeitungsvorrichtung der
vorliegenden Erfindung, und zusammen mit dem Drucker 200 bildet
er das Bildverarbeitungssystem der vorliegenden Erfindung. Dieser
Computer 100 und der Drucker 200 sind über ein
Netzwerk 300 miteinander verbunden, und ein Server 400 ist
ebenfalls mit dem Netzwerk 300 verbunden.
-
Der
Computer 100 kann z.B. ein tragbares Informationsendgerät wie z.B.
ein mobiler Computer, ein PDA, oder ein tragbares Multifunktionstelefon
sein, und ist mit einer CPU 102 zum Durchführen verschiedener Prozesse
und Steuerungen gemäß einem
Computerprogramm, einem Speicher 104 zum Aufzeichnen des
zuvor genannten Computerprogramms und zum zeitweiligen Aufzeichnen
von Dingen wie z.B. Daten, die während
der Verarbeitung erhalten werden, einer I/O-Einheit 108 zum
Durchführen
des Austausches von Dingen wie beispielsweise Daten zwischen der
CPU 102 und anderen strukturellen Elementen, einer Betriebseinheit 110 zum
Eingeben von Befehlen, etc. von dem Nutzer, einem Monitor 112 zum
Anzeigen von Bildern, etc., und einer Kommunikationseinheit 106 zum
Durchführen
des Sendens und Empfangens von Dingen wie beispielsweise Daten mit
anderen Vorrichtungen wie beispielsweise dem Drucker 200 über das
Netzwerk 300 ausgerüstet.
-
Innerhalb
des Druckers 200 ist eine CPU 202 vorgesehen,
um verschiedene Prozesse und Steuerungen entsprechend einem Computerprogramm
durchzuführen,
sowie ein Speicher 204 zum Aufzeichnen des zuvor genannten
Computerprogramms und zum zeitweiligen Aufzeichnen von Dingen wie
beispielsweise Daten, die während
der Verarbeitung erhalten werden, eine I/O-Einheit 208 zum
Durchführen
des Austausches von Dingen wie beispielsweise Daten zwischen der
CPU 202 und anderen strukturellen Elementen, eine Druckermechanismuseinheit 210 zum
Drucken von Bildern, etc. auf Druckpapier, und eine Kommunikationseinheit 206 zum
Durchführen
des Sendens und Empfangens von Dingen wie beispielsweise Daten mit
anderen Vorrichtungen wie beispielsweise dem Computer 100 über das
Netzwerk 300.
-
Außerdem sind
innerhalb des Servers 400 verschiedene Bilder einschließlich JPEG-Bildern
gespeichert, und diese werden auf dem Netzwerk 300 veröffentlicht.
-
Für das Netzwerk 300 ist
es möglich,
verschiedene Netzwerke unabhängig
davon, ob sie drahtgebunden oder drahtlos sind, einschließlich dem
Internet, lokalen Netzwerken oder zweckgebundenen Netzwerken, zu
verwenden.
-
(2) Betrieb der ersten
bevorzugten Ausführungsform
-
Im
Folgenden wird der Betrieb dieser bevorzugten Ausführungsform
beschrieben. 2 ist ein Flussdiagramm, das
den Fluss der Prozesse für
das Bildverarbeitungssystem der 1 zeigt.
-
In 1 steuert,
wenn der Nutzer des Computers 100 Befehle zum Herunterladen
eines gewünschten JPEG-Bildes
von dem Server 400 über
die Betriebseinheit 110 gibt, die CPU 102 die
Kommunikationseinheit 106 entsprechend diesen Befehlen
und greift auf den Server 400 über das Netzwerk 300 zu,
lädt das Ziel-JPEG-Bild,
das im Server 400 gespeichert ist, herunter (Schritt S102
in 2), und speichert dieses im Speicher 104.
-
Wie
es zuvor beschrieben wurde, sind JPEG-Bilder datenkomprimierte Bilder
und werden einer diskreten Cosinustransformation unterzogen. Im
Folgenden wird die diskrete Cosinustransformation (DCT: diskrete
Cosinustransformation) erläutert.
-
Die
diskrete Cosinustransformation ist eine expandierte grade Funktion
einer Fouriertransformation und eine Transformation, die jede Zyklusfunktion
als eine Summe einer Cosinusfunktion darstellt. Eine eindimensionale
diskrete Cosinustransformation und umgekehrte diskrete Cosinustransformation sind
in der folgenden Gleichung (1) mit F(m) als die transformierten
Komponenten für
die Frequenzkomponenten gezeigt.
-
-
Jedoch
gilt
-
-
Ebenfalls
ist die Umkehrtransformation in der folgenden Gleichung (2) gezeigt.
-
-
Aus
den Gleichungen (1) und (2) ist, wenn die Abtastzahl N ist, das
Berechnungsvolumen für
die diskrete Cosinustransformation und die umgekehrte diskrete Cosinustransformation
O (N2). Es wurde jedoch für die diskrete
Cosinustransformation dieselbe Art von Hochgeschwindigkeitsalgorithmus
wie für
die Fouriertransformation entwickelt, und wenn die Abtastzahl N
ein Vielfaches von 8 ist, kann man sehen, dass das Berechnungsvolumen
auf O (NlogN) verringert werden kann.
-
Es
ist ebenfalls möglich,
mehrdimensionale diskrete Cosinustransformationen als wiederholte
eindimensionale diskrete Cosinustransformationen zu berechnen. Auf ähnliche
Weise ist es möglich,
mehrdimensionale umgekehrte diskrete Cosinustransformationen als
wiederholte eindimensionale umgekehrte diskrete Cosinustransformationen
zu berechnen.
-
Die
zweidimensionale diskrete Cosinustransformation, die zur Bildanalyse
verwendet wird, lautet z.B. wie folgt. Es wird hier eine diskrete
Cosinustransformation in Bezug auf ein zweidimensionales Signal
x(n, m), das N × M
Pixel aufweist, ähnlich
demjenigen in 3 betrachtet. Die zweidimensionale
diskrete Cosinustransformation ist unten in der Gleichung (3) gezeigt.
-
F(n,
m) ist jedoch eine Komponente, die durch eine diskrete Cosinustransformation
in eine Ortsfrequenz transformiert ist.
-
-
Jedoch
gilt
-
-
Ebenfalls
ist die umgekehrte Transformation unten in der Gleichung (4) gezeigt.
-
-
Wenn
die Transformationsgleichung für
die zweidimensionale diskrete Cosinustransformation und die Transformationsgleichung
für die
eindimensionale diskrete Cosinustransformation verglichen werden,
ist zu sehen, dass der einzige Unterschied darin besteht, dass das
Produkt der Konstante der eindimensionalen diskreten Cosinustransformation
genommen wird und der Cosinus zweimal verwendet wird. Daher ist
es durch Ändern
der Transformationsgleichung der zweidimensionalen diskreten Cosinustransformation
möglich,
zur eindimensionalen diskreten Cosinustransformation zurückzukehren.
-
Die
Transformationsgleichung der zweidimensionalen diskreten Cosinustransformation
wird wie folgt geändert.
-
-
Jedoch
gilt
-
-
4A ist
eine erläuternde
Figur, die den DCT-Koeffizienten für eine zweidimensionale diskrete
Cosinustransformation zeigt. 4B ist
eine erläuternde
Figur, die das Grundbild für
die zweidimensionale diskrete Cosinustransformation zeigt. In der 4 gilt N = 8 und M = 8. 4A stellt
den DCT-Koeffizienten X(u, v) und 4B stellt
das Grundbild dar.
-
Wie
es in 4A gezeigt ist, können durch
Transformieren in eine Ortsfrequenzkomponente unter Verwendung der
diskreten Cosinustransformation für einen 8 × 8-Bereich 8 × 8 DCT-Koeffizienten
erhalten werden. Diese 8 × 8
DCT-Koeffizienten haben die folgende Bedeutung.
-
Insbesondere
wird die obere linke Komponente X(0, 0) des DCT-Koeffizienten der DC-Koeffizient (Gleichstromkomponente)
genannt und weist eine bestimmte Rolle auf, die sich von den anderen
63 Koeffizienten unterscheidet. Wenn z.B. in dem 8 × 8-Bereich
die Pixelwerte vor der Transformation sämtlich für die Komponenten, die in die
Ortsfrequenzkomponente unter Verwendung der diskreten Cosinustransformation transformiert
werden, gleich sind, weist nur die Gleichstromkomponente einen bestimmten
Wert auf, und die anderen Wechselstromkomponenten weisen sämtlich einen
Wert von 0 auf. Mit anderen Worten stellt der DC-Koeffizient das
mittlere integrale Vielfache (mit 8 × 8, dem Achtfachen des Mittelwertes)
des Pixelwertes innerhalb des Betriebsgitters (in diesem Fall 8 × 8) auf.
Außerdem
werden die anderen 63 Koeffizienten Wechselstromkomponenten genannt
und stellen den variierenden Abschnitt des Pixelwertes dar.
-
Das
Graustufenbild, das in 4B gezeigt ist, ist ein Pixel,
der das oben beschriebene darstellt. Wenn eine Eins-zu-eins-Entsprechung
mit den in 4A gezeigten DCT-Koeffizienten
durchgeführt
wird, gibt es einen variierten Abschnitt in dem Bereich, der dem
oberen linken DCT-Koeffizienten entspricht. Bei einer Bewegung von
links nach rechts ist gezeigt, dass eine graduelle Erhöhung der
horizontalen Frequenzkomponente in der horizontalen Richtung vorliegt,
und auf ähnliche
Weise liegt von oben nach unten eine Erhöhung der vertikalen Frequenzkomponente
vor, so dass die untere rechte Komponente die höchste Komponente für sowohl
die horizontale als auch die vertikale Komponente zeigt.
-
Im
Allgemeinen, wenn ein fotografiertes Bild wie z.B. eine natürliche Szene
einer zweidimensionalen diskreten Cosinustransformation unterzogen
wird, wird der DCT-Koeffizient X(0, 0) am größten, und der Wert für die Wechselstromkomponente
tendiert dazu kleiner zu werden, wenn der DCT-Koeffizient X(u, v) die hohe Frequenz
betrifft (u, v groß).
-
Außerdem zeigt 4B zeigt
ein diskretes Cosinustransformationsgrundbild für eine 8 × 8-Matrix, aber durch Durchführen einer
diskreten Cosinustransformation für einen breiteren Bereich (16 × 16, 32 × 32, etc.)
ist es möglich,
höhere
Frequenzkomponenten darzustellen.
-
Unter
Verwendung der oben beschriebenen diskreten Cosinustransformation
werden Bilder, die von den Raumkoordinaten in Ortsfrequenzkomponenten
transformiert werden, danach einer Quantisierung unterzogen, wonach
sie einer Huffman-Codierung und einer Datenkompression unterzogen
werden.
-
Mit
dem Quantisierungsprozess wird die folgende Art von Prozess durchgeführt. Insbesondere
sind menschliche Sehcharakteristika in niedrigen Frequenzbereichen
sehr empfindlich, aber in hohen Frequenzbereichen nicht sehr empfindlich.
Daher werden die meisten Quantisierungsbits den niedrigen Frequenzkomponenten
zugeordnet, und wenige Quantisierungsbits werden den hohen Frequenzkomponenten
zugeordnet, was es möglich
macht, das Gesamtinformationsvolumen zu verringern. Diese Operation
teilt den DCT-Koeffizientenwert durch irgendeinen Wert, um ihn kleiner
zu machen, und stellt diesen während
der Dekodierung wieder her, und diese Operation wird "Quantisierung" genannt. Unter Verwendung
dieser Quantisierung tritt eine Verschlechterung des Bildes in dem
wiederhergestellten Bild auf, aber durch geeignetes Definieren der Quantisierungstabelle
ist es möglich
es schwierig zu gestalten, die Bildverschlechterung zu bemerken.
-
Mit
dem Huffman-Kodierungsprozess wird der folgende Prozess durchgeführt. Insbesondere
werden bei der Huffman-Kodierung redundante Bits der Quantisierungsdaten
verringert. Eine Huffman-Kodierung verwendet ein unterschiedliches
Verfahren für
DC-Komponenten und AC-Komponenten. DC-Komponenten sind ein integrales
Vielfaches des Mittelwertes der Pixelwerte innerhalb des MCU (eine
MCU ist eine Ansammlung von 8 × 8-Blöcken, die
aus 8 × 8
Pixelteilbildern erhalten werden, die aus einem Quellenbild abgetastet
werden), und da kein großer
Unterschied für
DC-Koeffizienten zwischen benachbarten MCUs besteht, wird der Unterschied
zur DC-Komponente
der vorherigen MCU für
die DC-Koeffizienten kodiert. Für
die AC-Komponenten erfolgt unter Verwendung der Tatsache, dass hohe
Frequenzkomponenten fast sämtlich
0 sind, eine Kodierung durch Abtasten in Zickzackrichtung innerhalb
des MCU, um aufeinander folgende Nullen so viel wie möglich zu
zeigen.
-
Bilder,
die durch eine wie oben beschriebene Prozedur datenkomprimiert werden,
sind normale JPEG-Bilder.
-
Im
Folgenden wird unter Bezugnahme auf 1 angenommen,
dass der Nutzer wünscht,
ein herunter geladenes JPEG-Bild auf einem fernen Drucker 200 über das
Netzwerk 300 zu drucken, und wenn der Nutzer diese Befehle über die
Betriebseinheit 110 eingibt, führt die CPU 102 einen
Prozess wie z.B. den folgenden mit dem JPEG-Bild durch.
-
5 ist
ein Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit
dem Computer 100 und dem Drucker 200 der 1 ausgerüstet ist.
Wie es in 5 gezeigt ist, ist der Computer 100 mit
einer Rauschaddiereinheit 700 ausgerüstet, und der Drucker 200 ist
mit einer Umkehr-DCT-Transformationseinheit 710 und
einer Binärisierungseinheit 720 ausgerüstet. Von
diesen wird die Rauschaddiereinheit 700 durch die CPU 102 realisiert,
die entsprechend dem Computerprogramm, das in dem Speicher 104 aufgezeichnet
ist, funktioniert, und die Umkehr-DCT-Transformationseinheit 710 und
die Binärisierungseinheit 720 werden
durch die CPU 202 realisiert, die entsprechend dem Computerprogramm,
das in dem Speicher 204 aufgezeichnet ist, funktioniert.
-
Die
Rauschaddiereinheit 700, die entsprechend der CPU 102 funktioniert,
liest ein herunter geladenes Ziel-JPEG-Bild aus dem Speicher 104 aus
und fügt
bestimmtes Rauschen zu dem JPEG-Bild hinzu (Schritt S104).
-
6 ist
ein Blockdiagramm, das ein spezielles Beispiel einer Rauschaddiereinheit 700 der 5 zeigt.
Wie es in 6 gezeigt ist, wird bei diesem
speziellen Beispiel die Rauschaddiereinheit 700 von einer DCT-Transformationseinheit 702 und
einer Addiereinheit 704 ausgebildet.
-
Insbesondere
liest, wie es oben beschrieben wurde, die Rauschaddiereinheit 700 das
Ziel-JPEG-Bild aus dem Speicher 104 aus und liest die Bayer-Matrix,
die eine der Dither-Matrizen für
das organisierte Dither-Verfahren ist, aus. Danach führt die
DCT-Transformationseinheit 702 innerhalb der Rauschaddiereinheit 700 die
diskrete Cosinustransformation mit der gelesenen Bayer-Matrix aus
und erhält
Rauschen. Die Addiereinheit 704 addiert das Rauschen, das
von der DCT-Transformationseinheit 702 erhalten wird, zu
dem gelesenen JPEG-Bild.
-
Außerdem wird
die Bayer-Matrix im Voraus in dem Speicher 104 gespeichert.
Die Bayer-Matrix kann rekursiv aus der unteren Gleichung (6) abgeleitet
werden.
-
-
Es
gilt jedoch
und hinsichtlich Un sind
sämtliche
Elemente eine 1(n × n)-Matrix.
-
Eine
(8 × 8)-Bayer-Matrix
würde z.B.
wie in der Gleichung (7) gezeigt beschaffen sein.
-
-
Wenn
jedoch dieser Typ von Bayer-Matrix in eine Ortsfrequenzkomponente
durch die DCT-Transformationseinheit 702 unter Verwendung
der diskreten Cosinustransformation transformiert wird, erscheinen nicht
nur hohe Frequenzkomponenten, sondern auch niedrige Frequenzkomponenten.
Daher wird, wenn Rauschen in der Addiereinheit 704 zu einem
JPEG-Bild addiert wird, Rauschen nicht nur zum JPEG-Bild der hohen Frequenzseite
(insbesondere der rechten Seite und der unteren Seite der 4A)
addiert, sondern es wird ebenfalls Rauschen zur niedrigen Frequenzseite
(der linken Seite und der oberen Seite der 4A) addiert.
-
Nach
Durchführung
des Obigen steuert anschließend,
wenn Rauschen zu einem JPEG-Bild durch die Rauschaddiereinheit 700 addiert
wurde, die CPU 102 die Kommunikationseinheit 106 und
greift auf den Drucker 200 über das Netzwerk 300 zu
und sendet das rauschaddierte JPEG-Bild zum Drucker 200 (Schritt
S106).
-
Wenn
ein rauschaddiertes JPEG-Bild auf diese Weise gesendet wird, steuert
die CPU 202 für
den Drucker 200 die Kommunikationseinheit 206 und
empfängt
dieses Bild (Schritt S108) und speichert dieses im Speicher 204.
Die Umkehr-DCT-Transformationseinheit 710, die entsprechend
der CPU 202 funktioniert, liest das empfangene JPEG-Bild
aus dem Speicher 204 aus und führt eine umgekehrte diskrete
Cosinustransformation des rauschaddierten JPEG-Bildes aus (Schritt
S110). Als Ergebnis wird das rauschaddierte JPEG-Bild von der Ortsfrequenz
in Raumkoordinaten transformiert.
-
Anschließend binärisiert
die Binärisierungseinheit 720,
die entsprechend der CPU 202 funktioniert, das Bild, das
in die Raumkoordinaten expandiert wurde (Schritt S112). Insbesondere
liest die Binärisierungseinheit 720 den
eingestellten Schwellenwert, der im Voraus im Speicher 204 vorbereitet
wurde, und vergleicht aufeinander folgend den eingestellten Schwellenwert
mit jedem Pixelwert des expandierten Bildes und binärisiert
diese. Als Ergebnis wird ein halbtonverarbeitetes Bild erhalten.
-
Anschließend steuert
die CPU 202 die Druckermechanismuseinheit 210 und
druckt das gewünschte halbtonverarbeitete
Bild auf Druckpapier aus (Schritt S114).
-
Wie
es oben beschrieben wurde, wird für diese bevorzugte Ausführungsform
Rauschen zu einem JPEG-Bild im Computer 100 addiert, und
beim Drucker 200 ist es durch Durchführen einer umgekehrten diskreten
Cosinustransformation des rauschaddierten JPEG-Bildes und durch
Binärisieren
unter Verwendung eines eingestellten Schwellenwertes möglich, eine
Halbtonverarbeitung auf demselben Niveau wie gestreutes Dithern
durchzuführen.
-
Außerdem wird
im Computer 100 Rauschen zur Ortsfrequenz addiert, ohne
das JPEG-Bild in Raumkoordinaten zu expandieren, so dass es hinsichtlich
der Verarbeitung durch die CPU 102 tatsächlich ausreichend ist, einfach
dieselbe Art von Addition eines Wertes zur Ortsfrequenzkomponente
zu wiederholen, und daher besteht für die CPU 102 des
Computers 100 nur eine geringe Belastung, und die Verarbeitungszeit
ist kurz. Außerdem
ist es aufgrund dessen möglich,
die Aufgaben unter Verwendung einer niedrigen Verarbeitungskapazität CPU der
CPU 102 handzuhaben. Es ist ebenfalls nicht notwendig,
ein komplexes Verarbeitungsprogramm vorzubereiten. Außerdem ist
sogar dann, wenn eine zweckgebundene Hardware anstelle der CPU 102 verwendet
wird, die Erstellung dieser Hardware leicht.
-
Im
Drucker 200 werden mit derselben Art von Verfahren wie
ein normales Verfahren zum Expandieren eines JPEG-Bildes JPEG-Bilder,
die vom Computer 100 gesendet werden (insbesondere rauschaddierte JPEG-Bilder)
expandiert und unter Verwendung eines eingestellten Schwellenwerts
binäri siert,
und dieses reicht aus, die Halbtonverarbeitung zu vollenden, so
dass die Halbtonverarbeitungszeit kurz ist. Außerdem belastet die JPEG-Bildexpandierung
selbst die CPU 202 nicht stark, und die Binärisierung
selbst ist ebenfalls einfach ein Vergleich der Bildwerte mit einem
eingestellten Schwellenwert, so dass kein Bedarf besteht, Dinge
wie beispielsweise Koordinatenpositionen zu steuern, und dieses
verringert ebenfalls die Belastung für die CPU 202 und
verkürzt
die Verarbeitungszeit. Außerdem
ist der JPEG-Bild-Expandierungsprozess selbst ein bereits etablierter
Prozess, und es gibt vorhandene Universalverarbeitungsmodule, die
dafür verwendet
werden können.
-
Bei
dieser bevorzugten Ausführungsform
ist außerdem
das Bild, das vom Computer 100 zum Drucker 200 über das
Netzwerk 300 transferiert wird, kein expandiertes Bild,
sondern ein komprimiertes Bild, so dass das Bilddatenvolumen sehr
gering ist, und daher ist die Kommunikationszeit sehr kurz, und
sogar wenn die Datenkapazität
eines dazwischen liegenden Kommunikationspfads gering ist, können die
Daten ausreichend gehandhabt werden.
-
Bei
der obigen Erläuterung
wurde nicht speziell die Farbraumtransformation beschrieben, aber JPEG-Bilder
sind Bilder, die von dem RGB-Farbraum
in den YCbCr-Farbraum
transformiert werden, so dass die tatsächliche Verarbeitung wie folgt
durchgeführt
wird. Hier ist R die rote Komponente, E ist die grüne Komponente
und B ist die blaue Komponente, während Y die gelbe Komponente
ist und Cb und Cr die
Differenz zwischen der B-Komponente bzw. der R-Komponente und der
Y-Komponente und somit Farbdifferenzkomponenten sind.
-
Insbesondere
werden die zuvor genannten Rauschaddier- und umgekehrten diskreten
Cosinustransformationsprozesse für
jede Y-Komponente, Cb-Komponente und Cr-Komponente durchgeführt. Nach der Durchführung der
umgekehrten diskreten Cosinustransformation werden die Y-Komponente, die Cb-Komponente und die Cr-Komponente
in eine R-Komponente,
eine B-Komponente und eine G-Komponente transformiert (mit anderen
Worten von dem YCbCr-Farbraum
in den RGB-Farbraum transformiert), und der Binärisierungsprozess wird für jede R-Komponente,
G-Komponente und B-Komponente durchgeführt.
-
(3) Weiteres spezielles
Beispiel der Rauschaddiereinheit
-
In
dem speziellen Beispiel der Rauschaddiereinheit 700, das
in 6 gezeigt ist, wird die DCT-Transformationseinheit 702 verwendet,
um Rauschen von der Bayer-Matrix zu erhalten, aber die folgende
Art von Struktur kann ebenfalls verwendet werden. 7 ist
ein Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt.
Wie es in 7 gezeigt ist, besteht bei diesem
speziellen Beispiel die Rauschaddiereinheit 700 nur aus
der Addiereinheit 704.
-
Mit
anderen Worten wird bei diesem speziellen Beispiel Rauschen, das
durch die diskrete Cosinustransformation mit der Bayer-Matrix erhalten
wird, im Voraus im Speicher 104 gespeichert. Danach liest
die Rauschaddiereinheit 700 das Ziel-JPEG-Bild aus dem
Speicher 104 aus und liest, wie es oben beschrieben wurde,
das gespeicherte Rauschen aus, und auf ähnliche Weise addiert die Addiereinheit 704 das
gelesene Rauschen zum gelesenen JPEG-Bild.
-
Auf
diese Weise ist es durch Speichern von Rauschen, das durch eine
diskrete Cosinustransformation mit der Bayer-Matrix erhalten wird,
im Voraus im Speicher 104 nicht notwendig, die diskrete
Cosinustransformation in der Rauschaddiereinheit 700 durchzuführen, so
dass der Prozess noch einfacher ist.
-
In
den speziellen Beispielen, die in den 6 und 7 gezeigt
sind, wurde eine Bayer-Matrix als die Dither-Matrix für das organisierte
Dither-Verfahren
verwendet, aber die vorliegende Erfindung ist nicht darauf beschränkt, und
es ist z.B. möglich,
eine andere Dither-Matrix wie beispielsweise eine Spiral-Matrix
oder eine Punkt-Matrix zu verwenden.
-
Außerdem wurde
in den speziellen Beispielen, die in den 6 und 7 gezeigt
sind, als Rauschen Rauschen verwendet, das durch Durchführen einer
diskreten Cosinustransformation mit einer Dither-Matrix für ein organi siertes
Dither-Verfahren erhalten wird, aber die vorliegende Erfindung ist
nicht darauf beschränkt, und
anderes Rauschen kann ebenfalls verwendet werden.
-
8 ist
ein Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt.
Wie es in 8 gezeigt ist, wird ebenfalls
bei diesem speziellen Beispiel die Rauschaddiereinheit 700 nur
durch die Addiereinheit 704 ausgebildet.
-
Insbesondere
wird bei diesem speziellen Beispiel weißes Rauschen im Voraus im Speicher 104 gespeichert.
Danach liest die Rauschaddiereinheit 700 das Ziel-JPEG-Bild
aus dem Speicher 104 aus, und gleichzeitig liest sie das
gespeicherte Rauschen aus, und bei der Addiereinheit 704 wird
das gelesene weiße Rauschen
zum gelesenen JPEG-Bild addiert. Zu diesem Zeitpunkt ist es noch
effektiver, wenn das weiße
Rauschen zu hohen Frequenzbereich des JPEG-Bildes addiert wird.
-
9 ist
eine beispielhafte Figur, die den Zustand zeigt, wenn weißes Rauschen
dem hohen Frequenzbereich eines Bildes hinzuaddiert wird, das einer
diskreten Cosinustransformation unterzogen wurde. In diesem Fall
werden nur die (6 × 6)
Pixeldaten der niedrigen Frequenzseite für einen (8 × 8)-Pixelbereich verwendet, und nachdem
höhere
Frequenzkomponenten als diese entfernt sind, wird weißes Rauschen
addiert.
-
Wenn
weißes
Rauschen zu einem JPEG-Bild auf diese Weise addiert wird, ist es
ebenfalls möglich, denselben
Effekt zu erzielen wie wenn Rauschen addiert wird, das durch Durchführen einer
diskreten Cosinustransformation mit einer Dither-Matrix erhalten
wird. Hinsichtlich der Qualität
des letztendlich erhaltenen gedruckten Bildes wird jedoch in den
meisten Fällen
die Qualität
niedriger sein als wenn Rauschen addiert wird, das durch Durchführen einer
diskreten Cosinustransformation mit einer Dither-Matrix erhalten
wird. Da jedoch nur ein einfaches Addieren von weißem Rauschen
notwendig ist, ist die Verarbeitung einfach.
-
(4) Variationsbeispiel
-
10A ist ein Blockdiagramm, das eine Variation
der Bildverarbeitungsvorrichtung, die in 1 gezeigt
ist, zeigt. 10B ist ein Blockdiagramm, das
eine Speichervorrichtung zeigt, die mit der in 10A gezeigten Bildverarbeitungsvorrichtung verbunden
werden kann.
-
Der
in 10A gezeigte Computer 100' ist ein Variationsbeispiel des
Computers 100, der die Bildverarbeitungsvorrichtung der
vorliegenden Erfindung bildet und in 1 gezeigt
ist. Der Computer 100' ist
dieselbe Art von tragbarem Informationsendgerät wie der Computer 100 und
kann mit der Speichervorrichtung 500, die in 10B gezeigt ist, verbunden werden.
-
Die
Speichervorrichtung 500 ist mit einem Speicher 502 wie
in 10B gezeigt ausgerüstet. Der Speicherraum innerhalb
des Speichers 502 ist in einen JPEG-Bildspeicherbereich 502a und
einen Bayer-Matrix-Speicherbereich 502b unterteilt.
Unter diesen wird innerhalb des Bayer-Matrix-Speicherbereichs 502b die Bayer-Matrix
im Voraus gespeichert, wie es zuvor beschrieben wurde.
-
Wenn
z.B. ein Nutzer diese Speichervorrichtung 500 in einer
Digitalkamera (nicht dargestellt) installiert und ein Foto unter
Verwendung der Digitalkamera aufnimmt, wird das Foto als ein JPEG-Bild
in dem JPEG-Bildspeicherbereich 502a innerhalb
des Speichers 520 der Speichervorrichtung 500 gespeichert.
Danach wird, wenn der Nutzer die Speichervorrichtung 500 aus
der Digitalkamera entfernt und diese in der bestimmten Stelle des
Computers 100' wie
in 10A gezeigt installiert, der Speicher 502 der
Speichervorrichtung 500 mit der I/O-Einheit 108 des
Computers 100' elektrisch
verbunden.
-
Wenn
der Nutzer danach das JPEG-Bild, das von der Digitalkamera aufgenommen
wurde und in der Speichervorrichtung 500 gespeichert ist,
auf einem fernen Drucker über
ein Netzwerk zu drucken wünscht, liest,
wenn der Nutzer Befehle zum Durchführen eines derartigen Betriebs über die
Betriebseinheit 110 eingibt, die CPU 102 (Rauschaddiereinheit 700)
das Ziel-JPEG-Bild
von dem JPEG-Bildspeicherbereich 502a in dem Speicher 502 der
Speichervorrichtung 500 aus und liest die Bayer-Matrix
von dem Bayer-Matrix-Speicherbereich 502b aus.
Wie es zuvor anhand der 6 erläutert wurde, erhält die Rauschaddiereinheit 700 Rauschen, das
durch Durchführen
der diskreten Cosinustransformation mit der gelesenen Bayer-Matrix
erhalten wird, und addiert dieses Rauschen zum gelesenen JPEG-Bild.
Die anschließende
Verarbeitung ist dieselbe wie der zuvor beschriebene Prozess, so
dass deren Erläuterung
hier weggelassen wird.
-
Außerdem weist
die Speichervorrichtung 500, die in 10 gezeigt
ist, einen Bayer-Matrix-Speicherbereich 502b innerhalb
des Speichers 502 auf, aber es ist ebenfalls möglich, einen
Rauschspeicherbereich anstelle dieses Bayer-Matrix-Speicherbereichs
vorzubereiten und Rauschen, das durch Durchführen der diskreten Cosinustransformation
mit einer Dither-Matrix wie z.B. einer Bayer-Matrix erhalten wird,
oder weißes Rauschen
dort zu speichern und dieses zu verwenden.
-
Wie
es oben beschrieben wurde, kann bei diesem Variationsbeispiel durch
Speichern einer Dither-Matrix, die verwendet wird, wenn Rauschen
addiert wird, oder durch Speichern des Rauschens selbst in einer Speichervorrichtung 500 zum
Speichern von JPEG-Bildern Rauschen auf einfache Weise ohne Vorbereiten
einer derartigen Dither-Matrix oder Rauschen im Computer 100' addiert werden.
-
(5) Struktur einer zweiten
bevorzugten Ausführungsform
-
11 ist
ein Blockdiagramm, das die summarische Struktur einer Bildverarbeitungsvorrichtung
gemäß einer
zweiten bevorzugten Ausführungsform
der vorliegenden Erfindung zeigt.
-
Der
in 11 gezeigte Computer 150 bildet die Bildverarbeitungsvorrichtung
der vorliegenden Erfindung, und ein typischer Drucker 250 ist
direkt mit dessen Außenseite
verbunden. Der Computer 150 ist mit einem Netzwerk 300 auf
dieselbe Weise wie der Computer 100, der in 1 gezeigt
ist, verbunden.
-
Der
Computer 150 kann z.B. ein Personalcomputer vom Typ Notebook
sein und ist wie der Computer 100, der in 1 gezeigt
ist, mit einer CPU 102, einem Speicher 104, einer
I/O-Einheit 108, einer Betriebseinheit 110, einem
Monitor 112, einer Kommunikationseinheit 106 und
ebenfalls mit einer Festplatte 116 zum Speichern größerer Volumina
wie beispielsweise JPEG-Bildern
ebenso wie zum Speichern des später
beschriebenen Computerprogramms sowie mit einem CD-ROM-Laufwerk 114 ausgerüstet.
-
Das
Computerprogramm, das auf der CPU 102 abläuft, ist
in einem Speicher 104 ebenso wie bei der bevorzugten Ausführungsform,
die in 1 gezeigt ist, aufgezeichnet. Bei der in 1 gezeigten
bevorzugten Ausführungsform
ist das Computerprogramm jedoch in einem ROM oder einem wiederbeschreibbaren,
nichtflüchtigen
Speicher im Speicher 104 aufgezeichnet, während bei
dieser bevorzugten Ausführungsform
das Computerprogramm in Form einer Aufzeichnung auf einem Aufzeichnungsmedium
CD-ROM 115 vorgesehen ist, und durch Lesen dieses Programms
durch das CD-ROM-Laufwerk 114 wird es in den Computer 150 geholt. Danach
wird das geholte Computerprogramm zur Festplatte 116 transferiert,
wonach es zum Zeitpunkt des Starts oder ähnlichem zum Speicher 104 transferiert
wird, und im Speicher 104 wird es im RAM aufgezeichnet. Oder
das gelesene Computerprogramm kann direkt zum Speicher 104 transferiert
werden, ohne die Festplatte 116 zu durchlaufen.
-
Auf
diese Weise wurde bei dieser bevorzugten Ausführungsform die Verwendung einer
CD-ROM als Aufzeichnungsmedium beschrieben, die von einem Computer
gelesen werden kann und die ein Computerprogramm aufzeichnet, aber
es ist außerdem
möglich,
eine Vielzahl von Medien zu verwenden, die von einem Computer gelesen
werden können,
beispielsweise Disketten, optische elektromagnetische Platten, IC-Karten, ROM-Kassetten,
Lochkarten, gedruckte Gegenstände,
die mit einem Code wie beispielsweise Barcodes bedruckt sind, interne
Computerspeichervorrichtungen (Speicher wie beispielsweise einem
RAM) und externe Speichervorrichtungen.
-
Außerdem kann
das Computerprogramm anstatt in dieser Form auf dieser Art von Aufzeichnungsmedium
aufgezeichnet zu sein auch von einem Programmserver durch Zugriff
auf den Programmserver (nicht dargestellt), der das Computerprogramm über ein
Netzwerk 300 liefert, in den Computer geholt werden.
-
Außerdem kann
ein Teil des zuvor genannten Computerprogramms durch ein Betriebssystemprogramm
aufgebaut sein.
-
(6) Betrieb der zweiten
bevorzugten Ausführungsform
-
Im
Folgenden wird der Betrieb dieser bevorzugten Ausführungsform
erläutert.
In 11 sind mehrere JPEG-Bilder, die vom Server 400 herunter
geladen werden, bereits auf der Festplatte 116 gespeichert.
-
Wenn
der Nutzer hier ein herunter geladenes JPEG-Bild auf einem Drucker 250,
der direkt mit dem Computer 150 verbunden ist, zu drucken
wünscht,
verarbeitet die CPU 102 das JPEG-Bild wie es im Folgenden
beschrieben wird, wenn der Nutzer Befehle zur Durchführung über die
Betriebseinheit 110 eingibt.
-
12 ist
ein Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit
dem in 11 gezeigten Computer 150 ausgerüstet ist.
Bei der in 1 gezeigten bevorzugten Ausführungsform
ist der Drucker 200 mit einer Umkehr-DCT-Transformationseinheit 710 und
einer Binärisierungseinheit 720 ausgerüstet, aber bei
dieser bevorzugten Ausführungsform,
die in 12 gezeigt ist, sind zusätzlich zur
Rauschaddiereinheit 700 eine Umkehr-DCT-Transformationseinheit 710 und
eine Binärisierungseinheit 720 in
dem Computer 150 vorhanden. Mit anderen Worten funktioniert
die CPU 102 als eine Rauschaddiereinheit 700 entsprechend
dem Computerprogramm, das in dem Speicher 104 aufgezeichnet
ist, und ebenfalls als Umkehr-DCT-Transformationseinheit 710 und
als Binärisierungseinheit 720.
-
Die
Rauschaddiereinheit 700, die entsprechend der CPU 102 funktioniert,
liest das herunter geladene Ziel-JPEG-Bild von der Festplatte 116 und
addiert bestimmtes Rauschen zu dem JPEG-Bild. Das Verfahren des
Addierens von Rauschen zum JPEG-Bild ist das gleiche wie bei der
bevorzugten Ausführungsform,
die in 1 gezeigt ist, so dass dessen Erläuterung
weggelassen wird.
-
Anschließend führt die
Umkehr-DCT-Transformationseinheit 710, die entsprechend
der CPU 102 funktioniert, eine umgekehrte diskrete Cosi nustransformation
des rauschaddierten JPEG-Bildes durch und expandiert dieses in Raumkoordinaten.
-
Anschließend liest
die Binärisierungseinheit 720,
die entsprechend der CPU 102 funktioniert, den eingestellten
Schwellenwert, der im Speicher 104 im Voraus vorbereitet
ist, aus und vergleicht aufeinanderfolgend jeden Pixelwert des Bildes,
das in die Raumkoordinaten expandiert wurde, mit dem eingestellten
Schwellenwert und binärisiert
diesen. Als Ergebnis wird ein halbtonverarbeitetes Bild erhalten.
-
Danach
fügt die
CPU 102 einen Drucksteuerbefehl zum halbtonverarbeiteten
Bild hinzu und sendet dieses zum extern verbundenen Drucker 250.
Der Drucker 250 druckt das eingegebene Bild auf gewünschtem Druckpapier
entsprechend dem hinzugefügten
Drucksteuerbefehl.
-
Wie
zuvor erläutert
wird bei dieser bevorzugten Ausführungsform
Rauschen zu einem JPEG-Bild im Computer 150 addiert, und
durch Durchführen
einer umgekehrten diskreten Cosinustransformation des rauschaddierten
JPEG-Bildes und Binärisieren
dieses unter Verwendung eines eingestellten Schwellenwerts wird eine
vollständige
Folge der Halbtonverarbeitung innerhalb des Computers 150 durchgeführt.
-
Daher
ist alles, was in dem Computer 150 durchgeführt wird,
dass Rauschen bei der Raumfrequenz addiert wird, das JPEG-Bild expandiert
wird und dieses bei einem eingestellten Schwellenwert binärisiert
wird, ohne das JPEG-Bild in Raumkoordinaten zu expandieren, so dass
die Belastung des Computers 150 auf die CPU 102 sehr
gering und die Verarbeitungszeit kurz ist.
-
Bei
der obigen Erläuterung
wurde das JPEG-Bild, zu dem Rauschen von der Rauschaddiereinheit 700 addiert
wurde, einer umgekehrten diskreten Cosinustransformation durch die
Umkehr-DCT-Transformationseinheit 710 unterzogen und durch
die Binärisierungseinheit 720 binärisiert,
aber es ist jedoch ebenfalls möglich,
das Bild mit dem addierten Rauschen zu speichern wie es ist.
-
Dieses
wird insbesondere nachdem das Rauschen zum JPEG-Bild addiert wurde
durch die CPU 102 durchgeführt, die das Bild auf einer
Festplatte 116 über
die I/O-Einheit 108 speichert, oder durch Schreiben auf die
CD-ROM 115 unter Verwendung des CD-ROM-Laufwerks 114.
-
Wenn
z.B. ein rauschaddiertes JPEG-Bild auf die CD-ROM 115 geschrieben
wird, ist es möglich,
diese CD-ROM 115 in eine andere Bildverarbeitungsvorrichtung
einzuführen
und bei dieser Bildverarbeitungsvorrichtung das geschriebene Bild
zu lesen, und durch Durchführen
einer umgekehrten diskreten Cosinustransformation und einer Binärisierungsverarbeitung
ein halbtonverarbeitetes Bild unter Verwendung einer anderen Bildverarbeitungsvorrichtung
zu erhalten.
-
Außerdem wird
durch Sichern eines datenkomprimierten JPEG-Bildes wie es ist weniger
Speicherbereich zum Sichern benötigt.
-
Die
vorliegende Erfindung ist nicht auf die zuvor genannten bevorzugten
Ausführungsformen
und Aspekte beschränkt
und kann in einer Vielzahl von Formen ohne vom Bereich der Erfindung
abzuweichen implementiert werden.
-
Bei
den zuvor genannten bevorzugten Ausführungsformen wurde ein Beispiel
erläutert,
bei dem ein Bild von einem Drucker gedruckt wird, aber die vorliegende
Erfindung ist nicht darauf beschränkt und kann z.B. zum Anzeigen
eines Bildes auf einem Monitor etc. verwendet werden. Wenn z.B.
der Computer 100 ein tragbares Informationsendgerät wie in 1 beschrieben
ist, kann man keine Hochleistungsvorrichtung als eingebauten Monitor 112 erwarten.
Sogar wenn z.B. der Monitor 112 ein Farbmonitor ist, ist,
wenn jede Abstufung der R-Komponente, G-Komponente und B-Komponente
jeweils zwei Stufen aufweist, ebenso wie bei einem Drucker eine
Halbtonverarbeitung des Bildes notwendig, um ein mehrstufiges Bild
in zwei Abstufungen anzuzeigen. Daher wird, wenn ein JPEG-Bild auf
dieser Art von Monitor angezeigt wird, wenn die vorliegende Erfindung
verwendet wird, derselbe Effekt erzielt wie wenn es auf einem Drucker
gedruckt wird.
-
Außerdem waren
bei den zuvor genannten bevorzugten Ausführungsformen die Gegenstände JPEG-Bilder,
aber die vorliegende Erfindung ist nicht auf JPEG-Bilder beschränkt und
kann verwendet werden, so lange wie das Bild einer Normal-Orthogonaltransformation
unterzogen wurde. Insbesondere sind JPEG-Bilder Bilder, die einer
diskreten Cosinustransformation unterzogen wurden, aber die Erfindung
kann sogar bei anderen Bildern angewendet werden, die einer Normal-Orthogonaltransformation
unterzogen wurden. Als andere Normal-Orthogonaltransformationen
können
verschiedene Transformationen wie beispielsweise eine diskrete Fouriertransformation,
eine Walsh-Adamar-Transformation, eine Slant-Transformation und
eine diskrete Sinustransformation verwendet werden.
-
Außerdem wurde
bei den zuvor genannten bevorzugten Ausführungsformen für den Binärisierungsprozess
ein eingestellter Schwellenwert verwendet, und jeder Pixelwert eines
expandierten Bildes wurde mit dem eingestellten Schwellenwert verglichen,
und dann erfolgte eine Binärisierung,
aber die vorliegende Erfindung ist nicht darauf beschränkt und
es ist möglich,
den Schwellenwert für
jeden Pixelwert eines Bildes zu ändern,
den Pixelwert mit dem geänderten
Schwellenwert zu vergleichen und danach die Binärisierung durchzuführen.
-
Außerdem war
das letztendlich erhaltene Bild in den zuvor genannten bevorzugten
Ausführungsformen
ein binärisiertes
Bild, aber die vorliegende Erfindung ist nicht darauf beschränkt, und
es ist möglich,
ein Endbild zu erhalten, das auf der Basis drei, Basis vier oder
auf der Basis eines noch größeren Wertes
verarbeitet wurde. Insbesondere werden die folgenden beiden Verfahren
betrachtet.
-
Als
ein erstes Verfahren können,
wenn eine Binärisierungsverarbeitung
durchgeführt
wird, zwei oder mehr unterschiedliche Schwellenwerte vorbereitet
werden, jeder Pixelwert des Bildes kann mit diesen Schwellenwerten
verglichen werden, und eine Multi-Wert-Verarbeitung kann erfolgen.
-
Als
ein zweites Verfahren können,
wenn Rauschen addiert wird, zwei oder mehr unterschiedliche Dither-Matrizen
vorbereitet werden, die jeweils einer diskreten Cosinustransformation
unterzogen werden, und das jeweilige Rauschen kann erhalten werden,
während
gleichzeitig zwei oder mehr derselben Ziel-JPEG-Bilder vorbereitet
werden können.
Das erhaltene Rauschen kann zum jeweiligen JPEG-Bild addiert werden,
und nachdem jedes JPEG-Bild einer umgekehrten diskreten Cosinustransformation
unterzogen wurde, wird jedes Bild unter Verwendung eines eingestellten
Schwellenwerts binärisiert,
und das letztendlich erhaltene Bild wurde einer Multi-Wert-Verarbeitung unterzogen.
-
In
dem zuvor genannten Variationsbeispiel (Variationsbeispiel, das
in 10 gezeigt ist) gab es einen JPEG-Bildspeicherbereich 502a und
einen Bayer-Matrix-Speicherbereich 502b im Speicher 502 der
Speichervorrichtung 500, aber es ist ebenfalls möglich, einen
anderen Bereich zum Speichern weiterer Informationen bereitzustellen.
Wenn es z.B. möglich
ist, eine Farbabbildungsverarbeitung in dem Computer, der mit der
Speichervorrichtung verbunden ist, durchzuführen, könnte außerdem ein Farbabbildungstabellenspeicherbereich im
Speicher 502 vorgesehen sein, und eine Farbabbildungstabelle
könnte
dort gespeichert sein und verwendet werden, wenn die zuvor genannte
Farbabbildung durchgeführt
wird.
-
Außerdem waren
bei den zuvor genannten bevorzugten Ausführungsformen Farbbilder Gegenstand, aber
es ist selbstverständlich
möglich,
die Erfindung für
Schwarz-Weiß-Bilder
zu verwenden.
-
Bei
den zuvor genannten bevorzugten Ausführungsformen wurde ein Beispiel
erläutert,
bei dem ein tragbares Informationsendgerät oder ein Personalcomputer
vom Typ Notebook als der Computer verwendet wurde, aber es ist ebenfalls
möglich,
verschiedene Computer wie z.B. einen Desktop-Personalcomputer oder eine Arbeitsstation
zu verwenden, sowie verschiedene periphere Einrichtungen, die im
Wesentlichen eine Computerfunktion aufweisen, beispielsweise Drucker,
Kopierer, Scanner oder Digitalkameras, oder verschiedene Typen von
Heim- oder Arbeitseinrichtungen, die auf ähnliche Weise Computerfunktionen
aufweisen, beispielsweise ein Audioset, ein Videoset oder eine Set-Top-Box.