DE60025875T2

DE60025875T2 - Bildverarbeitung

Info

Publication number: DE60025875T2
Application number: DE2000625875
Authority: DE
Inventors: Teruyuki łc/o Seiko Epson Corporatio Suwa-shi Takata; Fumio łc/o Seiko Epson Corporation Suwa-shi Nagasaka
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1999-11-15
Filing date: 2000-11-08
Publication date: 2006-10-26
Also published as: EP1102209B1; EP1545120A1; US7136193B2; US20050083545A1; JP4496574B2; DE60025875T8; EP1102209A3; EP1102209A2; US6914699B1; DE60025875D1; ATE317575T1; JP2001143066A

Description

HINTERGRUND DER ERFINDUNG
1. Bereich der Erfindung
Die vorliegende Erfindung betrifft eine Bildverarbeitungstechnologie, die eine bestimmte Verarbeitung von normal-orthogonal-transformierten Bildern wie z.B. JPEG-Bildern (Joint Photographic Experts Group) durchführt.
2. Beschreibung des Stands der Technik
Drucker und ähnliches sind als Ausgabevorrichtungen für Dinge wie z.B. Bilder, die von einem Netzwerk herunter geladen werden, Bilder, die unter Verwendung einer Digitalkamera geschossen werden, und Bilder, die unter Verwendung eines Computers erzeugt werden, bekannt. Drucker drucken Bilder durch Ausdrucken von Punkten auf ein Druckmedium unter Verwendung von Tinte, etc., so dass normalerweise nur zwei Abstufungen für jeden Pixel ausgedrückt werden, d.h. Punkt ein bzw. vorhanden oder aus bzw. nicht vorhanden. Somit wird zum Ausdrücken der Abstufung eines Bildes, bei dem eine Punktstreuung verwendet wird, eine sog. Halbtonverarbeitung für das zu druckende Bild verwendet.
Unterdessen sind seit den letzten Jahren die meisten Bilder wie beispielsweise Bilder, die von einem Netzwerk herunter geladen werden, oder Bilder, die unter Verwendung einer Digitalkamera geschossen werden, datenkomprimierte Bilder, und die meisten von diesen sind JPEG-Bilder. JPEG (Joint Photographic Experts Group) ist ein Standbildkompressionsverfahren, das von der ISO (International Standardization Organization) und der ITU-TS (International Telecommunication Union Telecommunication Standardization Sector) bestimmt wird und für Vollfarben oder Grautöne verwendet wird, und ein Schlüsselmerkmal besteht darin, dass trotz des hohen Kompressionsniveaus die Verschlechterung der Bildqualität minimal ist.
Daher ist es z.B., wenn ein JPEG-Bild, das von einem Netzwerk herunter geladen wird, unter Verwendung eines Druckers gedruckt wird, notwendig, eine Halbtonverarbeitung zu verwenden. In einem derartigen Fall wurde in der Vergangenheit zuerst das herunter geladene JPEG-Bild auf einem Computer expandiert, und danach wurde die Halbtonverarbeitung des expandierten Bildes durchgeführt, wonach es zum Drucker gesendet wurde.
Insbesondere JPEG-Bilder sind Bilder, die einer diskreten Cosinustransformation unterzogen werden, so dass, wenn ein JPEG-Bild expandiert wird, eine umgekehrte diskrete Cosinustransformation dieses Bildes durchgeführt wird, und nach dem Expandieren in räumliche Koordinaten wird eine Halbtonverarbeitung des expandierten Bildes durchgeführt. Als Halbtonverarbeitung wird beispielsweise, wenn das Dither-Verfahren verwendet wird, eine Dither-Matrix für das organisierte Dither-Verfahren eingeführt, und als ein Schwellenwert für eine jeweilige Matrix wird ein Vergleich mit dem entsprechenden Koordinatenpunktpixelwert (Pixelkonzentration) durchgeführt, und dieser wird binärisiert.
Wenn jedoch das herkömmliche Verfahren verwendet wird, wird bei der Halbtonverarbeitung im Vergleich zu einem Bild mit großem Datenvolumen, das in die Raumkoordinaten expandiert wird, eine Binärisierung durchgeführt, während die Koordinatenposition und der entsprechende Matrixwert für jeden Pixel aufeinander folgend gesteuert werden, was zu dem Problem einer übermäßigen Belastung für die CPU und zu einer sehr langen Verarbeitungszeit führt.
Außerdem wird das Bilddatenvolumen durch die Durchführung der Halbtonverarbeitung erneut erhöht, und um unter Verwendung des Druckers zu drucken, erhöht sich, wenn ein Drucksteuerbefehl dem Bild hinzugefügt wird, das Datenvolumen noch weiter. Daher ist es z.B., wenn der Drucker mit einem Computer über ein Netzwerk oder eine öffentliche Leitung, etc. verbunden ist, notwendig, dieses Bild mit einem großen Datenvolumen von dem Computer über ein Netzwerk über eine öffentliche Leitung zum Drucker zu senden, was zu dem Problem führt, dass die Kommunikationszeit lang ist, und zu Verkehrsproblemen führt.
Das Dokument US-A-5 809 139 beschreibt ein digitales Verfahren und eine digitale Vorrichtung zum Versehen mit einem Wasserzeichen, die die Markierung eines digitalen Videosignals mit einem Wasserzeichen in komprimierter Form erlaubt. Ein Videosignal wird transformationscodiert, vorzugsweise mit einer diskreten Cosinustransformation, und ein Wasserzeichensignal, das unter Verwendung desselben Typs von Transformation transformationscodiert wurde, wird zum codierten Videosignal addiert. Das Wasserzeichensignal selbst wird durch Wasserzeichenbits bestimmt, die durch Wiederholung gemäß den Chipratenprinzip gestreut werden, um eine Streufolge zu erhalten. Die Streufolge wird mit einem Verstärkungsfaktor verstärkt und mit einer binären Pseudo-Zufallsrauschfolge moduliert, um ein moduliertes Wasserzeichensignal zu erhalten. Das somit modulierte Wasserzeichensignal wird dann transformationscodiert. Das Wasserzeichensignal wird zu einem Empfänger übertragen. Das empfangene Signal wird von einem Decodierer dekodiert, der die umgekehrten Funktionen des Codierers, der für die Transformationscodierung verwendet wird, durchführt.
Das Dokument EP-A-0 766 468 beschreibt ein digitales Versehen mit einem Wasserzeichen von Audio-, Bild-, Video- oder Multimediadaten, das durch Einfügen des Wasserzeichens in die wahrnehmbar signifikanten Komponenten einer Aufspaltung von Daten derart erzielt wird, dass es visuell nicht wahrgenommen wird. Eine Fouriertransformation der Daten wird erhalten. Ein Wasserzeichen wird in wahrnehmbare signifikante Komponenten des Frequenzspektrumbildes eingefügt. Das resultierende Wasserzeichenspektrumbild wird einer umgekehrten Fouriertransformation unterzogen, um Daten mit einem Wasserzeichen zu erzeugen.
ZUSAMMENFASSUNG DER ERFINDUNG
Daher ist es Aufgabe der vorliegenden Erfindung, die zuvor genannten Probleme des Stands der Technik zu lösen, eine Bildverarbeitungstechnologie bereitzustellen, die die Belastung der CPU nicht erhöht und einen äquivalenten Prozess zur Halbtonverarbeitung eines normal-orthogonal-transformierten Bildes durchführen und dieses über einen Kommunikationspfad mit minimalen Datenvolumen übertragen kann.
Die Aufgabe wird durch die Merkmale der unabhängigen Ansprüche gelöst. Die abhängigen Ansprüche sind auf bevorzugte Ausführungsformen der Erfindung gerichtet.
Auf diese Weise addiert die Rauschaddiereinheit bestimmtes Rauschen zu einem normal-orthogonal-transformierten Bild, wonach eine umgekehrte Normal-Orthogonaltransformation, die eine umgekehrte Transformation der zuvor genannten Normal-Orthogonaltransformation ist, des Bildes durchgeführt, und durch Binarisieren unter Verwendung eines bestimmten Schwellenwertes ist es möglich, eine Halbtonverarbeitung von etwa demselben Niveau wie die eines gestreuten Dither (dispersed dither) zu realisieren.
Außerdem wird durch Addieren von Rauschen zum normal-orthogonal-transformierten Bild Rauschen ohne Expandieren des Bildes in die Raumkoordinaten zur Ortsfrequenz addiert, so dass der Prozess für die Rauschaddiereinheit einfach sein kann, und daher ist sogar dann, wenn die Rauschaddiereinheit beispielsweise durch die Verwendung der CPU realisiert wird, die Belastung für die CPU sehr gering, und die Verarbeitungszeit ist ebenfalls kurz. Außerdem ist es aufgrund dessen ausreichend, eine CPU mit einer niedrigen Verarbeitungskapazität zu verwenden. Außerdem ist es sogar dann, wenn eine zweckgebundene Hardware als die Rauschaddiereinheit anstelle einer CPU verwendet wird, leicht, diese Hardware zu erstellen.
Außerdem ist sogar dann, wenn ein rauschaddiertes Bild (Bild, zu dem Rauschen addiert wurde) über einen Kommunikationspfad zu einer anderen Vorrichtung transferiert wird, das Bild selbst ein Bild, das einer Normal-Orthogonaltransformation unterzogen wurde, so dass das Datenvolumen des Bildes relativ gering ist, und daher kann die Kommunikationszeit sehr kurz sein, und es sind sogar Datenpfade mit geringer Datenkapazität ausreichend, um derartige Bilder zu handhaben.
Hinsichtlich des Rauschens ist es durch Addieren dieser Art von Rauschen, das von einer Dither-Matrix erhalten wird, möglich, die Qualität des letztendlich erhaltenen Bildes zu verbessern. Außerdem ist es durch geeignetes Ändern der Amplituden- oder Frequenzkomponenten, etc. des Rauschens, das zu dem Bild addiert wird, möglich, die Bildqualität zu steuern, aber wie es oben beschrieben wurde, ist es unter Verwendung von Rauschen, das von einer im Voraus bekannten Dither-Matrix erhalten wird, als das Rauschen möglich, diese Art von Bildqualitätssteuerung noch genauer und noch leichter durchzuführen.
Es ist vorteilhaft, wenn die Matrix eine Bayer-Matrix ist.
Dieses kommt daher, dass die Bayer-Matrix typischerweise als die Dither-Matrix für eine Halbtonverarbeitung verwendet wird.
Es ist vorteilhaft, wenn die Normal-Orthogonaltransformation eine diskrete Cosinustransformation ist.
Dieses kommt daher, dass eine diskrete Cosinustransformation breite Verwendung als ein Verfahren findet, für das eine hocheffiziente Bildkodierung möglich ist, und als eine Normal-Orthogonaltransformation zur Bildverarbeitung geeignet ist.
Das Bild, das der Normal-Orthogonaltransformation unterzogen wurde, ist vorzugsweise ein JPEG-Bild.
Ein JPEG-Bild ist ein datenkomprimiertes Bild und findet breite Verwendung für beispielsweise Internet-Homepages, Digitalkameras und Farbfaxgeräte, da ein starker Bedarf nach einer Bildverarbeitung durch den Nutzer besteht. Dieses kommt daher, dass JPEG-Bildexpansionsverfahren vorhanden sind und diese Verfahren auf leichte Weise sogar dann verwendet werden können, wenn rauschaddierte JPEG-Bilder expandiert werden.
Die Art von Umkehrtransformationseinheit und Binärisierungseinheit können eine von der Bildverarbeitungsvorrichtung, die beispielsweise mit der Rauschaddiereinheit ausgerüstet ist, getrennte Vorrichtung sein, aber wie es oben beschrieben wurde, können sie ebenfalls in derselben Bildverarbeitungsvorrichtung vorgesehen sein. Auf diese Weise kann, wenn in derselben Bildverarbeitungsvorrichtung vorgesehen sind, unter alleiniger Verwendung dieser Bildverarbeitungsvorrichtung die gesamte Halbtonverarbeitung vollendet und ein halbtonverarbeitetes Bild erhalten werden.
Der Schwellenwert kann ein bestimmter Wert sein.
Durch Binärisieren unter Verwendung eines bestimmten Schwellenwertes kann auf diese Weise der Binärisierungsprozess selbst leicht durchgeführt werden.
Eine Ausführungsform der vorliegenden Erfindung enthält vorzugsweise außerdem eine Ausgabeeinheit, die das binärisierte Bild durch Anzeigen oder Drucken ausgibt.
Durch Ausrüsten der Bildverarbeitungsvorrichtung mit dieser Art von Einheit ist es möglich, dem Nutzer auf geeignete Weise ein halbtonverarbeitetes Bild bereitzustellen.
Eine andere Ausführungsform führt eine bestimmte Verarbeitung eines Bildes durch, dessen Hochfrequenzkomponenten entfernt wurden.
Für datenkomprimierte Bilder wie beispielsweise JPEG-Bilder werden normalerweise zum Komprimieren von Daten Hochfrequenzkomponenten, für die das menschliche Auge nicht sehr empfindlich ist, entfernt. Somit ist es durch Hinzufügen von bestimmtem Rauschen zu einem Bild, bei dem diese Art von Hochfrequenzkomponente entfernt ist, wenn die zuvor genannte umgekehrte Normal-Orthogonaltransformation oder die Binärisierungsverarbeitung danach mit dem Bild durchgeführt wird, möglich, eine Halbtonverarbeitung ähnlich wie zuvor beschrieben zu realisieren.
Unter Verwendung von Rauschen, das von einer Dither-Matrix erhalten wird, als das Rauschen ist es möglich, die Qualität des letztendlich erhaltenen Bildes zu verbessern und die Bildqualität noch genauer und leichter zu steuern.
Gemäß einer anderen Ausführungsform addiert die Rauschaddiereinheit bestimmtes Rauschen zum normal-orthogonal-transformierten Bild, und die Sendeeinheit sendet dieses Bild über einen Kommunikationspfad, während im Hinblick auf die Empfangsvorrichtung die Empfangseinheit das ge sendete Bild empfängt, die Umkehrtransformationseinheit eine umgekehrte Normal-Orthogonaltransformation des Bildes durchführt, und die Binärisierungseinheit das Bild unter Verwendung eines bestimmten Schwellenwerts binärisiert. Durch die Durchführung dieser Art von Verarbeitung ist es möglich, dasselbe Niveau der Halbtonverarbeitung wie mit einem gestreuten Dither durchzuführen.
Außerdem wird hinsichtlich der Empfangsvorrichtung eine Halbtonverarbeitung einfach durch die Durchführung einer umgekehrten Normal-Orthogonaltransformation und einer Binärisierung mit einem bestimmten Schwellenwert mit dem Bild, das von der Sendevorrichtung gesendet wird (mit anderen Worten ein rauschaddiertes Bild), vollendet, so dass die Verarbeitungszeit für die Halbtonverarbeitung kurz ist. Außerdem fügen sogar dann, wenn die Umkehrtransformationseinheit oder die Binärisierungseinheit beispielsweise unter Verwendung einer CPU realisiert werden, die Durchführung der Bildumkehrtransformation und die Binärisierung selbst keine zusätzliche Belastung der CPU hinzu.
Wenn das Bild, das zur Empfangsvorrichtung über einen Kommunikationspfad von der Sendevorrichtung transferiert wird, ein Bild ist, das mit einer Normal-Orthogonaltransformation so belassen wird wie es ist, so dass das Datenvolumen des Bildes relativ gering ist, ist die Kommunikationszeit sehr kurz, und sogar wenn die Kommunikationspfaddatenkapazität niedrig ist, reicht diese aus, um derartige Bilder zu handhaben.
Bei der Speichervorrichtung einer anderen Ausführungsform der vorliegenden Erfindung speichert die erste Speichereinheit das normal-orthogonal-transformierte Bild, und die zweite Speichereinheit speichert eine Dither-Matrix oder Rauschen, das durch Durchführen derselben Transformation wie die Normal-Orthogonaltransformation mit der Dither-Matrix erhalten wird.
Daher ist es bei der Speichervorrichtung der vorliegenden Erfindung durch Speichern der Dither-Matrix, die verwendet wird, wenn Rauschen hinzugefügt wird, oder das Rauschen selbst in der Speichervorrichtung zum Speichern von Bildern möglich, auf leichte Weise Rauschen zu einem Bild zu addieren, ohne eine Dither-Matrix oder Rauschen auf der Bildverarbeitungsvorrichtung vorzubereiten.
Das computerlesbare Medium der vorliegenden Erfindung ist ein Medium, das ein Bild speichert, das durch Addieren von bestimmtem Rauschen zu einem normal-orthogonal-transformierten Bild erhalten wird.
Dadurch, dass der Computer die zuvor genannten Bilder von einem derartigen Medium liest und durch Durchführen der zuvor genannten umgekehrten Normal-Orthogonaltransformation und der Binärisierungsverarbeitung ist es leicht, halbtonverarbeitete Bilder zu erhalten.
Für die vorliegende Erfindung ist es ebenfalls möglich, eine andere Form wie unten erwähnt zu verwenden. Mit anderen Worten enthält die Form außerdem eine Multiwerteinheit, die Multiwerte bzw. Mehrfachwerte für ein Bild vergibt, das einer umgekehrten Normal-Orthogonaltransformation unterzogen wird, unter Verwendung der Umkehrtransformationseinheit, die zwei oder mehr unterschiedliche Schwellenwerte verwendet. Mit dieser Form ist es möglich, ein halbtonverarbeitetes Mehrfachwertbild zu erhalten.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Es zeigen:
1 ein Blockdiagramm, das die summarische Struktur der Bildverarbeitungsvorrichtung und des Bildverarbeitungssystems als eine erste bevorzugte Ausführungsform der vorliegenden Erfindung zeigt,
2 ein Flussdiagramm, das den Prozessfluss für das Bildverarbeitungssystem der 1 zeigt,
3 eine erläuternde Figur, die das zweidimensionale Signal x(n, m) zeigt, das N × M Pixel aufweist,
4A eine erläuternde Figur, die den DCT-Koeffizienten für eine zweidimensionale diskrete Cosinustransformation zeigt,
4B eine erläuternde Figur, die das Grundbild für eine zweidimensionale diskrete Cosinustransformation zeigt,
5 ein Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit dem Computer 100 und dem Drucker 200 der 1 ausgerüstet ist,
6 ein Blockdiagramm, das ein spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt,
7 ein Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt,
8 ein Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt,
9 einer erläuternde Figur, die den Zustand eines Bildes zeigt, das einer diskreten Cosinustransformation unterzogen wurde, wobei weißes Rauschen dem Hochfrequenzbereich hinzugefügt wurde,
10A ein Blockdiagramm, das eine Variation der Bildverarbeitungsvorrichtung der 1 zeigt,
10B ein Blockdiagramm, das eine Speichervorrichtung zeigt, die mit der Bildverarbeitungsvorrichtung der 10A verbunden werden kann,
11 ein Blockdiagramm, das die summarische Struktur einer Bildverarbeitungsvorrichtung als eine zweite bevorzugte Ausführungsform der vorliegenden Erfindung zeigt, und
12 ein Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit dem Computer 150 der 11 ausgerüstet ist.
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
(1) Struktur der ersten bevorzugten Ausführungsform
Im Folgenden wird ein bevorzugter Aspekt der vorliegenden Erfindung auf der Grundlage einer bevorzugten Ausführungsform erläutert. 1 ist ein Blockdiagramm, das die summarische Struktur einer Bildverarbeitungsvorrichtung und eines Bildverarbeitungssystems gemäß einer ersten bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
Der Computer 100 bildet die Bildverarbeitungsvorrichtung der vorliegenden Erfindung, und zusammen mit dem Drucker 200 bildet er das Bildverarbeitungssystem der vorliegenden Erfindung. Dieser Computer 100 und der Drucker 200 sind über ein Netzwerk 300 miteinander verbunden, und ein Server 400 ist ebenfalls mit dem Netzwerk 300 verbunden.
Der Computer 100 kann z.B. ein tragbares Informationsendgerät wie z.B. ein mobiler Computer, ein PDA, oder ein tragbares Multifunktionstelefon sein, und ist mit einer CPU 102 zum Durchführen verschiedener Prozesse und Steuerungen gemäß einem Computerprogramm, einem Speicher 104 zum Aufzeichnen des zuvor genannten Computerprogramms und zum zeitweiligen Aufzeichnen von Dingen wie z.B. Daten, die während der Verarbeitung erhalten werden, einer I/O-Einheit 108 zum Durchführen des Austausches von Dingen wie beispielsweise Daten zwischen der CPU 102 und anderen strukturellen Elementen, einer Betriebseinheit 110 zum Eingeben von Befehlen, etc. von dem Nutzer, einem Monitor 112 zum Anzeigen von Bildern, etc., und einer Kommunikationseinheit 106 zum Durchführen des Sendens und Empfangens von Dingen wie beispielsweise Daten mit anderen Vorrichtungen wie beispielsweise dem Drucker 200 über das Netzwerk 300 ausgerüstet.
Innerhalb des Druckers 200 ist eine CPU 202 vorgesehen, um verschiedene Prozesse und Steuerungen entsprechend einem Computerprogramm durchzuführen, sowie ein Speicher 204 zum Aufzeichnen des zuvor genannten Computerprogramms und zum zeitweiligen Aufzeichnen von Dingen wie beispielsweise Daten, die während der Verarbeitung erhalten werden, eine I/O-Einheit 208 zum Durchführen des Austausches von Dingen wie beispielsweise Daten zwischen der CPU 202 und anderen strukturellen Elementen, eine Druckermechanismuseinheit 210 zum Drucken von Bildern, etc. auf Druckpapier, und eine Kommunikationseinheit 206 zum Durchführen des Sendens und Empfangens von Dingen wie beispielsweise Daten mit anderen Vorrichtungen wie beispielsweise dem Computer 100 über das Netzwerk 300.
Außerdem sind innerhalb des Servers 400 verschiedene Bilder einschließlich JPEG-Bildern gespeichert, und diese werden auf dem Netzwerk 300 veröffentlicht.
Für das Netzwerk 300 ist es möglich, verschiedene Netzwerke unabhängig davon, ob sie drahtgebunden oder drahtlos sind, einschließlich dem Internet, lokalen Netzwerken oder zweckgebundenen Netzwerken, zu verwenden.
(2) Betrieb der ersten bevorzugten Ausführungsform
Im Folgenden wird der Betrieb dieser bevorzugten Ausführungsform beschrieben. 2 ist ein Flussdiagramm, das den Fluss der Prozesse für das Bildverarbeitungssystem der 1 zeigt.
In 1 steuert, wenn der Nutzer des Computers 100 Befehle zum Herunterladen eines gewünschten JPEG-Bildes von dem Server 400 über die Betriebseinheit 110 gibt, die CPU 102 die Kommunikationseinheit 106 entsprechend diesen Befehlen und greift auf den Server 400 über das Netzwerk 300 zu, lädt das Ziel-JPEG-Bild, das im Server 400 gespeichert ist, herunter (Schritt S102 in 2), und speichert dieses im Speicher 104.
Wie es zuvor beschrieben wurde, sind JPEG-Bilder datenkomprimierte Bilder und werden einer diskreten Cosinustransformation unterzogen. Im Folgenden wird die diskrete Cosinustransformation (DCT: diskrete Cosinustransformation) erläutert.
Die diskrete Cosinustransformation ist eine expandierte grade Funktion einer Fouriertransformation und eine Transformation, die jede Zyklusfunktion als eine Summe einer Cosinusfunktion darstellt. Eine eindimensionale diskrete Cosinustransformation und umgekehrte diskrete Cosinustransformation sind in der folgenden Gleichung (1) mit F(m) als die transformierten Komponenten für die Frequenzkomponenten gezeigt.
Jedoch gilt
Ebenfalls ist die Umkehrtransformation in der folgenden Gleichung (2) gezeigt.
Aus den Gleichungen (1) und (2) ist, wenn die Abtastzahl N ist, das Berechnungsvolumen für die diskrete Cosinustransformation und die umgekehrte diskrete Cosinustransformation O (N²). Es wurde jedoch für die diskrete Cosinustransformation dieselbe Art von Hochgeschwindigkeitsalgorithmus wie für die Fouriertransformation entwickelt, und wenn die Abtastzahl N ein Vielfaches von 8 ist, kann man sehen, dass das Berechnungsvolumen auf O (NlogN) verringert werden kann.
Es ist ebenfalls möglich, mehrdimensionale diskrete Cosinustransformationen als wiederholte eindimensionale diskrete Cosinustransformationen zu berechnen. Auf ähnliche Weise ist es möglich, mehrdimensionale umgekehrte diskrete Cosinustransformationen als wiederholte eindimensionale umgekehrte diskrete Cosinustransformationen zu berechnen.
Die zweidimensionale diskrete Cosinustransformation, die zur Bildanalyse verwendet wird, lautet z.B. wie folgt. Es wird hier eine diskrete Cosinustransformation in Bezug auf ein zweidimensionales Signal x(n, m), das N × M Pixel aufweist, ähnlich demjenigen in 3 betrachtet. Die zweidimensionale diskrete Cosinustransformation ist unten in der Gleichung (3) gezeigt.
F(n, m) ist jedoch eine Komponente, die durch eine diskrete Cosinustransformation in eine Ortsfrequenz transformiert ist.
Jedoch gilt
Ebenfalls ist die umgekehrte Transformation unten in der Gleichung (4) gezeigt.
Wenn die Transformationsgleichung für die zweidimensionale diskrete Cosinustransformation und die Transformationsgleichung für die eindimensionale diskrete Cosinustransformation verglichen werden, ist zu sehen, dass der einzige Unterschied darin besteht, dass das Produkt der Konstante der eindimensionalen diskreten Cosinustransformation genommen wird und der Cosinus zweimal verwendet wird. Daher ist es durch Ändern der Transformationsgleichung der zweidimensionalen diskreten Cosinustransformation möglich, zur eindimensionalen diskreten Cosinustransformation zurückzukehren.
Die Transformationsgleichung der zweidimensionalen diskreten Cosinustransformation wird wie folgt geändert.
Jedoch gilt
4A ist eine erläuternde Figur, die den DCT-Koeffizienten für eine zweidimensionale diskrete Cosinustransformation zeigt. 4B ist eine erläuternde Figur, die das Grundbild für die zweidimensionale diskrete Cosinustransformation zeigt. In der 4 gilt N = 8 und M = 8. 4A stellt den DCT-Koeffizienten X(u, v) und 4B stellt das Grundbild dar.
Wie es in 4A gezeigt ist, können durch Transformieren in eine Ortsfrequenzkomponente unter Verwendung der diskreten Cosinustransformation für einen 8 × 8-Bereich 8 × 8 DCT-Koeffizienten erhalten werden. Diese 8 × 8 DCT-Koeffizienten haben die folgende Bedeutung.
Insbesondere wird die obere linke Komponente X(0, 0) des DCT-Koeffizienten der DC-Koeffizient (Gleichstromkomponente) genannt und weist eine bestimmte Rolle auf, die sich von den anderen 63 Koeffizienten unterscheidet. Wenn z.B. in dem 8 × 8-Bereich die Pixelwerte vor der Transformation sämtlich für die Komponenten, die in die Ortsfrequenzkomponente unter Verwendung der diskreten Cosinustransformation transformiert werden, gleich sind, weist nur die Gleichstromkomponente einen bestimmten Wert auf, und die anderen Wechselstromkomponenten weisen sämtlich einen Wert von 0 auf. Mit anderen Worten stellt der DC-Koeffizient das mittlere integrale Vielfache (mit 8 × 8, dem Achtfachen des Mittelwertes) des Pixelwertes innerhalb des Betriebsgitters (in diesem Fall 8 × 8) auf. Außerdem werden die anderen 63 Koeffizienten Wechselstromkomponenten genannt und stellen den variierenden Abschnitt des Pixelwertes dar.
Das Graustufenbild, das in 4B gezeigt ist, ist ein Pixel, der das oben beschriebene darstellt. Wenn eine Eins-zu-eins-Entsprechung mit den in 4A gezeigten DCT-Koeffizienten durchgeführt wird, gibt es einen variierten Abschnitt in dem Bereich, der dem oberen linken DCT-Koeffizienten entspricht. Bei einer Bewegung von links nach rechts ist gezeigt, dass eine graduelle Erhöhung der horizontalen Frequenzkomponente in der horizontalen Richtung vorliegt, und auf ähnliche Weise liegt von oben nach unten eine Erhöhung der vertikalen Frequenzkomponente vor, so dass die untere rechte Komponente die höchste Komponente für sowohl die horizontale als auch die vertikale Komponente zeigt.
Im Allgemeinen, wenn ein fotografiertes Bild wie z.B. eine natürliche Szene einer zweidimensionalen diskreten Cosinustransformation unterzogen wird, wird der DCT-Koeffizient X(0, 0) am größten, und der Wert für die Wechselstromkomponente tendiert dazu kleiner zu werden, wenn der DCT-Koeffizient X(u, v) die hohe Frequenz betrifft (u, v groß).
Außerdem zeigt 4B zeigt ein diskretes Cosinustransformationsgrundbild für eine 8 × 8-Matrix, aber durch Durchführen einer diskreten Cosinustransformation für einen breiteren Bereich (16 × 16, 32 × 32, etc.) ist es möglich, höhere Frequenzkomponenten darzustellen.
Unter Verwendung der oben beschriebenen diskreten Cosinustransformation werden Bilder, die von den Raumkoordinaten in Ortsfrequenzkomponenten transformiert werden, danach einer Quantisierung unterzogen, wonach sie einer Huffman-Codierung und einer Datenkompression unterzogen werden.
Mit dem Quantisierungsprozess wird die folgende Art von Prozess durchgeführt. Insbesondere sind menschliche Sehcharakteristika in niedrigen Frequenzbereichen sehr empfindlich, aber in hohen Frequenzbereichen nicht sehr empfindlich. Daher werden die meisten Quantisierungsbits den niedrigen Frequenzkomponenten zugeordnet, und wenige Quantisierungsbits werden den hohen Frequenzkomponenten zugeordnet, was es möglich macht, das Gesamtinformationsvolumen zu verringern. Diese Operation teilt den DCT-Koeffizientenwert durch irgendeinen Wert, um ihn kleiner zu machen, und stellt diesen während der Dekodierung wieder her, und diese Operation wird "Quantisierung" genannt. Unter Verwendung dieser Quantisierung tritt eine Verschlechterung des Bildes in dem wiederhergestellten Bild auf, aber durch geeignetes Definieren der Quantisierungstabelle ist es möglich es schwierig zu gestalten, die Bildverschlechterung zu bemerken.
Mit dem Huffman-Kodierungsprozess wird der folgende Prozess durchgeführt. Insbesondere werden bei der Huffman-Kodierung redundante Bits der Quantisierungsdaten verringert. Eine Huffman-Kodierung verwendet ein unterschiedliches Verfahren für DC-Komponenten und AC-Komponenten. DC-Komponenten sind ein integrales Vielfaches des Mittelwertes der Pixelwerte innerhalb des MCU (eine MCU ist eine Ansammlung von 8 × 8-Blöcken, die aus 8 × 8 Pixelteilbildern erhalten werden, die aus einem Quellenbild abgetastet werden), und da kein großer Unterschied für DC-Koeffizienten zwischen benachbarten MCUs besteht, wird der Unterschied zur DC-Komponente der vorherigen MCU für die DC-Koeffizienten kodiert. Für die AC-Komponenten erfolgt unter Verwendung der Tatsache, dass hohe Frequenzkomponenten fast sämtlich 0 sind, eine Kodierung durch Abtasten in Zickzackrichtung innerhalb des MCU, um aufeinander folgende Nullen so viel wie möglich zu zeigen.
Bilder, die durch eine wie oben beschriebene Prozedur datenkomprimiert werden, sind normale JPEG-Bilder.
Im Folgenden wird unter Bezugnahme auf 1 angenommen, dass der Nutzer wünscht, ein herunter geladenes JPEG-Bild auf einem fernen Drucker 200 über das Netzwerk 300 zu drucken, und wenn der Nutzer diese Befehle über die Betriebseinheit 110 eingibt, führt die CPU 102 einen Prozess wie z.B. den folgenden mit dem JPEG-Bild durch.
5 ist ein Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit dem Computer 100 und dem Drucker 200 der 1 ausgerüstet ist. Wie es in 5 gezeigt ist, ist der Computer 100 mit einer Rauschaddiereinheit 700 ausgerüstet, und der Drucker 200 ist mit einer Umkehr-DCT-Transformationseinheit 710 und einer Binärisierungseinheit 720 ausgerüstet. Von diesen wird die Rauschaddiereinheit 700 durch die CPU 102 realisiert, die entsprechend dem Computerprogramm, das in dem Speicher 104 aufgezeichnet ist, funktioniert, und die Umkehr-DCT-Transformationseinheit 710 und die Binärisierungseinheit 720 werden durch die CPU 202 realisiert, die entsprechend dem Computerprogramm, das in dem Speicher 204 aufgezeichnet ist, funktioniert.
Die Rauschaddiereinheit 700, die entsprechend der CPU 102 funktioniert, liest ein herunter geladenes Ziel-JPEG-Bild aus dem Speicher 104 aus und fügt bestimmtes Rauschen zu dem JPEG-Bild hinzu (Schritt S104).
6 ist ein Blockdiagramm, das ein spezielles Beispiel einer Rauschaddiereinheit 700 der 5 zeigt. Wie es in 6 gezeigt ist, wird bei diesem speziellen Beispiel die Rauschaddiereinheit 700 von einer DCT-Transformationseinheit 702 und einer Addiereinheit 704 ausgebildet.
Insbesondere liest, wie es oben beschrieben wurde, die Rauschaddiereinheit 700 das Ziel-JPEG-Bild aus dem Speicher 104 aus und liest die Bayer-Matrix, die eine der Dither-Matrizen für das organisierte Dither-Verfahren ist, aus. Danach führt die DCT-Transformationseinheit 702 innerhalb der Rauschaddiereinheit 700 die diskrete Cosinustransformation mit der gelesenen Bayer-Matrix aus und erhält Rauschen. Die Addiereinheit 704 addiert das Rauschen, das von der DCT-Transformationseinheit 702 erhalten wird, zu dem gelesenen JPEG-Bild.
Außerdem wird die Bayer-Matrix im Voraus in dem Speicher 104 gespeichert. Die Bayer-Matrix kann rekursiv aus der unteren Gleichung (6) abgeleitet werden.
Es gilt jedoch
und hinsichtlich Un sind sämtliche Elemente eine 1(n × n)-Matrix.
Eine (8 × 8)-Bayer-Matrix würde z.B. wie in der Gleichung (7) gezeigt beschaffen sein.
Wenn jedoch dieser Typ von Bayer-Matrix in eine Ortsfrequenzkomponente durch die DCT-Transformationseinheit 702 unter Verwendung der diskreten Cosinustransformation transformiert wird, erscheinen nicht nur hohe Frequenzkomponenten, sondern auch niedrige Frequenzkomponenten. Daher wird, wenn Rauschen in der Addiereinheit 704 zu einem JPEG-Bild addiert wird, Rauschen nicht nur zum JPEG-Bild der hohen Frequenzseite (insbesondere der rechten Seite und der unteren Seite der 4A) addiert, sondern es wird ebenfalls Rauschen zur niedrigen Frequenzseite (der linken Seite und der oberen Seite der 4A) addiert.
Nach Durchführung des Obigen steuert anschließend, wenn Rauschen zu einem JPEG-Bild durch die Rauschaddiereinheit 700 addiert wurde, die CPU 102 die Kommunikationseinheit 106 und greift auf den Drucker 200 über das Netzwerk 300 zu und sendet das rauschaddierte JPEG-Bild zum Drucker 200 (Schritt S106).
Wenn ein rauschaddiertes JPEG-Bild auf diese Weise gesendet wird, steuert die CPU 202 für den Drucker 200 die Kommunikationseinheit 206 und empfängt dieses Bild (Schritt S108) und speichert dieses im Speicher 204. Die Umkehr-DCT-Transformationseinheit 710, die entsprechend der CPU 202 funktioniert, liest das empfangene JPEG-Bild aus dem Speicher 204 aus und führt eine umgekehrte diskrete Cosinustransformation des rauschaddierten JPEG-Bildes aus (Schritt S110). Als Ergebnis wird das rauschaddierte JPEG-Bild von der Ortsfrequenz in Raumkoordinaten transformiert.
Anschließend binärisiert die Binärisierungseinheit 720, die entsprechend der CPU 202 funktioniert, das Bild, das in die Raumkoordinaten expandiert wurde (Schritt S112). Insbesondere liest die Binärisierungseinheit 720 den eingestellten Schwellenwert, der im Voraus im Speicher 204 vorbereitet wurde, und vergleicht aufeinander folgend den eingestellten Schwellenwert mit jedem Pixelwert des expandierten Bildes und binärisiert diese. Als Ergebnis wird ein halbtonverarbeitetes Bild erhalten.
Anschließend steuert die CPU 202 die Druckermechanismuseinheit 210 und druckt das gewünschte halbtonverarbeitete Bild auf Druckpapier aus (Schritt S114).
Wie es oben beschrieben wurde, wird für diese bevorzugte Ausführungsform Rauschen zu einem JPEG-Bild im Computer 100 addiert, und beim Drucker 200 ist es durch Durchführen einer umgekehrten diskreten Cosinustransformation des rauschaddierten JPEG-Bildes und durch Binärisieren unter Verwendung eines eingestellten Schwellenwertes möglich, eine Halbtonverarbeitung auf demselben Niveau wie gestreutes Dithern durchzuführen.
Außerdem wird im Computer 100 Rauschen zur Ortsfrequenz addiert, ohne das JPEG-Bild in Raumkoordinaten zu expandieren, so dass es hinsichtlich der Verarbeitung durch die CPU 102 tatsächlich ausreichend ist, einfach dieselbe Art von Addition eines Wertes zur Ortsfrequenzkomponente zu wiederholen, und daher besteht für die CPU 102 des Computers 100 nur eine geringe Belastung, und die Verarbeitungszeit ist kurz. Außerdem ist es aufgrund dessen möglich, die Aufgaben unter Verwendung einer niedrigen Verarbeitungskapazität CPU der CPU 102 handzuhaben. Es ist ebenfalls nicht notwendig, ein komplexes Verarbeitungsprogramm vorzubereiten. Außerdem ist sogar dann, wenn eine zweckgebundene Hardware anstelle der CPU 102 verwendet wird, die Erstellung dieser Hardware leicht.
Im Drucker 200 werden mit derselben Art von Verfahren wie ein normales Verfahren zum Expandieren eines JPEG-Bildes JPEG-Bilder, die vom Computer 100 gesendet werden (insbesondere rauschaddierte JPEG-Bilder) expandiert und unter Verwendung eines eingestellten Schwellenwerts binäri siert, und dieses reicht aus, die Halbtonverarbeitung zu vollenden, so dass die Halbtonverarbeitungszeit kurz ist. Außerdem belastet die JPEG-Bildexpandierung selbst die CPU 202 nicht stark, und die Binärisierung selbst ist ebenfalls einfach ein Vergleich der Bildwerte mit einem eingestellten Schwellenwert, so dass kein Bedarf besteht, Dinge wie beispielsweise Koordinatenpositionen zu steuern, und dieses verringert ebenfalls die Belastung für die CPU 202 und verkürzt die Verarbeitungszeit. Außerdem ist der JPEG-Bild-Expandierungsprozess selbst ein bereits etablierter Prozess, und es gibt vorhandene Universalverarbeitungsmodule, die dafür verwendet werden können.
Bei dieser bevorzugten Ausführungsform ist außerdem das Bild, das vom Computer 100 zum Drucker 200 über das Netzwerk 300 transferiert wird, kein expandiertes Bild, sondern ein komprimiertes Bild, so dass das Bilddatenvolumen sehr gering ist, und daher ist die Kommunikationszeit sehr kurz, und sogar wenn die Datenkapazität eines dazwischen liegenden Kommunikationspfads gering ist, können die Daten ausreichend gehandhabt werden.
Bei der obigen Erläuterung wurde nicht speziell die Farbraumtransformation beschrieben, aber JPEG-Bilder sind Bilder, die von dem RGB-Farbraum in den YC_bC_r-Farbraum transformiert werden, so dass die tatsächliche Verarbeitung wie folgt durchgeführt wird. Hier ist R die rote Komponente, E ist die grüne Komponente und B ist die blaue Komponente, während Y die gelbe Komponente ist und C_b und C_r die Differenz zwischen der B-Komponente bzw. der R-Komponente und der Y-Komponente und somit Farbdifferenzkomponenten sind.
Insbesondere werden die zuvor genannten Rauschaddier- und umgekehrten diskreten Cosinustransformationsprozesse für jede Y-Komponente, C_b-Komponente und C_r-Komponente durchgeführt. Nach der Durchführung der umgekehrten diskreten Cosinustransformation werden die Y-Komponente, die C_b-Komponente und die C_r-Komponente in eine R-Komponente, eine B-Komponente und eine G-Komponente transformiert (mit anderen Worten von dem YC_bC_r-Farbraum in den RGB-Farbraum transformiert), und der Binärisierungsprozess wird für jede R-Komponente, G-Komponente und B-Komponente durchgeführt.
(3) Weiteres spezielles Beispiel der Rauschaddiereinheit
In dem speziellen Beispiel der Rauschaddiereinheit 700, das in 6 gezeigt ist, wird die DCT-Transformationseinheit 702 verwendet, um Rauschen von der Bayer-Matrix zu erhalten, aber die folgende Art von Struktur kann ebenfalls verwendet werden. 7 ist ein Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt. Wie es in 7 gezeigt ist, besteht bei diesem speziellen Beispiel die Rauschaddiereinheit 700 nur aus der Addiereinheit 704.
Mit anderen Worten wird bei diesem speziellen Beispiel Rauschen, das durch die diskrete Cosinustransformation mit der Bayer-Matrix erhalten wird, im Voraus im Speicher 104 gespeichert. Danach liest die Rauschaddiereinheit 700 das Ziel-JPEG-Bild aus dem Speicher 104 aus und liest, wie es oben beschrieben wurde, das gespeicherte Rauschen aus, und auf ähnliche Weise addiert die Addiereinheit 704 das gelesene Rauschen zum gelesenen JPEG-Bild.
Auf diese Weise ist es durch Speichern von Rauschen, das durch eine diskrete Cosinustransformation mit der Bayer-Matrix erhalten wird, im Voraus im Speicher 104 nicht notwendig, die diskrete Cosinustransformation in der Rauschaddiereinheit 700 durchzuführen, so dass der Prozess noch einfacher ist.
In den speziellen Beispielen, die in den 6 und 7 gezeigt sind, wurde eine Bayer-Matrix als die Dither-Matrix für das organisierte Dither-Verfahren verwendet, aber die vorliegende Erfindung ist nicht darauf beschränkt, und es ist z.B. möglich, eine andere Dither-Matrix wie beispielsweise eine Spiral-Matrix oder eine Punkt-Matrix zu verwenden.
Außerdem wurde in den speziellen Beispielen, die in den 6 und 7 gezeigt sind, als Rauschen Rauschen verwendet, das durch Durchführen einer diskreten Cosinustransformation mit einer Dither-Matrix für ein organi siertes Dither-Verfahren erhalten wird, aber die vorliegende Erfindung ist nicht darauf beschränkt, und anderes Rauschen kann ebenfalls verwendet werden.
8 ist ein Blockdiagramm, das ein anderes spezielles Beispiel der Rauschaddiereinheit 700 der 5 zeigt. Wie es in 8 gezeigt ist, wird ebenfalls bei diesem speziellen Beispiel die Rauschaddiereinheit 700 nur durch die Addiereinheit 704 ausgebildet.
Insbesondere wird bei diesem speziellen Beispiel weißes Rauschen im Voraus im Speicher 104 gespeichert. Danach liest die Rauschaddiereinheit 700 das Ziel-JPEG-Bild aus dem Speicher 104 aus, und gleichzeitig liest sie das gespeicherte Rauschen aus, und bei der Addiereinheit 704 wird das gelesene weiße Rauschen zum gelesenen JPEG-Bild addiert. Zu diesem Zeitpunkt ist es noch effektiver, wenn das weiße Rauschen zu hohen Frequenzbereich des JPEG-Bildes addiert wird.
9 ist eine beispielhafte Figur, die den Zustand zeigt, wenn weißes Rauschen dem hohen Frequenzbereich eines Bildes hinzuaddiert wird, das einer diskreten Cosinustransformation unterzogen wurde. In diesem Fall werden nur die (6 × 6) Pixeldaten der niedrigen Frequenzseite für einen (8 × 8)-Pixelbereich verwendet, und nachdem höhere Frequenzkomponenten als diese entfernt sind, wird weißes Rauschen addiert.
Wenn weißes Rauschen zu einem JPEG-Bild auf diese Weise addiert wird, ist es ebenfalls möglich, denselben Effekt zu erzielen wie wenn Rauschen addiert wird, das durch Durchführen einer diskreten Cosinustransformation mit einer Dither-Matrix erhalten wird. Hinsichtlich der Qualität des letztendlich erhaltenen gedruckten Bildes wird jedoch in den meisten Fällen die Qualität niedriger sein als wenn Rauschen addiert wird, das durch Durchführen einer diskreten Cosinustransformation mit einer Dither-Matrix erhalten wird. Da jedoch nur ein einfaches Addieren von weißem Rauschen notwendig ist, ist die Verarbeitung einfach.
(4) Variationsbeispiel
10A ist ein Blockdiagramm, das eine Variation der Bildverarbeitungsvorrichtung, die in 1 gezeigt ist, zeigt. 10B ist ein Blockdiagramm, das eine Speichervorrichtung zeigt, die mit der in 10A gezeigten Bildverarbeitungsvorrichtung verbunden werden kann.
Der in 10A gezeigte Computer 100' ist ein Variationsbeispiel des Computers 100, der die Bildverarbeitungsvorrichtung der vorliegenden Erfindung bildet und in 1 gezeigt ist. Der Computer 100' ist dieselbe Art von tragbarem Informationsendgerät wie der Computer 100 und kann mit der Speichervorrichtung 500, die in 10B gezeigt ist, verbunden werden.
Die Speichervorrichtung 500 ist mit einem Speicher 502 wie in 10B gezeigt ausgerüstet. Der Speicherraum innerhalb des Speichers 502 ist in einen JPEG-Bildspeicherbereich 502a und einen Bayer-Matrix-Speicherbereich 502b unterteilt. Unter diesen wird innerhalb des Bayer-Matrix-Speicherbereichs 502b die Bayer-Matrix im Voraus gespeichert, wie es zuvor beschrieben wurde.
Wenn z.B. ein Nutzer diese Speichervorrichtung 500 in einer Digitalkamera (nicht dargestellt) installiert und ein Foto unter Verwendung der Digitalkamera aufnimmt, wird das Foto als ein JPEG-Bild in dem JPEG-Bildspeicherbereich 502a innerhalb des Speichers 520 der Speichervorrichtung 500 gespeichert. Danach wird, wenn der Nutzer die Speichervorrichtung 500 aus der Digitalkamera entfernt und diese in der bestimmten Stelle des Computers 100' wie in 10A gezeigt installiert, der Speicher 502 der Speichervorrichtung 500 mit der I/O-Einheit 108 des Computers 100' elektrisch verbunden.
Wenn der Nutzer danach das JPEG-Bild, das von der Digitalkamera aufgenommen wurde und in der Speichervorrichtung 500 gespeichert ist, auf einem fernen Drucker über ein Netzwerk zu drucken wünscht, liest, wenn der Nutzer Befehle zum Durchführen eines derartigen Betriebs über die Betriebseinheit 110 eingibt, die CPU 102 (Rauschaddiereinheit 700) das Ziel-JPEG-Bild von dem JPEG-Bildspeicherbereich 502a in dem Speicher 502 der Speichervorrichtung 500 aus und liest die Bayer-Matrix von dem Bayer-Matrix-Speicherbereich 502b aus. Wie es zuvor anhand der 6 erläutert wurde, erhält die Rauschaddiereinheit 700 Rauschen, das durch Durchführen der diskreten Cosinustransformation mit der gelesenen Bayer-Matrix erhalten wird, und addiert dieses Rauschen zum gelesenen JPEG-Bild. Die anschließende Verarbeitung ist dieselbe wie der zuvor beschriebene Prozess, so dass deren Erläuterung hier weggelassen wird.
Außerdem weist die Speichervorrichtung 500, die in 10 gezeigt ist, einen Bayer-Matrix-Speicherbereich 502b innerhalb des Speichers 502 auf, aber es ist ebenfalls möglich, einen Rauschspeicherbereich anstelle dieses Bayer-Matrix-Speicherbereichs vorzubereiten und Rauschen, das durch Durchführen der diskreten Cosinustransformation mit einer Dither-Matrix wie z.B. einer Bayer-Matrix erhalten wird, oder weißes Rauschen dort zu speichern und dieses zu verwenden.
Wie es oben beschrieben wurde, kann bei diesem Variationsbeispiel durch Speichern einer Dither-Matrix, die verwendet wird, wenn Rauschen addiert wird, oder durch Speichern des Rauschens selbst in einer Speichervorrichtung 500 zum Speichern von JPEG-Bildern Rauschen auf einfache Weise ohne Vorbereiten einer derartigen Dither-Matrix oder Rauschen im Computer 100' addiert werden.
(5) Struktur einer zweiten bevorzugten Ausführungsform
11 ist ein Blockdiagramm, das die summarische Struktur einer Bildverarbeitungsvorrichtung gemäß einer zweiten bevorzugten Ausführungsform der vorliegenden Erfindung zeigt.
Der in 11 gezeigte Computer 150 bildet die Bildverarbeitungsvorrichtung der vorliegenden Erfindung, und ein typischer Drucker 250 ist direkt mit dessen Außenseite verbunden. Der Computer 150 ist mit einem Netzwerk 300 auf dieselbe Weise wie der Computer 100, der in 1 gezeigt ist, verbunden.
Der Computer 150 kann z.B. ein Personalcomputer vom Typ Notebook sein und ist wie der Computer 100, der in 1 gezeigt ist, mit einer CPU 102, einem Speicher 104, einer I/O-Einheit 108, einer Betriebseinheit 110, einem Monitor 112, einer Kommunikationseinheit 106 und ebenfalls mit einer Festplatte 116 zum Speichern größerer Volumina wie beispielsweise JPEG-Bildern ebenso wie zum Speichern des später beschriebenen Computerprogramms sowie mit einem CD-ROM-Laufwerk 114 ausgerüstet.
Das Computerprogramm, das auf der CPU 102 abläuft, ist in einem Speicher 104 ebenso wie bei der bevorzugten Ausführungsform, die in 1 gezeigt ist, aufgezeichnet. Bei der in 1 gezeigten bevorzugten Ausführungsform ist das Computerprogramm jedoch in einem ROM oder einem wiederbeschreibbaren, nichtflüchtigen Speicher im Speicher 104 aufgezeichnet, während bei dieser bevorzugten Ausführungsform das Computerprogramm in Form einer Aufzeichnung auf einem Aufzeichnungsmedium CD-ROM 115 vorgesehen ist, und durch Lesen dieses Programms durch das CD-ROM-Laufwerk 114 wird es in den Computer 150 geholt. Danach wird das geholte Computerprogramm zur Festplatte 116 transferiert, wonach es zum Zeitpunkt des Starts oder ähnlichem zum Speicher 104 transferiert wird, und im Speicher 104 wird es im RAM aufgezeichnet. Oder das gelesene Computerprogramm kann direkt zum Speicher 104 transferiert werden, ohne die Festplatte 116 zu durchlaufen.
Auf diese Weise wurde bei dieser bevorzugten Ausführungsform die Verwendung einer CD-ROM als Aufzeichnungsmedium beschrieben, die von einem Computer gelesen werden kann und die ein Computerprogramm aufzeichnet, aber es ist außerdem möglich, eine Vielzahl von Medien zu verwenden, die von einem Computer gelesen werden können, beispielsweise Disketten, optische elektromagnetische Platten, IC-Karten, ROM-Kassetten, Lochkarten, gedruckte Gegenstände, die mit einem Code wie beispielsweise Barcodes bedruckt sind, interne Computerspeichervorrichtungen (Speicher wie beispielsweise einem RAM) und externe Speichervorrichtungen.
Außerdem kann das Computerprogramm anstatt in dieser Form auf dieser Art von Aufzeichnungsmedium aufgezeichnet zu sein auch von einem Programmserver durch Zugriff auf den Programmserver (nicht dargestellt), der das Computerprogramm über ein Netzwerk 300 liefert, in den Computer geholt werden.
Außerdem kann ein Teil des zuvor genannten Computerprogramms durch ein Betriebssystemprogramm aufgebaut sein.
(6) Betrieb der zweiten bevorzugten Ausführungsform
Im Folgenden wird der Betrieb dieser bevorzugten Ausführungsform erläutert. In 11 sind mehrere JPEG-Bilder, die vom Server 400 herunter geladen werden, bereits auf der Festplatte 116 gespeichert.
Wenn der Nutzer hier ein herunter geladenes JPEG-Bild auf einem Drucker 250, der direkt mit dem Computer 150 verbunden ist, zu drucken wünscht, verarbeitet die CPU 102 das JPEG-Bild wie es im Folgenden beschrieben wird, wenn der Nutzer Befehle zur Durchführung über die Betriebseinheit 110 eingibt.
12 ist ein Blockdiagramm, das einen Bildverarbeitungsblock zeigt, der mit dem in 11 gezeigten Computer 150 ausgerüstet ist. Bei der in 1 gezeigten bevorzugten Ausführungsform ist der Drucker 200 mit einer Umkehr-DCT-Transformationseinheit 710 und einer Binärisierungseinheit 720 ausgerüstet, aber bei dieser bevorzugten Ausführungsform, die in 12 gezeigt ist, sind zusätzlich zur Rauschaddiereinheit 700 eine Umkehr-DCT-Transformationseinheit 710 und eine Binärisierungseinheit 720 in dem Computer 150 vorhanden. Mit anderen Worten funktioniert die CPU 102 als eine Rauschaddiereinheit 700 entsprechend dem Computerprogramm, das in dem Speicher 104 aufgezeichnet ist, und ebenfalls als Umkehr-DCT-Transformationseinheit 710 und als Binärisierungseinheit 720.
Die Rauschaddiereinheit 700, die entsprechend der CPU 102 funktioniert, liest das herunter geladene Ziel-JPEG-Bild von der Festplatte 116 und addiert bestimmtes Rauschen zu dem JPEG-Bild. Das Verfahren des Addierens von Rauschen zum JPEG-Bild ist das gleiche wie bei der bevorzugten Ausführungsform, die in 1 gezeigt ist, so dass dessen Erläuterung weggelassen wird.
Anschließend führt die Umkehr-DCT-Transformationseinheit 710, die entsprechend der CPU 102 funktioniert, eine umgekehrte diskrete Cosi nustransformation des rauschaddierten JPEG-Bildes durch und expandiert dieses in Raumkoordinaten.
Anschließend liest die Binärisierungseinheit 720, die entsprechend der CPU 102 funktioniert, den eingestellten Schwellenwert, der im Speicher 104 im Voraus vorbereitet ist, aus und vergleicht aufeinanderfolgend jeden Pixelwert des Bildes, das in die Raumkoordinaten expandiert wurde, mit dem eingestellten Schwellenwert und binärisiert diesen. Als Ergebnis wird ein halbtonverarbeitetes Bild erhalten.
Danach fügt die CPU 102 einen Drucksteuerbefehl zum halbtonverarbeiteten Bild hinzu und sendet dieses zum extern verbundenen Drucker 250. Der Drucker 250 druckt das eingegebene Bild auf gewünschtem Druckpapier entsprechend dem hinzugefügten Drucksteuerbefehl.
Wie zuvor erläutert wird bei dieser bevorzugten Ausführungsform Rauschen zu einem JPEG-Bild im Computer 150 addiert, und durch Durchführen einer umgekehrten diskreten Cosinustransformation des rauschaddierten JPEG-Bildes und Binärisieren dieses unter Verwendung eines eingestellten Schwellenwerts wird eine vollständige Folge der Halbtonverarbeitung innerhalb des Computers 150 durchgeführt.
Daher ist alles, was in dem Computer 150 durchgeführt wird, dass Rauschen bei der Raumfrequenz addiert wird, das JPEG-Bild expandiert wird und dieses bei einem eingestellten Schwellenwert binärisiert wird, ohne das JPEG-Bild in Raumkoordinaten zu expandieren, so dass die Belastung des Computers 150 auf die CPU 102 sehr gering und die Verarbeitungszeit kurz ist.
Bei der obigen Erläuterung wurde das JPEG-Bild, zu dem Rauschen von der Rauschaddiereinheit 700 addiert wurde, einer umgekehrten diskreten Cosinustransformation durch die Umkehr-DCT-Transformationseinheit 710 unterzogen und durch die Binärisierungseinheit 720 binärisiert, aber es ist jedoch ebenfalls möglich, das Bild mit dem addierten Rauschen zu speichern wie es ist.
Dieses wird insbesondere nachdem das Rauschen zum JPEG-Bild addiert wurde durch die CPU 102 durchgeführt, die das Bild auf einer Festplatte 116 über die I/O-Einheit 108 speichert, oder durch Schreiben auf die CD-ROM 115 unter Verwendung des CD-ROM-Laufwerks 114.
Wenn z.B. ein rauschaddiertes JPEG-Bild auf die CD-ROM 115 geschrieben wird, ist es möglich, diese CD-ROM 115 in eine andere Bildverarbeitungsvorrichtung einzuführen und bei dieser Bildverarbeitungsvorrichtung das geschriebene Bild zu lesen, und durch Durchführen einer umgekehrten diskreten Cosinustransformation und einer Binärisierungsverarbeitung ein halbtonverarbeitetes Bild unter Verwendung einer anderen Bildverarbeitungsvorrichtung zu erhalten.
Außerdem wird durch Sichern eines datenkomprimierten JPEG-Bildes wie es ist weniger Speicherbereich zum Sichern benötigt.
Die vorliegende Erfindung ist nicht auf die zuvor genannten bevorzugten Ausführungsformen und Aspekte beschränkt und kann in einer Vielzahl von Formen ohne vom Bereich der Erfindung abzuweichen implementiert werden.
Bei den zuvor genannten bevorzugten Ausführungsformen wurde ein Beispiel erläutert, bei dem ein Bild von einem Drucker gedruckt wird, aber die vorliegende Erfindung ist nicht darauf beschränkt und kann z.B. zum Anzeigen eines Bildes auf einem Monitor etc. verwendet werden. Wenn z.B. der Computer 100 ein tragbares Informationsendgerät wie in 1 beschrieben ist, kann man keine Hochleistungsvorrichtung als eingebauten Monitor 112 erwarten. Sogar wenn z.B. der Monitor 112 ein Farbmonitor ist, ist, wenn jede Abstufung der R-Komponente, G-Komponente und B-Komponente jeweils zwei Stufen aufweist, ebenso wie bei einem Drucker eine Halbtonverarbeitung des Bildes notwendig, um ein mehrstufiges Bild in zwei Abstufungen anzuzeigen. Daher wird, wenn ein JPEG-Bild auf dieser Art von Monitor angezeigt wird, wenn die vorliegende Erfindung verwendet wird, derselbe Effekt erzielt wie wenn es auf einem Drucker gedruckt wird.
Außerdem waren bei den zuvor genannten bevorzugten Ausführungsformen die Gegenstände JPEG-Bilder, aber die vorliegende Erfindung ist nicht auf JPEG-Bilder beschränkt und kann verwendet werden, so lange wie das Bild einer Normal-Orthogonaltransformation unterzogen wurde. Insbesondere sind JPEG-Bilder Bilder, die einer diskreten Cosinustransformation unterzogen wurden, aber die Erfindung kann sogar bei anderen Bildern angewendet werden, die einer Normal-Orthogonaltransformation unterzogen wurden. Als andere Normal-Orthogonaltransformationen können verschiedene Transformationen wie beispielsweise eine diskrete Fouriertransformation, eine Walsh-Adamar-Transformation, eine Slant-Transformation und eine diskrete Sinustransformation verwendet werden.
Außerdem wurde bei den zuvor genannten bevorzugten Ausführungsformen für den Binärisierungsprozess ein eingestellter Schwellenwert verwendet, und jeder Pixelwert eines expandierten Bildes wurde mit dem eingestellten Schwellenwert verglichen, und dann erfolgte eine Binärisierung, aber die vorliegende Erfindung ist nicht darauf beschränkt und es ist möglich, den Schwellenwert für jeden Pixelwert eines Bildes zu ändern, den Pixelwert mit dem geänderten Schwellenwert zu vergleichen und danach die Binärisierung durchzuführen.
Außerdem war das letztendlich erhaltene Bild in den zuvor genannten bevorzugten Ausführungsformen ein binärisiertes Bild, aber die vorliegende Erfindung ist nicht darauf beschränkt, und es ist möglich, ein Endbild zu erhalten, das auf der Basis drei, Basis vier oder auf der Basis eines noch größeren Wertes verarbeitet wurde. Insbesondere werden die folgenden beiden Verfahren betrachtet.
Als ein erstes Verfahren können, wenn eine Binärisierungsverarbeitung durchgeführt wird, zwei oder mehr unterschiedliche Schwellenwerte vorbereitet werden, jeder Pixelwert des Bildes kann mit diesen Schwellenwerten verglichen werden, und eine Multi-Wert-Verarbeitung kann erfolgen.
Als ein zweites Verfahren können, wenn Rauschen addiert wird, zwei oder mehr unterschiedliche Dither-Matrizen vorbereitet werden, die jeweils einer diskreten Cosinustransformation unterzogen werden, und das jeweilige Rauschen kann erhalten werden, während gleichzeitig zwei oder mehr derselben Ziel-JPEG-Bilder vorbereitet werden können. Das erhaltene Rauschen kann zum jeweiligen JPEG-Bild addiert werden, und nachdem jedes JPEG-Bild einer umgekehrten diskreten Cosinustransformation unterzogen wurde, wird jedes Bild unter Verwendung eines eingestellten Schwellenwerts binärisiert, und das letztendlich erhaltene Bild wurde einer Multi-Wert-Verarbeitung unterzogen.
In dem zuvor genannten Variationsbeispiel (Variationsbeispiel, das in 10 gezeigt ist) gab es einen JPEG-Bildspeicherbereich 502a und einen Bayer-Matrix-Speicherbereich 502b im Speicher 502 der Speichervorrichtung 500, aber es ist ebenfalls möglich, einen anderen Bereich zum Speichern weiterer Informationen bereitzustellen. Wenn es z.B. möglich ist, eine Farbabbildungsverarbeitung in dem Computer, der mit der Speichervorrichtung verbunden ist, durchzuführen, könnte außerdem ein Farbabbildungstabellenspeicherbereich im Speicher 502 vorgesehen sein, und eine Farbabbildungstabelle könnte dort gespeichert sein und verwendet werden, wenn die zuvor genannte Farbabbildung durchgeführt wird.
Außerdem waren bei den zuvor genannten bevorzugten Ausführungsformen Farbbilder Gegenstand, aber es ist selbstverständlich möglich, die Erfindung für Schwarz-Weiß-Bilder zu verwenden.
Bei den zuvor genannten bevorzugten Ausführungsformen wurde ein Beispiel erläutert, bei dem ein tragbares Informationsendgerät oder ein Personalcomputer vom Typ Notebook als der Computer verwendet wurde, aber es ist ebenfalls möglich, verschiedene Computer wie z.B. einen Desktop-Personalcomputer oder eine Arbeitsstation zu verwenden, sowie verschiedene periphere Einrichtungen, die im Wesentlichen eine Computerfunktion aufweisen, beispielsweise Drucker, Kopierer, Scanner oder Digitalkameras, oder verschiedene Typen von Heim- oder Arbeitseinrichtungen, die auf ähnliche Weise Computerfunktionen aufweisen, beispielsweise ein Audioset, ein Videoset oder eine Set-Top-Box.

Claims

Bildverarbeitungssystem zum Durchführen von Verarbeitungen eines orthogonal transformierten Bilds, das aufweist: eine Rauschaddiereinheit (700), die Rauschen zu einem Bild addiert, wobei das Bild einer orthogonalen Transformation unterzogen wurde, eine Umkehrtransformationseinheit (710) zum Durchführen einer umgekehrten orthogonalen Transformation, die eine umgekehrte Transformation der orthogonalen Transformation ist, mit dem rauschaddierten Bild, gekennzeichnet durch eine Binärisierungseinheit (720), die das Bild binärisiert, das der umgekehrten orthogonalen Transformation unterzogen wurde, unter Verwendung eines Schwellenwerts, um ein halbtonverarbeitetes Bild zu erhalten, wobei das Rauschen durch Durchführen derselben Transformation wie die orthogonale Transformation auf eine Dither-Matrix erhalten wird.
Bildverarbeitungssystem nach Anspruch 1, wobei die Dither-Matrix eine Bayer-Matrix ist.
Bildverarbeitungssystem nach einem der Ansprüche 1 bis 2, das außerdem eine Speichervorrichtung (500) aufweist, die eine erste Speichereinheit (502a), die das Bild speichert, das der orthogonalen Transformation unterzogen wurde, und eine zweite Speichereinheit (502b) aufweist, die die Dither-Matrix oder das Rauschen speichert.
Bildverarbeitungsverfahren, das eine Verarbeitung eines orthogonal transformierten Bilds durchführt und das die folgenden Schritte aufweist: Addieren von Rauschen zu einem Bild, wobei das Bild einer orthogonalen Transformation unterzogen wurde, Durchführen einer umgekehrten orthogonalen Transformation, die eine umgekehrte Transformation der orthogonalen Transformation ist, mit dem rauschaddierten Bild, gekennzeichnet durch Binärisieren des Bildes, das der umgekehrten orthogonalen Transformation unterzogen wurde, unter Verwendung eines Schwellenwerts, um ein halbtonverarbeitetes Bild zu erhalten, wobei das Rauschen durch Durchführen derselben Transformation wie die orthogonale Transformation auf eine Dither-Matrix erhalten wird.
Bildverarbeitungsverfahren nach Anspruch 4, wobei die Dither-Matrix eine Bayer-Matrix ist.
Bildverarbeitungsvorrichtung zum Durchführen einer Verarbeitung eines orthogonal transformierten Bildes und zur Verwendung mit einem Drucker, wobei die Bildverarbeitungsvorrichtung aufweist: eine Rauschaddiereinheit (700), die Rauschen zu einem Bild addiert, wobei das Bild einer orthogonalen Transformation unterzogen wurde, und eine Sendeeinheit (106), die das Bild, zu dem das Rauschen addiert wurde, über einen Kommunikationspfad sendet, und wobei der Drucker aufweist: eine Empfangseinheit (206) zum Empfangen des gesendeten Bildes, eine Umkehrtransformationseinheit (710) zum Durchführen einer umgekehrten orthogonalen Transformation, die eine umgekehrte Transformation der orthogonalen Transformation ist, mit dem empfangenen Bild, gekennzeichnet durch eine Binärisierungseinheit (720), die das Bild binärisiert, das der umgekehrten orthogonalen Transformation unterzogen wurde, unter Verwendung eines Schwellenwerts, um eine halbtonverarbeitetes Bild zu erhalten, wobei das Rauschen durch Durchführen derselben Transformation wie die orthogonale Transformation auf eine Dither-Matrix erhalten wird.
Bildverarbeitungsvorrichtung nach Anspruch 6, wobei die Dither-Matrix eine Bayer-Matrix ist.