-
Gebiet der
Erfindung
-
Die vorliegende Erfindung betrifft
Verfahren zur Verbesserung von digitalen Farbbildern. Insbesondere wird
bei dem Verfahren eine Skalierfunktion verwendet, um die Intensität von RGB-Punkten
in einem Bild zu verändern,
ohne den eigenen dynamischen Bereich des Bildes zu überschreiten.
-
Hintergrund
der Erfindung
-
Wenn man die bunten Glasfenster einer
Kathedrale fotografieren würde,
wäre das
resultierende Bild typischerweise für moderne Geschmäcker zu
dunkel. Die Schönheit
des bunten Glases geht verloren. Weiterhin kann ein Fotograf die
Tiefenschärfe
durch Verringerung der Apertur der Einrichtung erhöhen; jedoch
geht dies zu Lasten der Lichtsammlung und es kann auch ein dunkles
Bild entstehen. Da außerdem
eine Standbildeinrichtung in der Lage ist, das Bild nur unter Verwendung
einer vorbestimmten Apertur und Belichtungszeit aufzunehmen, können Bilder
mit einer großen
Abweichung zwischen hell und dunkel lediglich einen Kompromiss darstellen;
die Einstellung der Filmbelichtung oder der Aufzeichnung, die entweder
auf den dunklen Bereichen oder den hellen Bereichen basiert, ist
ein Versuch, die darin enthaltenen Einzelheiten richtig zu verdeutlichen.
Bilder, die bei jedem der oben genannten versuche entstehen, können von
einer Bildverbesserung profitieren.
-
Die übliche Reaktion des Betrachters
ist der Wunsch, die dunklen Bereiche aufzuhellen und somit die Einzelheiten,
die dem bloßen
Auge sonst unklar erscheinen, erkennbar zu machen. Die bekannten
Verfahren weisen beim Aufhellen einige unerwünschte Effekte auf: entweder
werden die Farben in nahezu graue Farben "ausgebleicht" (können
Sie sich ein fast schwarzweißes
und sehr ausgebleichtes Bundglasfenster vorstellen?); oder die hellen
Bereiche werden bezüglich
der Farben sehr verzerrt und einige sind ganz ausbleicht. Die verzerrten
Bereiche sind häufig
gerade die interessantesten Bereiche, wie beispielsweise die Einzelheiten
eines Gesichts.
-
Bei der herkömmlichen digitalen Bildverarbeitung
treten die gleichen Probleme auf, wenn ein deutliches Aufhellen
erforderlich ist. Die "Standard"-Verbesserung besteht
darin, das Bild aufzuhellen (auszubleichen) und dann anschließend die
Farben zu verstärken.
Diese Lösung
ist jedoch nur eine annähernde
Lösung und
funktioniert nur bei Bildern, die sowieso nicht so schlecht sind.
Wenn ein sehr starkes Aufhellen erfolgt, wird das Bild bezüglich der
Farben stark verzerrt.
-
Im US-Patent 5,982,926 von Kuo et
al. ("Kuo") schlägt Kuo vor,
dass ein Farbbild, insbesondere ein Farbbild, das vom Video stammt,
viel effizienter verbessert werden kann, wenn zunächst der
RGB-Farbraum in einen HSV-Farbraum transformiert wird. Alle nachfolgenden
Prozesse werden in dem transformierten HSV-Farbraum durchgeführt. Einmal
im HSV-Farbraum angekommen, dann isoliert und trennt Kuo die Farbinformation
(Farbton) von den restlichen Bildkomponenten (Sättigung und Intensität). Kuo
trägt vor,
dass die Komponenten Sättigung
und Intensität
verbessert werden können,
ohne eine Verzerrung der Farb- oder Farbtonkomponente zu verursachen.
Das Farbbild von Kuo wird durch mehrere Pixel im HSV-Farbraum dargestellt. Nach
der Transformation wandelt Kuo die HSV-Werte zurück in den RGB-Farbraum um und
behauptet stets, dass dieses Verfahren effizient ist. Bei dem bevorzugten
Ausführungs beispiel
stellt Kuo die Intensität
(V) und die Sättigung
(S) ein. Zusammengefasst wandelt Kuo zunächst den RGB-Farbraum in einen
HSV-Farbraum um, wendet zwei aufeinanderfolgende Transformationsfunktionen
jeweils auf V und S an und wandelt schließlich die geänderten
HSV-Werte in RGB-werte um, um sie visuell darzustellen.
-
Der Anmelder behauptet respektvoll,
dass die Manipulation der Sättigung
die Farbe doch beeinflusst und somit, dass sich aus dem Verfahren
nach Kuo keine Verbesserung der Echtfarben ergibt. Farbfotos weisen drei
Freiheitsgrade R, G und B auf, während
Schwarzweißfotos
lediglich einen Freiheitsgrad aufweisen. Jede Transformation der
drei Werte ergibt drei weitere Werte, wobei jeder dieser Werte eine
Farbkomponente und nicht nur einen einzigen Farbwert (d. h. "Farbton") und zwei andere
unabhängige,
strukturelle Komponenten (d.h. Sättigung
und Intensität)
enthält.
Der Farbton mag ein bedeutenderes Maß für die Farbe sein als die Sättigung,
die Sättigung
ist jedoch immer noch eine Farbkomponente. Die Einstellung der Sättigung
eines Farbpunktes ergibt eine Änderung
der Anteile von RGB im Farbpunkt und somit eine Änderung seiner Farbe. Wenn die
Sättigung
geändert
wird, beispielsweise als Teil des Aufhellens des Bildes, ist das
Ergebnis nicht das Gleiche, als wenn das Aufnahmegerät oder die
Kamera das Bild direkt von einem Subjekt der realen Welt bei helleren
Bedingungen oder einer längeren
Belichtung erhalten hätte.
-
Es sei weiterhin erwähnt, dass
Kuo es betont und versucht, Computerkosten oder allgemeine Kosten zu
minimieren. Unglücklicherweise
führt Kuo
zusätzlich
zu sämtlichen
(vorzugsweise zwei) Einstellungen, die Kuo beim HSV-Pixel durchführt, zwei
RGB-HSV- und HSV-RGB-Transformationen ein. Eine Transformation vom
RGB- in HSV-Farbraum und zurück
hat die Verwendung von computerintensiven mathematischen Funktionen
zur Folge.
-
In
US
3,684,825 von Dischert wird eine Schaltung, die einen Verstärker und
einen Signalintensitätsformer
enthält,
unmittelbar zwischen den R-, G- und B-Farbbildaufnahmeröhren und
einem Mehrkanalfarbausgang angeordnet. Die Schaltung komprimiert
den Kontrast im durchlaufenden Signal und verhindert somit eine
Begrenzung des Signals des Mehrkanalfarbausganges. Da die Farbbildaufnahmeröhren in
der Lage sind, mit einem Kontrastverhältnis von 100:1 zu arbeiten,
während
das Ausgangssystem nur mit 20:1 arbeiten kann, ist eine erhebliche
Komprimierung erforderlich. Um eine Farbverzerrung zu verhindern,
beschreibt Dischert eine Komprimierung der Verstärkung jedes der R-, G- und
B-Werte auf die Ausgangskontrastpegel, bei der gleichzeitig relative
Verhältnisse
erhalten bleiben.
-
Die EP-A2-0,838,942 (Eastman Kodak)
beschreibt ein Verfahren und eine Einrichtung zur bereichselektiven
Einstellung der Belichtung, wobei ein Digitalbild mit einem dynamischen
Bereich, der eine Helligkeit einer Originalszene darstellt, reduziert
wird, um es an den stärker
begrenzten dynamischen Bereich eines Ausgangsmediums anzupassen.
Das Bild wird in einen ersten Teil und einen zweiten Teil unterteilt,
wobei der erste Teil einen Helligkeitsbereich darstellt, der sich
von einer minimalen Helligkeit bis zum dynamischen Bereich des Ausgangsmediums
nach oben erstreckt, während
der zweite Teil einen Helligkeitsbereich darstellt, der sich von
einer maximalen Helligkeit bis zum dynamischen Bereich des Ausgangsmediums
nach unten erstreckt. Für
den ersten und den zweiten Teil des Bildes werden jeweils eine erste
und eine zweite Transformation bestimmt, die den ersten und den
zweiten Teil auf den dynamischen Bereich des Ausgangsmediums unter
Verwendung eines Belichtungsbestim mungsalgorithmus der Art abbilden,
die beim Bilddruck verwendet wird.
-
Die EP-A2-0,357,385 (Canon KK) beschreibt
ein Bildverarbeitungsverfahren, bei dem Abweichungen zwischen maximalen
und minimalen Werten für
vorbestimmte Pixeldaten errechnet werden, wobei ein Farbkorrektur-Maskierungskoeffizient
bestimmt wird, um das Bild in Richtung auf einen Farbenbereich hin
zu verschieben, der für
einen Betrachter angenehm ist.
-
Die US-A-5,661,575 beschreibt eine
Abstufungskorrektureinrichtung, bei der ein Helligkeitssignalkonverter
verwendet wird, um aus R-, G- und B-Eingangssignalen ein Helligkeitssignal
zu erzeugen und einen Korrekturkoeffizient zu kalkulieren, welcher
auf jeden der R-, G- und B-Eingangssignalen
angewandt wird, um eine gewünschte
Helligkeitskorrektur zu erreichen. Somit wird ein Bild eingestellt,
um die wirksame Helligkeit zu verändern, ohne den dynamischen
Helligkeitsbereich in einer Ausgangseinrichtung zu überschreiten.
-
Demzufolge ist ein Bedarf für einen
computermäßig effizienten
Prozess aufgezeigt, der in der Lage ist, während der Verbesserung eines
Digitalbildes die richtige Farbe für jeden Farbpunkt aufrechtzuerhalten.
-
Die vorliegende Erfindung löst diese
Probleme dadurch, dass sie ein Verfahren zur Verfügung stellt, bei
dem unabhängig
vom erforderlichen Ausmaß des
Bildaufhellens oder davon, welcher Art dieses Bildaufhellen ist,
die Farbe sämtlicher
Farbpunkte unter allen Umständen
beibehalten wird.
-
Zusammenfassung
der Erfindung
-
Die Wirkung der vorliegenden Erfindung
besteht darin, das Licht, das von einem Digitalbildaufzeichnungsgerät aufgenommen
wird, virtuell zu verstärken.
Das bedeutet, dass, wenn das aufgenommene Bild durch die Verwendung
der vorliegenden Erfindung verarbeitet wird, jeder Punkt des zu
verarbeitenden Bildes derart modifiziert wird, dass er dem gleichen
Punkt entspricht, für
den das Digitalbildaufzeichnungsgerät ein anderes Lichtsammelvermögen oder
-prozedur einschließlich
der Simulation der Verwendung einer größeren Apertur oder einer längeren Belichtungszeit
verwendet hätte.
Dieses modifizierte Lichtsammelverfahren kann auf das gesamte verarbeitetes
Bild gleichmäßig angewandt
werden oder kann von einem Punkt zum anderen variieren. Durch Sicherstellen,
dass der dynamische Bereich des Digitalaufzeichnungsgeräts nie überschritten wird,
erhält
der virtuelle Lichtverstärkungsprozess
durch Verarbeiten in dem primären
RGB-Farbraum und durch identische Verarbeitung jedes der R-, G-
und B-Werte eines Farbpunktes die richtige Farbe des Originalbildes
aufrecht.
-
Bei einem bevorzugten Ausführungsbeispiel,
bei dem der RGB-Farbraum beibehalten wird, wird ein Triplett von
RGB-Werten für jeden
Punkt des Digitalbildes extrahiert. Das Maximum des RGB-Tripletts
wird für jeden
Punkt bestimmt. Das Maximum sämtlicher
Farbpunktmaxima, also ein Bildmaximum, wird bestimmt und eine Skalierfunktion
(das ist ein Skalierfaktor), die auf ein Farbpunktmaximum angewandt
wird, wird auch auf jeden der restlichen R-, G- oder B-Werte dieses
Punktes angewandt, so dass die ursprünglichen Anteile oder Verhältnisse
zwischen R, G und B und somit die richtige Farbe aufrechterhalten
werden.
-
Die Verbesserung ist sehr wirksam
und erfordert lediglich drei einfache Multiplikationen mit dem gleichen
Skalierfaktor, um jeden Farbpunkt zu verbessern. Weiterhin und vorteilhafter
wird durch Bilden einer Tabelle von Skalierfaktoren für die ermittelten
Farbpunktmaxima die Berechnung des Skalierfaktors nur einmal durchgeführt. Der
dynamische Bereich beträgt
typisch 0-255 (ein Maximum von 256 unterschiedlicher Lichtintensitäten) und
deshalb weisen für
ein gewöhnliches
Bild, das in der Größenordnung
250 000 Farbpunkte aufweist, mindestens 1000 von ihnen die gleiche
Intensität
auf und somit kann der gleiche Skalierfaktor durchschnittlich auf
1000 Farbpunkten angewandt werden. Entsprechend viele Berechnungsvorgänge werden
eingespart. Bei größeren Bildern,
die immer beliebter werden, werden sogar noch mehr Berechnungsvorgänge eingespart.
-
Gemäß einer grundsätzlichen
Sichtweise der Erfindung wird ein Verfahren zur Einstellung eines
Digitalbildes ohne Einführung
von Farbverzerrung vorgesehen. Das Bild wird durch mehrere Farbpunkte
gebildet, wobei jeder Farbpunkt mindestens drei unabhängige Werte
aufweist, die die Intensität
der drei primären
Farben R, G und B darstellen. Jeder der RGB-Werte liegt zwischen
einem Minimum und einem Maximum des dynamischen Bereichs des Systems.
-
Das Verfahren weist die folgenden
Schritte auf:
- – Bestimmen des Farbpunktmaximums
der drei RGB-Werte im RGB-Farbraum;
- – Anwenden
eines vorbestimmten Skalierfaktors auf jedes Farbpunktmaximum, wobei
der Skalierfaktor derart gestaltet ist, dass das skalierte Farbpunktmaximum
immer kleiner als das Maximum des dynamischen Be reichs des Systems
oder diesem gleich ist; und
- – Anwenden
desgleichen auf ein Farbpunktmaximum verwendeten Skalierfaktors
bei jedem der beiden restlichen R-, G- oder B-Werte des Farbpunktes.
-
Nach der Einstellung entsprechend
dem obigen verfahren weist das eingestellte Bild für jeden
Farbpunkt mehrere neu skalierte RGB-werte auf, wobei die Verhältnisse
zwischen R, G und B für
einen Farbpunkt nach dem Skalieren gleich so bleiben, wie sie vor
dem Skalieren waren, wodurch die richtige Farbe aufrechterhalten
wird.
-
Die Skalierfaktoren werden vorzugsweise
aus einer kontinuierlichen Skalierfunktion erhalten. Die Skalierfunktion
normalisiert mindestens einen Teil des Bildbereichs auf einen Teil
des dynamischen Bereichs, ohne jemals das Maximum des dynamischen
Bereichs zu überschreiten.
Da die Größe des dynamischen
Bereichs kleiner ist als die Anzahl der Farbpunkte in einem Bild,
wird die Computereffizienz dadurch erhöht, dass zuerst eine Tabelle
von Skalierfaktoren erstellt wird.
-
Die bevorzugte Skalierfunktion ist
eine horizontale "S"-Kurvenform, die eine ästhetisch
angenehme Verbesserung der meisten Digitalbilder erzeugt.
-
Bei einer anderen bevorzugten Ausführung kann
lediglich ein Bildausschnitt, üblicherweise
eine unterbelichtete Fläche,
ausgewählt,
und den Bildbereich des Bildausschnittes auf im Wesentlichen den
gesamten dynamischen Bereich des Systems zum Zweck der Verbesserung
der darin enthaltenen Einzelheiten normalisiert werden, wobei alle
Vorgänge
ohne jegliches überschreiten
des dynamischen Bereichs des Systems für sämtliche Farbpunkte durchgeführt werden,
während
die richtige Farbe durch Berücksichtigen der
Verhältnisse von
R, G und B für
jeden Farbpunkt aufrechterhalten wird.
-
Kurzbeschreibung
der Zeichnungen
-
In den Figuren werden mehrere Digitalbilder
dargestellt. Da diese Anmeldung auf die Verbesserung von digitalen
Farbbildern gerichtet ist, ohne dass sie unter einer Farbverzerrung
leiden, können
die Ergebnisse hier auf einem Graustufen-Druckmedium nicht richtig
reproduziert werden. Die Originalfarbbilder wurden bei den einzelnen
Patentämtern
eingereicht.
-
1 ist
ein Diagramm, das eine Linearfunktion als Grundlage für die Korrektur
jedes R-, G- oder B-Farbpunktmaximums als Eingangsgröße für ein eingestelltes
Ausgangs-Farbpunktmaximum darstellt, wobei beide zwangsweise an
den dynamischen Bereich des Systems angepasst wurden. Diese besondere
Funktion wäre
eine Einheitsfunktion und würde
keine Korrektur durchführen,
es sei denn, die Eingangsgröße wird
durch vorheriges Skalieren des Maximums der Punktmaxima auf 1,0
auf den dynamischen Bereich normalisiert.
-
2 ist
ein kurzes Kodierungsbeispiel in Visual Basic zum Lesen eines digitalen
Bildschirmbildes, Extrahieren von Farbpunkten, Ermitteln eines Farbpunktmaximums,
Anwenden eines Korrekturfaktors auf das Farbpunktmaximum, Anwenden
der Korrektur auf sämtliche
RGB-Werte eines Farbpunktes und Schreiben des korrigierten Farbpunktes
zurück
auf den Bildschirm.
-
3 ist
ein Diagramm, das eine Skalierfunktion darstellt, die der Modifikation
eines Bildes dient, das absichtlich, beispielsweise durch Verwendung
einer kleinen Apertur, unterbelichtet wurde, um eine verbesserte Tiefenschärfe zu erhalten.
-
4 ist
ein Diagramm, das eine Skalierfunktion darstellt, die den Kontrast
in einem bestimmten Bereich des Farbpunktmaximums, das zwischen
0,3 – 0,5
des Bildbereichs beträgt,
durch Skalieren von 20% des Bereichs auf ungefähr 100% oder im Wesentlichen
auf den gesamten dynamischen Bereich erhöht, wobei die Kontraste von
dunkleren und helleren Bereichen reduziert wurden.
-
5 ist
ein Diagramm gemäß 4, das die Farbpunktmaxima
in dem dunklen Bereich verbessert, der zwischen 0,1 – 0,2 des
Bildbereichs beträgt.
-
6 ist
ein Diagramm gemäß 5, das die Farbpunktmaxima
in dem hellen Bereich verbessert, der zwischen 0,9 – 1,0 des
Bildbereichs beträgt.
-
7a ist
ein kurzes Kodierungsbeispiel in Visual Basic zum Verwenden einer
GUI-Schnittstelle, um eine x1,y1- und x2,y2-Fensterfläche auszuwählen, Lesen
des digitalen Bildschirmbildes im Fenster, Extrahieren von Farbpunkten,
Ermitteln eines Farbpunktmaximums, Anwenden eines Korrekturfaktors
auf das Farbpunktmaximum, und Erstellen eines Histogramms des Auftretens
der Farbpunktmaxima.
-
7b ist
ein kurzes Kodierungsbeispiel in Visual Basic zum Erzeugen des Histogramms
gemäß dem dritten
Ausführungsbeispiels.
-
8 ist
ein Diagramm, das eine variable Skalierfunktion darstellt, die einer
Einheitsdiagonale überlagert
wird, wobei durch die variable Funktion eine ästhetisch angenehme Verbesserung
durch das Aufhellen des Bildes erreicht wird. Die Skalierfunktion
ist eine gleichmäßige Kurve,
beispielsweise eine Kurve dritter Ordnung, die die dunkleren Bereiche
abschwächt
und die helleren Bereiche aufhellt.
-
9a – 9f sind Aufnahmen einer Abtei,
diese sind in Reihenfolge: die Originale; die Originale, die gemäß dem Stand
der Technik aufgehellt wurden; die Originale, die gemäß dem Stand
der Technik aufgehellt und kontrastmäßig eingestellt wurden; die
Originale, die gemäß dem Stand
der Technik aufgehellt und sättigungsmäßig eingestellt
wurden; die Originale, die nach dem ersten Ausführungsbeispiel der vorliegenden
Erfindung zum vollen dynamischen Bereich verbessert wurden; und
die Originale, die nach dem zweiten Ausführungsbeispiel der vorliegenden
Erfindung verbessert wurden.
-
10a – 10f sind Aufnahmen von Stone
Henge, diese sind in Reihenfolge: die Originale; die Originale,
die gemäß dem Stand
der Technik aufgehellt wurden; die Originale, die gemäß dem Stand
der Technik aufgehellt und kontrastmäßig eingestellt wurden; die
Originale, die gemäß dem Stand
der Technik aufgehellt und sättigungsmäßig eingestellt
wurden; die Originale, die nach dem ersten Ausführungsbeispiel der vorliegenden
Erfindung zum vollen dynamischen Bereich verbessert wurden; und
die Originale, die nach dem zweiten Ausführungsbeispiel der vorliegenden
Erfindung verbessert wurden.
-
11a und 11b sind eine Originalaufnahme
eines Satelliten bzw, eine nach dem dritten Ausführungsbeispiel der vorliegenden
Erfindung verbesserte Aufnahme.
-
12a und 12b sind eine Originalaufnahme
eines Luftschiffs bzw. eine nach dem dritten Ausführungsbeispiel
der vorliegenden Erfindung verbesserte Aufnahme.
-
13a und 13b sind eine Originalaufnahme
eines Kraftfahrzeugkennzeichens bzw. eine nach dem dritten Ausführungsbeispiel
der vorliegenden Erfindung verbesserte Aufnahme; und
-
14a, 14b und 14c sind eine Originalaufnahme eines
Skiläufers
bzw. von Skispuren im Schnee und zwei nach dem dritten Ausführungsbeispiel
der vorliegenden Erfindung verbesserte Aufnahmen, wobei bei jeder
Aufnahme ein anderer Teil der Aufnahme zur Durchführung der
Verbesserung verwendet wurde.
-
Ausführliche
Beschreibung des bevorzugten Ausführungsbeispiels
-
Zunächst wird ein Bild durch Verwendung
eines Digitalbildaufzeichnungsgeräts aufgenommen. Digitalbildaufzeichnungsgeräte fallen
in zwei Kategorien: physikalisch und virtuell. Physikalische Digitalbildaufzeichnungsgeräte 10 sind
Einrichtungen, die ein Digitalbild durch Messen von Lichtenergie
aufzeichnen, wie eine Digitalkamera 11. Ähnlich wie
eine herkömmliche
Filmkamera weisen die Digitalkameras 11 einen "Objektivkomplex" auf, der eine Lichtsammlung
durchführt,
wobei das Bild durch eine Anordnung von Digitalsensoren derart aufgezeichnet
wird, dass der Wert jedes Farbpunktes die aktuellen Messwerte des
Lichtes darstellt. Ein Digitalbild kann auch als ein digitaler Scan
eines herkömmlichen
Fotos erhalten werden. Bei einem Foto wurde die Lichtsammlung mit
einer herkömmlichen
Kamera durchgeführt
und das Bild wurde auf einem Film aufgezeichnet. Dementsprechend
kann ein physikalisches Digitalbildaufzeichnungsgerät 10 als
eine Kombination einer Kamera, die das Film-/Druckbild erzeugt,
und eines Scanners 12 ausgebildet sein, der das Bild digitalisiert.
Andere Beispiele umfassen digitale kinematogra phische Aufnahmen,
digitalisierte kinematographische Aufnahmen, digitale Röntgenstrahlen
und dergleichen.
-
Virtuelle Digitalbildaufzeichnungsgeräte 10 sind
Computerwiedergabegeräte,
die die Realität
imitieren. Die Programme erzeugen ein "virtuelles" Bild (wie in virtueller Realität) mittels
einer logischen Imitation des fotografischen Prozesses, die vollständig im
Computer selbst läuft.
Diese Digitalbilder zeigen, wie ein Foto ausgesehen hätte, wenn
ein tatsächlich
existierendes "Computermodell" existiert hätte. Ein
Beispiel sind kinematographische Aufnahmen mit phantastischen Dinosauriersimulationen.
-
Ein Objektivkomplex ist die Vorrichtung,
die das Licht in verschiedenen Fotografieformen erfasst. Sie wird
durch mindestens eine Linse, gewöhnlich
aber durch ein System derartiger Linsen gebildet. Der Objektivkomplex
weist auch eine Aperturblende und einen Blendenverschluss auf, die
beide die Lichtsammlung steuern.
-
Das Lichtsammelvermögen einer
Linse wird oft als der Oberflächenbereich
der Objektivlinse selbst angegeben. Eine Linse, welche gegenüber einer
anderen Linse die doppelte Oberfläche hat, kann die doppelte Lichtmenge
erfassen. In der Praxis weist ein Objektivkomplex zwei Mittel zum
Steuern der Menge des tatsächlich
erfassten Lichts auf. Das erste Steuermittel ist die einstellbare
Apertur, die die Lichtmenge verändert,
die pro Zeiteinheit gesammelt wird. Die doppelte Oberfläche bedeutet
die doppelte Lichtmenge pro Zeiteinheit. Das zweite Steuermittel
wird Blendenverschluss genannt und verändert die Zeitdauer, in der
das Licht in den Körper
der Kamera eintritt. Ein doppelt so langes Offenhalten des Blendenverschlusses
bedeutet, dass eine doppelte Lichtenergiemenge in die Kamera eintritt.
-
Ein Echtfarbdigitalbild weist ein
Rasterfeld von Punkten auf, in dem jeder Punkt drei unabhängige Messwerte
aufweist, die die Intensitäten
der roten, grünen
und blauen (RGB) Komponenten des Lichtes darstellen. Dies ist als
RGB-Farbraum bekannt. Für
derartige Bilder werden zahlreiche Computerdateiformate 13 verwendet,
die zahlreiche "Komprimierungsverfahren" nutzen, um Computerplattenspeicherplatz
zu sparen. Ungeachtet des Komprimierungsverfahrens speichern alle
derartigen Digitaldateiformate 13 ein Rasterfeld von Punkten
mit RGB-Werten.
-
Zur Zeit beträgt der allgemeine Standardmaximumwert,
der in derartigen Dateien oder in einem System gespeichert wird,
für jeden
der R-, G- oder B-Werte 255. Dementsprechend kann die Intensität jeder
der RGB-Komponenten im Bereich von 0 bis 255 liegen. Einige Dateiformate
speichern nun Werte im Bereich von 0 bis 1023, wobei größere Formate
zu erwarten sind.
-
Dynamischer
Bereich
-
Jede Einrichtung, einschließlich unseres
Digitalbildrecorders, hat einen "dynamischen
Bereich", der ein
Maß seiner
Fähigkeit
darstellt, relative Energieabweichungen aufzuzeichnen. wie oben
erwähnt
wurde, wird dieser dynamische Bereich gewöhnlich durch die Speichermittel,
die Datei oder das System bestimmt und beträgt typischerweise 0 – 255. Bei
der Fotografie besteht der Trick zum Erfolg darin, den gesamten
dynamischen Bereich zu verwenden, ohne ihn zu überschreiten. Bei einem Foto
besteht der Trick darin, sowohl die Einzelheiten in hellen Bereichen
als auch die Einzelheiten in dunklen Bereichen zu erfassen, ohne
das einen Verlust an Einzelheiten irgendwo auftritt.
-
Wenn in der Kinematographie eine
größere Fläche des
Negativs undurchsichtig wurde, bedeutet das, dass das Licht in diesem
Bereich so intensiv war, dass keine Filmkristalle unverändert blieben.
Die Variationen innerhalb des ausgebleichten Bereichs des Fotos
gehen verloren und es kann gesagt werden, dass "der dynamische Bereich des Systems überschritten
wurde".
-
In der Digitalfotografie wird die
Intensität
der Lichtenergie durch fotoelektrische Sensoren gemessen. Diese
Werte werden als eine Computerdatei im Echtfarbformat gespeichert.
Der dynamische Bereich des Systems wird überschritten, wenn Bereiche
des Rasterfeldes auf Maximum (z. B. 255) gesetzt wurden. Dementsprechend
können
Variationen innerhalb der hellen Bereiche, hypothetisch 256 – 300, lediglich
als 255 aufgezeichnet werden, so dass Einzelheiten innerhalb dieser
Bereiche verloren gehen.
-
Mit einem begrenzten dynamischen
Bereich, wie im Fall von Digitalbildern, kann die Menge des erfassten
Lichts das Bild erheblich beeinflussen. Angenommen, dass ein Bild
erhalten wird, das einen besonderen Lichtpunkt enthält, der
innerhalb des dynamischen Bereichs der Aufzeichnungseinrichtung
erfasst wird. Das Licht kann z. B. von einer braunen Fläche kommen.
Der Lichtpunkt wird im Sinne von drei Farbintensitäten rot
(R), grün
(G) und blau (B) gemessen. Wenn ein zweites Bild mit einer doppelten
Belichtungszeit erhalten wird, dann tritt in die Aufzeichnungseinrichtung
die doppelte Lichtmenge für
jeden einzelnen Punkt einschließlich
des Punktes, den wir unserer Annahme zugrunde gelegt hatten, ein.
wenn der Lichtbereich innerhalb des dynamischen Bereichs des Systems
bleibt, dann werden alle drei Werte von R, G und B verdoppelt – aber die Farbe
des braunen Originalpunktes bleibt braun. Die Verdoppelung des eintretenden
Lichts bedeutet eine Ver doppelung des Messwertes seiner Intensität – R wird
verdoppelt, G wird verdoppelt und B wird verdoppelt.
-
Im Fall einer Digitalinformation,
beispielsweise nach einer Verdoppelung der Lichtmenge (mittels größerer Apertur
oder längerer
Belichtungszeit), werden relative RGB-Werte auch verdoppelt. RGB-Werte
von 50, 30, 20 werden auf 100, 60, 40 verdoppelt, da 100 = 50·2, 60
= 30·2
und 40 = 20·2.
-
Wenn die doppelte Energiemenge jeden
Sensor trifft, dann wird die Anregung jedes Sensors verdoppelt.
Die doppelte Rotenergiemenge trifft den Rotsensor und eine andere
Energie beeinflusst ihn nicht. Die doppelte Grünenergiemenge trifft den Grünsensor.
Und die doppelte Blauenergiemenge trifft den Blausensor.
-
Wenn das Lichtsammelvermögen erhöht wird,
werden die drei Messwerte der Primärfarben desselben Punktes proportional
erhöht,
wie in der folgenden Tabelle 1 dargestellt ist – somit bleiben die Farben
gleich und sind nur heller.
-
Tabelle
1
Wirkung des erhöhten
Lichtsammelvermögens
auf Messungen von RGB
-
In Tabelle 1 bleiben das Verhältnis von
Grün/Rot
und das Verhältnis
Blau/Rot ohne Rücksicht
auf das Lichtsammelvermögen
konstant.
-
Das Bezugsniveau für das Lichtsammelvermögen ist
ein künstlicher
Wert bzw. eine Angelegenheit der Annehmlichkeit. was ist der "richtige" Messwert der Farbe
des Punktes in der Tabelle 1? In einem Bild, das im Freien bei bedecktem
Himmel entsteht, können
Farbpunkte von 50, 30, 20 gemessen werden, während ein Farbpunkt, der in
einem hellen Innenraum gemessen wird, durch Verwendung eines vierfachen
Lichtsammelvermögens
Werte von 200, 120, 80 aufweisen könnte.
-
Während
es möglich
ist, das Lichtsammelvermögen
in Bezug auf die gesammelte Energie einzustellen, wird dies in der
Praxis selten gemacht. Natürlich
verändert
sich das Lichtsammelvermögen
unserer eigenen Augen. Stadtlichter, die nachts sehr hell zu sein
scheinen, erscheinen bei Tageslicht trübe, da die Iris eines Auges
sich nachts automatisch öffnet
und sich am Tag schließt,
wie es erforderlich ist, um mit den natürlichen, extremen Veränderungen
des Lichtniveaus fertig zu werden. Dem Anmelder ist keine Aufzeichnungseinrichtung
bekannt, die einen ausreichend breiten dynamischen Bereich aufweist,
um den Bereich vom natürlichen Tageslicht
bis zur künstlichen,
nächtlichen
Stadtbeleuchtung mit den gleichen Lichtsammeleinstellungen zu verarbeiten.
was ein gutes Bild ausmacht, ist teilweise, dass das Lichtsammelvermögen abhängig vom
Licht derart verändert
wird, dass die Aufzeichnung nicht außerhalb des dynamischen Bereichs
verschoben wird. Beide Messwerte von 50, 30, 20 und 200, 120, 80
sind für
die gleiche Farbe oder den gleichen Punkt gültig.
-
Für
jede Gruppe von drei Größen, beispielsweise
die Intensitätswerte
für Rot,
Grün und
Blau, existiert eine Ge samtanzahl von sechs möglichen Verhältnissen,
nämlich
G/R, B/R, G/B, R/G, R/B und B/G. Einzigartig sind lediglich zwei
der Verhältnisse,
während
die anderen vier Verhältnisse
als Varianten der ersten zwei redundant sind. Beispielsweise sind
unter Zugrundelegung von G/R und B/R die anderen:
grün/blau =
(grün/rot)/(blau/rot)
rot/grün = 1/(grün/rot)
rot/blau
= 1/(blau/rot)
blau/grün
= (blau/rot)/(grün/rot)
-
Im Prinzip können von den sechs Verhältnissen
beliebige zwei ausgewählt
werden. Für
die Zwecke dieser Beschreibung wurden die Verhältnisse grün/rot und blau/rot gewählt.
-
Eine effiziente Auswahl für den Wert
der Intensität
des RGB-Tripletts wäre,
einfach den maximalen Wert der drei RGB-Werte zu nehmen. Im Fall
von 50, 30, 20 für
RGB erscheint rot als maximaler Wert und die Berechnung der Intensität und der
zwei Verhältnisse
sieht folgendermaßen
aus:
Intensität
= rot = 50
Verhältnis
1 = grün/rot
= 30/50 = 0,600
Verhältnis
2 = blau/rot = 20/50 = 0,400
-
Umgekehrt kann man auch zurückrechnen
und den Rotwert, den Grünwert
und den Blauwert wie folgt erhalten:
rot = Intensität = 50
grün = Intensität·Verhältnis 1
= rot·grün/rot =
50 0,600 = 30
blau = Intensität·Verhältnis 2 = rot·blau/rot
= 50 0,400 = 20
-
Diese künstliche Darstellung des RGB-Tripletts
ist zweckmäßig, da
die zwei Verhältnisse
für jeden Punkt
vom Lichtsammelvermögen
unabhängig
sind. Die Menge des erfassten Lichts beeinflusst lediglich die Intensitätskomponente.
-
Eine zu starke Lichtsammlung wird
eine Verzerrung der Farbmessung verursachen, da mindestens eine
der drei Primärfarben
RGB den dynamischen Bereich überschreiten
und somit nicht genau dargestellt wird. Es wird das vorhergehende
Beispiel des Punktes von 50, 30, 20 bei einem willkürlich gewählten Bezugsniveau
des Lichtsammelvermögens
betrachtet. Wenn das Bild jedoch bei einem viel höheren Lichtsammelvermögen wieder
aufgenommen wird, dann wird mindestens eine Farbe aus dem dynamischen
Bereich herausgedrängt. Tabelle
2
Erhöhtes
Lichtsammelvermögen
außerhalb
des dynamischen Bereichs des Systems
-
Es sei erwähnt, dass weder das Verhältnis von
grün/rot
noch blau/rot über
dem 5,1-fachen des Lichtsammelvermögens konstant ist (da sie gesättigt sind).
Da eine maxi male Energiemenge besteht, die mit der Aufzeichnungseinrichtung
(entweder Digitalsensoren oder Film) gemessen werden kann, existiert
für jedes Subjekt
ein praktisches Limit für
das zweckmäßige Lichtsammelvermögen. In
Tabelle 2 wird gezeigt, dass wenn das Lichtsammelvermögen das
Fünffache
der Bezugsgröße des Lichtsammelvermögens überschreitet, der
dynamische Bereich fast vollständig
genutzt wird. Die Intensität
des Punktes beträgt
250 und das Maximum, das gespeichert werden kann, beträgt 255.
Dieses Maximum wird bei exakt 5,1-fachem Lichtsammelvermögen erreicht.
Beim 5,1-fachen Wert beträgt
die Intensität
des Punktes 255, aber die zwei Verhältnisse betragen immer noch
0,600 bzw. 0,400. Bei 5,2-fachem Lichtsammelvermögen tritt in die Aufzeichnungseinrichtung
sogar noch mehr Licht ein. Der Rotsensor würde den Wert 260 speichern;
er kann es jedoch nicht, da der dynamische Bereich überschritten
und der Wert stattdessen auf 255 begrenzt wurde. Die korrekten werte werden
sowohl für
den Grün-
als auch für
den Blausensor abgespeichert, wobei jedoch die nicht korrekte Gesamtfarbe
aufgezeichnet wird, was daran zu erkennen ist, dass die beiden Verhältnisse
nun von den richtigen Verhältnissen
0,600 und 0,400 abweichen. Bei 6-fachem Lichtsammelvermögen tritt
sogar noch mehr Licht ein und die Verzerrungen werden dementsprechend
größer. Die
Verhältnisse
sind jetzt mit 0,706 und 0,471 erheblich verändert und unrichtig und entsprechen
einer erheblich abweichenden Farbe. Bei 8,5-fachem Lichtsammelvermögen misst
auch der Blausensor begrenzte Werte. Das Licht wird so aufgezeichnet,
als ob es die gleiche Intensität
sowohl in der roten als auch in der blauen Primärfarbe aufweisen würde. Das
Verhältnis
blau zu rot beträgt
nun 1,000 und die vorher verzerrte Farbe (rötlich braun) wird nun weiter
in orange verzerrt. Bei 12,25-fachem Lichtsammelvermögen messen
schließlich
alle drei Sensoren begrenzte Werte und die Farbe wird als drei Pri märfarben
mit voller Intensität,
nämlich
weiß,
aufgezeichnet.
-
Es ist wichtig, das Sammeln von Licht
außerhalb
der Fähigkeit
des Aufzeichnungssystems (seines dynamischen Bereichs) zu verhindern,
da dies Farbverzerrungen verursacht.
-
Jede Farbe des RGB-Tripletts kann
als Bezugsfarbe ausgewählt
werden. Wenn grün
die stärkste
Farbe war und unter der Voraussetzung, dass die Farbe die Werte
30, 50, 20 (beim gleichen Bezugslichtsammelvermögen wie das vorhergehende Beispiel
für rot)
aufwies, dann, wie Tabelle 3 zeigt, tritt das gleiche Verhalten ein. Tabelle
3
Wirkung des erhöhten
Lichtsammelvermögens
mit grün
als stärkste
Farbe
-
Wie dargestellt wird, tritt auch
hier die gleiche Situation ein, bei der die Verhältnisse grün/rot und blau/rot auf eine
sehr ähnliche
Art verzerrt werden. In diesem Fall weisen die Verhältnisse
rot/grün
und blau/grün
die gleichen Werte (0,600 und 0,400) auf wie bei der vorherigen
50,30,20-Darstellung für
den Fall von rot.
-
Dementsprechend existiert, ohne Rücksicht
darauf, welcher Einzelwert des RGB-Tripletts das Maximum ist, eine
Symmetrie und die Intensität
wird als der maximale Intensitätswert
von (Rot, Grün,
Blau) definiert und es ergeben sich die Farbverhältnisse (rot/Intensität, grün/Intensität, blau/Intensität). Eines
der drei Verhältnisse
wird genau 1 sein, da die Intensität immer einem der Zähler entspricht.
Im Fall von Rot in der Tabelle 1 ist RGB = 50,30,20, so dass die
Intensität
= max von (50,30,20) ist, d. h. 50, und die Farbverhältnisse
(50/50, 30/50, 20/50) =(1, 0,600, 0,4001 betragen.
-
Somit gilt jeweils für Rot, Grün und Blau:
-
Wenn eine Kamera im Vergleich zu
einer anderen Einstellung für
das gleiche Bild mehr Licht erfasst, wie oben in Erwägung gezogen
wurde, hat ein bestimmter Punkt die Eigenschaft, dass die Verhältnisse
der gemessenen Primärfarben
gleich bleiben – wenn
innerhalb des dynamischen Bereichs des Aufzeichnungssystems gearbeitet
wird. Statt den Punkt als ein RGB-Triplett zu betrachten, kann der
Punkt als eine Intensität
und Verhältnisse
angesehen werden. Bei seiner Bezugsintensität von 50 ergeben sich für unseren
Punkt 50,30,20 wieder die Farbverhältnisse 1, 0,600 und 0,400.
-
Verbesserung
des Bildes
-
Solange die Farbverhältnisse
unverändert
bleiben, kann das Bild eingestellt werden, ohne dass die Farben
negativ beeinflusst werden. Wenn zum Beispiel von der Aufzeichnungseinrichtung
eine nicht ausreichende Lichtmenge erfasst wurde, können wir
die Strahlungsleistung oder die Intensität beim Aufrechterhalten der
Farbe virtuell verstärken.
-
Um das Licht mit einem Korrekturfaktor
von 2 virtuell zu verstärken
oder zu skalieren, wird die Intensität ohne Änderung der Farbverhältnisse
verdoppelt: So ergibt sich zum Beispiel aus der Verdopplung der
Intensität
unseres Punktes von (50,30,20) auf 100 ein Farbpunkt 50·2·(1, 0,6,
0,4) = (100,60,40). Das gleiche Ergebnis kann einfach durch ein
einfaches Multiplizieren der R, G und B mit 2 erreicht werden.
-
Diese virtuelle Verstärkung des
Echtfarblichts wird durch ein Multiplizieren oder Skalieren sämtlicher Primärfarben
mit der gleichen Zahl realisiert. Solange die Ausgangswerte innerhalb
des dynamischen Bereichs bleiben, werden keine Farben verzerrt.
Der dynamische Bereich wird überschritten,
wenn ein R-, G- oder B-wert errechnet wird, der größer ist
als der Bereich, der im Dateiformat für das Bild (z. B. 255) verwendet
wird.
-
Durch Ableiten der Korrektur von
einem algebraischen Skalierausdruck oder -funktion kann sichergestellt
werden, dass kein Wert, der sich aus dem dreifachen Skalieren durch
Multiplizieren ergibt, den dynamischen Bereich überschreitet.
-
Bezugnehmend auf 1 stellt die x-Achse die Intensität eines
Bildpunktes (Maximum von rot, grün und
blau) dar. Die Skalierung 0 – 1
stellt die Grenzwerte des dynamischen Bereichs (z.B. 0 – 255) dar.
Bei der gezeigten linearen Diagonale wird eine Intensität von 50
(50/256 = 0,2) eines Punktes mit einem Einheitswert auf einen Aus gangswert
von 0,2 skaliert. Demzufolge entspricht die Einheitsdiagonale einer "wirkungslosen" Situation, in der
der Ausgangswert mit dem Eingangswert identisch ist. Sobald jedoch
die Skalierfunktion vom Einheitswert abweicht, weichen die Ausgangswerte
von den Eingangswerten ab, woraus sich eine Änderung des Bildes ergibt.
-
Um den dynamischen Bereich von 0
bis 1,0 zu skalieren, wird ein aktueller Intensitätswert (Maximum des
RGB-Tripletts) einfach durch den maximalen Zahlenwert dividiert,
der in diesem dynamischen Bereich gespeichert werden kann. Es wird
angenommen, dass dieser Zahlenwert 255 beträgt. Ein willkürlich gewählter Punkt
wird eine maximale Punktintensität
mit einem wert zwischen 0 und 255 aufweisen. Um das Punktmaximum
auf 0 bis 1,0 zu skalieren, wird die Intensität durch 255 dividiert.
-
Sowohl die Eingangs- als auch die
Ausgangsachse stellen die Werte des Maximums des RGB-Tripletts,
das ist das Punktmaximum, dar. Der Eingangswert ist das in Erwägung gezogene
Punktmaximum. Der Ausgangswert entspricht dem eingestellten Punktmaximum
für das
RGB-Triplett, das als Ergebnis des Verfahrens errechnet wird.
-
Punktmaximum
-
Eine Methode zum Ermitteln eines
Maximums eines RGB-Eingangstripletts besteht darin, einen wert als
Maximum auszuwählen,
jeden der anderen werte zu prüfen
und, wenn ein anderer Wert größer ist,
das Maximum auf diesen Wert einzustellen. Die folgenden drei Zeilen
eines Pseudocodes beschreiben die Auswahl eines Punktmaximums:
-
Intensität = rot
-
Die Intensität wird auf "rot" gesetzt.
-
IF Intensität < grün THEN Intensität = grün
-
Wenn die Intensität kleiner als der Grünwert ist,
dann wird sie auf den Grünwert
gesetzt.
-
IF Intensität < blau THEN Intensität = blau
-
Wenn die Intensität kleiner als der Blauwert
ist, dann wird sie auf den Blauwert gesetzt.
-
Bezugnehmend auf 1 ist jede Skalierung oder Korrektur
auf das dargestellten 1 × 1-Diagramm eingeschränkt. Die
Eingangsachse ist auf den Abschnitt von 0 bis 1 eingeschränkt und
die Ausgangsachse ist auf den Bereich von 0 bis 1 eingeschränkt. Das
bedeutet, dass die Intensität
eines eingestellten oder korrigierten Punktes den dynamischen Bereich
nicht überschreiten
wird.
-
Jede Skalierfunktion, die im eingeschränkten Diagramm
graphisch dargestellt werden kann, kann für die virtuelle Verstärkung des
Echtfarblichts verwendet werden. Die Eigenschaften eines bestimmten
Graphs beeinflussen die letztendliche Ästhetik und die Anwendung.
Für die
Anwendung wird eine besondere Funktion als geeignet ausgewählt, je
nachdem, ob sie der Einstellung der Helligkeit des gesamten Bildes,
oder eines Teils des Bildes oder einer anderen Einstellung dient.
-
Zwei Implementierungen der Korrektur
mittels Skalierfunktion umfassen: entweder die Bildung einer Tabelle
mit Korrekturen (eine endliche Anzahl, die durch den dynamischen
Bereich festgelegt wird), oder ein weniger effizientes Mittel, nämlich die
unabhängige
Berechnung jedes Punktes nacheinander. Es ist nachvollziehbar, dass
sich der wert der Intensität
eines besonderen Punktes in einem Bild für viele andere Punkte mehrmals
wiederholen wird. Im Falle einer Tabelle kann somit für eine effiziente
Be rechnung eine Korrektur nur einmal berechnet, aber mehrmals verwendet
werden.
-
Bei der Tabellenmethode werden alle
Korrekturen (gewöhnlich
256, abhängig
von den Grenzwerten des dynamischen Bereichs), sobald die zur Bestimmung
einer besonderen Skalierfunktion erforderlichen Parameter bekannt
sind, mittels eines Unterprogramms berechnet und die Ergebnisse
in einer Tabelle abgelegt, so dass jede Korrektur nur einmal berechnet
wird. Dann wird die Korrektur auf diese Art einfach ausgesucht (wobei
ein pseudocodiertes Beispiel wie folgt aussieht):
corr = corra(Intensität),
wobei
corr die besondere Korrektur für
den aktuellen Punkt ist;
corra() die Tabelle oder eine Anordnung
ist, in der die Korrekturen abgelegt sind;
und
Intensität das Punktmaximum
der RGB für
den aktuellen Punkt ist.
-
Ein anderer (weniger effizienter)
Weg besteht darin, eine Funktion zur Berechnung der Korrektur für jeden
einzelnen bestimmten Punkt nacheinander zu verwenden. Ein Beispiel
wäre:
corr
= correct(Intensität),
wobei
corr die besondere Korrektur für
den aktuellen Punkt ist;
correct() die Korrekturfunktion ist,
die durch einfaches "Aufrufen" ihres Namens auf
diese Weise ausgefhrt wird; und
Intensität das Punktmaximum der RGB
für den
aktuellen Punkt ist.
-
Ein gegebener Punkt der graphisch
dargestellten Skalierfunktion, der einen Eingangs- und einen Ausgangswert
aufweist, wird verwendet, um den Korrektur-Multiplizierer oder -faktor
abzuleiten. Ein Korrekturfaktor ist gleich Ausgangswert/Eingangswert.
-
Um die einzelnen Farbverhältnisse
aufrechtzuerhalten, werden alle drei RGB-Triplettwerte mit der gleichen
Korrektur corr multipliziert, die für das Punktmaximum bestimmt
und durch das Punktmaximum festgelegt wurde.
-
Dementsprechend gilt rot = rot·corr;
grün =
grün·corr;
blau = blau·corr,
wobei rot, grün
und blau die Werte des aktuellen Punkt vor und nach der Korrektur
annehmen. Die Wirkung der Verknüpfung
dieser vier Überlegungen
ist die Wirkung der virtuellen Verstärkung des Echtfarblichts. Der
dynamische Bereich wird nie überschritten
und die Farbe bleibt immer erhalten.
-
Praktische
Implementierung
-
Ein Bild kann auf verschiedene Art
und weise gelesen werden. Der Anmelder hat die Notwendigkeit vermieden,
die zahlreichen graphischen Computerdateiformate 13 zu überprüfen, indem
er das Verfahren durch ein auf einem Bildschirm angezeigtes Bild
darstellt. Dem Anmelder ist bekannt, dass gegenwärtig Visual Basic (eine Programmiersprache 14,
die unter dem Windows-Betriebssystem lauffähig ist – alles Marken von Microsoft
Corporation) und die meisten anderen modernen Programmiersprachen 14 einfache
Befehle benutzen, die das Auslesen eines Bildes ermöglichen.
In Visual Basic lautet ein Befehl pbox.Picture = LoadPicture(file_in),
wo mit pbox ein "picture-box-object" bezeichnet wird,
das für
die Darstellung von Bildern verwendet wird, Picture ein "Verfahren" ist, das ein Bild
einem Objekt zuordnet, LoadPicture() die Funktion ist, die die Bilddateien
liest und file-in der Name der Datei 13 ist,
die gelesen werden soll. Sobald dieser Befehl von Visual Basic erteilt
wird, wird die Bilddatei 13 eingelesen und auf dem Bildschirm
in dem Programmierwerkzeug, das "picture-box-object" genannt wird, dargestellt.
Ein ähnliches
Verfahren wird verwendet, um ein Bild zu speichern.
-
Bezugnehmend auf 2 zeigt der vereinfachte Code eine Visual
Basic-Implementierung des Verfahrens zur virtuellen Verstärkung des
Echtfarblichts, das auf ein Bild angewandt wird. Dieses vereinfachte
Verfahren erfordert als Minimum eine 16-bit-Videokarte, wobei eine
24-bit-Karte bevorzugt wird. Der Code nach 2 betrifft das Extrahieren von Farbwerten
aus der Videokarte 15 selbst. Dies ist nicht das effizienteste
Verfahren und könnte
durch Abspeichern des Bildes in dem Haupt-RAM-Speicher 16 wesentlich
verbessert werden. Dies würde
jedenfalls den Zugriff auf die Videokarte 15 sowie die
Extraktionsschritte beim Herausnehmen von R-, G- und B-Werten aus
einer kombinierten Farbvariablen überflüssig machen, wie sie beispielsweise durch
die Visual-Basic-Funktion pbox.Point(icol,irow) zurückgeschickt
wird. Durch einen Zugriff auf den Speicher 16 könnte sich
eine siebenfache Erhöhung
der Effizienz ergeben.
-
Der Prozess ermöglicht ganz einfach eine Einstellung
eines auf dem Bildschirm angezeigten rechteckigen, aus Punkten bestehenden
Bildes. Das Bild kann beispielsweise dunkel sein und nur eine Maximalintensität jedes
Punktmaximums von ca. 128, also nur die Hälfte des dynamischen Bereichs
des Systems, aufweisen. Im einfachsten Fall wird der Bildbereich
auf den dynamischen Bereich wie eine lineare Funktion skaliert.
Dementsprechend wird die Intensität sämtlicher Punktmaxima. durch
die Normalisierung des Maximums von 128 auf 255 verdoppelt. Dementsprechend
ist die Skalierfunktion lediglich eine Konstante von 2 und das Ergebnis
des Ablesevorgangs beträgt
für jedes
Punktmaximum 2. Für
jede Bildspalte werden die Werte für blau, grün und rot extrahiert. Das Punktmaximum
wird auf rot festgelegt und grün
und blau werden geprüft,
um die Intensität
auf das Maximum der drei werte einzustellen. Die Korrektur wird
von der Tabelle abgelesen und ist in diesem Fall eine Konstante
von 2. Jeder der Werte für
RGB wird mit 2 skaliert, wobei der maximale skalierte Wert 128·2 oder
256 – das
Maximum des dynamischen Bereichs – beträgt. Der modifizierte Punkt
wird an den Bildschirm zurückgeschrieben,
wobei alle Farben erhalten bleiben, ohne dass der dynamische Bereich überschritten
wurde.
-
Anwendungen – Wirkung
der Skalierfunktion
-
Die virtuell unbegrenzte Auswahl
von Skalierfunktionen, die auf das Bild angewandt werden können, hat
unterschiedliche Wirkungen für
zahlreiche unterschiedliche Ziele zur Folge. Manchmal bestimmt die
Bildqualität,
welche Funktion zu verwenden ist (beispielsweise eine Funktion,
die dem Aufhellen eines dunklen Bildes dient), oder eine speziellere
Funktion, die lediglich bestimmte Intensitäten im Bild verbessert (beispielsweise
das Extrahieren von Details aus einem schmalen Teil mit minimaler
Bedeutung bezüglich
der Wirkung auf die anderen Bildteile).
-
Anwendungen – virtuelle
Linse
-
Sowohl die Apertur als auch der Blendenverschluss
verursachen eigene und andere Probleme. Wenn das Subjekt der Aufnahme
sich bewegt, kann der Blendenverschluss nur für eine kurze Zeitdauer geöffnet werden,
sonst wird das Bild durch die Bewegung selbst unscharf.
-
Wenn die Apertur geöffnet wird,
nimmt die Tiefenschärfe
(der Bereich von Abständen,
der scharf abgebildet wird) ab. Selbst wenn richtig fokussiert wird,
bedeutet eine weit geöffnete
Apertur, dass nur ein kleiner Bereich der Abstände scharf abgebildet wird.
Diese "Verzerrung" wird durch die sphärische Form
der Linse selbst verursacht. Wenn die Apertur klein ist, ist die
Tiefenschärfe
besser, da lediglich der fast flache, mittlere Bereich der Linse
verwendet wird. Die kleinste Einstellung der Apertur bringt die
größtmögliche Tiefenschärfe.
-
In der Praxis stellt die Fotografie
(und die Lichtsammlung allgemein) ein Ergebnis dieser beiden Effekte
dar. Eine unbewegliche Szene kann eine große Tiefenschärfe aufweisen,
die durch die Wahl einer kleinen Apertur und einer niedrigen Blendenverschlussgeschwindigkeit
erreicht wird. Ein Rennwagen kann lediglich auf Kosten der Tiefenschärfe aufgenommen
werden, da der Blendenverschluss nicht lange geöffnet werden kann, so dass
die Apertur geöffnet
werden muss, um mehr Licht zu erfassen.
-
Es wird angenommen, dass eine Linse "normaler Qualität" verwendet wird,
um etwas zu fotografieren, was sich schnell bewegt, und dass der
Fotograf die Tiefenschärfe
aber nicht verlieren will. Ohne den erfindungsgemäßen Prozess
besteht keine Möglichkeit,
dies zu tun. Dementsprechend wird durch Einstellen der Steuerung
derart, dass zu wenig Licht erfasst wird, das nicht korrigierte
Bild unter dem Gesichtspunkt von normalen fotografischen Betrachtungen
zu dunkel. Die Tiefenschärfe
bleibt jedoch erhalten. Es wird angenommen, dass der Fotograf ein
Viertel (25%) der Lichtmenge gesammelt hatte, die die Verwendung
des gesamten dynamischen Bereichs ermöglichen würde. Das Bild wird fast schwarz,
wobei der größte aufgezeichnete
Wert 63 beträgt,
während
der Grenzwert des dynamischen Bereichs 255 beträgt. Dieses Bild kann korrigiert
werden, um die Einzelheiten in den dunklen Bereichen zum Vorschein
zu bringen.
-
Dementsprechend ist das Diagramm
bei einem ersten Ausführungsbeispiel,
bezugnehmend auf 3,
eine gerade Linie, die im Punkt (x, 1,0) endet, wo x das Maximum
des gesamten gemessenen Bildes ist. Dieser Maximalwert kann durch
Verwendung einer modifizierten Histogrammmethode ermittelt werden.
In diesem Beispiel wäre
x = 0,25; könnte
jedoch jeden Wert zwischen 0 und 1 annehmen. Bei dem bevorzugten Ausführungsbeispiel
der Erfindung wird ein virtuelles Licht hinzugefügt, wie das bei einer weiteren Öffnung der Apertur
ebenfalls erreicht wäre,
außer
dass es eine Tiefenschärfe
ergibt, die sonst nur mit einer hochwertigeren Linse erreichbar
wäre. Der
Prozess kann auch zum Korrigieren von "Fehlgriffen" verwendet werden, bei denen ungeeignete
Linseneinstellungen in einer zu dunklen Aufnahme resultieren.
-
Virtuelle
Iris
-
Bei einem zweiten Ausführungsbeispiel,
bezugnehmend auf 8,
kann ein Graph derart ausgewählt werden,
dass die dunkelsten Teile des Bildes dunkel bleiben und die trüberen Teile
aufgehellt werden, aber auch derart, dass die hellen Teile des Bildes
fast unverändert
bleiben. 8 und gleichmäßig, nicht
lineare Graphen ähnlicher
Form wirken derart, dass sie die Iris imitieren, wenn sie im Zusammenhang
mit der virtuellen Verstärkung
des Echtfarblichts gemäß der vorliegenden
Erfindung verwendet werden. Das resultierende Bild kommt der Erfahrung
aus dem visuellen Gedächtnis
viel näher.
Der Anmelder bezeichnet diese Verbesserung als "virtuelle Iris".
-
Der sanfte Charakter dieses nicht
linearen Graphs stellt sicher, dass sich aus einem hochwertigen
Eingangsbild ein schön
verarbeitetes Bild ergibt. Eine wichtige Voraussetzung für die Erzielung
dieses ästhetischen
Ergebnisses besteht darin, dass der Graph gleichförmig bleibt,
dass die Graphsteigung nie Null wird und sich auch gleichmäßig ändert und
dass insgesamt ein resultierender Aufhellungseffekt auftritt.
-
In 8 nähert sich
die Skalierfunktion der Asymptote des Minimums und des Maximums
des dynamischen Bereichs des Systems. Je mehr sich die Funktion
der Tangente des Minimums und des Maximums des dynamischen Bereichs
nähert,
desto stärker
wird die Korrektur durchgeführt.
-
Virtuelle
Detailverbesserung
-
Um es einfach auszudrücken, ist
jedes Bildfeld einer Fotoaufnahme das Ergebnis nur einer Einstellung der
Apertur und des Blendenverschlusses. Bei Ermittlungsarbeiten ergibt
sich daraus die lästige
Einschränkung,
dass Details in bestimmten Bereichen der Fotoaufnahme schwach dargestellt
werden. Bei einem dritten Ausführungsbeispiel
wird ein Prozess zum Hervorheben von Details in diesem bestimmten
schwächeren
Bereich vorgeschlagen.
-
Bei der Darstellung in 4 wird der in Frage kommende
Bereich ausgewählt
und eine Histogrammmethode angewandt, um zu ermitteln, dass innerhalb
des Bereichs der Punkt mit minimaler Intensität 0,30 ist und der Punkt mit
maximaler Intensität
0,50 ist. Dieser Bereich verwendet lediglich 20 %des dynamischen
Bereichs, was bedeutet, dass der Kontrast schwach sein wird – oder durch
das Auge fast nicht sichtbar.
-
Durch die Verwendung einer dreiteiligen
Skalierfunktion, wie in 4 dargestellt
ist, werden diese kleinen Kontraste in große Kontraste umgewandelt, da
der Ausgabewert aus diesem bestimmten Bereich nun über 80%
des dynamischen Bereichs überstreicht.
-
Linien mit kleiner Steigung unterhalb
0,30 und oberhalb 0,50 am Eingang bewirken ein Ausbleichen der Details
in dunkleren und helleren Teilen des Bildes. Die resultierende Farbe
in jedem Punkt wird jedoch nie verzerrt werden und die helleren
Teile des Bildes stellen eine gute Bezugsgröße dar. Es kann jeder Bereich der
Fotoaufnahme ausgewählt
werden. Bezugnehmend auf 5 werden
Details in einem sehr dunklen Bereich, z. B. eine Schrift durch
Schatten verdeckt, verdeutlicht. 6 zeigt,
wie Details in einem hellen Bereich, wie Spuren im Schnee, verdeutlicht
werden können.
Die Details jeder beliebigen Anzahl von Bereichen können durch
einfache Auswahl des in Frage kommenden Bereichs und Anwendung der
Korrektur verbessert werden.
-
Insbesondere können sämtliche Bereiche oder Teile
des Bildes optimiert werden. Zunächst
muss der Bereich identifiziert werden. Auf einer graphischen Benutzeroberfläche wird
dies durch die Verwendung der Maus in einem "Klick- und Zieh"-Modus leicht durchgeführt. Bei
objektorientierter Programmierung kann dies durch Verwendung des
Betriebssystems (Windows) erreicht werden, um zu erkennen, wann
die Maustaste angeklickt wurde. In Visual Basic sind Unterprogramme
(für jedes
Programm) vorgesehen, die ausgeführt
werden, sobald die Maustaste niedergedrückt oder losgelassen wird.
-
Ein Benutzer kann jeden rechteckigen
Bereich innerhalb des Bildes auswählen. Die "Koordinaten" sind im gemeinsamen Speicher als xdwn,
ydwn, xup und yup abgelegt. Siehe die fotografischen Beispiele Nr.
1 und Nr. 2 eines auf dem Bild überlagerten
Rechteckes.
-
Sowohl im Absatz "Virtuelle Linse" als auch im Absatz "Virtuelle Detailverbesserung" wurde auf eine "modifizierte Histogrammmethode" Bezug genommen.
Ein Histogramm ist ganz einfach die Ermittlung der Anzahl von Ereignissen
gegen den wert der Ereignisse.
-
Beispielsweise, wie in Tabelle 4,
an einer Gruppe von RGB-Tripletts gezeigt wird:
-
In diesem Beispiel werden 10 Punkte
dargestellt, von denen jeder drei werte (rot, grün und blau) hat, wobei jeder
dieser dreißig
werte im Bereich von 0 bis 5 liegt. Das normale Histogramm wird
dadurch berechnet, indem zusammenaddiert wird, wie oft jeder Wert
(0, 1, 2, 3, 4, 5) insgesamt auftritt.
-
Die modifizierte Histogrammmethode,
bei der die Intensität
= max (rot, grün,
blau), zeigt Tabelle 5 wie folgt: Tabelle
5
Modifizierte Histogrammmethode
-
Zum Aufbau des Histogramms wird die
Häufigkeit
des Auftritts von Zahlen der maximalen Intensität und nicht die einzelnen Werte
von rot, grün
und blau verwendet.
-
Dies entspricht dem Geist der vorliegenden
Patentanmeldung, der darin besteht, dass Rot-, Grün- und Blauwerte
als eine Einheit, die eine Intensität sowie Verhältnisse
aufweist, und nicht als drei unabhängige Werte verarbeitet werden.
-
Das Histogramm wird durch Berücksichtigung
lediglich derjenigen Punkte erstellt, die im Bereich der Reihen
= xdwn bis xup und der Spalten = ydwn bis yup liegen.
-
In 7a ist
ein Beispiel eines Codes zur Anwendung des modifizierten Histogramms
gezeigt.
-
An diesem Punkt der Bildverarbeitung
wird das Histogramm erstellt und die aufsummierten Werte bezogen
auf die Intensitäten
der RGB-Tripletts im markierten Bereich sind bekannt. wie durch
die Histogrammdaten dargestellt ist, werden die wesentlichen Anfangs-
und Endintensitäten
bestimmt.
-
Um Fehler, wie tote oder gesättigte Aufzeichnungselemente
und andere "Ausreißerwerte", die für den Bereich
nicht bezeichnend sind, zu vermeiden, kann man die relevanten Punkte
auf 2% und 98% der Anzahl der Ereignisse begrenzen, um die niedrigsten
und die höchsten
relevanten RGB-Intensitäten darzustellen.
-
Die Gesamtzahl der im Histogramm
aufgezählten
Intensitäten
ist gleich dem Gesamtwert nach der letzten Aufsummierung, so dass
die 2%- und 98%-Werte leicht ermittelt werden. Der entsprechende
Code ist in 7b dargestellt,
der den Bereich der Intensitätsindizes
(hmin und hmax) bestimmt, der dem Intensitätsbereich in der vom Benutzer
gewählten
Ausschnitt entspricht.
-
Bezugnehmend auf 4 ermittelte die modifizierte Histogrammmethode,
dass 0,30 (des Maximums des dynamischen Bereichs) und 0,50 (des
Maximums des dynamischen Bereichs) den minimalen und den maximalen
Intensitätswert
des vom Benutzer ausgewählten
Bildteiles darstellen. (Siehe fotografische Beispiele Nr. 1, Nr.
2 für die
Ausschnitte).
-
Es wurde auch angenommen, dass der
aus der modifizierten Histogrammmethode errechnete Bereich derart
modifiziert werden sollte, dass er sich über den größten Teil des dynamischen Bereichs
schwankt.
-
Was sollte aus diesem Eingangsbereich
hmin und hmax werden? Wir möchten,
dass er den größten Teil
des dynamischen Bereichs abdeckt. Eine gute Schätzung sind 80% des dynamischen
Bereichs mit einem kleinen Rest für die dunk len und die hellen
Bereiche, so dass sie noch als eine Bezugsgröße verwendet werden können.
-
Im Anwendungscode wurde der Ausgangs-Intensitätsbereich
des ausgewählten
Bereichs ursprünglich
auf 0,1 bis 0,9 des Maximums des dynamischen Bereichs gesetzt. Später wurde
er auf 0,2 bis 0,9 gesetzt, da diese Werte nach der Betrachtung
mehrerer Bilder ganz einfach als vorteilhafter erschienen.
-
Der zur Berechnung der Tabelle verwendete
Code, der auf der modifizierten Histogrammmethode zur Bestimmung
des Eingangs-Intensitätsbereichs
und des (nahezu) willkürlichen
Ausgangsbereichs von 0,2 bis 0,9 folgt.
-
Der Graph nach
4 kann im Allgemeinen so angesehen werden,
als ob er drei Liniensegmente aufweist, von denen jeder zwei Endpunkte
hat. Tabelle
6
Liniensegmente
- wo xmin und xmax durch die modifizierte
Histogrammmethode errechnet wurden. Das bedeutet:
- xmin = hmin/drmx
- xmax = hmax/drmx
-
Beide Eingangsachsen werden in Relation
zum dynamischen Bereich definiert. Die Eingangswerte werden in Relation
zur Intensität
(max von RGB) des Punktes definiert. Der Graph verlässt nie "das Fenster" 0 bis 1. Diese Ein schränkungen
müssen
immer bei jeder Skalierfunktion in jedem besonderen Prozess eingehalten
werden.
-
Alles, was hier übrig bleibt, ist, dass der
Ausgangswert von einem Programm errechnet wird, das dem äquivalent
ist, das oben im Zusammenhang mit 2 beschrieben
wurde, und dass die Tabelle nicht genau dem Graph, sondern dem Verhältnis zwischen
Ausgangs- und Eingangsgröße entspricht.
-
Jedes Liniensegment kann mittels
Algebra in der "Achsenabschnittssteigungsform" ausgedrückt werden,
deren allgemeine Formel y = m·x
+ b lautet. Für
jedes der drei Liniensegmente werden Lineargleichungen und Skalierfaktoren
bestimmt. Aus den drei Gleichungen kann eine Reihe von Korrekturen
oder Skalierfaktoren bestimmt werden. Durch das Dividieren der Ausgangswerte
durch den dynamischen Bereich des Systems entsteht das Verhältnis der
Ausgangs- zur Eingangsgröße.
-
Dieses virtuelle Detailverbesserungsverfahren – oder forensisches
Ausleuchten, was auf seine Fähigkeit
zurückzuführen ist,
sich mit den normalerweise verdeckten Bereichen eingehend zu befassen – maximiert den
dynamischen Bereich jedes Ziels, so dass die Details verbessert
werden. Dies ist nicht auf den Zielbereich begrenzt, sondern es
werden sämtliche
Teile der Fotoaufnahme verbessert, die Intensitäten aufweisen, die der Benutzerauswahl
entsprechen. Es kann jeder beliebige Zielbereich ausgewählt werden,
so dass bei der gleichen Fotoaufnahme mehrere nützliche Korrekturen durchgeführt werden
können.
Die Bereiche, die eine Intensität
aufweisen, die stärker
als der vom Benutzer gewählte
Intensitätsbereich
ist, bilden aufgrund des "Echtfarbencharakters" der Korrektur nützliche
Bezugswerte.
-
Beispiele
-
Virtuelles Ausleuchten – virtuelle
Iris
-
Die in 9 und 10 dargestellten Beispiele
zeigen Korrekturen von Beschränkungen,
die aus den physikalischen Belichtungseinrichtungen oder Bildaufzeichnungsgeräten resultieren.
Die eine Einstellung der Apertur und des Blendenverschlusses für den gesamten
Rahmen bedeutet, dass ein Foto wahrscheinlich von dem abweicht,
woran man sich eigentlich erinnert. Die Iris eines Auges stellt
sich beim Wahrnehmen von Kontrasten selbst ein. In einem Park an
einem sonnigen Tag öffnet
sich die Iris beim Übergang
vom Sonnenschein in den Schatten, so dass man sich daran erinnert,
dass das Gras grün
war, während
Fotoaufnahmen oft das Gras im Schatten als schwarz darstellen.
-
Fotoaufnahme Nr. 1 (9a – 9f) – Touristenfoto
einer Abtei
-
Dieses Beispiel zeigt, wie verschiedene
Prozesse nach dem Stand der Technik und die vorliegende Erfindung
das Bild verbessern. Die Methode mittels der Prozesse nach dem Stand
der Technik besteht darin, mit dem Bild so lange zu "spielen", bis die Helligkeit
den eigenen Vorstellungen entspricht. Dies ist eine subjektive Betrachtungsweise
und der Fachbenutzer ist jemand, der die erforderlichen Kompromisse
richtig schließt.
Das Originalbild in 9a,
das von einem Foto eingescannt wurde, ist sehr dunkel, verwendet
jedoch immer den ganzen/den größten Teil
des dynamischen Bereichs (der Punktmaxima (Treffer), wobei diese
außerhalb
der Intensitätswerte
5 und 254 liegen) eines Systems von 256.
-
9b bis 9d zeigen Verfahren nach
dem Stand der Technik zum Aufhellen von Bildern. Bei 9 wird dies durch Erhöhen der
Bildhelligkeit um 80% durchgeführt.
Während
das Bild nach 9b heller
ist, sind die Farben sehr verblasst und auch der Himmel weist eine
erhebliche Farbenveränderung
auf. 9c zeigt ein gemäß dem Stand
der Technik aufgehelltes Bild nach 9b,
dessen Kontrast auf 50% eingestellt wurde. Bei einem Versuch, die
beim Aufhellen verlorenen Farben wieder herzustellen, wird der Kontrast
erhöht.
Es ist bemerkbar, wie viele Details des Bildes verloren gehen. Das
Verfahren hat viele Punkte hinter den Rand – außerhalb des dynamischen Bereichs – verschoben. 9d zeigt ein aufgehelltes
Bild nach 9b, deren
Sättigung
auf 50% eingestellt wurde. Eine Erhöhung der Sättigung ist eine andere Methode
zur Wiederherstellung der Farben. Als Ergebnis wird der Himmel fast
in den ursprünglichen
Zustand zurückversetzt,
der Rest des Bildes weist jedoch erhebliche und hässliche
Farbverzerrungen auf.
-
Durch die Anwendung der Methoden
gemäß der vorliegenden
Erfindung wird das Foto, insbesondere in 9f, viel schärfer. In 9e wird der Bildbereich von 2 bis 254
linear in 0 bis 255 abgebildet. Die Wirkung ist gering, da das Originalbild
bereits fast dem vollen Bereich entsprach. Es wird jedoch sichergestellt,
dass das Ausgangsbild dem vollen dynamischen Bereich entspricht.
Um ein qualitativ besseres Bild zu erhalten wurde bei 9f eine Skalierfunktion
gemäß 8 angewandt. Sämtliche
Farben entsprechen dem Bild so, wie es eingescannt wurde, und sind
lebendig, genauso wie sie dem Auge erscheinen würden. ohne jegliche Verluste
an Details.
-
Fotoaufnahme Nr. 2 (10a – 10f) – Touristenfoto
von Stone Henge
-
Im Originalbild von 10a sind die Steine aufgrund der extremen
Belichtungsbedingungen im Schatten. In 10f kompensiert der Prozess der virtuellen
Iris gemäß der vorliegenden
Erfindung ähnlich,
wie die Iris dies automatisch tut, und wandelt das schlechte Foto
in ein gutes um.
-
Das Subjekt in 10 ist insbesondere sehr dunkel und verwendet
wieder den ganzen/den größten Teil
des dynamischen Bereichs (wobei nur 1% der Treffer außerhalb
des Intensitätsbereichs
von 6 und 253 liegt). Diese Bild wurde durch andere "vorverarbeitet", um Details zum
Vorschein zu bringen – es
sei bemerkt, dass der Himmel fast weiß ist, dass jedoch die Wolken
immer sichtbar sind (bei der Wiedergabe der Figuren in dieser Anmeldung
konnte die tatsächliche
Anwesenheit der Wolken nicht unbedingt sichergestellt werden). Der
Stand der Technik hat das Bild "so
weit" vorangebracht,
wie es möglich
war; das Subjekt war jedoch immer noch zu dunkel. 10b zeigt ein Aufhellen des Bildes gemäß dem Stand
der Technik um 60%. Obwohl das Bild heller ist, sind die Farben
sehr verblasst und die Steine haben alle ihre Farben verloren. Durch
diesen Prozess alleine gehen auch einige Details verloren. Zu erwähnen ist,
dass sogar bei einer Graustufenbearbeitung die Aufhellung des "roten" Felsens links von
den Steinen und am linken Rand des Bildes in 10b verbleibt. 10c ist das aufgehellte Bild nach 10b mit einer Einstellung
des Kontrasts auf 40%. Es sei angemerkt, dass die Steine in bestimmten,
jedoch nicht in anderen Bereichen einiges an Farbe wiedergewonnen
haben. Es sei auch zu merken, wie viel mehr von den Details des
Bildes verlorengehen. 10d ist
das aufgehellte Bild nach 10b mit
einer Einstellung der Sättigung
auf 15%. Es wurde eine verbesserte Farbe erreicht, die an sich halbwegs
richtig ist, es wurden jedoch auch künstliche Farbe, wie rote und
gelbe Farben, hinzufügt. Sogar
bei Fotoaufnahmen, bei denen nicht viel Korrektur erforderlich ist,
führt eine
Manipulation mit der Sättigung
bei jedem Punkt zu unterschiedlichen RGB-Verhältnissen, als aufgezeichnet
wurden. Schließlich
erhält man
als Bestes nur eine Kompromisslösung.
-
Bei der Anwendung der Methoden gemäß der vorliegenden
Erfindung wird in 10e der
Bildbereich von 6 bis 253 auf 0 bis 255 linear abgebildet, um den
gesamten dynamischen Bereich im Ausgangsbild zu gewährleisten.
In 10f wurde wieder
die Skalierfunktion gemäß 8 angewandt, um ein hochwertiges
Echtfarbbild ohne Detailverluste zu erhalten.
-
Forensisches
Ausleuchten –virtuelle
Detailverbesserung
-
Foto Nr. 3 (11a, 11b) – Satellit
-
In 11a ist
der Satellit im Schatten und die Oberfläche ist sehr dunkel. Das geschieht
im Weltraum infolge des extremen Kontrasts in der Beleuchtung oft.
Wichtige "Andockports" können nicht
gesehen werden. Durch die Verwendung des mit forensischem Ausleuchten
arbeitenden Korrekturverfahrens gemäß dem dritten Ausführungsbeispiel
wurde im dunklen Bereich ein Fenster oder Ausschnitt gewählt, wobei
zum Erstellen eines für
diesen Bereich geeigneten Korrekturgraphs die Histogrammmethode
verwendet wurde.
-
In 11b zeigt
nun das verarbeitete Bild Details im dunklen Bereich. Die mit weißen Kreisen
markierten Andockports sind nun sichtbar.
-
Foto Nr. 4 (12a, 12b) – Luftschiff
-
Im Originalbild in 12a ist die Unterseite des Luftschiffs
im Schatten. Das geschieht in der Fotografie oft, wenn die Linsen
auf den Himmel gerichtet ist. Insbesondere können die Identifikationsmarkierungen nicht
gesehen werden, da das Heck zu dunkel ist.
-
Der Heckbereich wird nach der Methode
des dritten Ausführungsbeispiels
ausgewählt
und zum Erstellen eines für
diesen Bereich geeigneten Korrekturgraphs wird die Histogrammmethode
verwendet. Als Ergebnis, wie in 12b dargestellt
ist, zeigt das verarbeitete Bild in dem vorher verdeckten, dunklen
Bereich die Beschriftung. Das Luftschiff ist nun als COLUMBIA N3A
identifiziert.
-
Foto Nr. 5 (13a, 13b) – Fahrzeugkennzeichen
-
Im Originalrahmen der 13a ist das Fahrzeugkennzeichen
größtenteils
im Schatten gehüllt.
Das Fahrzeug kann nicht identifiziert werden, da das Kennzeichen
nicht gelesen werden kann. Mittels des dritten Ausführungsbeispiels
wird das Kennzeichen ausgewählt
und zum Erstellen eines für
diesen Bereich geeigneten Korrekturgraphs wird die Histogrammmethode
verwendet.
-
Als Ergebnis, und Bezugnehmend auf 13b, zeigt das verarbeitete
Bild , dass das Fahrzeug kein normales Kennzeichen hat, sondern
stattdessen die Worte: Classic Mustang trägt.
-
Foto Nr. 6 (14a, 14b, 14c) – Spuren
im Schnee
-
In 14a fahren
zwei Leute Ski. Ihre Spuren sind erkennbar, jedoch schwach. Durch
die Verwendung des mit fo rensischem Ausleuchten arbeitenden Korrekturverfahrens
gemäß dem dritten
Ausführungsbeispiel
wurde im überbelichteten
Bereich der Spuren im Schnee ein Fenster oder ein Ausschnitt ausgewählt, wobei
zum Erstellen eines für
diesen Bereich geeigneten Korrekturgraphs die Histogrammmethode
verwendet wurde.
-
In 14b zeigt
nun das verarbeitete Bild Details im überbelichteten Bereich. Die
Spuren im Schnee sind deutlich sichtbar.
-
Ähnlich
wurde ein Fenster oder ein Ausschnitt im dunklen Bereich des Gesichts
des Skiläufers
gewählt. 14c ist das Ergebnis der
Histogrammmethode, die zum Erstellen eines nur für diesen Bereich des Fotos
geeigneten Korrekturgraphs verwendet wurde. Die Gesichtszüge des Skiläufers sind
deutlicher erkennbar als im in 14a gezeigten
Originalfoto.
-
Zusammenfassung
-
Die Schlüsselkonzepte sind hier als
eine Kombination der folgenden sechs Faktoren dargestellt: Korrektur
im RGB-Farbraum,
Korrekturgraph, Definition der Korrekturachsen, Beschränkung des
Arbeitspunkts und des Bereichs auf den dynamischen Bereich des Systems,
Eigenschaften des Graphs, und Anwendung des gleichen Korrekturfaktors
auf jeden der R-, G-, und B-Werte im Triplett.
-
Die Korrektur muss auf den RGB-Farbraum
angewandt werden, um Echtfarbe aufrechtzuerhalten. Es kann jeder
Korrekturgraph angewandt werden, der die obigen Eigenschaften aufweist.
Sowohl die Eingangs- als auch die Ausgangsachse stellen das Maximum
des RGB-Tripletts dar. Die Eingangsgröße ist das Maximum des zu bearbeitenden
RGB-Tripletts und die Ausgangsgröße entspricht
dem Maximum des RGB-Tri pletts, das als Ergebnis der virtuellen Echtfarblichtverstärkung errechnet
wird. Die Korrektur wird auf den dynamischen Bereich beschränkt. Das
bedeutet, dass die Intensität
des errechneten Punktes auf den dynamischen Bereich beschränkt wird.
Für den
Prozess kann jeder beliebige Graph verwendet werden, der im begrenzten
Bereich aufgezeichnet werden kann. Die Eigenschaften eines besonderen
Graphs werden die Wirkung der Korrektur beeinflussen. wiederum müssen alle
drei RGB-werte mit dem von dem Graph abgeleiteten Skalierfaktor
multipliziert werden. Ein gegebener Punkt auf dem Graph hat einen
Eingangs- und einen Ausgangswert. Die Korrektur entspricht dem Verhältnis (Division)
dieser beiden Werte und alle drei Werte des RGB-Tripletts werden mit
diesem Verhältnis
Ausgangswert zu Eingangswert multipliziert.
-
Das Ergebnis dieser Erwägungen ist
eine Folge von Prozessen, von denen jeder die Ursprungsfarbe jedes
Punkts im digitalen Eingangsbild aufrechterhält, während er das wirksame Lichtsammelvermögen verändert, wobei
die Veränderung
mühelos
auf einer Punkt-zu-Punkt-Basis stattfinden kann.
-
Alles, wodurch sich die obigen Ausführungsbeispiele
voneinander unterscheiden, ist die Veränderung des Graphs innerhalb
der festgelegten Einschränkungen.
Bei der virtuellen Echtfarblichtverstärkung ist ein neues und nützliches
Ergebnis nur vom Erkennen der Notwendigkeit, das Bild zu verbessern,
und vom Erkennen eines für
diese Notwendigkeit geeigneten Graphs abhängig.