DE69830572T2 - Verbesserung an künstlicher bilderzeugung - Google Patents

Verbesserung an künstlicher bilderzeugung Download PDF

Info

Publication number
DE69830572T2
DE69830572T2 DE69830572T DE69830572T DE69830572T2 DE 69830572 T2 DE69830572 T2 DE 69830572T2 DE 69830572 T DE69830572 T DE 69830572T DE 69830572 T DE69830572 T DE 69830572T DE 69830572 T2 DE69830572 T2 DE 69830572T2
Authority
DE
Germany
Prior art keywords
filter
aperture
pixel
image
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69830572T
Other languages
English (en)
Other versions
DE69830572D1 (de
Inventor
Alexander Graham Uckfield THOMAS
Thomas Richard Orsett RUSSELL
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Broadcasting Corp
Original Assignee
British Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Broadcasting Corp filed Critical British Broadcasting Corp
Application granted granted Critical
Publication of DE69830572D1 publication Critical patent/DE69830572D1/de
Publication of DE69830572T2 publication Critical patent/DE69830572T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/122Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Studio Circuits (AREA)
  • Processing Or Creating Images (AREA)

Description

  • Diese Erfindung bezieht sich auf das Gebiet der künstlichen Bilderzeugung.
  • Es gibt viele Verfahren die verwendet werden können, um künstliche Bilder zu erzeugen, die vom einfachen „Ausschneiden und Einfügen" von Teilen von Fotos bzw. Ablichtungen bis zur computergestützten Erzeugung von Darstellungen bzw. Ansichten von 3D-Modellen reichen. Die meisten Verfahren, die gegenwärtig benutzt werden, tendieren dazu, Bilder zu erzeugen, als würden sie durch eine einfache Lochkamera mit einer unendlichen Schärfentiefe (der Bereich von Kameraobjektiv-Abständen über den bzw. die das Bild scharf ist) betrachtet, sodass alle Objekte perfekt im Fokus zu sein scheinen. Dies kann die Bilder unrealistisch aussehen lassen.
  • Um den Realismus von solchen künstlichen Bildern zu verbessern, ist es wünschenswert, die defokussierenden Effekte, die mit einer realen Kamera vorkommen, zu simulieren. Objekte, die näher zur, oder weiter weg von der Kamera sind als der Abstand, auf den die Kamera fokussiert ist, werden in einem Maße unscharf (verschwommen), das vom Abstand des Objektes und der Apertur (Iris bzw. Blende) der Kamera abhängt. Wenn die Apertur der Kamera klein ist, wird die Tiefenschärfe groß, und wenn die Apertur groß ist, wird die Tiefenschärfe klein.
  • Angenommen, dass man ein perfektes Kameraobjektiv mit einer kreisförmigen bzw. einer kreisrunden Apertur hat und Beugungseffekte vernachlässigt, wird jeder Punkt in einem Objekt defokussiert und in der Bildebene zu einer Scheibe. Diese Scheibe, auch bekannt als „Zerstreuungskreis" bzw. „Unschärfekreis", weist eine Größe auf, die vom Abstand des Objektes vom Objektiv und von der Apertur des Objektivs abhängt: wenn das Objekt „im Fokus" ist, reduziert sich die Scheibe zu einem Punkt. Das endgültige Bild ist die Überlagerung von all diesen „Scheiben", welche von jedem Punkt der Szene resultieren (unter Berücksichtigung des Effektes, dass Vordergrund-Objekte Hintergrund-Objekte verdecken bzw. vernebeln).
  • In Situationen, bei denen alle Punkte in dem Bild denselben Grad an Defokussierung erfordern, kann dies relativ leicht durch „Falten" (engl.: convolving) des Bildes mit einem geeigneten Filter erreicht werden. Zum Beispiel können einige DVEs (digitale Video-Effekt-Vorrichtungen) dies in Echtzeit für Standard-Übertragungs-Video-Signale zur Anwendung bringen. Die Punkt-Verteilungs-Funktion (d.h. der Filter-Kern bzw. Filter-Kernel) sollte grundsätzlich kreisförmig sein (entsprechend zu dem „Zerstreuungskreis" bzw. „Unschärfekreis"), obwohl es für DVEs üblich ist, eine rechteckige Apertur einzusetzen, da dies zu einer effizienteren Hardware-Ausführung im Tausch gegen weniger Realismus führt.
  • Jedoch wird das synthetische Bild im allgemeinen Fall Objekte in einem Tiefenbereich enthalten, von denen jedes in einem anderen Umfang defokussiert werden sollte. Es ist im Grunde unmöglich solch ein Bild so zu verarbeiten, wie man es mittels einer Kamera mit endlicher Apertur sehen würde, weil einige der Informationen verloren gegangen sein werden. Zum Beispiel erscheint ein Vordergrund-Objekt an seinen Kanten nicht länger völlig undurchsichtig wenn es aus dem Fokus ist, deshalb verdeckt es den Hintergrund nicht vollständig. Da einiges von diesem Hintergrund in dem Originalbild nicht vorhanden ist (es war durch den scharf fokussierten Vordergrund verdeckt), kann er niemals neu erstellt werden.
  • Ein Ansatz zu diesem Problem, welcher in Situationen anwendbar ist, bei denen das synthetische Bild durch einen Computer berechnet wird, um einer Darstellung bzw. Ansichten eines 3D-Modells zu entsprechen, ist, eher den Effekt der Tiefenschärfe während des Rendering-Prozesses zu simulieren, als einen gesonderten Prozess zu verwenden, nachdem das Bild gerendert worden ist. Dies kann durch Berechnen etlicher Darstellungen bzw. Ansichten von der Szene von unterschiedlichen Punkten geschehen, wobei innerhalb der Apertur der Kamera modelliert wird, und die resultierenden Bilder gemittelt werden. Dies simuliert direkt den Effekt von der finiten Kamera-Apertur und ermöglicht es, ein sehr realistisches Bild zu erzeugen, wenn eine große Anzahl mit engem Zwischenraum angeordneter Darstellungspunkte bzw. Ansichtspunkten verwendet wird. Dies erfordert jedoch eine riesige Menge an zusätzlichen Berechnungen, verglichen mit Rendern des Bildes von einem einzigen Darstellungspunkt aus. Das Nettoergebnis hiervon ist im Allgemeinen, dass die Gesamtqualität des Bildes, das gerendert werden kann, für einen gegebenen Betrag von Verarbeitungskapazität, gemindert wird. Dies kann eher in einer Reduzierung des Realismus als in einer Verbesserung des endgültigen Bildes enden.
  • Ein alternatives Verfahren ist, das ursprüngliche scharfe Bild unter der Steuerung eines Tiefensignals, welches den Abstand von der Kamera des Objektes an jedem Punkt in dem Bild anzeigt, zu filtern. Dieses Signal kann dazu benutzt werden, um die Größe des Filterkerns bzw. Filter-Kernels zu steuern, mit welchem das Bild gefaltet wird. Diese Idee wurde in einer Veröffentlichung mit dem Titel „Synthetische Bilderzeugung mit einem Linsen- und Apertur Kamera-Modell" von M. Potmesil und I. Chakravarty in ACM Transaction of Graphics, Vol. 1 No. 2, April 1982, pp. 85–108, vorgeschlagen. Es wurde die Verwendung einer kreisförmigen Punkt-Ausbreitungs-Funktion vorgeschlagen, abhängig vom Abstand des Bildpunktes von der Kamera und der Fokus-Einstellung und Tiefenschärfe von der Kamera. Die Veröffentlichung schlug ebenfalls vor, dass jeder Bildpunkt bzw. Pixel im eingegebenen Bild seine Helligkeit bzw. Intensität auf Pixel im ausgegebenen Bild gemäß der Punkt-Ausbreitungs-Funktion, passend für die Tiefe von diesem Pixel, verteilen sollte. Auf diese Weise erfahren Objekte, die in einer Tiefe sind, welche der Kamera-Fokus-Einstellung entspricht, kein Verwackeln, wohingegen solche in anderen Abständen in einem Umfang passend zu diesem Abstand, verwackelt sind. Jedoch führt dieser Prozess an Grenzlinien zwischen Objekten in unterschiedlichen Tiefen nicht zu zufrieden stellenden Ergebnissen.
  • Betrachtet man zum Beispiel die Situation, die in 1 gezeigt ist. Die Abbildung zeigt einen weißen Kreis mit einer schwarzen Linie rund um seine Kante (wie zum Beispiel eine weiße Untertasse mit einem schwarzen Rand) vor einem weißen Hintergrund mit einer horizontalen schwarzen Linie darauf gezogen. Das eingegebene Bild zeigt sowohl den Vordergrund als auch den Hintergrund scharf, wie in (a) gezeigt. Die Tiefenabbildung ist in (b) gezeigt, und zwar mit einer dunkleren Schattierung, die die Fläche zeigt, die weiter weg ist. Wenn der Vordergrund-Kreis im Fokus ist und der Hintergrund aus dem Fokus ist, ist in 2(a) das ideale ausgegebene Bild mit der hell schattierten Fläche gezeigt, welches das Verwackeln der horizontalen Linie zeigt. Das ideale Bild mit dem Hintergrund im Fokus, ist in 2(b) gezeigt, mit der dunkel schattierten Fläche, welche das Verwackeln des Rings zeigt. Wenn das Bild mit einem früher beschriebenen Verfahren des Stands der Technik verarbeitet wird, wird das Bild in 3(a) mit dem Vordergrund im Fokus verarbeitet, und 3(b) mit dem Hintergrund im Fokus. Die Linie im Hintergrund in 3(a) hat sich falsch in die Fläche des Kreises ausgebreitet, da jeder Punkt in dem eingegebenen Bild (einschließlich solcher, die sofort an die Kante des Kreises angrenzen) sich gemäß seinem Abstand zur Kamera ausbreitet. Subjektiv gesehen ist dies sehr ärgerlich. Das Verhalten in 3(b) ist weniger störend, jedoch mit dem einzigen Mangel, welcher ist, dass die scharfe Linie im Hintergrund nur bis einschließlich der halben Breite des Verwackelns bzw. Verschwimmens sichtbar ist, als vielmehr der gesamten Breite, wie im Idealfall in 2(b) gezeigt.
  • Dieses Stand-der-Technik-Verfahren hat ein weiteres Manko: es ist in Echtzeit Hardware schwer zu implementieren. Dies ist so, weil es „eingabe-getrieben" ist; Das heißt, der Beitrag zum ausgegebenen Bild eines jeden eingegebenen Beispiels bzw. Eingabesamples wird eines nach dem anderen berechnet. Es ist erforderlich einen wahlweise zugreifbaren Bild-Speicher zu verwenden, um das verarbeitete Bild aufzubauen, und da jedes eingegebene Beispiel bzw. Eingabesample zu vielen zehn (oder sogar hunderten) von ausgegebenen Beispielen bzw. Ausgabesamples beitragen kann, würde der Speicher eine extrem hohe Eingabe/Ausgabe Bandbreite aufweisen müssen. Eine viel günstigere Architektur ist eine, die „ausgabe-getrieben" ist, wobei jedes ausgegebene Beispiel der Reihe nach von den eingegebenen Beispielen in dem umgebenden Bereich berechnet wird. Diese Architektur kann implementiert werden, wobei ein konventioneller zweidimensionaler, begrenzt auf einen Impuls ansprechender Filter bzw. FIR-Filter: verwendet wird, dessen Reaktion bzw. Antwort von Beispiel bzw. Sample zu Beispiel bzw. Sample gemäß eines Steuerungssignals wechselt, welches von der Tiefenabbildung und der Kamera-Tiefenschärfe abgeleitet wird.
  • Die einfachste Ausführung eines „ausgabe-getriebenen" defokussierenden Algorithmus würde jedes ausgegebene Beispiel bzw. Sample durch Anwendung eines Filters auf das eingegebene Bild, erzeugen, auf die Mitte des auszugebenden Beispiels bzw. Ausgabesamples eingestellt, dessen Form die der Punkt-Ausbreitungs-Funktion für ein Objekt in dieser Tiefe war. Das Verhalten von diesem Algorithmus wird in 4(a) und 4(b) gezeigt. Man kann sehen, dass er sich im Vergleich zu dem „eingabe-getriebenen" Algorithmus in beiden Fällen schwach verhält. In dem Fall, bei welchem der Hintergrund defokussiert ist, 4(a), ist die äußere Kante des Vordergrund-Objektes in den Hintergrund hinein verschwommen bzw. verwackelt, weil die Bildpunkte im Hintergrund alle von einem Groß-Apertur-Filter abgeleitet sind, welcher einige der Vordergrund-Kreise für Punkte nahe seiner Kanten umfasst. In dem Fall, bei welchem der Vordergrund defokussiert ist, 4(b), erscheint die äußere Kante eines Kreises scharf, wenn sie verschwommen bzw. verwackelt sein sollte, weil die Beispiele rund um die Kante von einem Filter erhalten werden, der kein Verwackeln bzw. Verschwimmen ausführt, welcher durch die Tiefe des Hintergrundes gesteuert ist. Beide Effekte sind subjektiv inakzeptabel.
  • Dieses sehr schwache Verhalten deutet an, dass ein ausgabe-getriebener Prozess ungeeignet ist, um Defokussierung auszuführen.
  • US 5 570 433 und WO 96/14621 beschreiben unterschiedliche Verfahren, um defokussierende Effekte in Bildern bereitzustellen.
  • Es ist ein Ziel der vorliegenden Erfindung ein verbessertes Verfahren bereitzustellen, um Tiefenschärfe-Effekte in einem synthetischen Bild zu simulieren.
  • Es ist ein weiteres Ziel (of aspects) der vorliegenden Erfindung, ein Verfahren zur Simulation von Tiefenschärfe-Effekten in einem synthetischen Bild bereitzustellen, welches eine effiziente Hardware-Implementierung erlaubt.
  • Dementsprechend besteht die vorliegende Erfindung in einem Aspekt in einem Verfahren, um Tiefenschärfe-Effekte in einem synthetischen Bild zu simulieren, in welchem Bildpunkte bzw. Pixel in einem räumlichen Ausmaß verschwommen bzw. verwackelt sind, welches durch eine Tiefenabbildung für das Bild durch Anwendung eines defokussierenden Filters, welcher Informationen aus einer Vielzahl von eingegebenen Pixel aufnimmt, um jeden auszugebenden Pixel zu erzeugen, bestimmt wird, wobei das räumliche Ausmaß des Verschwimmens bzw. Verwackelns eines Hintergrund-Pixels, der an einen Vordergrund-Pixel angrenzt, in Übereinstimmung mit der räumlichen Ausdehnung des Verschwimmens oder Verwackelns des Vordergrund-Pixels modifiziert wird, und dem Abstand zwischen dem Hintergrund-Pixel und dem Vordergrund-Pixel in der Bildebene.
  • Wir haben erkannt, dass es wichtig ist, die relative Tiefe von Objekten in einem Bild zu berücksichtigen, bevor es einem Objekt ermöglicht wird, über einem anderen zu verschwimmen bzw. zu verwackeln. Speziell an einer Grenze zwischen zwei Objekten von unterschiedlicher Tiefe ist es wichtig sicherzustellen, dass das Objekt am nächsten zur Kamera den vorrangigen Effekt auf die Art und Weise hat, wie sich das Verschwimmen bzw. Verwackeln in seiner Umgebung durchsetzt.
  • Wir haben auch erkannt, dass es ein Verfahren gibt, um das Verhalten des Filters in einem „ausgabe-getriebenen" System zu modifizieren, um es zu ermöglichen, dieses Prinzip ein- bzw. umzusetzen. Dieses Verfahren ändert die Größe der Filter-Apertur nahe Grenzen in der Tiefenabbildung, um sicherzustellen, dass das Objekt am nächsten zur Kamera den vorrangigen Effekt auf die Art und Weise hat, wie sich das Verschwimmen bzw. Verwackeln in seiner Umgebung durchsetzt. Falls ein Vordergrund-Objekt im Fokus ist, wird die Filter-Apertur in Bereichen des Hintergrunds nahe dem Vordergrund-Objekt verkleinert, sodass nichts vom Vordergrund innerhalb der Apertur ist. Dies stellt sicher, dass die Kante des Vordergrund-Objekts scharf bleibt, was subjektiv wichtig ist. Es hat ebenso den Nebeneffekt des Erzeugens eines „Lichthofs" von scharfem Hintergrund rund um ein Vordergrund-Objekt, aber dies ist subjektiv dem Vordergrund-Entmischen (engl: bleeding) in den Hintergrund vorzuziehen. Dieser Effekt ist in 5(a) gezeigt. Falls der Hintergrund im Fokus ist, wird die Filter-Apertur in Bereichen des Hintergrunds nahe dem Vordergrund-Objekt vergrößert, sodass etwas Vordergrund in die Apertur aufgenommen wird. Dies hat den Effekt des Weichmachens der Kante des verschwommenen bzw. verwackelten Vordergrund-Objekts, was subjektiv wichtig ist. Dies wird in 5(b) gezeigt.
  • Die Erfindung wird nun als Beispiel mit Bezug auf die beigefügten Zeichnungen beschrieben, für die gilt:
  • 1 bis 5 zeigen ein stilisiertes eingegebenes Bild mit seiner Tiefenabbildung und veranschaulichen den Effekt bestimmter Verfahren gemäß dem bekannten Stand der Technik und der vorliegenden Erfindung;
  • 6 ist ein Diagramm, welches eine eindimensionale Tiefenabbildung zum Gebrauch der Veranschaulichung eines Verfahrens gemäß der vorliegenden Erfindung zeigt;
  • 7 veranschaulicht ein Verfahren gemäß der vorliegenden Erfindung;
  • 8 ist ein Blockdiagramm, welches Apparate gemäß der vorliegenden Erfindung zeigt;
  • 9 und 10 sind Diagramme, welche ein modifiziertes Verfahren gemäß der vorliegenden Erfindung zeigen.
  • Die bevorzugten Ausführungsformen der Erfindung, wie in 8 gezeigt, nehmen von einem Grafik-Prozessor 10 ein Bild, welches statisch oder bewegend sein kann und aus irgendeiner Quelle sein kann, und eine zugehörige „Tiefenabbildung", welche eine Menge von Werten stellvertretend für den Abstand von der virtuellen Kameralinse von jedem Punkt in dem Bild ist (Oberflächen werden als undurchsichtig angenommen). Die Tiefenabbildung nimmt die Form von einem monochromatischen Bild, bei dem sich der Helligkeitswert auf den Kamera-Objekt Abstand bezieht. Die Informationen in der Tiefenabbildung werden zusammen mit der Fokus- und Apertur-Einstellung der „virtuellen" Kamera verwendet, um ein selektiv-defokussiertes Bild zu erzeugen, welches sich demjenigen annähert, welches man durch eine reale Kamera erhalten haben würde.
  • Die Tiefenabbildung wird zu einem Filter-Apertur-Initialisierungsprogramm 12 gebracht, welches dem Filter-Apertur-Prozessor 14 eine Filter-Apertur-Abbildung bereitstellt. Dieser nimmt, wie beschrieben werden wird, sowohl die anfängliche Filter-Apertur-Abbildung, als auch die Tiefenabbildung, um eine verarbeitete Apertur-Abbildung bereitzustellen, welche im Filter 16 verwendet wird, um an dem Bild zu arbeiten, um ein Ergebnis bzw. einen Output zu erzeugen.
  • In einem Bereich eines Bildes, welcher in einem konstanten Abstand von der Kamera ist, sodass es keine Fälle eines Vordergrund-Objektes gibt, welches teilweise ein Hintergrund-Objekt verdeckt, ist all dies erforderlich, um den Effekt eines Bildes zu simulieren, welches nicht im Fokus ist, um es durch einen Filter mit einer gleichmäßigen kreisförmigen Apertur einer Größe passieren zu lassen, die gleich dem Unschärfekreis für diesen Abstand ist. Diese Größe kann aus dem Tiefenabbildungs-Wert für diesen Punkt in den Bild- und den Fokus- und Apertur-Einstellungen der virtuellen Kamera bestimmt werden und wird im Initialisie rungsprogramm 12 verwendet. Gibt es keine Änderungen der Tiefe, wird die kreisförmige Apertur im Filter 16 mit dem Prozessor 14 verwendet, welcher keinen Effekt hat.
  • Jedoch ist es in einem Bereich des Bildes nahe einer Änderung der Tiefe erforderlich, das Verhalten des Filters wie vorher beschrieben zu modifizieren. Dies wird im Prozessor 14 durch Ausführen einer gründlichen Suche nach den berechneten Filter-Apertur-Werten und den Tiefen für alle Pixel, die an das gegenwärtige Pixel sowohl horizontal als auch vertikal angrenzen, mit der maximalen Apertur des defokussierenden Filters erreicht.
  • Wenn ein Pixel mit einer Filter-Apertur gefunden wird, deren Radius kleiner ist als der von der Filter-Apertur des gegenwärtigen Pixels, um eine Differenz, die größer ist als der effektive Abstand zwischen den Pixeln, und deren Tiefenwert kleiner ist als der des gegenwärtigen Pixels, wird die Filter-Apertur auf einen Radius gleich dem von anderen Pixeln plus dem Abstand zwischen diesen modifiziert.
  • Ähnlich wird, wenn ein Pixel mit einer Filter-Apertur gefunden wird, deren Radius größer ist als der von der Filter-Apertur des gegenwärtigen Pixels, um eine Differenz, mehr als der effektive Abstand zwischen den Pixeln, und deren Tiefenwert kleiner ist als der des gegenwärtigen Pixels, wird die Filter-Apertur auf einen Radius gleich dem von anderen Pixeln abzüglich des Abstands zwischen diesen modifiziert.
  • Dieser Prozess kann durch die folgende „Pseudocode"-Beschreibung des funktionalen Blocks in 8 zusammengefasst werden, welcher bei einem Tiefensignal-Tiefe(x, y) und einem Wert zum Spezifizieren des Radius des defokussierenden Filters an jedem Punkt, Radius(x, y), arbeitet:
  • Filter-Apertur-Initialisierungsprogramm
  • Für jeden Pixel x, y in dem Bild:
    Initialisiere Radius(x, y) auf den Radius des defokussierenden Filters, erforderlich für ein Objekt in der Tiefe(x, y), gemäß des Kamera-Fokus und den Tiefenschärfe-Werten.
  • Filter-Apertur-Prozessor
  • Für jede Pixel-Position (x, y) in dem Bild:
    Für jeden Punkt (x1, y1) um (x, y) herum innerhalb der maximal möglichen Filter-Apertur:
  • Figure 00070001
  • Figure 00080001
  • Filter
  • Berechne ausgegebenes Beispiel bei (x, y) durch „Falten" des eingegebenen Beispiels mit einem Filter mit dem Radius Radius(x, y).
  • Dieses Verhalten ist in den 6 und 7 veranschaulicht. Das Bild enthält Objekte in drei unterschiedlichen Tiefen, wie in der Zeichnung des Tiefenwertes in 6 gezeigt. Die Kamera ist nahe bzw. dicht auf die mittlere Tiefe fokussiert. Der anfängliche Radius des defokussierenden Filters, abgeleitet im Initialisierungsprogramm 12, von dem Tiefenwert bei der entsprechenden Position, wobei Information über die Tiefenschärfe der Kamera und dem Abstand, auf den die Kamera fokussiert ist, in der dünnen durchgezogenen Linie in 7 gezeigt ist. Dieser Wert wird dann in Prozessor 14 gemäß des oben beschriebenen Verfahrens modifiziert, welches die dicke durchgezogene Linie von 7 zeigt. Es gibt drei Radien a, b und c für den defokussierenden Filter, entsprechend den drei Objekt-Tiefen.
  • Für die Pixel in dem mit P bezeichneten Bereich gibt es Pixel in dem links angrenzenden Bereich, deren Tiefe-Wert kleiner ist und deren Radius des defokussierenden Filters größer als der Abstand von diesen Pixeln ist. Deshalb wird der Radius des defokussierenden Filters für die Pixel in dem Bereich P vergrößert. Dies wirkt sich auf Pixel bis zu einem Abstand von der Kante von (c–a) aus, welches die Differenz in den Radien des defokussierenden Filters in den angrenzenden Bereichen ist. Dies stellt sicher, dass sich manches von dem verschwommenen bzw. verwackelten Vordergrund über die linke Seite des Objekts im Fokus erstreckt.
  • Für die Pixel in dem Bereich Q gibt es Pixel in dem links angrenzenden Bereich, deren Tiefe-Wert kleiner ist und deren Radius des defokussierenden Filters kleiner als der Abstand von diesen Pixeln ist. Deshalb wird der Radius des defokussierenden Filters für die Pixel in dem Bereich Q verkleinert. Dies wirkt sich auf Pixel bis zu einem Abstand von der Kante von (b–a) aus, welches die Differenz in den Radien des defokussierenden Filters in den angrenzenden Bereichen ist. Dies stellt sicher, dass die rechte Kante des scharfen Bereichs niemals in die Filter-Apertur fällt, welche dazu verwendet wird, um den Hintergrund zu defokussieren, wobei diese Kante scharf bleibt.
  • Die obige Beschreibung geht davon aus, dass der defokussierende Filter immer eine kreisrunde Apertur aufweist. Die Apertur bleibt in ihrer Größe kreisrund, wenn sie an den Grenzen in der Tiefenabbildung vergrößert oder verkleinert wird, wie oben erklärt. Um jedoch ein korrektes Verhalten an Tiefen-Grenzen sicher zu stellen, ist es lediglich erforderlich, den Teil der Filter-Apertur zu vergrößern oder zu verkleinern, welcher auf einen Teil des Bildes mit niedrigerem Tiefenwert fällt. Der obige Ansatz modifiziert die Filter-Apertur mehr als notwendig, um dies zu erreichen, da die Apertur eher überall in ihrer Größe vergrößert oder verkleinert wird, um dies zu erreichen, als nur in dem Bereich des Bildes, welches den niedrigeren Tiefenwert aufweist. Dies hat den Vorteil, leichter implementierbar zu sein, da der Filter, der bei jedem Pixel zu verwenden ist, durch nur eine Zahl vollständig spezifiziert ist (dem Radius). Der Nachteil ist, dass das Ausmaß des Filterns um mehr verändert wird als notwendig ist, um ein korrektes Verhalten an einer Kante zum Ergebnis zu haben, woraus eine größere Veränderung als erforderlich bei den Bereichen, die an die Kanten angrenzen, resultiert. Verwendet man komplexere Verarbeitungen, würde es möglich sein, nur Teile der Filter-Apertur zu ändern, wobei dieses Problem reduziert würde.
  • Betrachtet man zum Beispiel die Situation, die in 9 gezeigt ist. Die Filter-Apertur 20, die dazu verwendet wird, um den Hintergrund 22 zu verschwimmen bzw. zu verwackeln, ist mit verkleinertem Radius gezeigt, da die Kante des scharfen Vordergrund-Objekts 24 erreicht wird, gemäß der oben beschriebenen Ausführungsform. Diese weist das korrekte Verhalten auf, soweit es das Vordergrund-Objekt betrifft, aber führt zu einer größeren Abnahme in der Defokussierung als erforderlich, die auf den Hintergrund angewendet wird, und zwar rund um die Kante. Umgekehrt ist in 10 die Apertur des defokussierenden Filters nur in dem Bereich eingeschränkt, wo sie das Vordergrund-Objekt einschließen würde. Dies hält das korrekte Verhalten an der Kante des Vordergrund-Objektes aufrecht, mit einer minimalen Abnahme im Umfang des Defokussierens, das auf den Hintergrund-Bereich angewendet wird, und zwar um das Vordergrund-Objektes herum. Die resultierende Filter-Apertur ist in 26 gezeigt.
  • Auf diese Weise hat diese Ausführungsform eine Verbesserung im Verhalten an den Kanten im Tausch gegen ein komplexeres System der Filter-Apertur-Steuerung zur Folge. Um diesen Ansatz zu implementieren, wird der oben beschriebene Prozess wie folgt modifiziert. Für jeden Pixel wird der Koeffizient in der Filter-Apertur anfänglich basierend auf der Tiefe des Pixels berechnet, ohne die angrenzenden Pixel zu betrachten. In dem Pseudocode unten werden diese Werte in dem Feld Apertur (x1, y1) gespeichert, wobei x1, y1 die Positionen des Punktes in der Filter-Apertur relativ zur Position des berechneten ausgegebenen Pixels ist. Das Feld wird dann durch Prüfen des anfänglichen Wertes des Radius und des Tiefenwertes der umgebenden Pixel modifiziert. Nach dem Testen aller Pixel innerhalb des maximal möglichen Radius des gegenwärtigen Pixels, wird das Feld normiert (durch die Summe alle Koeffizienten geteilt), um einen Einheits-Zuwachs bzw. -Steigerung sicher zu stellen. Der Pixel in dem ausgegebenen Bild wird dann durch „Falten" des eingegebenen Bildes mit den Filter-Koeffizienten erzeugt.
  • Filter-Apertur-Initialisierungsprogramm
  • Für jeden Pixel x, y in dem Bild:
    Initialisiere Radius(x, y) auf den Radius des defokussierenden Filters, der für ein Objekt in der Tiefe(x, y) erforderlich ist, gemäß des Kamera-Fokus und dem Wert der Tiefenschärfe.
  • Filter-Apertur Prozessor
  • Für jede Pixel-Position (x, y) in dem Bild:
    Initialisiere Apertur(x1, y1) zur Einheit in dem Bereich rund um einen Abstand vom Radius(x, y), vom Mittelpunkt, und Null darüber hinaus;
    Für jeden Punkt (x1, y1) rund um (x, y) innerhalb der maximal möglichen Filter-Apertur:
  • Figure 00100001
  • Filter
  • Berechne das auszugebende Beispiel bei (x, y) durch „Falten" des eingegebenen Bildes mit den Filterkoeffizienten in Apertur.
  • Offensichtlich gibt es Ausführungsformen die zwischen den beiden hier beschriebenen Extremen liegen. Zum Beispiel könnte die taugliche Apertur in vier Quadranten aufgeteilt werden, wobei jeder Quadrant, falls erforderlich, in der Größe zu reduzieren ist; dann könnte der Filter durch vier Werte vollständig spezifiziert werden, eher als durch einen, in dem einfachen Fall, oder durch einen binären Wert für jedes potenzielle Pixel in der Apertur des komplexen Falles.
  • Es wird verstanden sein, dass diese Erfindung nur als Beispiel beschrieben wurde und dass eine große Vielfalt von Modifikationen möglich ist, ohne vom Geltungsbereich dieser Erfindung abzuweichen. Der Apparat, der in 8 gezeigt ist – als ein spezielles Beispiel – kann eine Anzahl unterschiedlicher Ausgestaltungen annehmen. Wenn es zweckmäßig ist, können der Betrieb des Filter-Apertur-Initialisierungsprogramms und der Filter-Apertur Prozessor mit einer Software durchgeführt werden, die auf dem Grafik-Prozessor 10 läuft.

Claims (11)

  1. Verfahren, um Tiefenschärfe-Effekte in einem künstlichen Bild zu simulieren, in dem Pixel in einem räumlichen Ausmaß verschwommen sind, das durch eine Tiefenabbildung für das Bild durch Einsatz eines defokussierenden Filters bestimmt wird, welcher Informationen von einer Vielzahl von Eingangs-Pixeln aufnimmt, um jeden Ausgangs-Pixel zu erzeugen, wobei das räumliche Ausmaß des Verschwimmens bzw. Verwackelns eines Hintergrund-Pixels, das an ein Vordergrund-Pixel angrenzt, gemäß dem räumlichen Ausmaß des Verschwimmens bzw. Verwackelns des Vordergrund-Pixels und der Entfernung in der Bildebene zwischen dem Hintergrund-Pixel und dem Vordergrund-Pixel abgeändert wird.
  2. Verfahren, nach Anspruch 1, bei welchem ein defokussierender Filter verwendet wird, welcher eine kreisförmige Apertur aufweist.
  3. Verfahren, nach Anspruch 1 oder Anspruch 2, bei welchem das räumliche Ausmaß des Verschwimmens bzw. Verwackelns durch Steuerung der Größe der Apertur des defokussierenden Filters abgeändert wird.
  4. Verfahren, nach irgendeinem der Ansprüche 1 bis 3, bei welchem das räumliche Ausmaß des Verschwimmens bzw. Verwackelns durch Steuerung der Form der Apertur des defokussierenden Filters abgeändert wird.
  5. Verfahren, nach irgendeinem der vorangegangenen Ansprüche, bei welchem das räumliche Ausmaß in welchem ein Pixel verschwimmt, wenigstens teilweise durch den Radius einer Apertur des Filters festgelegt wird, der zu dem defokussierenden Filter für dieses Pixel gehört, welches aufweist: ein Radius der Filter-Apertur wird für jeden der Hintergrund- und Vordergrund-Pixel berechnet; und das räumliche Ausmaßes des Verschwimmens bzw. Verwackelns des Hintergrund-Pixels wird gemäß der berechneten Radien modifiziert.
  6. Verfahren, nach Anspruch 5, welches aufweist: ein Vergleichen des Unterschiedes zwischen den berechneten Radien der Filter-Apertur mit dem Abstand in der Bildebene zwischen den Hintergrund- und Vordergrund-Pixeln; und ein Abändern des räumlichen Ausmaßes des Verschwimmens bzw. Verwackelns der Hintergrund-Pixel in Abhängigkeit des Ergebnisses des Vergleichs.
  7. Gerät, um Tiefenschärfe-Effekte in einem künstlichen Bild durch Verschwimmen bzw. Verwackeln von Pixeln bzw. Bildelementen in einem räumlichen Ausmaß zu simulieren, das durch eine Tiefenabbildung für das Bild bestimmt wird, das einen räumlichen Filter zur Ausübung einer Wirkung auf ein Bildsignal aufweist, um Pixel bzw. Bildelemente gemäß einer Filter-Aperturabbildung verschwimmen zu lassen, die eine Filter-Apertur zu bzw. bei jedem Pixel bereitstellt, und Filter-Aperturabbildungs-Verarbeitung aufweist, die dazu dienen, um von der Tiefenabbildung eine Filter-Aperturabbildung abzuleiten, bei der die Filter-Apertur bei einem Hintergrund-Pixel, welches an ein Vordergrund-Pixel angrenzt, gemäß der Filter-Apertur bei jenem Vordergrund-Pixel und der Entfernung in der Bildebene zwischen dem Hintergrund-Pixel und dem Vordergrund-Pixel, geändert wird.
  8. Gerät entsprechend Anspruch 7, bei dem jede Filter-Apertur kreisförmig ist.
  9. Gerät entsprechend Anspruch 7 oder Anspruch 8, bei dem die Größe der Filter-Aperturen verändert wird.
  10. Gerät entsprechend Anspruch 7 oder Anspruch 8, bei dem die Form der Filter-Aperturen verändert wird.
  11. Gerät, entsprechend irgendeiner der Ansprüche 7 bis 10, bei dem die Filter-Aperturabbildung einen Filter-Aperturradius für jeden Pixel aufweist und bei welchem das Filter-Aperturabbildungs-Verarbeitungsmittel angepasst wird, um den Unterschied zwischen den Filter-Aperturradien, die den Vordergrund- und Hintergrund-Pixeln zugeordnet sind, mit dem Abstand in der Bildebene zwischen den Hintergrund- und Vordergrund-Pixeln zu vergleichen und um die Filter-Apertur bei dem Hintergrund-Pixel in Abhängigkeit des Ergebnisses des Vergleichs anzupassen.
DE69830572T 1997-03-27 1998-03-27 Verbesserung an künstlicher bilderzeugung Expired - Lifetime DE69830572T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB9706375 1997-03-27
GB9706375A GB2325131B (en) 1997-03-27 1997-03-27 Improvements in artificial image generation
PCT/GB1998/000938 WO1998044456A2 (en) 1997-03-27 1998-03-27 Improvements in artificial image generation

Publications (2)

Publication Number Publication Date
DE69830572D1 DE69830572D1 (de) 2005-07-21
DE69830572T2 true DE69830572T2 (de) 2006-05-04

Family

ID=10809957

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69830572T Expired - Lifetime DE69830572T2 (de) 1997-03-27 1998-03-27 Verbesserung an künstlicher bilderzeugung

Country Status (6)

Country Link
EP (1) EP0970441B1 (de)
AU (1) AU6845298A (de)
DE (1) DE69830572T2 (de)
ES (1) ES2241131T3 (de)
GB (1) GB2325131B (de)
WO (1) WO1998044456A2 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6148113A (en) * 1998-02-03 2000-11-14 Micrografx, Inc. System for stimulating the depth of field of an image in two dimensional space and method of operation
US6646687B1 (en) * 1999-04-16 2003-11-11 Ultimatte Corporation Automatic background scene defocusing for image compositing
AU2001264640A1 (en) * 2000-05-16 2001-11-26 Sun Microsystems, Inc. Graphics system using a blur filter
JP3748554B2 (ja) * 2003-02-05 2006-02-22 コナミ株式会社 画像生成装置、画像生成方法、及びプログラム
FR2857133A1 (fr) * 2003-07-03 2005-01-07 Thomson Licensing Sa Procede de generation de flou
US8280181B2 (en) 2007-12-13 2012-10-02 Seiko Epson Corporation Efficient filtering of image data
GB2467944A (en) * 2009-02-23 2010-08-25 Andrew Ernest Chapman Stereoscopic effect without glasses
EP2410377A1 (de) * 2010-07-20 2012-01-25 Research In Motion Limited Verfahren zur Verringerung der Tiefe eines Feldes für eine Kamera mit fester Apertur
JP6319972B2 (ja) 2013-08-26 2018-05-09 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、およびプログラム
CN111274927A (zh) * 2020-01-17 2020-06-12 北京三快在线科技有限公司 一种训练数据的生成方法、装置、电子设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4897806A (en) * 1985-06-19 1990-01-30 Pixar Pseudo-random point sampling techniques in computer graphics
US5055918A (en) * 1990-04-30 1991-10-08 Berman Robert A Pixel image enhancer
JP2792376B2 (ja) * 1993-02-02 1998-09-03 松下電器産業株式会社 画像ぼかし処理装置
GB9422089D0 (en) * 1994-11-02 1994-12-21 Philips Electronics Uk Ltd Blurring for computer graphics

Also Published As

Publication number Publication date
WO1998044456A3 (en) 1999-01-21
EP0970441B1 (de) 2005-06-15
ES2241131T3 (es) 2005-10-16
GB2325131A (en) 1998-11-11
WO1998044456A2 (en) 1998-10-08
EP0970441A2 (de) 2000-01-12
GB9706375D0 (en) 1997-05-14
AU6845298A (en) 1998-10-22
GB2325131B (en) 2002-01-16
DE69830572D1 (de) 2005-07-21

Similar Documents

Publication Publication Date Title
DE69430962T2 (de) Bilddefokusierungsverfahren und -vorrichtung
DE3686233T2 (de) Videosignalverarbeitung.
DE68927471T2 (de) Verfahren zur Schattierung eines graphischen Bildes
DE69828909T2 (de) Neue perzeptive lokale gradientenbasierte gratbestimmung
DE3689271T2 (de) Verfahren zur Bildanzeige.
DE60115034T2 (de) Verfeinerung von dreidimensionalen polygonalen gitterdaten
DE69919145T2 (de) Stochastiches detailniveau in einer rechneranimation
EP1784978B1 (de) Verfahren und vorrichtung zur darstellung eines digitalen bildes auf einer geometrisch und photometrisch nicht-trivialen oberfläche
DE602004001483T2 (de) Verfahren und System zur automatischen Reduzierung von Aliasing-Artefakten
DE60020887T2 (de) Optischer fluss und bildaufbau
WO2003036566A2 (de) Verfahren und vorrichtung zur erzeugung lichtmikroskopischer, dreidimensionaler bilder
DE69328333T2 (de) Holografisches Darstellungsverfahren und -gerät
DE4022384A1 (de) Anzeige zur vorausbestimmung eines graphikpfades
DE602004012125T2 (de) Robuste rekursive hüllenoperatoren für die schnelle verarbeitung von bildern des retinex-typs
DE69830572T2 (de) Verbesserung an künstlicher bilderzeugung
DE19958329A1 (de) Verfahren für das zeitbasierte Schatten-Rendering
DE69216244T2 (de) Vorrichtung zum erzeugen von aliasfreien anzeigebildern mit halo
DE3854619T2 (de) Quadratische interpolation zur schattierten bilderzeugung.
DE102011087852A1 (de) System, Verfahren und Computerprogrammprodukt zum Reduzieren von Rauschen in einem Bild unter Verwendung von tiefenbasiertem Entlangstreichen über Bildabtastwerte
DE102007020060B4 (de) Verteilte Berechnung von Bildern volumetrischer Objekte mittels Ray Casting
DE112007002924T5 (de) Vorrichtung zum Bereitstellen und Transformieren eines Shaders eines 3D-Graphiksystems
DE69322216T2 (de) Verfahren und Gerät zur graphischen Mustererzeugung
DE60030401T2 (de) Anzeigetechniken für dreidimensionale virtuelle Realität
DE102006044189A1 (de) Verfahren zum Bereitstellen von vielfältig verarbeiteten Bilddaten, Verfahren zum Verarbeiten vielfältiger Bilddaten und Röntgenbildsystem
DE10250602A1 (de) System zum Erzeugen einer synthetischen Szene

Legal Events

Date Code Title Description
8364 No opposition during term of opposition