DE69812518T2

DE69812518T2 - Bildverarbeitungsvorrichtung

Info

Publication number: DE69812518T2
Application number: DE69812518T
Authority: DE
Inventors: Simon Michael Rowe
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1997-09-16
Filing date: 1998-09-15
Publication date: 2003-12-11
Anticipated expiration: 2018-09-16
Also published as: EP0903695A1; GB9719694D0; JPH11149575A; US6421459B1; EP0903695B1; JP4217305B2; DE69812518D1

Description

Die Erfindung bezieht sich auf das Verarbeiten von bewegte Bilder darstellenden Daten, um eine Darstellung des(r) Objekts(e) in den Bildern in einem dreidimensionalen Computermodell zu erzeugen.
Gegenwärtig hängen Daten von dem Inhalt von Bildern, die von Video oder anderen bewegten Bildern hergestellt werden, von den Ansichts- bzw. Betrachtungscharakteristiken der Kamera ab, die die Daten aufgenommen hat. Genauer wird die Position, aus der Objekte von einem Betrachter angesehen werden, von der Ansichts- bzw. Betrachtungsposition und der Ansichts- bzw. Betrachtungsrichtung der Kamera in Bezug auf die Szene bestimmt.
Als Lösung für diese Einschränkung wurden interaktive Systeme vorgeschlagen, bei denen Videodaten verwendet werden, um ein dynamisches dreidimensionales Computermodell einer Szene zu erzeugen, aus der simulierte Ansichten bzw. Betrachtungen aus einer beliebigen gewünschten Ansichtsrichtung erzeugt werden können und einem Benutzer angezeigt werden können.
WO-A-96/31047 offenbart ein Immersions-Video-, oder -Fernsehsystem, bei dem Bilder einer Szene in der wirklichen Welt als verbunden mit einer beliebigen einer besonderen Perspektive in der Szene, oder einem Objekt oder einem Ereignis in der Szene synthetisiert werden. Die Synthese von virtuellen Bildern basiert auf computerisierter Videoverarbeitung, die "Hypermosaicing" bzw. "Hyperzusammensetzen" von mehreren Live-Videoperspektiven in der Szene bezeichnet wird. Beim Hypermosaicing beinhaltet eine Wissensdatenbank Informationen über die Szene, und/oder interne und/oder externe Kamerakalibrierungsmodelle. Mehrere Videokameras, jede an einem verschiedenen räumlichen Ort, stellen mehrere zweidimensionale Videobilder der Szene her. Ein Betrachter/Benutzer spezifiziert ein Betrachtungskriterium. Ein Computer umfasst (i) einen Videodatenanalysierer zur Erfassung und zum Aufspüren von Szenenobjekten und ihrer Orte, (ii) einen Umgebungsmodellersteller, der mehrere Szenenbilder kombiniert, um ein dreidimensionales dynamisches Modell zu erstellen, das Szenenobjekte und ihre augenblicklichen räumlichen Orte aufzeichnet, (iii) einen Betrachtungkriteriumsinterpretierer, und (iv) einen Visualisierer zur Erzeugung von einem oder mehreren besonderen zweidimensionalen Videobild(ern) der Szene aus dem dreidimensionalen Modell gemäß dem Betrachtungskriterium.
EP-A-0 773 516 offenbart eine virtuelle Kamerakonsole mit einer Einrichtung zum Speichern einer Datendatei, die die Position von bei einem Ereignis teilnehmenden wirklichen Objekten oder Akteuren darstellt; einer Einrichtung zum Speichern einer Datei von graphischen Informationen, die Objekte oder Akteure in einem begrenzten Raum darstellen; einer Einrichtung zum Empfang von Echtzeit-Informationen, die die Versetzungen der Objekte oder Akteure mit Identifikation der betroffenen Objekte oder Akteure darstellen; einer Einrichtung zur Verarbeitung der gespeicherten und/oder übertragenen Informationen; einer Berechnungseinrichtung, die auf der Grundlage dieser Informationen und von die Position der virtuellen Kamera definierenden Informationen, die von Steuersignalen geliefert werden, eine Bestimmung der Ansicht der Versetzungen bzw. Verschiebung der Akteure oder Objekte in dem begrenzten Raum als eine Funktion der Echtzeit oder der empfangenen Informationen zulässt und einer Einrichtung zur Darstellung dieser Ansicht der Versetzungen der Akteure oder Objekte.
"A Virtual Studio for Live Broadcasting: The Mona Lisa Project" von Blonde et al in IEEE Multimedia, Band 3, Nr. 2, Juni 1996, Seiten 18 bis 28 offenbart ein virtuelles Studiokonzept, das reale Hintergrunddekorationen und -aufbauten bzw. -Sets durch computergenerierte synthetische Szenen ersetzt. Bildsequenzen verbinden in dem Studio aufgenommene reale Vordergrundhandlung mit computergenerierten Hintergründen.
Erfindungsgemäß wird ein Erfahren zum Verarbeiten von Bilddaten nach Anspruch 1 zur Verfügung gestellt.
Die Erfindung stellt außerdem eine Bildverarbeitungsvorrichtung nach Anspruch 17 zur Verfügung.
Die Erfindung stellt außerdem ein Speichermedium, das Anweisungen speichert, nach Anspruch 29 zur Verfügung.
Die Erfindung stellt außerdem Signalträgeranweisungen nach Anspruch 30 zur Verfügung.
Optionale Merkmale sind in den Ansprüchen 2 bis 16 und 18 bis 28 dargelegt.
Nun werden Ausführungsbeispiele der Erfindung unter Bezugnahme auf die beiliegende Zeichnung nur anhand von Beispielen beschrieben. Es zeigen:
Fig. 1 schematisch die Komponenten eines Ausführungsbeispiels;
Fig. 2 schematisch die Sammlung von Videodaten von einer dynamischen Umgebung bei einem Ausführungsbeispiel;
Fig. 3 auf einer oberen Ebene die bei einem Ausführungsbeispiel durchgeführten Verarbeitungsoperationen, um bewegte Bilder definierende Signale zu verarbeiten, um ein dreidimensionales Computermodell zu erzeugen, und um Bilder für einen Benutzer aus einer gewünschten Ansichtsrichtung anzuzeigen;
Fig. 4 die bei Schritt S2 in Fig. 3 durchgeführten Verarbeitungsoperationen;
Fig. 5 die bei Schritt S6 in Fig. 3 durchgeführten Verarbeitungsoperationen;
Fig. 6 die bei Schritt S32 in Fig. 5 durchgeführten Verarbeitungsoperationen;
Fig. 7 die bei Schritt S40 in Fig. 5 durchgeführten Verarbeitungsoperationen; und
Fig. 8 die bei Schritt S10 in Fig. 3 durchgeführten Verarbeitungsoperationen.
Fig. 1 ist ein Blockschaltbild, das die allgemeine Anordnung einer Bildverarbeitungsvorrichtung bei einem Ausführungsbeispiel darstellt. Bei der Vorrichtung steht ein Computer 2 zur Verfügung, der eine zentrale Verarbeitungseinheit (CPU) 4 aufweist, die mit einem Speicher 6 verbunden ist, der betreibbar ist, um ein Programm zu speichern, das die von der CPU 4 durchzuführenden Operationen definiert, und um von der CPU 4 verarbeitete Objekt- und Bilddaten zu speichern.
An den Speicher 6 ist ein Diskettenlaufwerk 8 angeschlossen, das betreibbar ist, um austauschbare Datenspeichermedien, wie beispielsweise eine Floppydiskette 10, anzunehmen, und um darauf gespeicherte Daten zu dem Speicher 6 zu transferieren. Von einem austauschbaren Datenspeichermedium können unter Verwendung des Diskettenlaufwerks 8 Operationsanweisungen für die zentrale Verarbeitungseinheit 4 in den Speicher 6 eingegeben werden.
Von der CPU 4 zu verarbeitende Bilddaten können auch von einem austauschbaren Datenspeichermedium unter Verwendung des Diskettenlaufwerks 8 in den Computer 2 eingegeben werden. Alternativ, oder zusätzlich, können zu verarbeitende Bilddaten direkt von einer Videokamera 12 in den Speicher 6 eingegeben werden, die über einen digitalen Bildausgang verfügt, wie beispielsweise die Sony DCR-PC7. Vor der Eingabe in den Speicher 6 können die Bilddaten in der Kamera 12 gespeichert werden, oder können in Echtzeit, wie die Daten von der Kamera 12 erfasst werden, in den Speicher 6 transferiert werden. Bilddaten können auch von einer nicht- digitalen Videokamera anstelle einer digitalen Kamera 12 eingegeben werden. In diesem Fall wird ein (nicht abgebildeter) Digitalisierer verwendet, um von der Kamera aufgenommene Bilder zu digitalisieren und um davon digitale Bilddaten zur Eingabe in den Speicher 6 herzustellen. Zusätzlich können Bilddaten über eine (nicht abgebildete) Verbindung von einer die Daten speichernden lokalen oder entfernt angeordneten Datenbank in den Speicher 6 heruntergeladen werden.
An einen Eingangsanschluss der CPU 4 ist eine Benutzeranweisungs-Eingabevorrichtung 14 angeschlossen, die beispielsweise eine Tastatur und/oder eine positionsempfindliche Eingabevorrichtung wie beispielsweise eine Maus, einen Nachführungsball etc. umfassen kann.
Außerdem ist an die CPU 4 ein Bildpuffer bzw. Bildzwischenspeicher 16 angeschlossen, der eine Speichereinheit umfasst, die dahingehend ausgestaltet ist, um sich auf zumindest ein Bild beziehende Bilddaten zu speichern, die von der zentralen Verarbeitungseinheit 4 erzeugt werden, beispielsweise indem ein (oder mehrere) Speicherplatz (Speicherplätze) für ein Pixel des Bildes zur Verfügung gestellt werden. Der in dem Bildpuffer für jedes Pixel gespeicherte Wert definiert die Farbe oder Intensität dieses Pixels in dem Bild.
An den Bildpuffer 16 ist auch eine Anzeigeeinheit 18 zur Anzeige des in dem Bildpuffer 16 gespeicherten Bildes auf eine herkömmliche Weise angeschlossen. Außerdem ist an den Bildpuffer 16 ein Videokassettenrecorder (VTR) 20 oder eine andere Bildaufzeichnungsvorrichtung wie beispielsweise ein Papierdrucker oder ein 35mm-Filmrecorder angeschlossen.
An den Speicher 6 (typischerweise über die CPU 4) und auch an den Bildpuffer 16 ist eine Massenspeichervorrichtung wie beispielsweise ein Festplattenlaufwerk mit einer hohen Datenspeicherkapazität angeschlossen. Die Massenspeichervorrichtung 22 kann von der zentralen Verarbeitungseinheit 4 verarbeitete Daten von dem Speicher 6 oder Daten von dem Bildpuffer 16 empfangen, die auf der Anzeigeeinheit 18 anzuzeigen sind.
Die CPU 4, der Speicher 6, der Bildpuffer 16, die Anzeigeeinheit 18 und die Massenspeichervorrichtung 22 können einen Teil eines kommerziell erhältlichen Gesamtsystems bilden, zum Beispiel eine Workstation wie beispielsweise die von Sun Microsystems erhältliche SparcStation.
Operationsanweisungen zur Veranlassung des Computers 2 als ein Ausführungsbeispiel der Erfindung auszuführen, können kommerziell in der Form von auf der Floppydiskette 10 oder anderen Datenspeichermedien gespeicherten Programmen zugeführt werden, oder können als ein Signal an Computer 2 übertragen werden, beispielsweise über eine (nicht abgebildete) Datenverbindung, so dass der empfangende Computer 2 in eine Vorrichtung umkonfiguriert wird, die die Erfindung ausführt.
Fig. 2 veranschaulicht schematisch das Sammeln von Bilddaten zum Verarbeiten durch die CPU 4.
Anhand eines Beispiels zeigt Fig. 2 zwei Personen, 30, 32, die sich auf einem Fußballfeld 34 bewegen. Das Feld 34 und die Bewegungen der Personen 30, 32 darauf werden von der Videokamera 12 aufgezeichnet, die bei einer fixen Ansichtsposition angebracht ist und eine fixe Ansichtsrichtung aufweist.
Fig. 3 zeigt die bei diesem Ausführungsbeispiel durchgeführte Bildverarbeitungsoperation.
Bezugnehmend auf Fig. 3 wird bei Schritt S2 ein dreidimensionales Computermodell des statischen Hintergrunds (das bedeutet, sich nichtbewegende Teile) der von der Kamera 12 zu betrachtenden Szene von einem Benutzer erzeugt. Außerdem werden bei Schritt S2 Bildparameter für die Hintergrundszene gesetzt.
Fig. 4 zeigt die bei Schritt S2 in Fig. 3 durchgeführten Verarbeitungsschritte ausführlicher.
Bezug nehmend auf Fig. 4 wird bei Schritt S20 ein Modell des statischen Hintergrunds erstellt. Folglich wird unter Bezugnahme auf das in Fig. 2 gezeigte Beispiel ein Modell des Fußballfeld 34 erstellt. Dies wird auf eine herkömmliche Weise unter Verwendung eines kommerziell erhältlichen Pakets zur Erstellung eines Modells ausgeführt.
Bei Schritt S22 werden eine Vielzahl von Bezugsbildern des statischen Hintergrunds unter Verwendung von Kamera 12 aufgezeichnet. Bei diesem Ausführungsbeispiel werden von Kamera 12 vier Videobilder aufgezeichnet. Es wird eine Vielzahl von Bezugsbildern aufgezeichnet, um zeitliche Änderungen bei den Beleuchtungsbedingungen des Hintergrunds, Rauschen, und unerwünschten Bewegungen innerhalb des "statischen" Hintergrunds (die beispielsweise durch sich bewegende Äste und Blätter an Bäumen etc. verursacht werden könnten) zu berücksichtigen, was nachfolgend weiter beschrieben wird.
Bei Schritt S24 wird die Transformation zwischen dem Bildraum (d. h. ein von der Kamera 12 aufgezeichnetes Bild) und dem dreidimensionalen (3D)-Welt-Raum (d. h. der Raum, in dem bei Schritt S20 das dreidimensionale Computermodell erzeugt wurde) berechnet. Die Transformation definiert ein Abbilden zwischen der Grundebene (die Ebene, auf der sich die Objekte bewegen) im Bildraum und der Grundebene in dem 3D-Welt- Raum (3D-Computermodell). Diese Transformation wird berechnet, da die absolute Position der Kamera oder die Position der Kamera relativ zu der betrachteten Szene (d. h. das Fußballfeld 34 bei dem Beispiel von Fig. 2) nicht im Voraus bestimmt ist, und in ähnlicher Weise die Kameraabbildungsparameter (Brennweite, Größe der ladungsträgergekoppelten Schaltung bzw. Vorrichtung (charge coupled device), Zoomeinstellung, etc.) nicht im Voraus bestimmt sind. Die Transformation ermöglicht auf eine zuverlässige und effiziente Weise eine Darstellung eines in dem 3D-Computermodell zu erzeugenden Objektes auf der Grundlage der Position und der Ausmaße des Objektes im Bildraum, was nachfolgend beschrieben wird.
Um bei Schritt S24 die Transformation zu berechnen, wird eines der bei Schritt S22 aufgezeichneten Bilder des Hintergrunds einem Benutzer auf der Anzeigevorrichtung 18 angezeigt, und der Benutzer bezeichnet nach Aufforderung durch die CPU 4 eine Vielzahl von Punkten (bei diesem Ausführungsbeispiel vier Punkte) in dem Bild, die auf einer Ebene liegen, auf der sich Objekte in der Szene bewegen werden. Folglich können unter Bezugnahme auf das in Fig. 2 gezeigte Beispiel die Eckpunkte 36, 38, 40, 42 des Fußballfelds 34 bezeichnet werden (das Feld stellt eine Oberfläche dar, auf der sich die Personen 30, 32 bewegen werden). Die bei Schritt S20 erzeugten Punkte in dem dreidimensionalen Computermodell, die den in dem Videobild identifizierten Punkten entsprechen, werden auch von dem Benutzer definiert. Beispielsweise kann dem Benutzer auf der Anzeigevorrichtung 18 eine Ansicht des dreidimensionalen Computermodells aus einer vorbestimmten Ansichtsrichtung angezeigt werden, und die entsprechenden Punkte können unter Verwendung der Eingabeeinrichtung 14 bezeichnet werden. Unter Verwendung der in dem Videobild bezeichneten Positionen der Punkte und der in dem dreidimensionalen Computermodell bezeichneten Positionen der entsprechenden Punkte berechnet die CPU 4 dann die Transformation zwischen dem Bildraum und dem 3D-Welt-Raum auf eine herkömmliche Weise, beispielsweise unter Verwendung der Gleichung:
in der: n = 1 ... 4; Xn, Yn Punkte im Welt-Raum sind; xn, yn Punkte im Bildraum sind; und A-H erlangt werden durch:
Dies definiert eine Transformation zwischen der Grundebene im Bildraum und der Grundebene in dem 3D-Computermodell (3D-Welt-Raum).
Bei Schritt S26 berechnet die CPU 4 Bezugsbildpixelparameter für den statischen Hintergrund. Dies wird durch Berechnen der mittleren Graustufe u für jedes Pixel aus der Vielzahl von bei Schritt S22 aufgezeichneten Bildern durchgeführt. Das heißt, es wird die Graustufe für entsprechende Pixel in jedem der vier Bilder berücksichtigt und der arithmetische Mittelwert genommen. Außerdem wird die Standardabweichung σ des bestimmten Mittels berechnet. Dann wird ein "Fenster" für die Graustufe jedes Pixels als u ± (2σ + F) gesetzt, wobei F ein Fehlerfaktor ist, der gesetzt wird, um Variablen wie beispielsweise die Verstärkung der Videokamera 12, und Rauschen etc. zu berücksichtigen. Bei diesem Ausführungsbeispiel ist die Gesamtzahl von Grauskalastufen 256, und der Fehlerfaktor F wird auf fünf Grauskalastufen gesetzt.
Das bei Schritt S26 für jedes Pixel gesetzte "Fenster" stellt die Streuung von Grauskalawerten dar, die die Pixel annehmen sollten, wenn sie einen Teil eines Bildes des statischen Hintergrunds bilden (die Ansichtsposition und -richtung der Videokamera 12 ist konstant, so dass sich der Grauskalawert eines einen Teil des Hintergrund bildenden Pixels nur abhängig von Beleuchtungsänderungen und Fehlern aufgrund von Rauschen ändern sollte). Wie nachfolgend beschrieben wird, werden diese "Fenster" verwendet, um sich über den Hintergrund bewegende Objekte zu identifizieren (und daher wird veranlaßt, dass sich die Pixelwerte außerhalb der definierten Fenster bewegen).
Wieder bezugnehmend auf Fig. 3, werden bei Schritt S4 Bilder von "Handlung", dass heißt Bilder, bei denen eine Bewegung eines Objektes über den Hintergrund stattfindet (beispielsweise eine Bewegung der Fig. 30, 32 auf dem Fußballfeld 34), von der Videokamera 12 aufgezeichnet.
Bei Schritt S6 verarbeitet die CPU 4 die Bilddaten für ein bei Schritt S4 aufgezeichnetes Bild, um Objekte in dem Bild zu identifizieren, die nicht Teil des "statischen Hintergrunds" sind, d. h. Objekte, die sich über den Hintergrund bewegen. Dann verwendet die CPU 4 diese Informationen und das bei Schritt S2 definierte dreidimensionale Computermodell, um zeitgeprägte dreidimensionale Objektdaten zu erzeugen, die ein dreidimensionales Computermodell der von der Kamera 12 aufgezeichneten Szene repräsentieren.
Fig. 5 zeigt die von der CPU 4 bei Schritt S6 durchgeführten Verarbeitungsoperationen.
Bezugnehmend auf Fig. 5, vergleicht die CPU 4 bei Schritt S30 die Graustufe jedes Pixels in den gerade in Verarbeitung befindlichen Bilddaten mit dem Grauskala-"Fenster", das zuvor bei Schritt S26 für die entsprechenden Pixel in dem Bild gesetzt wurde. Jeder Pixel, der eine Graustufe außerhalb des zuvor definierten Fensters für diesen Pixel aufweist, wird potentiell als ein "Vordergrund"-Pixel in Erwägung gezogen, d. h. ein Pixel, der Teil eines sich vor dem Hintergrund bewegenden Objektes ist. Bei Schritt S30 macht daher die CPU 4 eine Aufzeichnung, welche Pixel Grauskalastufen außerhalb des zugehörigen zuvor berechneten Fensters aufweisen.
Bei Schritt S32 verarbeitet die CPU 4 die Bilddaten, um Rauschen zu beseitigen. Derartiges Rauschen kann in die Bilddaten auf zahlreiche Wege eingeschleppt worden sein: beispielsweise durch Quanteneffekte, wenn die Videokamera 12 eine ladungsträgergekoppelte Schaltungs-(CCD-)Kamera ist; durch Datenkomprimiertechniken, die zur Komprimierung der Daten von der Kamera 12 Verwendung finden; durch einen Bildgreifer, der zum Einfangen von Bildern der Videodaten zur Verarbeitung durch die CPU 4 etc. verwendet wird; oder kann Rauschen sein, das bei Bilddaten oft in der Nähe der Grenzen von sich bewegenden Objekten auftritt.
Fig. 6 zeigt die von der CPU 4 durchgeführten Operationen bei der Verarbeitung der Bilddaten, um bei Schritt S32 in Fig. 5 Rauschen zu beseitigen.
Bezug nehmend auf Fig. 6 wendet die CPU 4 bei Schritt S50 eine "schrumpfende" Maske auf die Bilddaten auf eine herkömmliche Art an, beispielsweise wie in "Computer and Robot Vision Volume 2" von R. M. Haralick und L. G. Shapiro, Addision-Wesley Publishing Company, 1993 ISBN 0-201-56943-4 (Band 2), Seite 583 beschrieben. Diese Operation umfasst ein Anwenden einer 3 · 3-Pixelmaske auf die Bilddaten und Zählen der Anzahl von (bei Schritt S30 identifizierten) "Vordergrund"-Pixeln und der Anzahl von "Hintergrund"- Pixeln in jedem Satz der von der Maske definierten neun Pixel. Sind die Mehrheit der Pixel innerhalb der Maske Hintergrundpixel, dann wird der Zentrumspixel als ein Hintergrundpixel definiert (auch wenn er zuvor als ein Vordergrundpixel identifiziert wurde). Es wird keine Änderung vorgenommen, wenn die Mehrheit der Pixel innerhalb der Maske Vordergrundpixel sind. Diese Operation wird wiederholt, bis die schrumpfende Maske auf die gesamten Bilddaten angewendet wurde.
Bei Schritt S52, wendet die CPU 4 eine "wachsende" Maske auf das Bild auf eine herkömmliche Art an, beispielsweise wie in "Computer and Robot Vision Volume 2" von R. M. Haralick und L. G. Shapiro, Addision-Wesley Publishing Company, 1993 ISBN 0-201-56943-4 (Band 2), Seite 583 beschrieben. Diese Operation wird auf die selbe Weise wie Schritt S50 durchgeführt, außer dass, wenn die Mehrheit der Pixel innerhalb der Maske Vordergrundpixel sind, das Zentrumspixel dann als ein Vordergrundpixel definiert wird (auch wenn es zuvor als ein Hintergrundpixel identifiziert wurde), und es wird keine Änderung vorgenommen, wenn die Mehrheit der Pixel innerhalb der Maske Hintergrundpixel sind. Der Effekt von Schritt S52 besteht darin, dass durch die schrumpfende Maskenoperation bei Schritt S50 irrtümlich als Hintergrundpixel gesetzte Pixel in Vordergrundpixel zurückgeführt werden.
Erneut Bezug nehmend auf Fig. 5, verarbeitet die CPU 4 bei Schritt S34 die Daten, um Anhäufungen von Vordergrundpixeln zu identifizieren. Dies wird auf eine herkömmliche Weise zur Identifizierung von Anhäufungen von Pixeln mit den selben Charakteristiken durchgeführt, indem die Bilddaten gescannt werden, um ein Vordergrundpixel zu identifizieren, und dann benachbarte Pixel auf eine iterative Weise betrachtet werden, um alle verbundenen Vordergrundpixel zu identifizieren.
Bei Schritt S36 betrachtet die CPU 4 die nächste der bei Schritt S34 identifizierten Anhäufung von Vordergrundpixeln (dies ist die erste Anhäufung für das erste Mal, dass Schritt S36 durchgeführt wird) und bestimmt, ob die Anzahl von Pixeln in der Anhäufung größer als 30 ist.
Ist die Anzahl von Pixeln geringer oder gleich 30, wird die Anhäufung als Repräsentation von Rauschen betrachtet, da es einen relativ kleinen Teil des gesamten Bildes (768 Pixel mal 512 Pixel bei diesem Ausführungsbeispiel) bildet. In diesem Fall wird die Anhäufung nicht weiter verarbeitet. Andererseits wird dann, wenn die Anzahl von Pixeln in der Anhäufung größer als 30 ist, die Anhäufung als Repräsentation eines sich bewegenden Objektes betrachtet und es wird eine weitere Verarbeitung durchgeführt.
Bei Schritt S38 bestimmt die CPU 4 die Ausdehnung der Anhäufung von Pixeln. Bei diesem Ausführungsbeispiel führt die CPU 4 diese Operation durch Bestimmen des umhüllenden Rechtecks der Anhäufung innerhalb des zweidimensionalen Bildes mit Seiten parallel zu den Seiten des Bildes durch.
Bei Schritt S40 projiziert die CPU 4 das bei Schritt S38 bestimmte umhüllende Rechteck in den Raum der dreidimensionalen Welt, in dem bei Schritt S20 das Computermodell unter Verwendung der bei Schritt S24 berechneten Transformation gebildet wurde. Dies stellt bei dem dreidimensionalen Computermodell eine einzelne Ebene her, auf die das Videobild des sich bewegenden Objektes zur Anzeige an einen Benutzer projiziert wird, was nachfolgend beschrieben wird. Bei diesem Ausführungsbeispiel ist die Ebene in dem dreidimensionalen Computermodell vertikal und hat ihre Basis auf der Oberfläche innerhalb des 3D-Modells, die durch die von dem Benutzer bei Schritt S24 ausgewählten Punkte definiert ist (da angenommen wird, dass sich Objekte mit der betrachteten Szene auf der entsprechenden Echtwelt-Oberfläche bewegen - das Fußballfeld bei dem Beispiel von Fig. 2).
Fig. 7 zeigt die von der CPU 4 durchgeführte Operation beim Transformieren der umhüllenden Ebene bei Schritt S40 in Fig. 5.
Bezug nehmend auf Fig. 7 projiziert die CPU 4 die beiden Ecken der umhüllenden Rechteckbasis aus dem Bildraum in den dreidimensionalen Welt-Raum, indem die Koordinaten unter Verwendung der zuvor bei Schritt S24 berechneten Transformation transformiert werden. Jede Ecke der umhüllenden Rechteckbasis wird in einen Punkt in dem dreidimensionalen Welt-Raum des Computermodells transformiert, der auf der Oberfläche liegt, die durch die zuvor bei Schritt S24 ausgewählten Punkte definiert ist.
Bei Schritt S64 berechnet die CPU 4 die Breite des umhüllenden Rechtecks in dem dreidimensionalen Welt-Raum, indem der Abstand zwischen den bei Schritt S62 transformierten Ecken bestimmt wird.
Bei Schritt S66 berechnet die CPU 4 die Höhe des umhüllenden Rechtecks in dem dreidimensionalen Welt-Raum unter Verwendung des Verhältnisses von Breite zu Höhe des umhüllenden Rechtecks im Bildraum und der bei Schritt S64 berechneten Breite im dreidimensionalen Welt-Raum (d. h., das Seitenverhältnis des umhüllenden Rechtecks wird im Bildraum und im dreidimensionalen Welt-Raum gleich gehalten).
Wieder Bezug nehmend auf Fig. 5 speichert die CPU 4 bei Schritt S42 die Position und Größe des umhüllenden Rechtecks in dem dreidimensionalen Welt-Raum, die zuvor bei Schritt S40 berechnet wurden, zusammen mit aus dem umhüllenden Rechteck innerhalb des Videobildes extrahierten Strukturdaten für das umhüllende Rechteck und einer "Vordergrundmaske", d. h. eine Maske, die identifiziert, welche der Pixel innerhalb des umhüllenden Rechtecks Vordergrundpixeln entsprechen. Die extrahierten Strukturdaten stellen effektiv für das umhüllende Rechteck in dem 3D- Welt-Raum eine Strukturkarte zur Verfügung.
Bei Schritt S44 bestimmt die CPU 4, ob bei Schritt S34 eine weitere Anhäufung von Vordergrundpixeln identifiziert ist, die bis jetzt nicht verarbeitet wurde. Die Schritte S36 bis S44 werden wiederholt, bis alle Anhäufungen von Vordergrundpixeln für das betrachtete Videobild auf die vorangehend beschriebene Weise verarbeitet wurden. Zu diesem Zeitpunkt ist ein dreidimensionales Computermodell hergestellt worden, bei dem eine einzelne Ebene (umhüllendes Rechteck) angeordnet wurde, um die Position von jedem sich bewegenden Objekt darzustellen, und es wurden Strukturbilddaten für diese sich bewegenden Objekte für nachfolgende Projektion auf die Ebenen gespeichert, in Abhängigkeit von einem von einem Benutzer ausgewählten Ansichtspunkt. Diese Daten entsprechen daher einem dreidimensionalen Computermodell eines einzelnen zweidimensionalen Bildes (Videobildes) von Kamera 12.
Wieder Bezug nehmend auf Fig. 3 bestimmt die CPU 4 bei Schritt S8, ob ein weiteres, von der Kamera 12 bei Schritt S4 aufgezeichnetes Bild (Videobild) vorhanden ist, das bis jetzt nicht verarbeitet worden ist. Die Schritte S6 und S8 werden wiederholt, bis alle von der Kamera 12 bei Schritt S4 aufgezeichneten Bilder auf die vorangehend beschriebene Weise verarbeitet worden sind.
Bei Schritt S10 zeigt die CPU 4 einem Benutzer Bilder auf der Anzeigevorrichtung 18 von einem beliebigen gewünschten, von dem Benutzer ausgewählten Ansichtspunkt aus an. Bei den bei diesem Schritt von der CPU 4 angezeigten Bilder handelt es sich um simulierte Videobilder, die unter Verwendung der im Voraus erzeugten dreidimensionalen Modell-Objektdaten erzeugt werden.
Fig. 8 zeigt die von der CPU 4 beim Anzeigen der Bilder bei Schritt S10 durchgeführten Verarbeitungsoperationen.
Bezug nehmend auf Fig. 8 wird bei Schritt S70 von dem Benutzer die Richtung, aus der das Objekt zu betrachten ist, unter Verwendung der Eingabevorrichtung 14 definiert.
Bei Schritt S72 wird der 3D-Welt-Raum abhängig von der bei Schritt S70 ausgewählten Ansichtsrichtung in einen Ansichts-Raum transformiert. Diese Transformation identifiziert ein besonderes Ansichtsfeld, das normalerweise weniger als den gesamten Modellraum abdecken wird. Dementsprechend führt die CPU 4 bei Schritt S74 einen Schneideprozess durch, um Oberflächen, oder Teile davon, zu entfernen, die außerhalb des Ansichtsfeldes liegen.
Bis zu diesem Zeitpunkt definieren die von der CPU 4 verarbeiteten Objektdaten dreidimensionale Koordinatenorte. Bei Schritt S76 werden die Eckpunkte der dreieckigen Oberflächen, die das dreidimensionale Computermodell herstellen, so projiziert, dass ein zweidimensionales Bild definiert ist.
Nach Projektion des Bildes in zwei Dimensionen, ist es erforderlich die dreieckigen Oberflächen zu identifizieren, die "vorderseitig", d. h. dem Betrachter zugewandt sind, und diejenigen, die "rückseitig" sind, d. h. von dem Betrachter nicht gesehen werden können. Daher werden bei Schritt S78 rückseitige Oberflächen identifiziert und herausgesucht bzw. entfernt. Folglich sind nach Schritt S78 Eckpunkte in zwei Dimensionen definiert, die die dreieckigen Oberflächen von sichtbaren Polygonen identifizieren.
Bei Schritt S80 werden die die Oberflächen definierenden zweidimensionalen Daten von der CPU 4 abtast-umgewandelt, um Pixelwerte herzustellen. Bei diesem Schritt werden, ebenso wie die den Hintergrund in dem Bild repräsentierenden Oberflächen wiedergegeben werden, auch die zuvor bei Schritt S40 bestimmten umhüllenden Rechtecke mit den bei Schritt S42 gespeicherten, dazugehörigen Videostrukturdaten wiedergegeben. Es werden nur Vordergrundpixel innerhalb des umhüllenden Rechtecks mit den gespeicherten Videostrukturdaten wiedergegeben, wobei diese Pixel durch die gespeicherte "Vordergrundmaske" definiert sind. Die anderen Pixel werden mit Hintergrundstrukturdaten wiedergegeben. Die bei Schritt S82 hergestellten, wiedergegebenen Daten repräsentieren ein simuliertes Videobild, bei dem der Hintergrund von dem bei Schritt S20 erzeugten Computermodell hergestellt ist, und jedes sich bewegende Objekt als eine vertikale Ebene repräsentiert ist, die sich von einer horizontalen Oberfläche des Hintergrunds erstreckt (das Fußballfeld 34 bei dem Beispiel von Fig. 2), auf die die von dem Videobild extrahierten Bilddaten des sich bewegenden Objektes projiziert sind.
Bei Schritt S82 werden die bei Schritt S80 erzeugten Pixelwerte auf einer Oberfläche-für-Oberflächen-Basis in den Bildpuffer geschrieben, wodurch Daten für ein vollständiges zweidimensionales Bild erzeugt werden.
Bei Schritt S84 erzeugt die CPU 4 ein die Pixelwerte definierendes Signal. Das Signal wird verwendet, um ein Bild des Objektes auf der Anzeigeeinheit 18 zu erzeugen und/oder wird beispielsweise auf einer Videokassette bzw. einem Videoband in einem Videokassettenrecorder 20 aufgezeichnet.
(Von diesem Videoband können weitere Aufzeichnungen der erzeugten Bilder erstellt werden.) Das Signal kann auch an einen entfernt angeordneten Empfänger zur Anzeige oder zum Aufzeichnen übertragen werden.
Bei Schritt S86 bestimmt die CPU 4, ob ein zuvor bei Schritt S6 erzeugtes, weiteres zeitgeprägtes "Bild" von dreidimensionalen Objektdaten vorhanden ist, das dem Benutzer bis jetzt noch nicht angezeigt worden ist. Die Schritte S70 bis S86 werden wiederholt, bis alle derartigen Bilder von Objektdaten auf die vorangehend beschriebene Weise angezeigt worden sind, wodurch dem Benutzer eine Sequenz von simulierten bewegten Bildern aus der gewünschten Ansichtsrichtung angezeigt wird. Natürlich kann der Benutzer die Ansichtsrichtung jederzeit während der Anzeige ändern.
Für das vorangehend beschriebene Ausführungsbeispiel sind verschiedenste Modifikationen möglich.
Wieder Bezug nehmend auf Fig. 3, wird bei dem vorangehenden Ausführungsbeispiel Schritt S6 (bei dem Bilddaten verarbeitet werden, um sich bewegende Objekte zu identifizieren, und um daraus Objektdaten zu erzeugen) durchgeführt, nachdem bei Schritt S4 alle Bilder aufgezeichnet worden sind. In ähnlicher Weise wird Schritt S10 (bei dem Bilder angezeigt werden) durchgeführt, nachdem die Schritte S6 und S8 vollendet worden sind. Jedoch können die Schritte S4, S6 und S10 so durchgeführt werden, dass eine Echtzeit-Anzeige von Bildern an einen Benutzer aus einer gewünschten Ansichtsrichtung ermöglicht wird. D. h., Schritt S6 und Schritt S10 könnten für ein Bild von Videodaten durchgeführt werden, während das nächste Bild von Daten von der Videokamera 12 aufgezeichnet wird. Diese Echtzeit-Operation ist möglich, da die Verarbeitungserfordernisse der Schritte S6 und S10 auf der CPU 4 nicht besonders aufwendig bzw. belastend sind, und innerhalb von 1/30-tel einer Sekunde ausgeführt werden könnten, was die Zeit zwischen dem Aufzeichnen von Videobildern ist.
Bei dem vorangehenden Ausführungsbeispiel werden sich bewegende Objekte auf der Grundlage von Grausskalawerten identifiziert. Jedoch ist es zusätzlich dazu oder an Stelle davon möglich, Fenster für Farben und/Infrarotwerte zu setzen und Vordergrundobjekte unter Verwendung dieser Bildcharakteristiken zu identifizieren.
Bei dem vorangehenden Ausführungsbeispiel wird eine einzelne Videokamera 12 verwendet, um die von der CPU 4 zu verarbeitenden Bilder aufzuzeichnen. In ähnlicher Weise wird ein einzelnes umhüllendes Rechteck in dem 3D-Welt-Raum berechnet, auf dem Videobilddaten wiedergegeben werden. Dieses System leidet unter dem Problem, dass wenn der Benutzer eine Ansichtsrichtung auswählt, die in der Ebene eines umhüllenden Rechtecks liegt, dann wird das von dieser umhüllenden Ebene definierte, sich bewegende Objekt dem Benutzer nicht angezeigt (da es "hochkant" zu dem Benutzer ist). Dieses Problem kann angegangen werden, indem bei Schritt S4 eine Vielzahl von Kameras zur simultanen Aufzeichnung von Bildern von "Handlung" Verwendung findet, und indem jedes Objekt durch eine Vielzahl von Ebenen repräsentiert wird, die alle den Boden berühren (beispielsweise vertikale Ebenen), die verbunden sind, um eine geschlossene Oberfläche zu bilden. Die auf eine der Ebenen wiederzugebenden Videobilddaten zur Anzeige an einen Benutzer könnten dann ausgewählt werden, indem bestimmt wird, welche Videokamera eine Ansichtsrichtung aufweist, die zu der Normalen der anzuzeigenden umhüllenden Ebene am nächsten liegt (wobei die Videodaten von dieser Kamera dann als Strukturdaten für das umhüllende Rechteck Verwendung finden).
Bei dem vorangehenden Ausführungsbeispiel werden die Bilddaten von einer einzelnen Videokamera 12 aufgezeichnet, so dass nur Daten für Oberflächen eines bewegten Objektes aufgezeichnet werden, das der Kamera zugewandt ist. Dementsprechend werden dann, wenn der Benutzer bei Schritt S70 (Fig. 8) eine Ansichtsrichtung wählt, die sich in Richtung auf die Kamera 12 befindet, die von der Kamera 12 gesehenen Videobilddaten auf dem umhüllenden Rechteck wiedergegeben und dem Benutzer angezeigt, auch wenn der Benutzer tatsächlich mit einem Bild der entgegengesetzten Oberfläche des Objektes angezeigt wird. Dieses Problem kann überwunden werden, indem eine erste und eine zweite Kamera Verwendung finden, die entgegengesetzten Richtungen zugewandt sind und indem die Videodaten zur Wiedergabe auf dem umhüllenden Rechteck durch Bestimmen ausgewählt werden, welche Videokamera eine Ansichtsrichtung aufweist, die der von dem Benutzer ausgewählten Ansichtsrichtung am nächsten liegt (wobei die Videodaten von dieser Kamera dann auf dem umhüllenden Rechteck wiedergegeben werden).

Claims

1. Verfahren zum Verarbeiten von Bilddaten, die eine Abfolge von Bildern eines sich in einer Szene bewegenden Objektes definieren, um Signale herzustellen, die eine Repräsentation des Objektes bei einer Vielzahl von Positionen in einem dreidimensionalen Computermodell definieren, die Positionen des Objektes in der Szene entsprechen, gekennzeichnet durch:

Verarbeiten der Bilddaten für eine Vielzahl der Bilder, um für jedes Bild ein jeweiliges Polygon zu definieren, das das Objekt in dem Bild umhüllt (S34, S36, S38);

Definieren von zumindest einer ebenen Oberfläche innerhalb des dreidimensionalen Computermodells, um jede jeweilige Position des Objektes zu repräsentieren, wobei jede ebene Oberfläche mit ihrer Basis auf einer vorbestimmten Oberfläche in dem dreidimensionalen Computermodell und mit einer Position und einer Größe in Abhängigkeit von einem jeweiligen Polygon der das Objekt in den Bilddaten umhüllenden Polygone und der Position des jeweiligen Polygons innerhalb der Bilddaten (S40) definiert ist; und

Erzeugen von Strukturdaten für die ebenen Oberflächen, um die Merkmale des Objektes in Abhängigkeit von Bilddaten von den entsprechenden umhüllenden Polygonen zu repräsentieren (S42).

2. Verfahren nach Anspruch 1, wobei jede ebene Oberfläche derart definiert ist, dass die Breite der ebenen Oberfläche durch die Breite des entsprechenden umhüllenden Polygons in den Bilddaten festgelegt ist, und die Höhe der ebenen Oberfläche unter Verwendung des Seitenverhältnisses des entsprechenden umhüllenden Polygons in den Bilddaten berechnet wird.

3. Verfahren nach einem der vorangehenden Ansprüche, wobei jede ebene Oberfläche so definiert ist, dass sie innerhalb einer Ebene liegt, die senkrecht zu der vorbestimmten Oberfläche in dem dreidimensionalen Computermodell liegt.

4. Verfahren nach einem der vorangehenden Ansprüche, wobei jedes umhüllenden Polygons als ein Rechteck definiert ist.

5. Verfahren nach Anspruch 4, wobei jedes umhüllende Polygon mit zu den Seiten des Bildes parallelen Seiten definiert ist.

6. Verfahren nach einem der vorangehenden Ansprüche, wobei eine einzelne ebene Oberfläche so definiert ist, dass jede Position des Objektes in dem dreidimensionalen Computermodell repräsentiert ist.

7. Verfahren nach einem der Ansprüche 1 bis 5, wobei eine Vielzahl von verbundenen ebenen Oberflächen so definiert ist, dass jede Position des Objektes in dem dreidimensionalen Computermodell repräsentiert ist.

8. Verfahren nach einem der vorangehenden Ansprüche, wobei:

die Bilddaten verarbeitet werden, um eine jeweilige Maske für jedes umhüllende Polygon zu extrahieren, die die Position des Objektes innerhalb des umhüllenden Polygons definiert; und

die Strukturdaten für jede ebene Oberfläche in Abhängigkeit von den Bilddaten innerhalb der entsprechenden Maske erzeugt werden.

9. Verfahren nach einem der vorangehenden Ansprüche, zudem mit dem Schritt des Bildens des dreidimensionalen Computermodells.

10. Verfahren nach einem der vorangehenden Ansprüche, wobei jede ebene Oberfläche in dem dreidimensionalen Computermodell durch Abbilden von Punkten auf einem dem umhüllenden Polygon von den Bilddaten auf die vorbestimmte Oberfläche in dem dreidimensionalen Computermodell definiert ist.

11. Verfahren nach Anspruch 10, zudem mit dem Schritt des Verarbeitens der Bilddaten und von das dreidimensionale Computermodell definierenden Daten, um darin eine Vielzahl von entsprechenden Punkten zu identifizieren, und um eine Transformation zwischen den Bilddaten und der vorbestimmten Oberfläche unter Verwendung der definierten Punkte zur nachfolgenden Verwendung beim Abbilden von Punkten von umhüllenden Polygonen auf die vorbestimmte Oberfläche zu definieren.

12. Verfahren nach einem der vorangehenden Ansprüche, zudem mit dem Schritt des Erzeugens von Bilddaten, indem ein Bild des dreidimensionalen Computermodells von einer gewählten Ansichtsrichtung wiedergegeben wird, bei der die Strukturdaten auf einer der ebenen Oberfläche wiedergegeben werden.

13. Verfahren nach Anspruch 12, zudem mit dem Schritt des Erzeugens eines Signals, das die Bilddaten übermittelt.

14. Verfahren nach Anspruch 13, zudem mit dem Schritt des Aufzeichnens des Signals.

15. Verfahren nach einem der Ansprüche 12 bis 14, zudem mit dem Schritt des Anzeigens eines Bildes des Objektes unter Verwendung der erzeugten Bilddaten.

16. Verfahren nach einem der Ansprüche 12 bis 15, zudem mit dem Schritt des Herstellens einer Aufzeichnung der Bilddaten entweder direkt oder indirekt.

17. Bildverarbeitungsvorrichtung (2) zur Verarbeitung von Bilddaten, die eine Abfolge von Bildern eines sich in einer Szene bewegenden Objektes definieren, um Signale herzustellen, die eine Repräsentation des Objektes bei einer Vielzahl von Positionen in einem dreidimensionalen Computermodell definieren, die Positionen des Objektes in der Szene entsprechen, gekennzeichnet durch:

eine Erzeugungseinrichtung für umhüllende Polygone zur Verarbeitung der Bilddaten für eine Vielzahl der Bilder, um für jedes Bild ein jeweiliges Polygon zu definieren, das das Objekt in dem Bild umhüllt;

eine Erzeugungseinrichtung für eine ebene Oberfläche zur Definition von zumindest einer ebenen Oberfläche innerhalb des dreidimensionalen Computermodells, um jede jeweilige Position des Objektes zu repräsentieren, wobei die Erzeugungseinrichtung für eine ebene Oberfläche dahingehend ausgestaltet ist, um jede ebene Oberfläche mit ihrer Basis auf einer vorbestimmten Oberfläche in dem dreidimensionalen Computermodell und mit einer Position und einer Größe in Abhängigkeit von einem jeweiligen Polygon der das Objekt in den Bilddaten umhüllenden Polygone und der Position des jeweiligen Polygons innerhalb der Bilddaten zu definieren; und

eine Erzeugungseinrichtung für Strukturdaten zur Erzeugung von Strukturdaten für die ebenen Oberflächen, um die Merkmale des Objektes in Abhängigkeit von Bilddaten von den entsprechenden umhüllenden Polygonen zu repräsentieren.

18. Vorrichtung nach Anspruch 17, wobei die Erzeugungseinrichtung für eine ebene Oberfläche dahingehend ausgestaltet ist, um jede ebene Oberfläche derart zu definieren, dass die Breite der ebenen Oberfläche durch die Breite des entsprechenden umhüllenden Polygons in den Bilddaten definiert wird, und die Höhe der ebenen Oberfläche unter Verwendung des Seitenverhältnisses des entsprechenden umhüllenden Polygons in den Bilddaten festgelegt wird.

19. Vorrichtung nach Ansprüch 17 oder Anspruch 18, wobei die Erzeugungseinrichtung für eine ebene Oberfläche dahingehend ausgestaltet ist, um jede ebene Oberfläche so zu definieren, dass sie innerhalb einer Ebene liegt, die senkrecht zu der vorbestimmten Oberfläche in dem dreidimensionalen Computermodell ist.

20. Vorrichtung nach einem der Ansprüche 17 bis 19, wobei die Erzeugungseinrichtung für ein umhüllendes Polygon dahingehend ausgestaltet ist, um jedes umhüllende Polygon als ein Rechteck zu definieren.

21. Vorrichtung nach Anspruch 20, wobei die Erzeugungseinrichtung für ein umhüllendes Polygon dahingehend ausgestaltet ist, um jedes umhüllende Polygon derart zu definieren, dass dessen Seiten parallel zu den Seiten des Bildes sind.

22. Vorrichtung nach einem der Ansprüche 17 bis 21, wobei die Erzeugungseinrichtung für eine ebene Oberfläche dahingehend ausgestaltet ist, um eine einzelne ebene Oberfläche so zu definieren, dass jede Position des Objektes in dem dreidimensionalen Computermodell repräsentiert ist.

23. Vorrichtung nach einem der Ansprüche 17 bis 21, wobei die Erzeugungseinrichtung für eine ebene Oberfläche dahingehend ausgestaltet ist, um eine Vielzahl von verbundenen ebenen Oberflächen so zu definieren, dass jede Position des Objektes in dem dreidimensionalen Computermodell repräsentiert ist.

24. Vorrichtung nach einem der Ansprüche 17 bis 23, zudem mit einer Einrichtung zur Verarbeitung der Bilddaten, um eine jeweilige Maske für jedes umhüllende Polygon zu extrahieren, die die Position des Objektes innerhalb des umhüllenden Polygons definiert, und wobei die Erzeugungseinrichtung für Strukturdaten dahingehend ausgestaltet ist, um die Strukturdaten für jede ebene Oberfläche in Abhängigkeit von den Bilddaten innerhalb der entsprechenden Maske zu erzeugen.

25. Vorrichtung nach einem der Ansprüche 17 bis 24, zudem mit einer Einrichtung zur Bildung des dreidimensionalen Computermodells.

26. Vorrichtung nach einem der Ansprüche 17 bis 25, wobei die Erzeugungseinrichtung für eine ebene Oberfläche dahingehend ausgestaltet ist, um jede ebene Oberfläche in dem dreidimensionalen Computermodell durch Abbildung von Punkten auf einem dem umhüllenden Polygon von den Bilddaten auf der vorbestimmten Oberfläche in dem dreidimensionalen Computermodell zu definieren.

27. Vorrichtung nach Anspruch 26, zudem mit einer Einrichtung zur Verarbeitung der Bilddaten und von das dreidimensionale Computermodell definierenden Daten, um darin eine Vielzahl von entsprechenden Punkten zu identifizieren, und um eine Transformation zwischen den Bilddaten und der vorbestimmten Oberfläche unter Verwendung der definierten Punkte zur nachfolgenden Verwendung durch die Erzeugungseinrichtung für eine ebene Oberfläche bei Abbildung von Punkten von umhüllenden Polygonen auf die vorbestimmte Oberfläche zu definieren.

28. Vorrichtung nach einem der Ansprüche 17 bis 27, zudem mit einer Einrichtung zum Wiedergeben der Strukturdaten auf der ebenen Oberfläche, um Bilddaten für ein Bild des dreidimensionalen Computermodells von einer Ansichtsrichtung zu erzeugen.

29. Speichermedium, das Anweisungen zur Programmierung einer programmierbaren Verarbeitungsvorrichtung speichert, damit es betreibbar wird, um ein Verfahren gemäß zumindest einem der Ansprüche 1 bis 16 durchzuführen.

30. Signal, das Anweisungen zur Programmierung einer programmierbaren Verarbeitungsvorrichtung trägt, damit es betreibbar wird, um ein Verfahren gemäß zumindest einem der Ansprüche 1 bis 16 durchzuführen.