WO1993006689A1 - Bewertung von bewegungen in von videokameras aufgenommenen szenen - Google Patents

Bewertung von bewegungen in von videokameras aufgenommenen szenen Download PDF

Info

Publication number
WO1993006689A1
WO1993006689A1 PCT/EP1992/002221 EP9202221W WO9306689A1 WO 1993006689 A1 WO1993006689 A1 WO 1993006689A1 EP 9202221 W EP9202221 W EP 9202221W WO 9306689 A1 WO9306689 A1 WO 9306689A1
Authority
WO
WIPO (PCT)
Prior art keywords
motion
image
sensors
motion information
sensor
Prior art date
Application number
PCT/EP1992/002221
Other languages
English (en)
French (fr)
Inventor
Broder Wendland
Ulrich Schmitz
Thomas Hollmann
Original Assignee
Grundig E.M.V. Elektro-Mechanische Versuchsanstalt Max Grundig Holländ. Stiftung & Co Kg
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grundig E.M.V. Elektro-Mechanische Versuchsanstalt Max Grundig Holländ. Stiftung & Co Kg filed Critical Grundig E.M.V. Elektro-Mechanische Versuchsanstalt Max Grundig Holländ. Stiftung & Co Kg
Priority to EP92920654A priority Critical patent/EP0605588B1/de
Priority to DE59208140T priority patent/DE59208140D1/de
Publication of WO1993006689A1 publication Critical patent/WO1993006689A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction

Definitions

  • the invention relates to a method for receiving
  • An inter-frame interpolation is necessary to convert moving images between different television standards and to increase the frame rate as well as to generate slow-motion sequences.
  • the use of signal processing based on motion information is of essential importance in order to obtain a motion display that is error-free for the human eye while maintaining the given local resolution.
  • a large part of the changes in successive images of an image sequence can be attributed to movements of the depicted objects and / or the recording camera. These changes can be described locally as a shift in the corresponding image content in subsequent images.
  • motion information-based signal processing in the case of image interpolation, the aim is now to reproduce the image content at a given point in time at the correct local position, which is determined by the object movement.
  • noise reduction in moving image signals is noise reduction in moving image signals. Effective noise reduction without a reduction in local resolution in moving image areas is only possible through temporal filtering in the direction of movement, which can be achieved by control using movement information.
  • the additional transmission of movement information enables the maintenance of an increased local resolution with an undersampled image signal up to higher speeds of object or camera movements.
  • overall lower data rates are achieved through the additional transmission of movement information for the generation of improved prediction pictures by means of movement processing-based signal processing.
  • a prerequisite for motion information-based signal processing is the determination of correct motion information.
  • the determination of movement information on the basis of the image signals supplied by today's cameras is impaired by the temporal resolution of the high-resolution image signals which is limited for reasons of bandwidth.
  • the resulting temporal alias in the image signal given a spatial resolution given in the measuring range from a corresponding speed, means that the speed can in principle no longer be measured correctly, that is, regardless of the motion measuring method used.
  • Ambiguities, for example on periodic image structures lead to correspondingly incorrect movement information in the movement measurement, which in principle cannot be prevented by any movement measurement method.
  • a correct movement measurement can also be made, for example, when a very small object is moving rapidly in front of a structured image background can be prevented since the local recording aperture can cause the brightness of the small object to change too much if the temporal resolution is insufficient.
  • Inter-frame interpolation can often be very disruptive, for example if a locally high-resolution image content "flashes" at a completely wrong location for a short time. Other errors that result from the fact that corresponding image content cannot be assigned in successive images lead, for example, to a greatly reduced spatial resolution in the image interpolation (fallback mode).
  • An increase in the temporal sampling requirement and the associated reduction in temporal alias during image recording is advantageous for reducing the frequency of such errors in motion measurement.
  • a camera with a scanning standard of, for example, 1250 lines / 50 Hz / 2: 1 has been implemented and tested, while a camera with about twice the bandwidth (for example. 250 Z / 50 Hz / 1: 1) is still in the development stage is.
  • a scanning standard of e.g. 1250Z / 100HZ / 1 with e.g. 120MHz bandwidth
  • the time of implementation is currently not foreseeable and a high-resolution image recording system with an even higher frame rate of e.g. 200 Hz, which would have advantages for correct interframe interpolation, the time of the technical implementation is far from being foreseeable.
  • the invention has for its object to provide a method for recording moving images, with which the temporal alias during image recording is greatly reduced in the presence of a limited signal bandwidth and, in principle, the frequency of measurement errors when determining movement information , ie regardless of the motion measurement method used, is greatly reduced.
  • This object is achieved in the claimed method in that, in addition to the image pickup sensors for the image signal ("image content sensors"), another (or more) image pickup sensor (s) is used as the "motion sensor", the signal of which is due to an increased frame rate compared to the Image content sensors is marked and is used for the determination of motion information.
  • the advantages of the invention essentially consist in the fact that the claimed method also delivers correct movement information when conventional image recording methods with the same technology or bandwidth already lead to incorrect results in the determination of movement information due to temporal alias.
  • This advantage is achieved in particular in that when determining the movement information, the image signal of the movement sensor with additional movement phases is available as an additional determination criterion.
  • FIG. 1 is a block diagram of the basic
  • Figure 2 is a block diagram of a
  • FIG. 3 shows a diagram to illustrate the reduction in temporal alias that can be achieved with the claimed method
  • Figure 4 is a sketch of a structure of a lens with reflection of the beam path for the provided in the claimed method
  • Figure 5 is a sketch of the principle of a
  • Camera beam splitter with four optical outputs for four image recording sensors, one of which is designed as a motion sensor and three as image content sensors, and
  • Figure 6 is a sketch for building a compact
  • FIG. 1 shows a block diagram for a basic explanation of the claimed method.
  • the dashed and dotted connecting lines between the blocks indicate optical connections, the solid connecting lines mean electrical connections.
  • the light of a scene supplied via the optical input E is imaged on the image content sensors 2 and on one (or more) motion sensor (s) 3 via an image recording optic 1, which contains a beam splitter for the light distribution in addition to the imaging optics.
  • the image content sensors 2, which are, for example, three sensors with 1250 lines, 25 Hz frame rate and interlace-free image scanning for the three color separations red, green and blue, deliver the corresponding locally high-resolution image signal to the output A1 for transmission, recording or further processing .
  • the motion sensor 3 scans the image of the scene with increased temporal resolution and reduced local resolution compared to the image content sensor.
  • the corresponding image signal which includes, for example, only luminance information with the same signal bandwidth and a format of 625 lines, 100 Hz image change sequence and interlaced image scanning, is supplied to a circuit block 4 for determining movement information.
  • the movement measurement in circuit block 4 in which, for example, a differential measurement method is used, as described in the journal Signal Processing: Image Communication 2 (1990), p. 69 ff. Or the journal Proceedings of the IEEE, VOL. 73, no. 4, April 1985, pp. 523 ff.,
  • the additional movement phases compared to the image signal of output A1 can be used as a determination criterion.
  • the locally high-resolution image signal supplied to the circuit block 4 by the image sensors 2 can also be used in the movement measurement 4 in order, for example, to generate a pixel-precise motion vector field.
  • Moving image description in the form of a locally high-resolution image signal at output A1 (for example 1 50Z / 25Hz / 1: 1) and additional motion information at output A2 (for example a pixel-precise motion vector field) are available.
  • a moving image description is suitable for any inter-frame interpolation by means of signal processing based on motion information.
  • FIG. 2 shows a block diagram of an image recording scenario in which the invention is used.
  • 25 Hz images and motion information is also a direct generation of sequences in large flicker-free reproduction standards (e.g. 100 Hz
  • a camera constructed according to the claimed method thus generates a kind of superordinate (superstandard) moving image description.
  • the movement information is consequently not determined, as in the prior art, only from the image signal on the recording side, the frame frequency of which may be equal to or higher than the frame frequency to be transmitted, but additionally (or exclusively) from the signal on the recording side of a ( or more) image recording sensor as a motion sensor with reduced spatial and increased temporal resolution compared to the image signal.
  • Diagrams are shown in FIG. 3 to illustrate the reduction of temporal alias in the claimed image recording method compared to conventional image recording methods.
  • the comparison is carried out as an example for image recording sensors with a uniform bandwidth which corresponds to a progressive scanning standard of 1250 lines and a frame rate of 25 Hz.
  • the uniquely determinable speed range of a picture content with a spatial frequency f x is given by a time sampling distance from the picture duration T _ D _>
  • the curve shown in FIG. 3a indicates the maximum uniquely determinable speed v in ° / sec as a function of the spatial frequency fx in TP / given in the measuring range.
  • the speed / spatial frequency range relevant to the reasonable maximum value applied for the speed and the spatial resolution, in which a clear speed measurement can be achieved, is shown hatched.
  • FIG. 3b shows this using the example of an additional motion sensor with a horizontal frequency halved in comparison to the image content sensors, the vertical frequency reduced by a factor of 4, but up to a factor of 8 increased temporal resolution (200 Hz).
  • the scene is to be recorded, for example, with three spatially high-resolution and low-resolution sensors for the three color separations red, green and blue, and at the same time with an image recording sensor with high time resolution and lower spatial resolution.
  • the first three of the sensors deliver the colored image signal (image content sensors), while the motion information is to be derived from the luminance signal of the fourth sensor (motion sensor). Since the image is to be taken with a single lens, the light must be split into four parts. There are two ways to do this, for example: 1.
  • Figure 4 shows the first of the two options:
  • the incident light is split in the camera lens.
  • the lens generally consists of several parts: a front part, a multi-stage zoom part (for zoom lenses) and a basic lens, which performs the imaging on the camera sensors.
  • the aperture is located between the vario part and the basic lens.
  • a beam splitter prism is inserted between the diaphragm and the basic lens to represent the scene on the motion sensor. It reflects part of the incident light at an angle of 45 degrees from the beam path of the lens. This reflected portion of the light is transmitted through a second basic lens, which is adapted to the format of the motion sensor Motion sensor shown. The transmitted light is imaged by the basic lens via the beam splitter with three outputs on the image content sensors.
  • the reflecting out can be made of the objective principle at another as described in the example above point ".
  • Lenses that are intended for the use of a test projector or range extender already have space for installing the divider prism at this point of the lens. This offers advantages when designing the lens based on existing system components. It is then only necessary to shift the basic lens to compensate for the glass path of the divider prism.
  • the reflection can be done at a different angle to increase the compactness of the lens.
  • the mirroring can alternatively also be carried out with a mirror instead of a prism.
  • this leads to increased astigmatism the image on the motion sensor and on the image sensors.
  • Figure 5 shows the second of the two options:
  • the light is split up completely behind the lens in the camera.
  • An optical beam splitter with four outputs supplies the four sensors with the light of the scene.
  • the splitting of the light is carried out by dichroic mirror layers.
  • the first mirror layer separates part of the incident white light. This light depicts the scene on the motion sensor.
  • the light transmitted by the first mirror is now separated into the three color components. First the blue component and then the red component can be mirrored. The green light for the green image content sensor remains.
  • the color components can also be split in a different order.
  • the reflection can also be implemented in various ways:
  • FIG. 6 shows a sketch of the basic structure of a prism beam splitter with four outputs.
  • both image recording tubes and semiconductor image recorders can be used for the concept of a camera with four image recording sensors. It should be noted, however, that sharp individual images are desirable both for determining movement information from the temporally high-frequency image signal and for interpolation based on the temporally low-frequency, locally high-resolution image signal.
  • Shutter speed control does not require additional mechanical orifice plates.
  • the shutter times (integration times) of all sensors can thus be set independently of one another.
  • the concept of beam splitting via a prism block can thus also be implemented.
  • Another embodiment is to use different types of sensors.
  • a semiconductor motion sensor could provide the motion information for a locally high-resolution tube camera.
  • the Motion sensor In order to reduce these local alias errors, the Motion sensor not positioned exactly in the focus plane of the picture.
  • the blurred image results in low-pass filtering of the image signal. Since the image now created contains fewer high-frequency components, fewer alias faults occur.
  • the local alias errors can be reduced with a birefringent quartz disk, the optical axis of which is inclined at 45 degrees.
  • the incident light is split into two parts and both parts are shown offset on the image sensor.
  • the modulation transfer function of the pre-filter can be varied by cascading several filter disks of different thicknesses.
  • the orientation of the filter discs determines the filter direction (horizontal, vertical, diagonal).
  • the blurring can be brought about in a targeted manner.
  • the filtering with birefringent quartz disks dampens high-frequency spatial frequencies and the scanning leads to lower alias interference.
  • the object speed when determining motion information, for example in the form of motion vector fields, can be measured after corner detection at the corners of moving structures.
  • the correct object displacement can be measured in a small local-temporal measuring range, in contrast to the measurement on one Structural edge, where only the displacement component perpendicular to the edge course can be clearly measured.
  • a two-dimensional frequency filtering of the motion vector fields is particularly suitable for homogenizing the vector fields, which correspondingly leads to reduced data rates. This is characterized by the fact that it is carried out on the one hand recursively and on the other hand (i.e. only if the most frequent vector also delivers a good match result is it assigned). The recursiveness increases the homogeneity of the vector fields. The conditionality of the filtering guarantees that the motion vectors of very small moving objects are not filtered out.
  • the zero vector is determined as motion information in the determination of the motion vectors in local areas of constant brightness within a moving object, then postprocessing is carried out in such a way that the zero vector is replaced by adjacent displacement vectors that are not equal to the Nu.llvekt.or, if the replacement vector also provides a good match result, ie can describe the movement of the image area under consideration well.
  • This has the advantage that the vector fields become more homogeneous, ie larger areas of uniform movement information arise, and thus a greater reduction in data can be achieved when coding the movement information.
  • An advantageous application of the claimed method is in a so-called chromakey mixer.
  • the generated motion information can be used as an additional determination criterion for the segmentation in the foreground object and the background at rest, in order to prevent the background image from being incorrectly faded into areas of the foreground object at those locations where the color of the foreground object is similar to the key - color is.
  • a further advantageous embodiment of the claimed method lies in the use of the hierarchical sensor concept described above (locally high / temporally low-resolved and temporally high / locally low-resolved) within the framework of a hierarchical method for motion measurement, as described in the conference proceedings "Proceedings of the Fourth International Workshop on HDTV and beyond (Chupeau: Multiscale Motion Estimation), Turin, Sept. 1991.
  • the measurement is carried out in several hierarchical levels with different spatial resolutions in order to reduce the proportion of incorrect measurements due to reduce temporal alias.

Abstract

Die Erfindung betrifft ein Verfahren zur Aufnahme von Bewegtbildern, die nach der Bildabtastung einer bewegungsinformationsgestützten Signalverarbeitung unterzogen werden sollen, beispielsweise einer digitalen Codierung, einer Übertragung von analogen Bildsignalen inkl. DATV-Signal, einer Normkonversion, einer Wiedergabe mit erhöhter Bildwechselfrequenz oder einer Zeitlupenwiedergabe. Das Abtastverfahren verwendet neben den Bildaufnahmesensoren (2) für das Bildsignal mindestens einen weiteren Bildaufnahmesensor (3) mit im Vergleich zu den Bildinhaltssensoren reduzierter Ortsauflösung und erhöhter Bildwechselfrequenz, dessen Signal für die Ermittlung von Bewegungsinformationen genutzt wird.

Description

Bewertung von Bewegungen in von Videokameras aufgenommenen Szenen
BESCHREIBUNG
Die Erfindung betrifft ein Verfahren zur Aufnahme von
Bewegtbildern für eine nachfolgende, bewegungsinformationsgestützte Signalverarbeitung.
Zur Umsetzung von Bewegtbildern zwischen unterschiedlichen Fernsehnormen und zur Erhöhung der Bildwiedergabefrequenz sowie zur Erzeugung von Zeitlupensequenzen ist eine Zwischenbildinterpolation notwendig. Von wesentlicher Bedeutung ist hierbei die Verwendung von bewegungsinformationsgestützter Signalverarbeitung, um unter Beibehaltung der gegebenen örtlichen Auflösung eine für das menschliche Auge fehlerfreie Bewegungsdarstellung zu erhalten.
Ein Großteil der Änderungen in aufeinanderfolgenden Bildern einer Bildsequenz ist auf Bewegungen der abgebildeten Objekte und/oder der Aufnahmekamera zurückzuführen. Diese Änderungen können lokal als eine Verschiebung der entsprechenden Bildinhalte in Folgebildern beschrieben werden. Mittels einer bewegungsinformationsgestützten Signalverarbeitung bei der Bildinterpolation soll nun erreicht werden, daß der Bildinhalt zu einem gegebenen Zeitpunkt an der richtigen örtlichen Position, welche durch die Objektbewegung festgelegt ist, wiedergegeben wird. Eine weitere Anwendung von bewegungsinformationsgestützter Signalverarbeitung ist die Rauschreduktion in Bewegtbildsignalen. Erst durch eine zeitliche Filterung in Bewegungsrichtung, die durch Steuerung mittels Bewegungsinformation erreicht werden kann, ist eine effektive Rauschreduktion ohne Reduktion von örtlicher Auflösung in bewegten Bildbereichen möglich.
Auch bei der Übertragung von analogen Bewegtbildsignalen ermöglicht die zusätzliche Übertragung von Bewegungsinformation die Aufrechterhaltung einer erhöhten örtlichen Auflösung bei zeitlich unterabgetastetem Bildsignal bis zu höheren Geschwindigkeiten von Objekt- bzw. Kamerabewegungen. Bei der Übertragung von digital codierten Bewegtbildsignalen werden durch die zusätzliche Übertragung von Bewegungsinformationen zur Erzeugung von verbesserten Prädiktionsbildern mittels bewegungsinformationsgestützter SignalVerarbeitung insgesamt geringere Datenraten erzielt.
Eine weitere Anwendung ergibt sich bei der Magnetbandaufzeichnung von Bewegtbildern, bei der eine Datenkompression mittels digitaler Codierung durchgeführt wird. Während bei der Magnetbandaufzeichnung ohne Datenkompression eine Korrektur von Aufzeichnungsfehlern, wie beispielsweise dem Ausfall eines Bildpunktes, noch mittels einfacher Bildpunktinterpolation aus benachbarten Bildpunkten möglich ist, kann bei der Verwendung von Datenkompressionstechniken mit einer oftmals angewendeten bildblockweisen Codierung der Bewegtbildsignale beispielsweise der Ausfall eines gesamten Blockes erst durch bewegungsinformationsgestützte Interpolation dieses Blockes aus benachbarten Bildern verhindert werden.
Voraussetzung für eine bewegungsinformationsgestütze Signalverarbeitung ist die Ermittlung von korrekten Bewegungsinformationen. Hinsichtlich eines möglichen HDTV-Studio-Szenarios mit Verwendung von Bewegungsinformationen im Studio zur verbesserten Rauschreduktion,
Normkonversion,
Zeitlupenerzeugung,
Bildwiedergabe mit erhöhter Bildwechselfrequenz,
Zeilensprung-nach-Progressiv-Umwandlung beim
Video-zu-Film-Transfer,
Übertragung von analog codierten Bewegtbildsignalen mit zusätzlicher Bewegungsinformation (z.B. bei
HD-MAC mit DATV oder bei verbessertem PAL-Syste mit
Bewegungsvektoren) ,
Übertragung von digital codierten Bewegtbildsignalen mit zusätzlicher Bewegungsinformation - und zur Magnetbandaufzeichnung mit verbessertem
Concealment für digital codierte HDTV-Signale und der damit verbundenen Notwendigkeit, neben Bildsignalen vielfach auch Bewegungsinformation für die weitere Signalverarbeitung zur Verfügung zu stellen, stellt sich die Frage, wie Bewegungsinformation im Studio sinnvollerweise erzeugt werden sollte.
Alle bisher bekannten Verfahren zur Bewegtbildaufnahme führen eine Bildabtastung derart durch, daß Signale für ein bestimmtes Bildabtastformat optimiert erzeugt werden. Dies ist beispielsweise bei der direkten Erzeugung von Bildsignalen mit 625 Zeilen und 50 Hz Bildwechselfrequenz der Fall. Ebenso bei der örtlichen Offsetabtastung zur Erzeugung optimal aufgelöster Bilder in einem bestimmten Bildformat, wie z.B. bei" 1 50-zeiligen, 50Hz-Progressiv-Bildern mit diagonaler Ortsauflösung. Auch sind Abtastverfahren vorgeschlagen worden, die durch eine Unterabtastung der Chrominanzanteile in der Kamera eine für ein bestimmtes Bildformat optimale Abtastung, hier entsprechend den Anforderungen des menschlichen Gesichtssinns mit reduzierter Chrominanzauflösung, ermöglichen sollen.
Entsprechend wird die Ermittlung von Bewegungsinformation auf der Basis der von heutigen Kameras gelieferten Bildsignale beeinträchtigt durch die aus Bandbreitengründen begrenzte zeitliche Auflösung der hochauflösenden Bildsignale. Der hierdurch bedingte zeitliche Alias im Bildsignal führt bei einer im Meßbereich gegebenen Ortsauflösung ab einer entsprechenden Geschwindigkeit dazu, daß die Geschwindigkeit prinzipiell, also unabhängig vom verwendeten Bewegungsmeßverfahren, nicht mehr korrekt gemessen werden kann. Mehrdeutigkeiten beispielsweise an periodischen Bildstrukturen führen bei der Bewegungsmessung zu entsprechend inkorrekter Bewegungsinformation, was prinzipiell von keinem Verfahren zur Bewegungsmessung verhindert werden kann. Auch kann beispielsweise bei einer schnellen Bewegung eines sehr kleinen Objektes vor einem strukturierten Bildhintergrund eine korrekte Bewegungsmessung verhindert werden, da durch die örtliche Aufnahmeapertur bei nicht ausreichender zeitlicher Auflösung eine zu starke Helligkeitsänderung des kleinen Objektes hervorgerufen werden kann.
Fehler, die infolge der Ermittlung von falschen Bewegungsinformationen bei der
Zwischenbildinterpolation entstehen können, sind oftmals sehr störend, beispielsweise wenn kurzzeitig ein örtlich hochaufgelöster Bildinhalt an einer völlig falschen Ortsposition "aufblitzt". Andere Fehler, die dadurch entstehen, daß korrespondierender Bildinhalt in aufeinanderfolgenden Bildern nicht zugeordnet werden kann, führen beispielsweise zu einer stark reduzierten Ortsauflösung bei der Bildinterpolation (Rückfallmodus) .
Eine Erhöhung der zeitlichen Abtast requenz und die damit verbundende Verminderung von zeitlichem Alias bei der Bildaufnahme ist zur Reduktion der Häufigkeit solcher Fehler bei der Bewegungsmessung von Vorteil.
Aus der Deutschen Patentanmeldung P 40 04 437 ist ein Verfahren zur Ermittlung von Bewegungsinformation bekannt, das eine erhöhte Bildwechselfrequenz und damit reduzierten zeitlichen Alias geeignet ausnutzen kann. Eine Erhöhung der zeitlichen Abtastrate bei der Bildaufnahme ergibt Vorteile für die Bewegungsschätzung. Denn bei erhöhter zeitlicher Abtastrate sind die Objektverschiebungen zwischen zwei au einanderfolgenden Bildern für gleiche Objektgeschwindigkeiten geringer. Dies bedeutet, daß für eine gegebene Ortsfrequenz im Bild erst bei höheren Geschwindigkeiten zeitlicher Alias auftritt, so daß bis zu höheren Geschwindigkeiten eine eindeutige Geschwindigkeitsmessung möglich ist.
Der Versuch, die Bildwechselfrequenz bei der Bildaufnahme zu erhöhen, stößt durch die Erhöhung der erforderlichen Bandbreite des Bildaufnahmesystems schnell an die Grenzen des technisch Realisierbaren.
Eine Kamera mit einem Abtaststandard von beispielsweise 1250Zeilen/50Hz/2: 1 (mit z.B. etwa 22 bis 30 MHz Bandbreite) ist realisiert und erprobt, während eine Kamera mit etwa doppelter Bandbreite (z.B. .250Z/50Hz/1 : 1 ) noch im Entwicklungsstadium ist. Für ein Bildaufnahmesystem mit einem Abtaststandard von z.B. 1250Z/100HZ/1 (mit z.B. 120MHz Bandbreite) ist der Zeitpunkt der Realisierung zur Zeit nicht absehbar und ein hochauflösendes Bildaufnahmesystem mit einer noch höheren Bildwechselfrequenz von z.B. 200 Hz, die zur korrekten Zwischenbildinterpolation Vorteile hätte, ist der Zeitpunkt der technischen Realisierung erst recht nicht absehbar.
Ausgehend vom vorstehend beschriebenen Stand der Technik liegt der Erfindung die Aufgabe zugrunde, ein Verfahren zur Aufnahme von Bewegtbildern anzugeben, mit dem bei Vorliegen einer begrenzten Signalbandbreite der zeitliche Alias bei der Bildaufnahme stark reduziert wird und damit die Häufigkeit von Meßfehlern bei der Ermittlung von Bewegungsinformation prinzipiell, d.h. unabhängig vom verwendeten Bewegungsmeßverfahren, stark vermindert wird. Diese- Aufgabe wird bei dem beanspruchten Verfahren dadurch gelöst, daß neben den Bildaufnahmesensoren für das Bildsignal ("Bildinhaltssensoren") ein weiterer (oder mehrere) Bildaufnahmesensor(en) als "Bewegungssensor" verwendet wird, dessen Signal durch eine erhöhte Bildwechselfrequenz im Vergleich zu den Bildinhaltssensoren gekennzeichnet ist und für die Ermittlung von Bewegungsinformationen genutzt wird.
Die Vorteile der Erfindung bestehen im wesentlichen darin, daß das beanspruchte Verfahren auch dann korrekte Bewegungsinformationen liefert, wenn herkömmliche Bildaufnahmeverfahren mit gleicher Technologie bzw. Bandbreite bereits aufgrund von zeitlichem Alias zu fehlerhaften Ergebnissen bei der Ermittlung von Bewegungsinformationen führen. Dieser Vorteil wird insbesondere dadurch erreicht, daß bei der Ermittlung der Bewegungsinformation das Bildsignal des Bewegungssensors mit zusätzlichen Bewegungsphasen als zusätzliches Bestimmungskriterium zur Verfügung steht. Dieser und weitere Vorteile ergeben sich aus der Erläuterung eines Diagrammes und eines Ausführungsbeispiels anhand der Figuren.
Es zeigt:
Figur 1 ein Blockschaltbild zur grundsätzlichen
Erläuterung des beanspruchten Verfahrens,
Figur 2 ein Blockschaltbild eines
Bildaufnahmeszenarios, bei dem die Erfindung verwendbar ist, Figur 3 ein Diagramm zur Verdeutlichung der mit dem beanspruchten Verfahren erreichbaren Reduktion von zeitlichem Alias,
Figur 4 eine Skizze eines Aufbaus eines Objektivs mit Ausspiegelung des Strahlenganges für den beim beanspruchten Verfahren vorgesehenen
Bewegungssensor,
Figur 5 eine Skizze des Prinzips eines
Kamera-Strahlteilers mit vier optischen Ausgängen für vier Bildaufnahmesensoren, von denen einer als Bewegungssensor und drei als Bildinhaltssensoren ausgelegt sind, und
Figur 6 eine Skizze zum Aufbau eines kompakten
Prismenstrahlteilers für das beanspruchte Verfahren.
Die Figur 1 zeigt ein Blockschaltbild zur grundsätzlichen Erläuterung des beanspruchten Verfahrens. Die gestrichelten und gepunkteten Verbindungslinien zwischen den Blöcken kennzeichnen optische Verbindungen, die durchgezogenen Verbindungslinien bedeuten elektrische Verbindungen. Das über den optischen Eingang E zugeführte Licht einer Szene wird über eine Bildaufnahmeoptik 1 , die neben der Abbildungsoptik einen Strahlteiler für die Lichtaufteilung enthält, auf die Bildinhaltssensoren 2 und auf einen (oder mehrere) Bewegungssensor(en) 3 abgebildet. Die Bildinhaltssensoren 2, bei welchen es sich beispielsweise um drei Sensoren mit 1250 Zeilen, 25 Hz Bildwechselfrequenz und zeilensprungfreier Bildabtastung für die drei Farbauszüge Rot, Grün und Blau handelt, liefern das entsprechende örtlich hochauflösende Bildsignal an den Ausgang A1 für die Übertragung, Aufzeichnung oder Weiterverarbeitung.
Der Bewegungssensor 3 tastet die Abbildung der Szene mit im Vergleich zum Bildinhaltssensor erhöhter zeitlicher Auflösung und reduzierter örtlicher Auflösung ab. Das entsprechende Bildsignal, das beispielweise nur Luminanzinformationen mit gleicher Signalbandbreite und ein Format von 625 Zeilen, 100 Hz Bildwechself equenz und zeilensprungfreier Bildabtastung umfaßt, wird einem Schaltungsblock 4 zur Ermittlung von Bewegungsinformationen zugeführt. Die Bewegungsmessung im Schaltungsblock 4, bei der beispielsweise eine differentielle Meßmethode verwendet wird, wie sie in der Zeitschrift Signal Processing: Image Com unication 2 (1990), S. 69 ff. oder der Zeitschrift Proceedings of the IEEE, VOL. 73, No . 4, April 1985, S. 523 ff. beschrieben ist, kann die im Vergleich zum Bildsignal des Ausgangs A1 zusätzlichen Bewegungsphasen als Bestimmungskriterium nutzen. Darüber hinaus kann auch das von den Bildsensoren 2 dem Schaltungsblock 4 zugeführte, örtlich hochauflösende Bildsignal bei der Bewegungsmessung 4 verwendet werden, um beispielsweise ein bildpunktgenaues Bewegungsvektorf ld zu erzeugen.
Insgesamt steht somit am Ausgang eine Bewegtbildbeschreibung in Form eines örtlich hochaufgelösten Bildsignals am Ausgang A1 (beispielsweise 1 50Z/25Hz/1 : 1 ) und zusätzlichen Bewegungsinformationen am Ausgang A2 (beispielsweise ein bildpunktgenaues Bewegungsvektorfeld) zur Verfügung. Eine solche Bewegtbildbeschreibung ist geeignet zur beliebigen Zwischenbildinterpolation mittels bewegungsinformationsgestützter Signalverarbeitung. So ist eine direkte bewegungsinfor ationsgestützte Interpolation von Bildsequenzen in verschiedenen HDTV-Studiostandards, wie dem europäischen 1250Z/50Hz/2: 1 bzw. 1250Z/50Hz/1.- 1 , dem japanischen 1125Z/60Hz/2: 1 und dem in Amerika möglichen 1050Z/59.94Hz/2: 1 Studiostandard, ebenso wie in die derzeit verbreiteten TV-Studiostandards möglich.
Auch ist eine direkte Erzeugung von Sequenzen für verschiedene Übertragungsstandards wie PAL, D2-MAC, HD-MAC und digitale Standards möglich, wobei den bei HD-MAC-Codern und bei digitalen Codecs benötigten Bewegungsinformationen die mittels des beanspruchten Verfahrens erhöhte Zuverlässigkeit und Genauigkeit der Bewegungsinformationen zugute kommt.
Die Figur 2 zeigt ein Blockschaltbild eines Bildaufnahmeszenarios, bei dem die Erfindung verwendet ist.
Neben der direkten Erzeugung von verschiedenen Studiostandards und Übertragungsstandards ausgehend von der beschriebenen Bewegtbildbeschreibung mit beispielsweise 1250-zeiligen, progressiven,
25 Hz-Bildern und Bewegungsinformationen ist auch eine direkte Erzeugung von Sequenzen in großflächenflimmerfreien Wiedergabenormen (z.B. 100 Hz
Bildwechselfrequenz) und von Zeitlupensequenzen mit
Bildern korrekter Bewegungsphase möglich.
Gemäß einer vorteilhaften Ausgestaltung kann auch bei einer solchen Bewegtbildbeschreibung eine effektive bewegungsinformationsgestützte Rauschreduktion mittels zeitlicher Filterung in Bewegungsrichtung direkt nach der Aufnahme erfolgen, was insbesondere für HDTV-Signale wegen der erhöhten Signalbandbreite und damit erhöhten Rauschstörungen vorteilhaft ist.
Als weiterer Vorteil einer solchen Bewegtbildbeschreibung mit Bildern und geeignet erzeugter Bewegungsinformation ist eine Art Überstandard-Eigenschaft erkennbar: Sequenzen in beliebigen Fernsehnormen können auf der Basis einer solchen Bewegtbildbeschreibung direkt erzeugt werden.
Eine nach dem beanspruchten Verfahren konstruierte Kamera erzeugt somit eine Art übergeordnete (Überstandard-) Bewegtbildbeschreibung.
Bei dem in Figur 2 dargestellten Beispiel mit 1250-zeiligen, progressiven 25 Hz-Bildern ist darüber hinaus ein direkter Austausch mit dem weltweit anerkannten Austauschstandard für hochauflösende Bilder, dem 35mm Kinofilm mit 24/25 Hz-Bildern, möglich. Beim Verfahren nach der Erfindung wird folglich die Bewegungsinformation nicht, wie beim Stand der Technik, nur aus dem aufnahmeseitigen Bildsignal, dessen Bildwechselfrequenz gleich oder höher als die zu übertragene Bildwechselfrequenz sein kann, ermittelt, sondern zusätzlich (oder ausschließlich) aus dem aufnahmeseitigen Signal eines (oder mehrerer) Bildaufnahmesensors als Bewegungssensor mit reduzierter Orts- und erhöhter zeitlicher Auflösung im Vergleich zum Bildsignal.
Zur Verdeutlichung der Reduktion von zeitlichem Alias beim beanspruchten Bildaufnahmeverfahren im Vergleich zu herkömmlichen Bildaufnahmeverfahren sind in Figur 3 Diagramme dargestellt.
Der Vergleich wird beispielhaft geführt für Bildaufnahmesensoren mit einer einheitlichen Bandbreite, die einem progressiven Abtaststandard von 1250 Zeilen und 25 Hz Bildwechselfrequenz entspricht.
Der eindeutig bestimmbare Geschwindigkeitsbereich eines Bildinhaltes mit einer Ortsfrequenz fx ist bei einem zeitlichen Abtastabstand von der Bilddauer T _D_> gegeben durch
0 <. |vχ| < 1/(2Tß) (1/fX)
Nimmt man für einen Vergleich eine maximal sinnvoll darstellbare Geschwindigkeit von einer Bildweite pro Sekunde für ein konventionelles TV-System an, so entspricht dies beim konventionellen TV-System mit einem Bildseitenverhältnis von 4:3 sowie einem Betrachtungsabstand von 4H einer Winkelgeschwindigkeit von 18,92°/sec. Setzt man in einem ersten Ansatz bei einem HDTV-System die gleiche maximal sinnvolle Winkelgeschwindigkeit des betrachtenden menschlichen Auges an, so ergibt sich also eine in dem Vergleich zu berücksichtigende maximale Geschwindigkeit von etwa 20°/sec.
Ein HDTV-System mit einem Bildseitenverhältnis von 16:9 und einem reduzierten Betrachtungsabstand von 2H besitzt einen Betrachtungswinkel von 47,92°. Wird die im CCIR vorgeschlagene Anzahl von 1920 Bildpunkten pro Zeile angesetzt, so ist von einer maximalen Ortsauflösung von etwa 20 / (LP=Linienpaare) auszugehen.
Die in Figur 3a gezeigte Kurve gibt für einen progressiven Abtaststandard mit 25 Hz Bildwechselfrequenz, der nur Bildinhaltssensoren verwendet (Kinofilm-Standard) , die maximal eindeutig bestimmbare Geschwindigkeit v in°/sec in Abhängigkeit von der im Meßbereich gegebenen Ortsfrequenz fx in TP/ an. Der entsprechend dem für die Geschwindigkeit und die Ortsauflösung angesetzten sinnvollen Maximalwert relevante Geschwindigkeits-/Ortsfrequenz-Bereich, in dem eine eindeutige Geschwindigkeitsmessung erreichbar ist, ist schraffiert dargestellt.
Wird nun entsprechend dem beanspruchten Verfahren neben den Bildinhaltssensoren ein zusätzlicher Bewegungssensor beispielsweise gleicher Signalbandbreite verwendet, so vergrößert sich der eindeutig meßbare Geschwindigkeits-/Ortsfrequenzbereich erheblich. Figur 3b zeigt dies am Beispiel eines zusätzlichen Bewegungssensors mit im Vergleich zu den Bildinhaltssensoren halbierter Horizontalfrequenz, um den Faktor 4 reduzierter Vertikalfrequenz, aber bis 'um den Faktor 8 erhöhter zeitlicher Auflösung (200 Hz).
In horizontaler Richtung sind bis zur halben örtlichen Grenzfrequenz und in vertikaler Richtung bis zu einem Viertel der örtlichen Grenzfrequenz jeweils um das 8-fache höhere Geschwindigkeiten eindeutig bestimmbar. Der schraffierte Bereich zeigt nur die Verbesserung für Geschwindigkeiten unterhalb der als sinnvoll angenommenen maximalen Geschwindigkeit.
Im folgenden werden zwei Ausführungsformen für den erforderlichen optischen Strahlteiler beschrieben.
Die Szene soll entsprechend dem beanspruchten Verfahren beispielsweise mit drei örtlich hochauflösenden und zeitlich niedrig auflösenden Sensoren für die drei Farbauszüge Rot, Grün und Blau sowie gleichzeitig mit einem Bildaufnahmesensor hoher Zeitauflösung und geringerer Ortsauflösung aufgenommen werden. Die ersten drei der Sensoren liefern das farbige Bildsignal (Bildinhaltεsensoren) , während vom Luminanzsignal des vierten Sensors die Bewegungsinformationen abgeleitet werden sollen (Bewegungsseήsor) . Da die Bildaufnahme mit einem einzelnen Objektiv erfolgen soll, ist eine Aufspaltung des Lichts in vier Anteile erforderlich. Dazu gibt es beispielsweise die beiden folgenden Möglichkeite : 1. Ausspiegelung eines Teils des einfallenden Lichts innerhalb des Objektivs und Abbildung dieses Lichtanteils der Szene auf dem am Objektiv separat angebrachten Bewegungssensor; hinter dem Objektiv Aufspaltung des verbleibenden Lichts in die drei Farbkomponenten mittels eines üblichen Strahlteilers in der Farbkamera und Abbildung dieser Farbanteile auf die Bildinhaltssensoren in der Kamera.
2. Lichtteilung komplett in der Kamera mittels eines Strahlteilers mit vier optischen Ausgängen; davon ein Ausgang mit weißem Licht für den Bewegungssensor und je ein Ausgang für jeden der drei Farbauszüge (Bildinhaltssensoren) .
Die Figur 4 zeigt die erste der beiden Möglichkeiten:
Die Aufspaltung des einfallenden Lichts erfolgt im Objektiv der Kamera. Das Objektiv besteht im allgemeinen aus mehreren Teilen: Einem Frontteil, einem mehrstufigen Varioteil (bei Zoomobjektiven) und einem Grundobjektiv, welches die Abbildung auf die Kamerasensoren durchführt. Die Blende befindet sich zwischen dem Varioteil und dem Grundobjektiv.
Zur Abbildung der Szene auf dem Bewegungssensor wird zwischen Blende und Grundobjektiv ein Strahlteilerprisma eingefügt. Es spiegelt einen Teil des einfallenden Lichts im Winkel von 45 Grad aus dem Strahlengang des Objektivs aus. Dieser reflektierte Anteil des Lichts wird über ein zweites, an das Format des Bewegungssensors angepaßtes Grundobjektiv auf dem Bewegungssensor abgebildet. Das durchgelassene Licht wird vom Grundobjektiv über den Strahlteiler mit drei Ausgängen auf den Bildinhaltssensoren abgebildet.
Die Ausspiegelung kann grundsätzlich auch an einer anderen als im obigen Beispiel beschriebenen Stelle "des Objektivs erfolgen.
Erfolgt die Ausspiegelung - wie im Beispiel oben beschrieben - zwischen Blende und Grundobjektiv, dann ergeben sich folgende Vorteile:
- Es ist nur eine Blende notwendig, die die
Beleuchtungsstärke auf allen Sensoren bestimmt.
Objektive, die für den Einsatz eines Prüfprojektors oder Range-Extenders (Ausweitung des Zoombereiches) vorgesehen sind, haben an dieser Stelle des Objektivs bereits Platz zum Einbau des Teilerprismas . Dieses bietet Vorteile bei der Konstruktion des Objektivs aufbauend auf bereits vorhandenen Systemkomponenten. Es ist dann nur die Verschiebung des Grundobjektivs erforderlich, um den Glasweg des Teilerprismas auszugleichen.
Die Ausspiegelung kann in einem anderen Winkel erfolgen, um die Kompaktheit des Objektivs zu erhöhen.
Die Ausspiegelung kann alternativ auch mit einem Spiegel anstelle eines Prismas durchgeführt werden. Dies führt jedoch zu verstärktem Astigmatismus bei der Abbildung auf dem Bewegungssensor und auf den Bildsensoren.
Die Figur 5 zeigt die zweite der beiden Möglichkeiten:
Die Aufspaltung des Lichts erfolgt komplett hinter dem Objektiv in der Kamera. In Erweiterung einer herkömmlichen Farbkamera mit drei Bildsensoren ist hierbei ein weiterer Sensor in der Kamera für die Ableitung der Bewegungsinformation vorhanden. Ein optischer Strahlteiler mit vier Ausgängen versorgt die vier Sensoren mit dem Licht der Szene.
Die Aufspaltung des Lichts wird von dichroitischen Spiegelschichten durchgeführt. Die erste Spiegelschicht trennt einen Teil des einfallenden weißen Lichts ab. Dieses Licht bildet die Szene auf dem Bewegungssensor ab. Das vom ersten Spiegel durchgelassene Licht wird nun in die drei Farbkomponenten aufgetrennt. Dazu kann zuerst die Blaukomponente und anschließend die Rotkomponente ausgespiegelt werden. Es verbleibt das grüne Licht für den grünen Bildinhaltssensor. Die Aufspaltung in die Farbkomponenten kann auch in anderer Reihenfolge erfolgen.
Die Ausspiegelung kann grundsätzlich ebenfalls auf verschiedene Weise realisiert werden:
Die Aufspaltung kann mit diskreten, dichroitischen Spiegeln erfolgen. Dabei ist je nach verwendeten Sensoren (Röhren oder CCD-Sensoren) eine Zwischenabbildung notwendig. Es kann ein kompakter Prismenstrahlteiler eingesetzt werden. Wie beim herkömmlichen Prismenteiler mit drei Ausgängen werden die Spiegelschichten auf Glasprismen aufgedampft. Durch diesen Aufbau ist ein sehr kompakter Strahlteiler realisierbar. Dieses bietet sich insbesondere beim Einsatz von CCD-Bildsensoren an.
Die Figur 6 zeigt eine Skizze zum prinzipiellen Aufbau eines Prismenstrahlteilers mit vier Ausgängen.
Grundsätzlich können für das Konzept einer Kamera mit vier Bildaufnahmesensoren sowohl Bildaufnahmeröhren als auch Halbleiterbildaufnehmer eingesetzt werden. Zu beachten ist allerdings, daß sowohl für die Ermittlung von Bewegungsinformation aus dem zeitlich hochfrequenten Bildsignal scharfe Einzelbilder, als auch zur Interpolation basierend auf dem zeitlich niederfrequenten, örtlich hochauflösenden Bildsignal scharfe Einzelbilder wünschenswert sind.
Dies kann bei beiden Sensortypen beispielsweise durch eine mechanische Verschlußblende erreicht werden. Da allerdings der Bewegungssensor mit einer anderen Bildwechselfrequenz arbeitet als die Bildinhaltssensoren, sind zwei Verschlußblenden notwendig, die mit unterschiedlicher Umlaufgeschwindigkeit betrieben werden. Eine Umlaufblende befindet sich im Strahlengang des Bewegungssensors, die andere vor der Aufspaltung in die Farbkomponenten. Dies läßt sich bei der Strahlteilung im Objektiv und bei der Teilung über diskrete. dichroitische Spiegel in der Kamera durchführen, nicht aber beim Einsatz eines Prismenstrahlteilers.
Werden Halbleiterbildaufnehmer (z.B. CCD-Sensoren) eingesetzt, vereinfacht sich der Aufbau. Da bei diesen die Möglichkeit der elektronischen
Verschlußzeitregelung besteht, sind keine zusätzlichen mechanischen Umlaufblenden notwendig. Die Verschlußzeiten (Integrationszeiten) aller Sensoren sind damit unabhängig voneinander einstellbar. Somit ist auch das Konzept einer Strahlteilung über einen Prismenblock realisierbar.
Eine weitere Ausführungsform besteht darin, unterschiedliche Sensortypen zu verwenden. So könnte beispielsweise ein Halbleiter-Bewegungssensor die Bewegungsinformation für eine örtlich hochauflösende Röhrenkamera liefern.
Aufgrund der im Vergleich zu den Bildinhaltssensoren geringeren örtlichen Auflösung des Bewegungssensors kommt es bei geringeren Ortsfrequenzen im Bild zu Aliasfehlern bei der Abtastung durch den Bewegungssensor. Dies tritt bei Rohrenbildaufnehmern in vertikaler Richtung durch die zeilenweise Abtastung und bei Halbleiterbildaufnehmern vertikal und horizontal infolge der zweidimensionalen Abtastung auf. Je nach Genauigkeitsan orderungen an die Bewegungsmessung kann sich dieses störend auswirken.
Zur Reduzierung dieser örtlichen Aliasfehler wird bei einer vorteilhaften Weiterbildung der Erfindung der Bewegungssensor nicht exakt in der Schärfeebene der Abbildung positioniert. Die unscharfe Abbildung bewirkt eine Tiefpassfilterung des Bildsignals. Da das nun erzeugte Abbild weniger hochfrequente Anteile enthält, treten weniger Aliasstörungen auf.
Alternativ dazu kann die Reduzierung der örtlichen Aliasfehler mit einer doppelbrechenden Quarzscheibe durchgeführt werden, deren optische Achse um 45 Grad geneigt ist. Das einfallende Licht wird dabei in zwei Anteile aufgespalten und beide Anteile gegeneinander versetzt auf dem Aufnahmesensor abgebildet. Durch Kaskadierung mehrerer Filterscheiben unterschiedlicher Dicke kann die Modulationsübertragungsfunktion des Vorfilters variiert werden. Die Orientierung der Filterscheiben legt die Filterrichtung (horizontal, vertikal, diagonal) fest. Im Gegensatz zur oben beschriebenen Möglichkeit kann hier die Unscharfe gezielt herbeigeführt werden. Durch die Filterung mit doppelbrechenden Quarzscheiben werden hochfrequente Ortsfrequenzen gedämpft und die Abtastung führt zu geringeren Aliasstörungen.
Gemäß einer weiteren vorteilhaften Weiterbildung der Erfindung kann bei der Ermittlung von Bewegungsinformation, beispielsweise in Form von Bewegungsvektorfeldern die Messung der Objektgeschwindigkeit nach einer Eckendetektion an den Ecken von bewegten Strukturen durchgeführt werden. Hierdurch kann in einem kleinen örtlich-zeitlichen Meßbereich die korrekte Objektverschiebung gemessen werden, im Gegensatz zur Messung an einer Strukturkante, wo nur die zum Kantenverlauf senkrechte Verschiebungskomponente eindeutig meßbar ist.
Aufgrund des reduzierten zeitlichen Alias bei der Bewegtbildabtastung ergibt sich eine, erhöhte Zuverlässigkeit der Bewegungsvektorfelder. Rauscheinflüsse können jedoch auch weiterhin zu vereinzelt falschen Bewegungsvektoren führen. Zur Homogenisierung der Vektorfelder, die entsprechend zu reduzierten Datenraten führt, eignet sich neben einer Medianfilterung insbesondere auch eine zweidimensionale Häufigkeitsfilterung der Bewegungsvektorfelder. Diese zeichnet sich dadurch aus, daß sie zum einen rekursiv und zum anderen bedingt (d.h. nur wenn der häufigste Vektor auch ein gutes Matchergebnis liefert, wird er zugeordnet) durchgeführt wird. Durch die Rekursivität wird eine erhöhte Homogenität der Vektorfelder erreicht. Die Bedingtheit der Filterung garantiert, daß die Bewegungsvektoren von sehr kleinen bewegten Objekten nicht weggefiltert werden.
Wird bei der Ermittlung der Bewegungsvektoren in Ortsbereichen konstanter Helligkeit innerhalb eines bewegten Objektes der Nullvektor als Bewegungsinformation ermittelt, dann erfolgt eine Nachverarbeitung derart, daß der Nullvektor durch angrenzende Verschiebungsvektoren, die ungleich dem Nu.llvekt.or sind, ersetzt wird, falls der Ersatzvektor ebenfalls ein gutes Matchergebnis liefert, d.h. die Bewegung des Betrachteten Bildbereiches gut beschreiben kann. Dies hat den Vorteil, daß die Vektorfelder homogener werden, d.h. größere Bereiche einheitlicher Bewegungsin ormation entstehen, und damit eine größere Datenreduktion bei der Codierung der Bewegungsinforma¬ tion erreicht werden kann. Eine vorteilhafte Anwendung des beanspruchten Verfahrens liegt bei einem sog. Chromakey-Mixer. Dabei kann die erzeugte Bewegungsinformation als zusätzliches Bestimmungskriterium für die Segmentierung in Vordergrund-Objekt und ruhendem Hintergrund verwendet werden, um das inkorrekte Einblenden des Hintergrundbildes in Bereiche des Vordergrund-Objektes an den Stellen zu verhindern, an denen die Farbe des Vordergrund-Objektes ähnlich der Key-Farbe ist.
Eine weitere vorteilhafte Ausgestaltung des beanspruch¬ ten Verfahrens liegt in der Verwendung des vorstehend beschriebenen hierarchischen Sensorkonzep¬ tes ( örtlich hoch-/ zeitlich niedrigaufgelöst und zeitlich hoch-/ örtlich niedrigaufgelöst ) im Rahmen eines hierarchischen Verfahrens zur Bewegungsmessung, wie es im Tagungsband "Proceedings of the Fourth International Workshop on HDTV and beyond ( Chupeau : Multiscale Motion Estimation ), Turin, Sept.1991, beschrieben ist. Bei diesem Verfahren wird die Messung in mehreren, hierarchisch aufgebauten Stufen unter¬ schiedlicher Ortsauflösungen durchgeführt, um den Anteil von Falschmessungen infolge von zeitlichem Alias zu reduzieren.

Claims

PATENTANSPRÜCHE 1. Verfahren zur Aufnahme von Bewegtbildern für eine bewegungsinformationsgestützte Signalverarbeitung unter Verwendung von Bildaufnahmesensoren als Bildinhaltssensoren, d a d u r c h g e k e n n z e i c h n e t, daß ein weiterer Bildaufnahmesensor vorgesehen ist, der als Bewegungssensor verwendet wird und im Vergleich zu den Bildinhaltssensoren eine erhöhte Bildwechselfrequenz aufweist, und daß das Ausgangssignal des weiteren Bildaufnahmesensors für die Ermittlung von Bewegungsinformation verwendet wird.
2. Verfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, daß der Bewegungssensor im Vergleich zu den Bildinhaltssensoren eine reduzierte Ortsauflösung hat.
3. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß zur Ermittlung von Bewegungsinformation neben dem Signal des Bewegungssensors auch das örtlich hoch¬ auflösende Signal der Bildinhaltssensoren im Sinne einer Feinkorrektur verwendet wird.
4. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß es im Rahmen eines hierarchischen Bewegungsme߬ verfahrens, bei dem in mehreren, hierarchisch aufge¬ bauten Stufen unterschiedlicher Ortsauflösung gemessen wird, verwendet wird.
5. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß mehrere Bewegungssensoren für verschiedene Farbauszüge vorgesehen sind, deren Signale für die Ermittlung von BewegungsInformation verwendet werden.
6. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß die Aufteilung des Lichtstrahles auf Bildinhaltssensoren und Bewegungssensoren mittels einer Ausspiegelung innerhalb des Objektives erfolgt und der Bewegungssensor am oder im Objektiv angebracht ist.
7.Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß die Aufteilung des Lichtstrahles auf Bildinhaltssensoren und Bewegungssensoren mittels eines Strahlteilers mit mehreren optischen Ausgängen außerhalb des Objektivs im Kamerakopf erfolgt.
8. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß im optischen Strahlengang für den Bewegungssensor vor der Abtastung eine optische Vorfilterung im Ortsbereich zur Reduktion von Aliasstörungen durchgeführt wird.
9. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß bei der Ermittlung der Bewegungsinformation eine Eckendetektion und eine gezielte
Geschwindigkeitsmessung an Objektecken durchgeführt wird.
10. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß bei der Erzeugung der Bewegungsinformation Bewegungsvektorfelder ermittelt werden und diese Bewegungsvektorfelder durch eine rekursive Häufigkeitsfilterung nachverarbeitet werden, wobei der häufigste Vektor nur zugeordnet wird, wenn er auch ein gutes Matchergebnis liefert.
11. Verf hren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß in Ortsbereichen konstanter Helligkeit innerhalb eines bewegten Objektes, in dem entsprechend der Nullvektor zugeordnet wurde, in der Weise eine Nachverarbeitung der Vektorfelder erfolgt, daß der Nullvektor durch angrenzende Verschiebungsvektoren, die ungleich dem Nullvektor sind, ersetzt wird, wenn der Ersatzvektor ebenfalls ein gutes Matchergebnis liefert.
12. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß die erzeugte Bewegungsinformation bei einem Chromakey-Mixer als zusätzliches Bestimmungskriterium für die Segmentierung in Vordergrund-Objekt und ruhenden Hintergrund verwendet wird, um das inkorrekte Einblenden des Hintergrundbildes in Bereiche des Vordergrund-Objektes an den Stellen zu verhindern, in denen die Farbe des Vordergrund-Objektes ähnlich der Key-Farbe ist.
PCT/EP1992/002221 1991-09-27 1992-09-25 Bewertung von bewegungen in von videokameras aufgenommenen szenen WO1993006689A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP92920654A EP0605588B1 (de) 1991-09-27 1992-09-25 AUFNAHME VON BEWEGTBILDERN MIT BILDSENSOR UND BEWEGUNGSSENSOR MIT ERHöHTER BILDWECHSELFREQUENZ
DE59208140T DE59208140D1 (de) 1991-09-27 1992-09-25 AUFNAHME VON BEWEGTBILDERN MIT BILDSENSOR UND BEWEGUNGSSENSOR MIT ERHöHTER BILDWECHSELFREQUENZ

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE4132359A DE4132359A1 (de) 1991-09-27 1991-09-27 Verfahren zur aufnahme von bewegtbildern fuer eine nachfolgende, bewegungsinformationsgestuetzte signalverarbeitung
DEP4132359.9 1991-09-27

Publications (1)

Publication Number Publication Date
WO1993006689A1 true WO1993006689A1 (de) 1993-04-01

Family

ID=6441704

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP1992/002221 WO1993006689A1 (de) 1991-09-27 1992-09-25 Bewertung von bewegungen in von videokameras aufgenommenen szenen

Country Status (3)

Country Link
EP (1) EP0605588B1 (de)
DE (2) DE4132359A1 (de)
WO (1) WO1993006689A1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2354656A (en) * 1999-06-22 2001-03-28 Snell & Wilcox Ltd Electronic capture of moving images
JP2001266158A (ja) * 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体
DE10043961C2 (de) * 2000-09-06 2003-03-27 Fraunhofer Ges Forschung Kombinierte Standard-Video- und High-Speed-Kamera
GB2393060B (en) * 2002-09-12 2006-01-25 Snell & Wilcox Ltd Manipulation of video compression

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0435319A1 (de) * 1989-12-28 1991-07-03 Olympus Optical Co., Ltd. Kamera mit Driftdetektor
US5041852A (en) * 1990-10-18 1991-08-20 Fjui Photo Film Co., Ltd. Camera shake correction system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0435319A1 (de) * 1989-12-28 1991-07-03 Olympus Optical Co., Ltd. Kamera mit Driftdetektor
US5041852A (en) * 1990-10-18 1991-08-20 Fjui Photo Film Co., Ltd. Camera shake correction system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PATENT ABSTRACTS OF JAPAN vol. 14, no. 557 (E-1011)21. September 1990 & JP,A,22 39 781 ( FUJI PHOTO FILM CO. LTD. ) 11. Dezember 1990 *
PATENT ABSTRACTS OF JAPAN vol. 8, no. 39 (E-228)(1476) 21. Februar 1984 & JP,A,58 197 972 ( HITACHI SEISAKUSHO K.K. ) 17. November 1983 *

Also Published As

Publication number Publication date
EP0605588B1 (de) 1997-03-05
DE4132359A1 (de) 1993-04-01
EP0605588A1 (de) 1994-07-13
DE59208140D1 (de) 1997-04-10

Similar Documents

Publication Publication Date Title
DE2619027C2 (de) Fernsehaufnahmesystem
EP2565860A1 (de) Vorrichtung und Verfahren zum Erkennen von Fahrzeug-Kennzeichentafeln
DE3233882A1 (de) System zur fernsehmaessigen uebertragung
DE3017658C2 (de)
DE3239404A1 (de) Umcodierbares, hochaufloesendes fernsehsystem mit vertikalabtastung und umcodiereinrichtung sowie empfaenger hierfuer
EP0796537A1 (de) Bildtransferverfahren und -vorrichtung
EP0162311A2 (de) Steuerschaltung für eine Videokamera und Verfahren zum Steuern einer Videokamera
DE19536691B4 (de) Verfahren und Anordnung zur Korrektur von Bildstandsfehlern bei der fernsehmäßigen Filmabtastung
DE2836582A1 (de) Fernsehkamera
DE3833823C1 (de)
EP0605588B1 (de) AUFNAHME VON BEWEGTBILDERN MIT BILDSENSOR UND BEWEGUNGSSENSOR MIT ERHöHTER BILDWECHSELFREQUENZ
DE3415685C2 (de)
DE3936935C1 (de)
DE2856804A1 (de) Anordnung zur darstellung kinematographischer filme durch ein fernsehgeraet
DE3444836A1 (de) Verfahren zur umwandlung eines videosignals
EP1317853B1 (de) Kombinierte standard-video- und high-speed-kamera
DE3341298C2 (de)
EP0370500B1 (de) Schaltungsanordnung zur Umsteuerung zwischen verschiedenen Flimmerreduktionsverfahren in einem Fernsehempfänger
EP1584184B1 (de) Verfahren zum verarbeiten von aus einem filmaufnahmestrahlengang einer laufbildkamera abgezweigten filmbildern
DE4327733C1 (de) Bewegungsdetektor
DE2333587C3 (de) Verfahren und Gerät zum Aufzeichnen von Videobildern auf einem kinematographischen Film
EP0765077B1 (de) Verfahren, Vorrichtung und Zusatzeinrichtung zum Vermeiden des Helligkeitsflimmerns eines aus einer Filmkamera ausgespiegelten Video-Bildes
DE3442890A1 (de) Fernsehschaltungsanordnung fuer eine bildflimmerkorrektur
EP0682453A2 (de) Bildaufnahme- und Wiedergabesystem
EP0442404B1 (de) Verfahren zur Ermittlung von Bewegungsinformationen aus Bildsignalen

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FR GB GR IE IT LU MC NL SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 1992920654

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1992920654

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 1992920654

Country of ref document: EP