DE102018113822A1 - Converting an image stream with stereoscopic image content - Google Patents
Converting an image stream with stereoscopic image content Download PDFInfo
- Publication number
- DE102018113822A1 DE102018113822A1 DE102018113822.9A DE102018113822A DE102018113822A1 DE 102018113822 A1 DE102018113822 A1 DE 102018113822A1 DE 102018113822 A DE102018113822 A DE 102018113822A DE 102018113822 A1 DE102018113822 A1 DE 102018113822A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- image data
- stream
- format
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012856 packing Methods 0.000 description 15
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 8
- 229920001817 Agar Polymers 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/139—Format conversion, e.g. of frame-rate or size
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2213/00—Details of stereoscopic systems
- H04N2213/007—Aspects relating to detection of stereoscopic image format, e.g. for adaptation to the display format
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
Verfahren zum Konvertieren eines Quell-Bildstroms (10), der Bilddaten in einem stereoskopischen Format enthält, in einen Ziel-Bildstrom (20), der Bilder (22) in einem vorgegebenen stereoskopischen Format aufweist, wobei die Bilder (22) jeweils ein links-Teilbild (26) für ein linkes Auge und ein rechts-Teilbild (28) für ein rechtes Auge umfassen, wobei das Verfahren die Schritte umfasst: Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms (10) basierend auf Bildinhalten der Bilddaten; Entnehmen von links-Teilbildern (16) für ein linkes Auge und rechts-Teilbildern (18) für ein rechtes Auge aus Bilddaten des Quell-Bildstroms (10), wobei diese Bilddaten des Quell-Bildstroms (10) gemäß dem erkannten stereoskopischen Format interpretiert werden; Erzeugen von Bildern (22) des Ziel-Bildstroms (20) im vorgegebenen stereoskopischen Format unter Einbeziehung der entnommenen links-Teilbilder (16) und rechts-Teilbilder (18); sowie Vorrichtung zur Durchführung des Verfahrens.A method of converting a source image stream (10) containing image data in a stereoscopic format into a target image stream (20) having images (22) in a predetermined stereoscopic format, each image (22) being left-aligned. Comprising a left eye and right field partial image (26) for a right eye, the method comprising the steps of: recognizing a stereoscopic format of image data of the source image stream (10) based on image contents of the image data; Taking left-hand sub-images (16) for a left eye and right-field images (18) for a right eye from image data of the source image stream (10), said image data of the source image stream (10) being interpreted according to the recognized stereoscopic format ; Generating images (22) of the target image stream (20) in the predetermined stereoscopic format, including the extracted left fields (16) and right fields (18); and device for carrying out the method.
Description
Die Erfindung betrifft ein Verfahren sowie eine Vorrichtung zum Konvertieren eines Quell-Bildstroms in einen Ziel-Bildstrom.The invention relates to a method and a device for converting a source image stream into a destination image stream.
Der eingehende Bildstrom eines 3D-Fernsehers enthält bei einem Bildstrom in einem stereoskopischen Format in der Regel separate Teilbilder für das linke Auge und für das rechte Auge eines Betrachters. Der 3D-Fernseher erzeugt daraus eine stereoskopische 3D-Wiedergabe, z.B. mittels abwechselnder Anzeige der Teilbilder für das linke Auge und für das rechte Auge und entsprechender Taktung einer Shutterbrille. Beispielsweise sind im HDMI (High Definition Multimedia Interface) Schnittstellenstandard in der HDMI Version 1.4a unter anderem drei Übertragungsformate definiert, die ein dem Standard entsprechender Fernseher entgegennehmen können muss: ein Frame Packing 3D-Videoformat, das einen Rahmenbereich definiert, der ein Teilbild für ein linkes Auge und ein Teilbild für ein rechtes Auge übereinander sowie aktiven Leerraum („active space“) zur Trennung der Teilbilder enthält; ein Side-by-Side (Half) 3D-Videoformat, das einen Rahmenbereich entsprechend einem Standard 2D Rahmen definiert, der horizontal um den Faktor 2 gestauchte Teilbilder für ein linkes Auge und ein rechtes Auge nebeneinander enthält; und ein Top-and-Bottom (Half) 3D-Videoformat, das einen Rahmenbereich entsprechend einem Standard 2D Rahmen definiert, der vertikal um den Faktor 2 gestauchte Teilbilder für ein linkes Auge und ein rechtes Auge übereinander enthält. Information, welches Übertragungsformat verwendet wird, kann über Metadaten in Form von 3D-InfoFrame-Datenpaketen übermittelt werden.The incoming image stream of a 3D television usually contains separate partial images for the left eye and for the right eye of an observer in the case of an image stream in a stereoscopic format. The 3D television generates therefrom a stereoscopic 3D reproduction, e.g. by alternately displaying the partial images for the left eye and for the right eye and corresponding timing of a shutter glasses. For example, in the HDMI (High Definition Multimedia Interface) interface standard in the HDMI version 1.4a, there are, among other things, defined three transmission formats that a standard television must be able to handle: a
Wird ein Bildstrom von einer Bildstromquelle nicht in einem für das 3D-Ausgabegerät geeigneten Format ausgegeben, oder sind beispielsweise bei der Bildausgabe eines Computers stereoskopische 3D-Bilder lediglich in einem Fenster einer Benutzeroberfläche in einem 2D-Bildstrom enthalten, so wird eine 3D-Wiedergabe erschwert oder verhindert.If an image stream from an image source is not output in a format suitable for the 3D output device, or if, for example, in the image output of a computer stereoscopic 3D images are contained only in a window of a user interface in a 2D image stream, a 3D reproduction is made more difficult or prevented.
Aufgabe der Erfindung ist es, eine Nutzung eines 3D-Ausgabegeräts, wie beispielsweise eines 3D-Fernsehers oder einer Datenbrille, zur stereoskopischen Wiedergabe von stereoskopischen Bilddaten mit unterschiedlichen stereoskopischen Formaten zu ermöglichen oder zu vereinfachen.The object of the invention is to enable or simplify the use of a 3D output device, such as a 3D television or data glasses, for the stereoscopic reproduction of stereoscopic image data with different stereoscopic formats.
Diese Aufgabe wird erfindungsgemäß gelöst durch ein Verfahren zum Konvertieren eines Quell-Bildstroms, der Bilddaten in einem stereoskopischen Format enthält, in einen Ziel-Bildstrom, der Bilder in einem vorgegebenen stereoskopischen Format aufweist, wobei die Bilder jeweils ein links-Teilbild für ein linkes Auge und ein rechts-Teilbild für ein rechtes Auge umfassen, wobei das Verfahren die Schritte umfasst:
- Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms, basierend auf Bildinhalten der Bilddaten,
- Entnehmen von links-Teilbildern für ein linkes Auge und rechts-Teilbildern für ein rechtes Auge aus Bilddaten des Quell-Bildstroms, wobei diese Bilddaten des Quell-Bildstroms gemäß dem erkannten stereoskopischen Format interpretiert werden,
- Erzeugen von Bildern des Ziel-Bildstroms im vorgegebenen stereoskopischen Format unter Einbeziehung der entnommenen links-Teilbilder und rechts-Teilbilder.
- Recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data,
- Extracting left-field images for a left eye and right-field images for a right eye from image data of the source image stream, this image data of the source image stream being interpreted according to the recognized stereoscopic format,
- Generating images of the target image stream in the predetermined stereoscopic format, including the extracted left fields and right fields.
D.h. die Bilddaten des Quell-Bildstroms werden interpretiert als die links-Teilbilder und die rechts-Teilbilder repräsentierend.That the image data of the source image stream is interpreted as representing the left fields and the right fields.
Somit kann eine Konvertierung eines digitalen Quell-Bildstroms in einen digitalen Ziel-Bildstrom mit einem vorgegebenen stereoskopischen Format der Bilder des Ziel-Bildstroms erfolgen. Der jeweilige Bildstrom umfasst eine Sequenz von Bildern oder Rahmen. Der Ziel-Bildstrom kann separate Datenströme für links-Teilbilder und rechts-Teilbilder umfassen. Der Quell-Bildstrom kann Bild für Bild oder Rahmen für Rahmen entgegengenommen werden. Das Erzeugen von Bildern des Ziel-Bildstroms kann erfolgen, während fortlaufend weitere Bilddaten des Quell-Bildstroms entgegengenommen werden. Vorzugsweise ist die Latenz zwischen dem Entgegennehmen eines Bildes oder eines Rahmens des Quell-Bildstroms und einem Ausgeben eines daraus erzeugten Bildes des Ziel-Bildstroms kleiner als 100 ms, weiter vorzugsweise kleiner als 51 ms, kleiner als 34 ms, oder besonders bevorzugt kleiner als 17 ms.Thus, conversion of a source digital image stream to a destination digital image stream can be done with a predetermined stereoscopic format of the images of the target image stream. The respective image stream comprises a sequence of images or frames. The destination image stream may include separate data streams for left fields and right fields. The source image stream can be received frame by frame or frame by frame. The generation of images of the target image stream can take place while continuously receiving further image data of the source image stream. Preferably, the latency between accepting an image or frame of the source image stream and outputting an image of the target image stream generated therefrom is less than 100 ms, more preferably less than 51 ms, less than 34 ms, or most preferably less than 17 ms.
Das Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms erfolgt anhand von Bildinhalten der Bilddaten, d.h. basierend auf Bildinhalten der Bilddaten. D.h., es kann zumindest auch basierend auf Bildinhalten der Bilddaten erfolgen.The recognition of a stereoscopic format of image data of the source image stream is based on image contents of the image data, i. based on image contents of the image data. That is, at least it may also be based on image contents of the image data.
Dabei werden die Bildinhalte durch die Bilddaten repräsentiert. Unter Bildinhalten werden hier für jeweilige Pixel definierte Inhalte verstanden, die durch die Bilddaten repräsentiert werden. D.h., das Erkennen erfolgt anhand von Bildinhalten in Form von für jeweilige Pixel definierten Inhalten, die durch die Bilddaten repräsentiert werden.The image contents are represented by the image data. Image contents are defined here for respective pixels defined content, which are represented by the image data. That is, the recognition is based on image contents in the form of contents defined for respective pixels represented by the image data.
Beispielsweise kann das Verfahren umfassen:
- Erkennen eines stereoskopischen Formats von ersten Bilddaten des Quell-Bildstroms, basierend auf Bildinhalten der ersten Bilddaten, und
- Entnehmen von links-Teilbildern für ein linkes Auge und rechts-Teilbildern für ein rechtes Auge aus weiteren Bilddaten des Quell-Bildstroms, wobei die weiteren Bilddaten des Quell-Bildstroms gemäß dem erkannten stereoskopischen Format der ersten Bilddaten interpretiert werden.
- Recognizing a stereoscopic format of first image data of the source image stream based on image contents of the first image data, and
- Extracting left-field images for a left eye and right-field images for a right eye from further image data of the source image stream, the further image data of the source image stream being interpreted according to the recognized stereoscopic format of the first image data.
Der Schritt des Erkennens kann auch für neue erste Bilddaten wiederholt werden, um auf einen Wechsel einer Zusammensetzung und/oder des stereoskopischen Formats der Bilddaten des Quell-Bildstroms zu reagieren.The step of recognizing may also be repeated for new first image data to respond to a change in composition and / or the stereoscopic format of the image data of the source image stream.
Vorzugsweise ist wenigstens einer von dem Quell-Bildstrom und dem Ziel-Bildstrom ein digitaler Bildstrom mit aufeinanderfolgenden Rahmen, die Bilder enthalten, beispielsweise ein digitaler Bildstrom gemäß dem HDMI 1.4, HDMI 2.0 oder HDMI 2.1 Standard.Preferably, at least one of the source image stream and the destination image stream is a digital image stream having successive frames containing images, for example, a digital image stream according to the HDMI 1.4, HDMI 2.0 or HDMI 2.1 standard.
Der Quell-Bildstrom ist ein Rastergrafik-Bildstrom. Die Bilddaten des Quell-Bildstroms sind insbesondere Rastergrafik-Bilddaten (oder Bitmap-Bilddaten), d.h. sie können bezeichnet werden als pixelbasierte Bilddaten. Bei dem Ziel-Bildstrom kann es sich ebenfalls um einen Rastergrafik-Bildstrom handeln.The source image stream is a raster graphics image stream. The image data of the source image stream is, in particular, raster graphics image data (or bitmap image data), i. they can be referred to as pixel-based image data. The target image stream may also be a raster graphics image stream.
Unter einem Rahmen (engl.: frame) wird eine Struktur eines Bildsignals verstanden, in welcher in definierter zeitlicher Abfolge Bilddaten zeilenweise enthalten sind. Der Rahmen enthält üblicherweise horizontale Austastlücken und eine vertikale Austastlücke. Ein Rahmenbereich, der zeilenweise aufeinanderfolgend die Bilddaten enthält, entspricht einem x-y-Positionsbereich des Rahmens, wobei y die Zeile angibt und x die Position innerhalb einer Zeile. Bei HDMI-Bildströmen können nicht nur die Bilddaten übertragen werden, sondern es können zusätzliche Informationen in Datenpaketen in den Austastlücken übertragen werden, etwa Audiodaten. In einem HDMI-Bildstrom werden Bilddaten in z.B. drei Kanälen gleichzeitig jeweils in Form eines Bitstroms übertragen.A frame is understood to mean a structure of an image signal in which image data are contained in a defined time sequence. The frame usually contains horizontal blanking intervals and a vertical blanking interval. A frame area containing line by line the image data corresponds to an x-y position area of the frame, where y indicates the line and x indicates the position within a line. In HDMI image streams, not only the image data can be transmitted, but additional information can be transmitted in data packets in the blanking intervals, such as audio data. In an HDMI image stream, image data is stored in e.g. transmit three channels simultaneously in the form of a bit stream.
Das stereoskopische Format von Bilddaten des Quell-Bildstroms kann beispielsweise einer Anordnung von links-Teilbildern und rechts-Teilbildern in den stereoskopischen Bilddaten des Quell-Bildstroms entsprechen oder eine solche Anordnung umfassen. Das vorgegebene stereoskopische Format der Bilder des Ziel-Bildstroms kann beispielsweise einer Anordnung von links-Teilbildern und rechts-Teilbildern in den stereoskopischen Bildern des Ziel-Bildstroms entsprechen oder eine solche Anordnung umfassen.The stereoscopic format of image data of the source image stream may, for example, correspond to or include an arrangement of left field images and right field images in the stereoscopic image data of the source image stream. The predetermined stereoscopic format of the images of the target image stream may correspond, for example, to or include an arrangement of left and middle images in the stereoscopic images of the target image stream.
Das Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten kann beispielsweise das Erkennen einer Anordnung von links-Teilbildern und rechts-Teilbildern in stereoskopischen Bilddaten des Quell-Bildstroms umfassen oder darin bestehen.For example, recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data may include or consist of recognizing an arrangement of left and right sub-images in stereoscopic image data of the source image stream.
Das vorgegebene stereoskopische Format der Bilder des Ziel-Bildstroms kann sich von dem stereoskopischen Format der Bilddaten des Quell-Bildstroms unterscheiden.The predetermined stereoscopic format of the images of the target image stream may differ from the stereoscopic format of the image data of the source image stream.
Beispielsweise kann sich eine Anordnung der links-Teilbilder und rechts-Teilbilder in Bildern des Ziel-Bildstroms unterscheiden von einer Anordnung von links-Teilbildern und rechts-Teilbildern in den stereoskopischen Bilddaten des Quell-Bildstroms, wobei die jeweilige Anordnung umfassen kann: eine Anordnung von links-Teilbild und rechts-Teilbild nebeneinander, eine Anordnung von links-Teilbild und rechts-Teilbild übereinander, eine zeilenweise verschachtelte Anordnung von links-Teilbild und rechts-Teilbild. Die Anordnung von links-Teilbildern und rechts-Teilbildern in den stereoskopischen Bilddaten des Quell-Bildstroms kann auch umfassen: eine Anordnung von links-Teilbild und rechts-Teilbild als Überlagerung, d.h. an gleicher Position in einem Bild, in unterschiedlichen Farben von links-Teilbild und rechts-Teilbild (farb-anaglyphisches Stereobild), eine Anordnung von links-Teilbildern und rechts-Teilbildern an gleicher Position abwechselnd in aufeinanderfolgenden Bildern des Quell-Bildstroms (das frame-interlacing oder frame-interlaced Format, auch bezeichnet als temporal interlacing), und eine Anordnung von links-Teilbild und rechts-Teilbild an gleicher Position in aufeinanderfolgenden Bildern des Quell-Bildstroms, wobei ein Teilbild zu unterschiedlichen Wiedergabezeitpunkten als links-Teilbild und als rechts-Teilbild dient (zur Ausnutzung des Pulfrich-Effektes).For example, an arrangement of the left fields and right fields in images of the target image stream may differ from an arrangement of left fields and right fields in the stereoscopic image data of the source image stream, which arrangement may include: an array of left partial image and right partial image next to each other, an arrangement of left partial image and right partial image one above the other, a line by line nested arrangement of left partial image and right partial image. The arrangement of left fields and right fields in the stereoscopic image data of the source image stream may also include: an arrangement of left field and right field as overlay, i. at the same position in an image, in different colors of the left partial image and the right partial image (color anaglyphic stereo image), an arrangement of left partial images and right partial images at the same position alternately in successive images of the source image current (the frame interlacing or frame-interlaced format, also referred to as temporal interlacing), and an arrangement of left-field and right-field at the same position in successive images of the source image stream, wherein one field at different playback times as left field and as right Partial image serves (to exploit the Pulfrich effect).
Der Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten kann beispielsweise dann durchgeführt werden, wenn Information über ein stereoskopisches Bildformat von Bildern des Quell-Bildstroms nicht aus Metadaten des Quell-Bildstroms ausgelesen werden konnte, wie beispielsweise aus 3D-InfoFrame-Datenpaketen eines 3D-Bildstroms gemäß einem HDMI-Standard.The step of recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data may be performed, for example, when information about a stereoscopic image format of images of the source image stream could not be read from metadata of the source image stream, such as 3D InfoFrame data packets of a 3D image stream according to an HDMI standard.
Beispielsweise kann das Verfahren umfassen:
- Überprüfen des Vorliegens von Information über ein stereoskopisches Bildformat von Bildern des Quell-Bildstroms in Metadaten des Quell-Bildstroms,
- Auslesen der Information über ein stereoskopisches Bildformat von Bildern des Quell-Bildstroms aus Metadaten des Quell-Bildstroms, wenn die Information vorliegt,
- wobei der Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten ausgeführt wird, wenn die Information nicht vorliegt, d.h. wenn Information über ein stereoskopisches Bildformat von Bildern des Quell-Bildstroms nicht aus Metadaten des Quell-Bildstroms ausgelesen werden konnte.
- Checking the presence of information about a stereoscopic image format of images of the source image stream in metadata of the source image stream,
- Reading the information about a stereoscopic image format from images of the source Image stream of metadata of the source image stream, if the information is present
- wherein the step of recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data is carried out when the information is not present, that is, when information about a stereoscopic image format of images of the source image stream is not extracted from metadata of the source image stream could.
In einer oder mehreren Ausführungsformen umfasst das Verfahren:
- Vergleichen einer Bildgröße eines Bildes des Quell-Bildstroms mit unterschiedlichen stereoskopischen Formaten zugeordneten Bildgrößen, wobei beim Vergleichen jeweils überprüft wird, ob eine Vergleichsbedingung für ein einer jeweiligen Bildgröße zugeordnetes stereoskopisches Format erfüllt ist,
- wobei der Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten ausgeführt wird, wenn in dem Schritt des Vergleichens einer Bildgröße eines Bildes des Quell-Bildstroms mit unterschiedlichen stereoskopischen Formaten zugeordneten Bildgrößen keine der jeweiligen Vergleichsbedingungen erfüllt ist. D.h., der Schritt des Erkennens, basierend auf den Bildinhalten, wird durchgeführt, wenn in dem Schritt des Vergleichens der Bildgröße kein stereoskopisches Format von Bildern des Quell-Bildstroms erkannt wurde.
- Comparing an image size of an image of the source image stream with image sizes associated with different stereoscopic formats, wherein in each case it is checked whether a comparison condition for a stereoscopic format assigned to a respective image size is fulfilled,
- wherein the step of recognizing a stereoscopic format of image data of the source image stream is performed based on image contents of the image data if none of the respective comparison conditions is satisfied in the step of comparing an image size of an image of the source image stream with image sizes associated with different stereoscopic formats. That is, the step of recognizing based on the image contents is performed when no stereoscopic format of images of the source image stream has been recognized in the step of comparing the image size.
Beispielsweise können wenigstens folgende Zuordnungen zwischen stereoskopischen Formaten und jeweiligen Bildgrößen mit betreffenden Vergleichsbedingungen vorgenommen werden:
- Bildgröße ist exakt gleich 1920 x 2205 - Frame-Packing 1080p, d.h. links-Teilbild 1920 x 1080 über aktivem Leerraum 1920 x 45 über rechts-Teilbild 1920 x 1080 in einem Bild, entsprechend einem Seitenverhältnis des Bildes von 128/149, gleich etwa 0,87:1;
- Bildgröße ist exakt gleich 1280 x 1470 - Frame-Packing 720p, d.h. links-Teilbild 1280 x 720 über aktivem Leerraum 1280 x 30 über rechts-Teilbild 1280 x 720 in einem Bild, entsprechend einem Seitenverhältnis des Bildes von 128/149, gleich etwa 0,87: 1;
- Bildgröße hat ein Seitenverhältnis größer gleich 2:1, beispielsweise 3840 x 1080, - Side-by-Side-(full), d.h. links-Teilbild und rechts-Teilbild (z.B. beide 1920 x 1080) direkt nebeneinander in einem Bild (ohne horizontale Stauchung);
- Bildgröße hat ein Seitenverhältnis kleiner als 1:1 (außer obige Frame-Packing-Formate), beispielsweise 1920 x 2160 - Top-and-Bottom-(full), d.h. links-Teilbild direkt über rechts-Teilbild in einem Bild (ohne vertikale Stauchung).
- Image size is exactly the same 1920 x 2205 - Frame Packing 1080p, ie left field 1920 x 1080 over active space 1920 x 45 over right field 1920 x 1080 in an image, corresponding to an aspect ratio of the image of 128/149, equal to about 0 , 87: 1;
- Image size is exactly equal to 1280 x 1470 - frame-packing 720p, ie left-field 1280 x 720 over active space 1280 x 30 over right-field 1280 x 720 in one image, corresponding to an aspect ratio of the image of 128/149, equal to about 0 , 87: 1;
- Image size has an aspect ratio greater than or equal to 2: 1, for example 3840 x 1080, - Side-by-Side (full), ie left field and right field (eg both 1920 x 1080) directly next to each other in one image (without horizontal compression );
- Image size has an aspect ratio smaller than 1: 1 (except for the above frame packing formats), for example 1920 x 2160 - top and bottom (full), ie left field directly over right field in a picture (without vertical compression) ).
Dabei können optional, etwa wenn, wie weiter unten erläutert, eine Erkennung für einen Teilbereich eines Bildes entsprechend einem angenommenen 3D-Bilddatenbereich erfolgen soll, die beiden erstgenannten Fälle Frame-Packing 1080p und Frame-Packing 720p umfasst sein durch die Zuordnung: Bildgröße hat ein Seitenverhältnis von 128/149 oder etwa gleich 0,87:1 - Frame-Packing, d.h. links-Teilbild über aktivem Leerraum über rechts-Teilbild in einem Bild, mit entsprechenden Höhenanteilen von links-Teilbild, aktivem Leerraum und rechts-Teilbild.Optionally, for example, as explained below, recognition for a partial area of an image corresponding to an assumed 3D image data area should be included, the first two cases frame packing 1080p and frame packing 720p by the assignment: image size has Aspect ratio of 128/149 or approximately equal to 0.87: 1 - Frame Packing, ie left partial image over active white space over right partial image in an image, with corresponding height components of left partial image, active white space and right partial image.
Für alle anderen Fälle, d.h. bei einer Bildgröße mit einem Seitenverhältnis im Bereich von einschließlich 1:1 bis kleiner als 2:1 (exclusive), erfolgt der Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten. Vorzugsweise wird dabei das zu erkennende Format von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten erkannt als eines von einem oder mehreren Formaten der nachfolgend genannten Formate (1) bis (2) und (6) bis (9).For all other cases, i. for an image size with an aspect ratio ranging from 1: 1 to less than 2: 1 (exclusive), the step of recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data is performed. Preferably, the format of image data of the source image stream to be recognized based on image contents of the image data is recognized as one of one or more formats of the following formats (1) to (2) and (6) to (9).
In einer oder mehreren Ausführungsformen wird das zu erkennende stereoskopische Format von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten erkannt als eines von mehreren stereoskopischen Formaten, wobei die mehreren stereoskopischen Formate stereoskopische Formate umfassen, welche eine jeweilige unterschiedliche Anordnung von links-Teilbildern und rechts-Teilbildern in den stereoskopischen Bilddaten des Quell-Bildstroms aufweisen.In one or more embodiments, the stereoscopic format of image data of the source image stream to be recognized based on image contents of the image data is recognized as one of a plurality of stereoscopic formats, the plurality of stereoscopic formats comprising stereoscopic formats having a respective different arrangement of left fields and right Have partial images in the stereoscopic image data of the source image stream.
In einer oder mehreren Ausführungsformen wird das zu erkennende Format von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten erkannt als eines von einem oder mehreren Formaten, welche umfassen:
- (1) ein Side-by-Side-(half)-Format mit einem links-Teilbild und einem rechts-Teilbild nebeneinander, die jeweils ein Seitenverhältnis aufweisen, das jeweils einem in x-Richtung mit dem Faktor 0,5 gestauchten Vollbild entspricht, wobei das Seitenverhältnis des Vollbildes vorzugsweise eines von 4:3 und 16:9 ist;
- (2) ein Top-and-Bottom-(half)-Format mit einem links-Teilbild und einem rechts-Teilbild in y-Richtung übereinander angeordnet, die jeweils ein Seitenverhältnis aufweisen, das jeweils einem in y-Richtung mit dem Faktor 0,5 gestauchten Vollbild entspricht, wobei das Seitenverhältnis des Vollbildes vorzugsweise eines von 4:3 und 16:9 ist,
- (3) ein Side-by-Side-(full)-Format mit einem links-Teilbild und einem rechts-Teilbild direkt nebeneinander, wobei das Seitenverhältnis des gesamten Bildes aus links-Teilbild und rechts-Teilbild vorzugsweise zusammen 32:9, also etwa 3,56:1 ist;
- (4) ein Top-and-Bottom-(full)-Format mit einem links-Teilbild und einem rechts-Teilbild direkt übereinander,
- (5) ein Frame-Packing-Format mit einem links-Teilbild und einem rechts-Teilbild in y-Richtung übereinander und getrennt durch aktiven Leerraum angeordnet, wobei das Seitenverhältnis des gesamten Bildes aus links-Teilbild, Leerraum und rechts-Teilbild vorzugsweise 128:149 oder etwa gleich 0,87:1 ist;
- (6) ein Line-Alternative-Format mit einem links-Teilbild und einem rechts-Teilbild zeilenweise verschachtelt, d.h. gerade Zeilen und ungerade Zeilen sind unterschiedlichen Teilbildern zugeordnet;
- (7) ein Frame-Interlaced-Format, bei dem ein Rahmen mit einem links-Teilbild und ein Rahmen mit einem rechts-Teilbild abwechselnd aufeinander folgen;
- (8) ein farb-anaglyphisches Format gemäß einer oder mehreren Kombinationen von links-kodierenden und rechts-kodierenden Farben, insbesondere eines oder mehrere von einem rot-blau-anaglyphischem Format, einem rot-grün-anaglyphischem Format, einem rot-cyan-anaglyphischem Format, einem gelb-blau-anaglyphischem Format;
- (9) ein zur Ausnutzung des Pulfrich-Effektes eingerichtetes Format.
- (1) a side-by-side (half) format with a left field and a right field side by side each having an aspect ratio each corresponding to a frame compressed in the x direction by a factor of 0.5, the aspect ratio of the Frame is preferably one of 4: 3 and 16: 9;
- (2) a top-and-bottom (half) format with a left field and a right field in the y direction superimposed, each having an aspect ratio, each one in the y direction by a factor of 0, 5 compressed frame, wherein the aspect ratio of the frame is preferably one of 4: 3 and 16: 9,
- (3) a side-by-side (full) format with a left field and a right field directly next to each other, wherein the aspect ratio of the entire picture of left field and right field preferably together 32: 9, so about 3.56: 1;
- (4) a top-and-bottom (full) format with a left field and a right field directly on top of each other,
- (5) a frame-packing format having a left field and a right field in the y direction superimposed and separated by active white space, wherein the aspect ratio of the entire image of left field, space and right field preferably 128: 149 or about 0.87: 1;
- (6) line-by-line interleaving a line alternative format with a left field and a right field, that is, even lines and odd lines are assigned to different fields;
- (7) a frame interlaced format in which one frame with a left field and one frame with a right field follow each other alternately;
- (8) a color anaglyphic format according to one or more combinations of left-coding and right-coding colors, in particular one or more of a red-blue anaglyphic format, a red-green-anaglyphic format, a red-cyan-anaglyphic Format, a yellow-blue anaglyphic format;
- (9) a format designed to exploit the Pulfrich effect.
Beispielsweise kann eines der Formate (1) bis (5) sowie (7) bis (9) als Format von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten erkannt werden, welche Bilddaten einem Teilbereich eines Bildes des Quell-Bildstroms entsprechen, insbesondere einem rechtwinklig polygonalem oder einem rechteckigem Teilbereich. Außerhalb dieses Teilbereichs können beispielsweise 2D-Bilddaten vorliegen. Somit können beispielsweise auch skaliert wiedergegebene Videobilder oder Bilder als Stereobilder erkannt werden.For example, one of the formats (1) to (5) and (7) to (9) may be recognized as a format of image data of the source image stream based on image contents of the image data, which image data corresponds to a partial area of an image of the source image stream, especially one right-angled polygonal or rectangular section. Outside this subarea, for example, 2D image data may be present. Thus, for example, scaled reproduced video images or images can be recognized as stereo images.
Die Erkennung kann auch auf eines oder mehrere der genannten Formate beschränkt sein, oder weitere Formate umfassen.The recognition may also be limited to one or more of the mentioned formats, or comprise further formats.
Bei der Erkennung des Formats kann anhand des Seitenverhältnisses auf das Vorliegen einer Stauchung der Teilbilder in x-Richtung oder y-Richtung geschlossen werden, insbesondere bei einem Side-by-Side-(half)-Format bzw. einem Top-and-Bottom-(half)-Format. Dies wird beim Interpretieren der Bilddaten zur Entnahme der Teilbilder berücksichtigt.When recognizing the format, it can be concluded from the aspect ratio that there is a compression of the sub-images in the x-direction or y-direction, in particular in a side-by-side (half) format or a top-and-bottom (half) format. This is taken into account when interpreting the image data for the removal of the partial images.
Das beschriebene Vergleichen der Bildgröße kann beispielsweise durchgeführt werden, wenn die Information über ein stereoskopisches Bildformat von Bildern des Quell-Bildstroms in Metadaten des Quell-Bildstroms nicht vorliegt.The described comparison of the image size can be carried out, for example, if the information about a stereoscopic image format of images of the source image current is not present in metadata of the source image current.
Vorteilhafte Ausgestaltungen der Erfindung sind in den Unteransprüchen angegeben.Advantageous embodiments of the invention are specified in the subclaims.
In einer oder mehreren Ausführungsformen umfasst das Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten:
- Überprüfen von mehreren Hypothesen über ein stereoskopisches Format von Bilddaten des Quell-Bildstroms,
- Erkennen des stereoskopischen Formats einer Hypothese als das stereoskopische Format der Bilddaten, wenn in dem Schritt des Überprüfens die Hypothese als zutreffend erkannt wurde.
- Examining several hypotheses about a stereoscopic format of image data of the source image stream,
- Recognizing the stereoscopic format of a hypothesis as the stereoscopic format of the image data if, in the step of checking, the hypothesis was found to be true.
Vorzugsweise umfasst eine Hypothese über ein stereoskopisches Format von Bilddaten des Quell-Bildstroms eine Hypothese über eine Anordnung von links-Teilbildern und rechts-Teilbildern in Bilddaten des Quell-Bildstroms. Beispielsweise kann eine Hypothese über ein stereoskopisches Format von Bilddaten des Quell-Bildstroms einer Hypothese über eine Anordnung von links-Teilbildern und rechts-Teilbildern in Bilddaten des Quell-Bildstroms entsprechen.Preferably, a hypothesis about a stereoscopic format of image data of the source image stream includes a hypothesis about an arrangement of left field images and right field images in image data of the source image stream. For example, a hypothesis about a stereoscopic format of image data of the source image stream may correspond to a hypothesis about an arrangement of left field images and right field images in image data of the source image stream.
Beispielsweise kann das Überprüfen von mehreren Hypothesen umfassen:
- Detektieren, für eine jeweilige Hypothese von zu überprüfenden Hypothesen, von paarweise korrespondierenden Merkmalen in links-Bildinhalten und rechts-Bildinhalten der Bilddaten, wobei die Bilddaten gemäß der betreffenden Hypothese als die links-Bildinhalte und die rechts-Bildinhalte repräsentierend interpretiert werden;
- Erkennen einer Hypothese als zutreffend basierend auf sich paarweise hauptsächlich in ihren x-Koordinaten unterscheidenden Positionen von detektierten, paarweise korrespondierenden Merkmalen.
- Detecting, for a respective hypothesis of hypotheses to be tested, paired corresponding features in left image contents and right image contents of the image data, the image data being interpreted as representing the left image contents and the right image contents according to the hypothesis in question;
- Recognizing a hypothesis as true based on pairs of mainly differing positions of detected, pairwise corresponding features in their x-coordinates.
D.h., in dem Schritt des Detektierens von paarweise korrespondierenden Merkmalen werden die Bilddaten gemäß der betreffenden Hypothese als Repräsentation der links-Bildinhalte und der rechts-Bildinhalte interpretiert. Es erfolgt eine Zuordnung der Bilddaten zu links-Bildinhalten und rechts-Bildinhalten entsprechend der betreffenden Hypothese. That is, in the step of detecting pairs of corresponding features, the image data is interpreted according to the hypothesis in question as a representation of the left image contents and the right image contents. There is an assignment of image data to left-image content and right-image content according to the hypothesis in question.
Beispielsweise kann in dem Schritt des Erkennens einer Hypothese als zutreffend das Erkennen einer Hypothese als zutreffend erfolgen, wenn die Hypothese unter denjenigen Hypothesen, für die ein Ähnlichkeitskriterium für die y-Koordinaten der paarweise korrespondierenden Merkmale für die betreffende Hypothese erfüllt ist, einen größten Wert eines Maßes für die Streuung der paarweisen Differenzen der x-Koordinaten der paarweise korrespondierenden Merkmale aufweist.For example, in the step of recognizing a hypothesis, the hypothesis may be deemed to be true if the hypothesis among those hypotheses for which a similarity criterion for the y-coordinates of the pairwise corresponding features is satisfied for the hypothesis in question is a maximum value of one Measure for the scattering of the pairwise differences of the x-coordinates of the pairwise corresponding features.
Auf diese Weise erfolgt das Erkennen einer Hypothese als zutreffend anhand einer Vereinbarkeit von Koordinaten der paarweise korrespondierenden Merkmale mit typischen Merkmalen eines stereoskopischen Bildinhalts.In this way, the recognition of a hypothesis is made as appropriate based on a compatibility of coordinates of the pairwise corresponding features with typical features of a stereoscopic image content.
Je nach der betreffenden Hypothese können der links-Bildinhalt und der rechts-Bildinhalt in einem Bild oder Rahmen des Quell-Bildstroms enthalten sein oder in aufeinanderfolgenden Bildern oder Rahmen des Quell-Bildstroms enthalten sein.Depending on the hypothesis in question, the left-hand image content and the right-hand image content may be included in a frame or frame of the source image stream or contained in successive images or frames of the source image stream.
In einer oder mehreren Ausführungsformen erfolgt das Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten mittels eines künstlichen Neuronalen Netzes. Insbesondere kann das Erkennen durch das künstliche Neuronale Netz erfolgen. Beispielsweise kann das Erkennen einer Anordnung von links-Teilbildern und rechts-Teilbildern in stereoskopischen Bilddaten des Quell-Bildstroms mittels eines künstlichen Neuronalen Netzes erfolgen.In one or more embodiments, the recognition of a stereoscopic format of image data of the source image stream is based on image contents of the image data by means of an artificial neural network. In particular, the recognition can be done by the artificial neural network. For example, the recognition of an arrangement of left partial images and right partial images in stereoscopic image data of the source image current can take place by means of an artificial neural network.
Beispielsweise kann das Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten eine Vorverarbeitung von Bildinhalten der Bilddaten umfassen, bei der globale Bildmerkmale aus Bildinhalten der Bilddaten extrahiert werden und das künstliche Neuronale Netz die extrahierten globalen Bildmerkmale als Eingangssignale erhält. Somit werden bei der Vorverarbeitung von Bildinhalten der Bilddaten globale Bildmerkmale aus Bildinhalten in Form von für jeweilige Pixel definierten Inhalten, die durch die Bilddaten repräsentiert werden, extrahiert. Beispielsweise kann das Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten das Erkennen einer Anordnung von links-Teilbildern und rechts-Teilbildern in stereoskopischen Bilddaten des Quell-Bildstroms umfassen, welches wiederum die Vorverarbeitung umfassen kann.For example, recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data may include preprocessing image contents of the image data, extracting global image features from image contents of the image data, and receiving the extracted global image features as inputs to the artificial neural network. Thus, in preprocessing image contents of the image data, global image features are extracted from image contents in the form of contents defined for respective pixels represented by the image data. For example, recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data may include recognizing an arrangement of left and right sub-images in stereoscopic image data of the source image stream, which in turn may include preprocessing.
In einer oder mehreren Ausführungsformen können die Bilddaten des Quell-Bildstroms, deren stereoskopisches Format erkannt wird, zusammen einem rechteckigen Teil eines Bildes des Quell-Bildstroms oder einem rechteckigen Teil aufeinanderfolgender Bilder des Quell-Bildstroms entsprechen. Die Bilddaten des Quell-Bildstroms, deren stereoskopisches Format erkannt wird, können auch einem Vollbild oder Gesamt-Bildbereich des Quell-Bildstroms oder Vollbildern oder einem Gesamt-Bildbereich von aufeinanderfolgenden Bildern des Quell-Bildstroms entsprechen.In one or more embodiments, the image data of the source image stream whose stereoscopic format is recognized may together correspond to a rectangular portion of an image of the source image stream or a rectangular portion of successive images of the source image stream. The image data of the source image stream whose stereoscopic format is recognized may also correspond to a frame or total image area of the source image stream or frames, or a total image area of successive images of the source image stream.
In einer oder mehreren Ausführungsformen umfasst das Verfahren: Erkennen eines Umfangs eines Bildbereichs von Bilddaten, die ein stereoskopisches Format aufweisen. Diese Bilddaten werden nachfolgend auch als 3D-Bilddaten bezeichnet, und der Bereich wird auch als 3D-Bilddatenbereich bezeichnet. Vorzugsweise wird der Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten dann durchgeführt für Bilddaten, die diesem Bildbereich entsprechen. Das Verfahren umfasst somit: Erkennen eines stereoskopischen Formats der Bilddaten, die diesem Bildbereich entsprechen. Das Verfahren kann insbesondere umfassen: Erkennen einer Anordnung von links-Teilbildern und rechts-Teilbildern in stereoskopischen Bilddaten des Quell-Bildstroms, die diesem Bildbereich entsprechen. Beispielsweise kann der Schritt des Erkennens eines Umfangs eines Bildbereichs von Bilddaten, die ein stereoskopisches Format aufweisen, durchgeführt werden, wenn in einem Schritt des Untersuchens von Bildinhalten von Bilddaten des Quell-Bildstroms zum Erkennen eines stereoskopischen Formats der Bilddaten basierend auf Bildinhalten der Bilddaten, wobei die Bilddaten einem Vollbild oder Gesamt-Bildbereich eines Bildes des Quell-Bildstroms entsprechen, kein stereoskopisches Format erkannt wird. Es kann dann ein weiterer Schritt des Untersuchens von Bildinhalten von Bilddaten des Quell-Bildstroms zum Erkennen eines stereoskopischen Formats der Bilddaten basierend auf Bildinhalten der Bilddaten erfolgen, wobei die Bilddaten dem erkannten Umfang des 3D-Bilddbereichs entsprechen. Dieser Schritt des Untersuchens von Bildinhalten von Bilddaten des Quell-Bildstroms umfasst dann beispielsweise den Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten. Er kann insbesondere den Schritt des Erkennens einer Anordnung von links-Teilbildern und rechts-Teilbildern in stereoskopischen Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten umfassen.In one or more embodiments, the method includes: detecting a perimeter of an image area of image data having a stereoscopic format. This image data will hereinafter also be referred to as 3D image data, and the area will also be referred to as 3D image data area. Preferably, the step of recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data is then performed for image data corresponding to that image region. The method thus comprises: recognizing a stereoscopic format of the image data corresponding to this image area. In particular, the method may include: detecting an arrangement of left and right sub-images in stereoscopic image data of the source image stream corresponding to that image region. For example, the step of recognizing a scope of an image area of image data having a stereoscopic format may be performed when, in a step of examining image contents of image data of the source image stream for recognizing a stereoscopic format of the image data based on image contents of the image data the image data corresponds to a frame or entire image area of an image of the source image stream, no stereoscopic format is recognized. There may then be another step of examining image contents of image data of the source image stream to recognize a stereoscopic format of the image data based on image contents of the image data, the image data corresponding to the detected amount of the 3D image area. This step of examining image contents of image data of the source image stream then includes, for example, the step of recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data. In particular, it may comprise the step of recognizing an arrangement of left fields and right fields in stereoscopic image data of the source image stream based on image contents of the image data.
Insbesondere kann es sich bei dem 3D-Bilddatenbereich um einen rechtwinkligpolygonalen oder einen rechteckigen Bildbereich handeln. Dieser Bildbereich kann auch als 3D-Bildbereich bezeichnet werden. Unter dem Umfang des Bildbereichs wird die Erstreckung oder die Größe des Bildbereichs der betreffenden Bilddaten verstanden. Das Erkennen eines stereoskopischen Formats der Bilddaten, die diesem Bildbereich entsprechen, basierend auf Bildinhalten der Bilddaten, kann beispielsweise, wie beschrieben, das Überprüfen von mehreren Hypothesen über ein stereoskopisches Format dieser Bilddaten des Quell-Bildstroms umfassen. Das Erkennen eines stereoskopischen Formats der Bilddaten, die diesem Bildbereich entsprechen, basierend auf Bildinhalten der Bilddaten, kann beispielsweise, wie beschrieben, mittels eines künstlichen Neuronalen Netzes erfolgen. Auch bei einem Schritt des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms, der für Bilddaten durchgeführt wird, die einem Vollbild oder Gesamt-Bildbereich eines Bildes des Quell-Bildstroms entsprechen, kann das Erkennen eines stereoskopischen Formats basierend auf Bildinhalten der Bilddaten beispielsweise, wie beschrieben, das Überprüfen von mehreren Hypothesen über ein stereoskopisches Format dieser Bilddaten des Quell-Bildstroms umfassen, oder, wie beschrieben, mittels eines künstlichen Neuronalen Netzes erfolgen. In particular, the 3D image data area may be a rectangular polygonal or a rectangular image area. This image area can also be called a 3D image area. The scope of the image area is understood to mean the extent or the size of the image area of the relevant image data. For example, recognizing a stereoscopic format of the image data corresponding to that image area based on image contents of the image data may include, as described, reviewing multiple hypotheses about a stereoscopic format of that image data of the source image stream. The recognition of a stereoscopic format of the image data that corresponds to this image area based on image contents of the image data can be done, for example, as described, by means of an artificial neural network. Also, in a step of recognizing a stereoscopic format of image data of the source image current performed for image data corresponding to a frame or entire image area of an image of the source image stream, recognizing a stereoscopic format based on image contents of the image data may be, for example, as described, include checking multiple hypotheses about a stereoscopic format of this image data of the source image stream, or, as described, using an artificial neural network.
In einer oder mehreren Ausführungsformen umfasst das Verfahren: Erkennen eines Umfangs eines Bildbereichs von 2D-Bilddaten; wobei das Verfahren weiter umfasst: Entnehmen von 2D-Teilbildern aus 2D-Bilddaten des Quell-Bildstroms, wobei das Erzeugen von Bildern des Ziel-Bildstroms im vorgegebenen stereoskopischen Format unter Einbeziehung der entnommenen links-Teilbilder und rechts-Teilbilder und unter Einbeziehung der entnommenen 2D-Teilbilder erfolgt. Die entnommenen 2D-Teilbilder werden beispielsweise dupliziert.In one or more embodiments, the method includes: detecting a perimeter of an image area of 2D image data; the method further comprising: extracting 2D subframes from 2D image data of the source image stream, generating images of the target image stream in the predetermined stereoscopic format, including the extracted left sub images and right sub images, and including the extracted 2D Partial images take place. The extracted 2D partial images are duplicated, for example.
Beispielsweise kann ein Bildbereich, welcher außerhalb eines Bildbereichs von Bilddaten liegt, die ein stereoskopisches Format aufweisen, als Bildbereich von 2D-Bilddaten erkannt werden.For example, an image area lying outside an image area of image data having a stereoscopic format can be recognized as an image area of 2D image data.
Beispielsweise kann, wenn für Bilddaten des Quell-Bildstroms kein stereoskopisches Format erkannt wird, ein Entnehmen von 2D-Bildern aus diesen Bilddaten des Quell-Bildstroms erfolgen, und es erfolgt ein Erzeugen von Bildern des Ziel-Bildstroms im vorgegebenen stereoskopischen Format unter Einbeziehung der entnommenen 2D-Teilbilder, welche dupliziert werden. Dadurch kann bei nur zeitweisem Vorhandensein von Bilddaten mit stereoskopischem Format in den übrigen Zeiten dennoch der Ziel-Bildstrom mit Bilddaten im vorgegebenen stereoskopischen Format erzeugt werden.For example, if no stereoscopic format is detected for image data of the source image stream, extraction of 2D images from these image data of the source image stream can be performed, and images of the target image stream are generated in the predetermined stereoscopic format including the extracted
Beispielsweise kann das Erkennen eines Umfangs eines Bildbereichs von Bilddaten des Quell-Bildstroms, die ein stereoskopisches Format aufweisen, basierend auf Bildinhalten der Bilddaten des Quell-Bildstroms erfolgen.For example, recognizing a perimeter of an image area of image data of the source image stream having a stereoscopic format may be based on image contents of the image data of the source image stream.
Beispielsweise kann das Erkennen eines Umfangs eines Bildbereichs von Bilddaten des Quell-Bildstroms, die ein stereoskopisches Format aufweisen, basierend auf Bildinhalten der Bilddaten des Quell-Bildstroms umfassen:
- Detektieren von horizontalen und vertikalen Kanten in Bildinhalten der Bilddaten, die zusammen einen Rand eines Bildbereichs definieren, wobei
die Bilddaten als 2D-Bilddaten interpretiert werden, und - Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms, die einem Bildbereich entsprechen, dessen Rand durch die detektierten Kanten definiert wird.
- Detecting horizontal and vertical edges in image contents of the image data that together define an edge of an image area, the image data being interpreted as 2D image data, and
- Recognizing a stereoscopic format of image data of the source image stream corresponding to an image area whose boundary is defined by the detected edges.
Beispielsweise können horizontale und vertikale Kanten detektiert werden, die zusammen einen Rand eines polygonalen, auch als rechtwinklig-polygonal bezeichneten, Bildbereichs oder insbesondere eines rechteckigen Bildbereichs definieren.For example, horizontal and vertical edges can be detected, which together define an edge of a polygonal image region, also referred to as a right-angled polygonal image region, or in particular of a rectangular image region.
Beispielsweise kann der Quell-Bildstrom 2D-Bildinhalte in einem 2D-Format enthalten, in denen stereoskopische Bildinhalte eingebettet und in einem beispielsweise rechteckigen Bildbereich enthalten sind.For example, the source image stream may contain 2D image contents in a 2D format in which stereoscopic image contents are embedded and contained in, for example, a rectangular image area.
In einer oder mehreren Ausführungsformen können in dem Schritt des Entnehmens von links-Teilbildern für ein linkes Auge und rechts-Teilbildern für ein rechtes Auge aus Bilddaten des Quell-Bildstroms die entnommenen links-Teilbilder und rechts-Teilbilder unterschiedlichen Farbkanälen von Bilddaten entsprechen, wenn das erkannte stereoskopische Format der Bilddaten ein Farb-anaglyphisches stereoskopisches Format ist. Dadurch können Farb-anaglyphisch-kodierte stereoskopische Bildinhalte in das vorgegebene stereoskopische Format konvertiert werden.In one or more embodiments, in the step of extracting left-left images for a left eye and right-images for image data of the source image stream, the extracted left images and right images may correspond to different color channels of image data recognized stereoscopic format of image data is a color anaglyphic stereoscopic format. As a result, color anaglyphic coded stereoscopic image contents are converted into the predetermined stereoscopic format.
In einer oder mehreren Ausführungsformen kann in dem Schritt des Entnehmens von links-Teilbildern für ein linkes Auge und rechts-Teilbildern für ein rechtes Auge aus Bilddaten des Quell-Bildstroms ein Entnehmen eines links-Teilbildes für ein linkes Auge und eines zugeordneten rechts-Teilbildes für ein rechtes Auge aus jeweiligen nacheinander folgenden Bildern des Quell-Bildstroms erfolgen, wobei bei dem Erzeugen von Bildern des Ziel-Bildstroms im vorgegebenen stereoskopischen Format ein verzögertes Einbeziehen der entnommenen Teilbilder für eines der beiden Augen erfolgt. Dadurch können Pulfrich-kodierte stereoskopische Bildinhalte in das vorgegebene stereoskopische Format konvertiert werden.In one or more embodiments, in the step of extracting left-left images for a left eye and right-images for a right eye from image data of the source image stream, extracting a left-field for a left eye and an associated right-field for a right eye is made of respective successive images of the source image stream, wherein when generating images of the target image stream in the predetermined stereoscopic format, there is a delayed inclusion of the extracted partial images for one of the two eyes. As a result, Pulfrich-coded stereoscopic image contents can be converted into the predetermined stereoscopic format.
Die Aufgabe wird weiter gelöst durch eine Vorrichtung zum Konvertieren eines Quell-Bildstroms, der Bilddaten in einem stereoskopischen Format enthält, in einen Ziel-Bildstrom, der Bilder in einem vorgegebenen stereoskopischen Format aufweist, wobei die Bilder jeweils ein links-Teilbild für ein linkes Auge und ein rechts-Teilbild für ein rechtes Auge umfassen, umfassend: eine Erkennungseinrichtung zum Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten; und eine Konvertierungseinrichtung zum Konvertieren des Quell-Bildstroms in den Ziel-Bildstrom, wobei die Vorrichtung zur Durchführung des Verfahrens eingerichtet ist. Insbesondere kann die Erkennungseinrichtung zur Durchführung des Schrittes des Erkennens eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms basierend auf Bildinhalten der Bilddaten eingerichtet sein. Insbesondere kann die Konvertierungseinrichtung zum Durchführen der Schritte des Entnehmens von links-Teilbildern und rechts-Teilbildern sowie des Erzeugens von Bildern des Ziel-Bildstroms eingerichtet sein.The object is further achieved by an apparatus for converting a source image stream containing image data in a stereoscopic format into a destination image stream having images in a predetermined stereoscopic format, the images each comprising a left field image for a left eye and a right-eye right-field image comprising: detecting means for recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data; and converting means for converting the source image stream into the target image stream, the apparatus being arranged to perform the method. In particular, the recognition means may be arranged to perform the step of recognizing a stereoscopic format of image data of the source image stream based on image contents of the image data. In particular, the converting means may be arranged to perform the steps of extracting left fields and right fields and generating images of the target image stream.
Die Vorrichtung kann beispielsweise in einer Bildstromquelle implementiert sein, etwa einem PC (Personal Computer), und kann beispielsweise in einem Bildschirmtreiber oder einem Grafikadapter (z.B. einer Grafikkarte) implementiert sein. Die Vorrichtung kann auch beispielsweise ein Konverter zur Verbindung einer Bildstromquelle mit einem 3D-Ausgabegerät sein. Die Vorrichtung kann auch, beispielsweise als Konverter, in einem 3D-Ausgabegerät integriert sein und den Ziel-Bildstrom in einem zur Ausgabe durch das 3D-Ausgabegerät geeignetem stereoskopischen Format ausgeben, etwa in Form eines Rahmen-sequentiellen (frame-sequential) Bildstroms mit abwechselnden Teilbildern für das linke und das rechte Auge, oder in Form von getrennten Datenströmen für links-Teilbilder und rechts-Teilbilder.The device may, for example, be implemented in an image-current source, such as a personal computer (PC), and may be implemented, for example, in a display driver or graphics adapter (e.g., a graphics card). The device can also be, for example, a converter for connecting an image source with a 3D output device. The device can also be integrated, for example as a converter, in a 3D output device and output the target image stream in a stereoscopic format suitable for output by the 3D output device, for example in the form of a frame-sequential image stream with alternating Partial images for the left and the right eye, or in the form of separate data streams for left partial images and right partial images.
Bevorzugte Ausführungsformen der Erfindung werden im Folgenden anhand der Zeichnung näher erläutert. Es zeigen:
-
1 eine schematische Darstellung einer Konvertierung eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem Ausführungsbeispiel; -
2 eine schematische Darstellung einer Konvertierung eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem weiteren Ausführungsbeispiel; -
3 eine schematische Darstellung einer Konvertierung eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem weiteren Ausführungsbeispiel; -
4 eine schematische Darstellung eines Konverters zum Konvertieren eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem Ausführungsbeispiel; -
5 eine schematische Darstellung einer Erkennung eines Umfangs einesBildbereichs von 3D-Bilddaten; -
6 eine schematische Darstellung von horizontalen und vertikalen Kanten in Bildinhalten der Bilddaten eines Bildes des Quell-Bildstroms; -
7 eine schematische Darstellung eines Verfahrens zum Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms mittels eines künstlichen Neuronalen Netzes; -
8 eine schematische Darstellung eines Verfahrens zum Erkennen eines stereoskopischen Formats von Bilddaten des Quell-Bildstroms mittels Merkmalsdetektoren; -
9 eine schematische Darstellung einer Konvertierung eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem weiteren Ausführungsbeispiel; -
10 eine schematische Darstellung einer Konvertierung eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem weiteren Ausführungsbeispiel; und -
11 eine schematische Darstellung einer Konvertierung eines Quell-Bildstroms in einen Ziel-Bildstrom gemäß einem weiteren Ausführungsbeispiel.
-
1 a schematic representation of a conversion of a source image stream into a target image stream according to an embodiment; -
2 a schematic representation of a conversion of a source image stream in a target image stream according to another embodiment; -
3 a schematic representation of a conversion of a source image stream in a target image stream according to another embodiment; -
4 a schematic representation of a converter for converting a source image stream into a target image stream according to an embodiment; -
5 a schematic representation of a detection of a scope of an image area of 3D image data; -
6 a schematic representation of horizontal and vertical edges in image contents of the image data of an image of the source image stream; -
7 a schematic representation of a method for recognizing a stereoscopic format of image data of the source image stream by means of an artificial neural network; -
8th a schematic representation of a method for detecting a stereoscopic format of image data of the source image stream by means of feature detectors; -
9 a schematic representation of a conversion of a source image stream in a target image stream according to another embodiment; -
10 a schematic representation of a conversion of a source image stream in a target image stream according to another embodiment; and -
11 a schematic representation of a conversion of a source image stream in a target image stream according to another embodiment.
Die 3D-Bilddaten, welche den Teilbildern
Es wird eine Folge von Bildern
In Schritt
In Schritt
Falls nein, wird festgestellt, dass kein stereoskopisches Format von Bilddaten des Quell-Bildstroms
Falls ja (in Schritt
- - Detektieren von horizontalen
Kanten 50 und vertikalenKanten 52 in Bildinhalten der Bilddaten eines Bildes12 , wobei die Bilddaten desBildes 12 als 2D-Bilddaten interpretiert werden; - - Auswählen detektierter horizontaler
Kanten 50 und vertikalerKanten 52 , die zusammen einen Rand eines rechteckigen Bildbereichs definieren, wobei die Bilddaten desBildes 12 als 2D-Bilddaten interpretiert werden.
- - Detecting
horizontal edges 50 andvertical edges 52 in image contents of the image data of animage 12 where the image data of theimage 12 interpreted as 2D image data; - Selecting detected
horizontal edges 50 andvertical edges 52 , which together define an edge of a rectangular image area, wherein the image data of theimage 12 be interpreted as 2D image data.
In
Das Verfahren wird dann mit dem Schritt
Die Hypothesen über den Bildbereich der 3D-Bilddaten können auch gleichzeitig oder zeitlich parallel überprüft werden.The hypotheses about the image area of the 3D image data can also be checked simultaneously or at the same time.
Das Erkennen eines stereoskopischen Formats von Bilddaten, basierend auf Bildinhalten der Bilddaten, d.h. insbesondere das Erkennen eines stereoskopischen Kodierungsformats von links-Bilddaten und rechts-Bilddaten innerhalb des angenommenen 3D-Bilddatenbereichs basierend auf Bildinhalten der Bilddaten in Schritt
Eine inzwischen etablierte Methode zur Klassifikation von Bildern ist, die Klassifikationsmethode von einem künstlichen Neuronalen Netz anhand von klassifizierten Beispielbildern lernen zu lassen. Für das vorliegende Klassifizierungsverfahren kann ein Deep Convolutional Neural Network (CNN) verwendet werden. Als Netzwerk-Topologie wird empfohlen, 6 oder mehr mal hintereinander eine Convolutional Layer (8 Filterkernel je 3x3 Pixel) mit einer Max-Pooling-Layer abzuwechseln, gefolgt von einer Fully Connected Layer. Als Aktivierungsfunktion wird in den verdeckten Schichten ReLU, und in der Ausgangsschicht SoftMax empfohlen. Zum Trainieren des Netzwerks werden beispielsweise ca. 10.000 Stereo-Bildpaare verwendet, die jeweils in jedem der zu unterscheidenden 3D-Formate als Eingabe Verwendung finden.An established method for classifying images is to have the classification method learned from an artificial neural network using classified example images. For the present classification method, a deep convolutional neural network (CNN) can be used. As a network topology, it is recommended to alternate a convolutional layer (8 filter cores each 3x3 pixels) 6 times or more in succession with a max pooling layer, followed by a fully connected layer. As an activation function in the hidden layers ReLU, and in the starting layer SoftMax is recommended. To train the network, for example, about 10,000 Stereo image pairs used, which are used in each of the different 3D formats as input.
In einem Schritt
Zur Erkennung eines Frame-Interlaced-Formats können außerdem die folgenden globalen Bildmerkmale aus Bildinhalten der Bilddaten des angenommenen 3D-Bilddatenbereichs extrahiert werden und als Eingabe in das künstliche Neuronale Netz gegeben werden: Die mittlere quadratische Summe der Differenzen von (f) zeitlich um einen Frame versetzten Pixeln (an derselben Position), und von (g) zeitlich um zwei Frames versetzten Pixeln (an derselben Position). Im Falle eines Frame-Interlaced-Formats ist die Veränderung zwischen zeitlich direkt aufeinanderfolgenden Frames (d.h. Abstand von 1 Frame) größer als zwischen Frames mit dem Abstand
Bei einem als zutreffend erkannten stereoskopischen Format, welches einer als zutreffend erkannten Anordnung von links-Teilbildern und rechts-Teilbildern in dem 3D-Bilddatenbereich des Quell-Bildstroms entspricht, kann außerdem in einem optionalen Schritt
Die Unterscheidung kann beispielsweise anhand eines Seitenverhältnisses des Bildbereichs der 3D-Bilddaten erfolgen. Beispielsweise kann bei einem Seitenverhältnis von 128/149 oder von etwa 0,87:1 auf ein Frame-Packing-Format geschlossen werden, welches keine Stauchung des Bildinhalts aufweist. Beispielsweise kann bei einem anderen Seitenverhältnis, welches kleiner als 1:1 ist, auf ein Top-Bottom-(full) Format geschlossen werden, welches keine Stauchung des Bildinhalts aufweist. Beispielsweise kann bei einem Seitenverhältnis von größer gleich 2:1 auf ein Side-by-Side-(full) Format geschlossen werden, welches keine Stauchung des Bildinhalts aufweist. Somit kann beispielsweise bei einem Seitenverhältnis von kleiner als 1:1 oder größer gleich 2:1 geschlossen werden, dass keine Stauchung des Bildinhalts vorliegt. Entsprechend kann beispielsweise bei einem Seitenverhältnis im Bereich von einschließlich 1:1 bis kleiner als 2:1 (exclusive) geschlossen werden, dass eine Stauchung des Bildinhalts mit dem Faktor 0,5 in der Richtung vorliegt, in welcher die Teilbilder nebeneinander oder übereinander angeordnet sind.The distinction can be made, for example, based on an aspect ratio of the image area of the 3D image data. For example, with an aspect ratio of 128/149 or about 0.87: 1, a frame-packing format may be inferred that does not compress the image content. For example, with a different aspect ratio that is less than 1: 1, a top-bottom (full) format may be inferred that does not compress the image content. For example, with an aspect ratio greater than or equal to 2: 1, a side-by-side (full) format can be deduced that does not compress the image content. Thus, for example, with an aspect ratio of less than 1: 1 or greater than 2: 1, it can be concluded that there is no compression of the image content. Accordingly, for example, with an aspect ratio in the range of 1: 1 to less than 2: 1 (exclusive), it can be concluded that the image content is compressed by a factor of 0.5 in the direction in which the partial images are arranged side by side or one above the other ,
Anstelle des Schritts
Die genannte Unterscheidung in Schritt
In einem Schritt
In einem Schritt
Bei einem gültigen Stereo-Bildpaar liegen einander korrespondierende Regionen oder Merkmale in etwa auf derselben y-Koordinate bei je nach Disparität abweichender x-Koordinate. Wenn man nun ein Eingangsbild je nach möglichem 3D-Format (d.h. gemäß der jeweiligen Hypothese) in potentielle Stereo-Bildpaare zerlegt, so zeichnet sich das tatsächlich vorliegende 3D-Format durch zwei Bedingungen aus. In the case of a valid stereo image pair, corresponding regions or features lie approximately at the same y-coordinate, depending on the disparity of the x-coordinate. By decomposing an input image into potential stereo image pairs depending on the possible 3D format (i.e., according to the particular hypothesis), the 3D format actually present is characterized by two conditions.
Eine erste Bedingung ist, dass eine kritische Mindestmenge an korrespondierenden Regionen oder Merkmalen sich paarweise in der
Falls in Schritt
Dies ist die zweite Bedingung für das tatsächlich vorliegende 3D-Format. Dadurch kann gewährleistet werden, dass z.B. ein stereoskopisches Side-by-Side-Bild nicht als stereoskopisches Zeilen-Interlaced-Bild interpretiert wird. Hypothesen, für die das Maß für die Streuung unterhalb eines unteren Schwellwertes liegt oder oberhalb eines oberen Schwellwertes liegt, können von dieser Auswertung ausgenommen werden.This is the second condition for the actual 3D format. This can ensure that e.g. a stereoscopic side-by-side image is not interpreted as a stereoscopic line interlaced image. Hypotheses for which the measure of the scattering lies below a lower threshold value or is above an upper threshold value can be excluded from this evaluation.
Die zu überprüfenden Hypothesen über ein stereoskopisches Format der 3D-Bilddaten des Quell-Bildstroms
In Schritt
Bei einer als zutreffend erkannten Hypothese über ein 3D-Format, welches einer als zutreffend erkannten Hypothese über eine Anordnung von links-Teilbildern und rechts-Teilbildern in den 3D-Bilddaten des Quell-Bildstroms entspricht, kann außerdem eine Unterscheidung zwischen 3D-Formaten mit oder ohne Stauchung des Bildinhalts in Richtung der Anordnung der links-Teilbilder und rechts-Teilbilder getroffen werden. Dies kann auf die oben für den Schritt
Die beschriebenen Erkennungsverfahren mittels künstlichem Neuronalen Netz oder mittels Merkmalsdetektion können außerdem leicht um die Erkennung eines Frame-Interlaced-Formats erweitert werden; für ein künstliches Neuronales Netz wurde dies oben bereits beschrieben. Bei der Verwendung von Merkmalsdetektoren werden dazu beispielsweise korrespondierende Merkmale in Bildinhalten eines Frames f(n), eines direkt vorhergehenden Frames f(n-1) und eines diesem wiederum direkt vorhergehenden Frames f(n-2) ermittelt. Anhand des Vorzeichens der horizontalen Positionsunterschiede kann erkannt werden, welcher Frame links-Bilddaten entspricht, und welcher Frame rechts-Bildinhalten entspricht. Somit kann die Hypothese über das Format aufgestellt werden und wie oben beschrieben den Schritten
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- US 6711293 [0082]US Pat. No. 6711293 [0082]
- WO 2012/136642 A1 [0082]WO 2012/136642 A1 [0082]
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018113822.9A DE102018113822A1 (en) | 2018-06-11 | 2018-06-11 | Converting an image stream with stereoscopic image content |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018113822.9A DE102018113822A1 (en) | 2018-06-11 | 2018-06-11 | Converting an image stream with stereoscopic image content |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102018113822A1 true DE102018113822A1 (en) | 2019-12-12 |
Family
ID=68652065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102018113822.9A Ceased DE102018113822A1 (en) | 2018-06-11 | 2018-06-11 | Converting an image stream with stereoscopic image content |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102018113822A1 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711293B1 (en) | 1999-03-08 | 2004-03-23 | The University Of British Columbia | Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image |
US20100053306A1 (en) * | 2008-09-02 | 2010-03-04 | Yasutaka Hirasawa | Image Processing Apparatus, Image Processing Method, and Program |
WO2010151049A2 (en) * | 2009-06-23 | 2010-12-29 | Samsung Electronics Co., Ltd. | Method and apparatus for automatic transformation of three-dimensional video |
WO2011071467A1 (en) * | 2009-12-09 | 2011-06-16 | Thomson Licensing | Method for distinguishing a 3d image from a 2d image and for identifying the presence of a 3d image format by feature correspondence determination |
WO2011162737A1 (en) * | 2010-06-24 | 2011-12-29 | Thomson Licensing | Detection of frame sequential stereoscopic 3d video format based on the content of successive video frames |
WO2012136642A1 (en) | 2011-04-08 | 2012-10-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Feature descriptor for image sections |
-
2018
- 2018-06-11 DE DE102018113822.9A patent/DE102018113822A1/en not_active Ceased
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711293B1 (en) | 1999-03-08 | 2004-03-23 | The University Of British Columbia | Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image |
US20100053306A1 (en) * | 2008-09-02 | 2010-03-04 | Yasutaka Hirasawa | Image Processing Apparatus, Image Processing Method, and Program |
WO2010151049A2 (en) * | 2009-06-23 | 2010-12-29 | Samsung Electronics Co., Ltd. | Method and apparatus for automatic transformation of three-dimensional video |
WO2011071467A1 (en) * | 2009-12-09 | 2011-06-16 | Thomson Licensing | Method for distinguishing a 3d image from a 2d image and for identifying the presence of a 3d image format by feature correspondence determination |
WO2011162737A1 (en) * | 2010-06-24 | 2011-12-29 | Thomson Licensing | Detection of frame sequential stereoscopic 3d video format based on the content of successive video frames |
WO2012136642A1 (en) | 2011-04-08 | 2012-10-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Feature descriptor for image sections |
Non-Patent Citations (1)
Title |
---|
HOWARD, Andrew G. [u.a.]: MobileNets: Efficient convolutional neural networks for mobile vision applications. 17.04.2017. S. 1-9. URL: https://arxiv.org/pdf/1704.04861 [abgerufen am 04.09.2018]. - arXiv: 1704.04861vl. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE10016074B4 (en) | Method and device for generating 3D images | |
DE4242796C2 (en) | Highly efficient coding method for natural images mixed with two-level images | |
DE69333694T2 (en) | Method and arrangement for image processing | |
EP3789962B1 (en) | Method and device for generating data for two dimensional or three dimensional representation of at least part of an object and for generating the two or three-dimensional representation of at least part of the object | |
WO2008064617A1 (en) | Arrangement and method for capturing and reproducing images of a scene and/or an object | |
EP1451775A1 (en) | Generation of a stereo image sequence from a 2d image sequence | |
EP2005361A1 (en) | Multi-sensorial hypothesis based object detector and object pursuer | |
WO2011103866A2 (en) | Method for visualizing three-dimensional images on a 3d display device and 3d display device | |
DE102011086318A1 (en) | Position determination of an object by detection of a position pattern by optical sensor | |
DE112015003626T5 (en) | SYSTEM AND METHOD FOR INCREASING THE BITTERY OF IMAGES | |
DE212018000230U1 (en) | Pedestrian dynamics display system | |
DE102013217826A1 (en) | METHOD FOR PRODUCING, TRANSMITTING AND RECEIVING STEREOSCOPIC IMAGES, AND RELATED DEVICES | |
EP0471878A1 (en) | Method of picture-in-picture superimposition and apparatus for following the method | |
DE10084783B3 (en) | System and method for generating video frames | |
EP2023638A2 (en) | Method for reducing image artefacts | |
DE60031559T2 (en) | METHOD AND APPARATUS FOR LEARNING CLASS SELECTION BY MULTIPLE CLASSIFICATIONS | |
DE102018113822A1 (en) | Converting an image stream with stereoscopic image content | |
DE19548451C1 (en) | Computer-assisted movement estimation system for video sequence images | |
EP2478705A1 (en) | Method and device for generating partial views and/or a stereoscopic image master from a 2d-view for stereoscopic playback | |
AT507531B1 (en) | METHOD OF COUNTING OBJECTS | |
DE60115028T2 (en) | Method and device for identifying identical images | |
DE102018201909A1 (en) | Method and device for object recognition | |
DE69531412T2 (en) | Image coding based on image areas and their segmented border lines | |
EP1185084A2 (en) | Image compression method and image coder | |
EP2122569B1 (en) | Method for marking a digital image with a digital watermark |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R016 | Response to examination communication | ||
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final |