WO2013032071A1 - Encoding/decoding device and method using virtual view synthesis and prediction - Google Patents

Encoding/decoding device and method using virtual view synthesis and prediction Download PDF

Info

Publication number
WO2013032071A1
WO2013032071A1 PCT/KR2011/010204 KR2011010204W WO2013032071A1 WO 2013032071 A1 WO2013032071 A1 WO 2013032071A1 KR 2011010204 W KR2011010204 W KR 2011010204W WO 2013032071 A1 WO2013032071 A1 WO 2013032071A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
encoding
mode
current
view
Prior art date
Application number
PCT/KR2011/010204
Other languages
French (fr)
Korean (ko)
Inventor
이진영
이재준
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to US14/241,320 priority Critical patent/US20140301455A1/en
Publication of WO2013032071A1 publication Critical patent/WO2013032071A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer

Definitions

  • One embodiment of the present invention relates to an encoding / decoding apparatus and method for encoding / decoding a 3D video, and more particularly, to applying a result of synthesizing images corresponding to a neighboring viewpoint of a current view to an encoding / decoding process.
  • An apparatus and method are provided.
  • the stereoscopic image refers to a 3D image that simultaneously provides shape information about depth and space.
  • images of different viewpoints are provided to the left and right eyes, whereas stereoscopic images provide the same images as viewed from different directions whenever the viewer views different views. Therefore, in order to generate a stereoscopic image, images captured at various viewpoints are required.
  • Images taken from various viewpoints to generate stereoscopic images have a large amount of data. Therefore, considering the network infrastructure, terrestrial bandwidth, etc. for stereoscopic video, even compression is performed using an encoding device optimized for Single-View Video Coding such as MPEG-2, H.264 / AVC, and HEVC. It is almost impossible to realize.
  • An encoding apparatus comprises: a synthesized image generator configured to synthesize a first image of an already encoded neighboring view and generate a synthesized image of a virtual view; And an image encoder which encodes blocks included in the second image of the current view by using the synthesized image of the virtual view.
  • the encoding apparatus may further include a mode selection unit for selecting an optimal encoding mode among encoding modes related to synthesis prediction using currently defined encoding modes and the synthesized image.
  • An encoding apparatus sets a skip mode flag (mb_skip_flag) related to a prediction method currently defined with respect to a second image of a current view to be located in a bitstream before a flag of a first encoding mode.
  • the apparatus may further include a flag setting unit.
  • an encoding apparatus may include: a synthesized image generator configured to synthesize first images of neighboring views, which are already encoded, to generate a synthesized image of a virtual view; A mode selection unit for selecting one of a virtual view synthesis skip mode and a virtual view synthesis residual signal encoding mode associated with the synthesized image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
  • an encoding apparatus may include: a synthesized image generator configured to synthesize a first image of an encoded neighboring view and generate a synthesized image of a virtual view; A mode selection unit for selecting a virtual view synthesis skip mode associated with the composite image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
  • an encoding apparatus may include: a synthesized image generator configured to synthesize a first image of an encoded neighboring view and generate a synthesized image of a virtual view; A mode selection unit for selecting a virtual view synthesis residual signal encoding mode associated with the synthesis image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
  • an encoding apparatus may include: a synthesized image generator configured to synthesize a first image of an encoded neighboring view and generate a synthesized image of a virtual view; A mode selection unit for selecting an encoding mode having the best encoding performance among virtual view synthesis skip modes, virtual view synthesis residual signal encoding modes, and currently defined encoding modes associated with the synthesized image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
  • Decoding apparatus comprises a synthesized image generating unit for generating a composite image of the virtual view by synthesizing the first image of the neighboring viewpoint already decoded; A mode determination unit that determines a decoding mode of a second image of a current view in a bitstream received from an encoding device; And an image decoder configured to decode current blocks included in the second image of the current view based on the synthesized image of the virtual view according to the decoding mode.
  • a decoding apparatus extracts a flag of a first decoding mode located after a flag (mb_skip_flag) of a skip mode associated with a prediction method currently defined for a second image of a current view in a bitstream. It may further include wealth.
  • Decoding apparatus comprises a synthesized image generating unit for generating a composite image of the virtual view by synthesizing the first image of the neighboring viewpoint already decoded; A mode determination unit that determines a decoding mode that is a virtual view synthesis skip mode associated with the composite image from a bitstream; And an image decoder configured to decode current blocks included in a second image of a current view using the decoding mode.
  • Decoding apparatus comprises a synthesized image generating unit for generating a synthesized image of the virtual view by synthesizing the first image of the neighboring viewpoint already decoded; A mode determination unit that determines a decoding mode that is a virtual view synthesis residual signal decoding mode associated with the composite image from a bitstream; And an image decoder configured to decode current blocks included in a second image of a current view using the decoding mode.
  • An encoding method comprises the steps of: synthesizing first images of neighboring viewpoints, which are already encoded, to generate a synthetic image of a virtual viewpoint; And encoding the current block included in the second image of the current view by using the synthesized image of the virtual view.
  • An encoding method may further include selecting an optimal encoding mode among encoding modes associated with synthesis prediction using currently defined encoding modes and the synthesized image.
  • An encoding method sets a flag of a skip mode related to a prediction method currently defined with respect to a second image of a current view to be located in a bitstream before a flag of a first encoding mode (mb_skip_flag). It may further comprise a step.
  • An encoding method comprises the steps of: synthesizing first images of neighboring views that are already encoded, generating a synthesized image of a virtual view; Selecting one of a virtual view synthesis skip mode or a virtual view synthesis residual signal encoding mode associated with the synthesis image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
  • the encoding method comprises the steps of: synthesizing the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; Selecting a virtual view synthesis skip mode associated with the synthesized image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
  • the encoding method comprises the steps of: synthesizing the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; Selecting a virtual view synthesis residual signal encoding mode associated with the synthesis image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
  • the encoding method comprises the steps of: synthesizing the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; Selecting an encoding mode having the best encoding performance among virtual view synthesis skip modes, virtual view synthesis residual signal encoding modes, and currently defined encoding modes associated with the synthesized image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
  • a decoding method comprises the steps of: synthesizing first images of neighboring viewpoints, which are already decoded, to generate a composite image of a virtual viewpoint; Determining a decoding mode of a second image of a current view in a bitstream received from an encoding apparatus; And decoding current blocks included in the second image of the current view using the synthesized image of the virtual view according to the decoding mode.
  • the decoding method may further include extracting a flag of the first decoding mode located after the flag of the skip mode related to the prediction method currently defined for the second image of the current view in the bitstream. Can be.
  • a composite image of a virtual view is generated by synthesizing an image of a neighboring view, and encoding by using the synthesized image of a virtual view.
  • the coding efficiency can be improved by eliminating it.
  • FIG. 1 is a view for explaining the operation of the encoding apparatus and the decoding apparatus according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating a detailed configuration of an encoding apparatus according to an embodiment of the present invention.
  • FIG. 3 is a diagram illustrating a detailed configuration of a decoding apparatus according to an embodiment of the present invention.
  • FIG. 4 is a diagram illustrating a structure of a multiview video according to an embodiment of the present invention.
  • FIG. 5 is a diagram illustrating an encoding system to which an encoding apparatus according to an embodiment of the present invention is applied.
  • FIG. 6 is a diagram illustrating a decoding system to which a decoding apparatus is applied according to an embodiment of the present invention.
  • FIG. 7 is a view for explaining a virtual view synthesis technique according to an embodiment of the present invention.
  • FIG. 8 is a diagram illustrating a skip mode of a virtual view synthesis prediction technique according to an embodiment of the present invention.
  • FIG. 9 illustrates a residual signal encoding mode of a virtual view synthesis prediction method according to an embodiment of the present invention.
  • FIG. 10 illustrates a flag position of a skip mode for a virtual view synthesis prediction technique according to an embodiment of the present invention.
  • FIG. 1 is a view for explaining the operation of the encoding apparatus and the decoding apparatus according to an embodiment of the present invention.
  • the encoding apparatus 101 may encode 3D video and then transmit the encoded data to the decoding apparatus 102 in the form of a bitstream.
  • the encoding apparatus 101 according to an embodiment of the present invention may improve encoding efficiency by removing redundancy between images as much as possible when encoding 3D video.
  • Intra, Inter, and Inter-View prediction methods may be used to remove the redundancy between the images.
  • various coding modes (SKIP, 2NX2N, NXN, 2NxN, NX2N, and intra modes) may be used when predicting a block. Since the skip mode does not encode block information, the bit amount may be reduced compared to other encoding modes. Therefore, when more blocks are encoded in a skip mode when encoding an image, better encoding performance may appear.
  • the encoding apparatus 101 may synthesize the images of the neighboring views, which are already encoded, generate a synthesized image of the virtual view, and encode the image of the current view by using the generated synthesized image.
  • the encoding apparatus defines a first image as an image of a current view to be encoded, a second image as an image of a neighboring view that is already encoded, and an image obtained by combining images of a neighboring view as a synthesized image.
  • the composite image represents the same current view as the first image.
  • FIG. 2 is a diagram illustrating a detailed configuration of an encoding apparatus according to an embodiment of the present invention.
  • the encoding apparatus 101 may include a synthesized image generator 201, a mode selector 202, a flag setter 203, and an image encoder 204.
  • the synthesized image generator 201 may generate the synthesized image of the virtual view by synthesizing the first images of the neighboring views that are already encoded.
  • the neighboring view means a view corresponding to the surrounding image of the second image of the current view to be encoded.
  • the virtual view means the same view as that of the second image to be encoded.
  • the mode selector 202 may select an optimal encoding mode among encoding modes related to synthesis prediction by using currently defined encoding modes and a synthesized image.
  • the mode selector 202 searches for a zero vector block located at the same position as the current block to be currently encoded in the composite image of the virtual view, and replaces the current block to be currently encoded with the zero vector block.
  • the mode can be determined.
  • the first encoding mode may be defined as a virtual view synthesis skip mode.
  • the mode selector 202 searches for a zero vector block located at the same position as the current block in the composite image of the virtual view, and selects a prediction block and a prediction block most similar to the current block to be currently encoded based on the zero vector block.
  • a second encoding mode for performing residual signal encoding may be determined based on the virtual synthesis vector indicated.
  • the second encoding mode may be defined as a virtual view synthesis residual signal encoding mode.
  • the mode selector 202 selects an encoding mode having the best encoding result among the first encoding mode and the currently defined third encoding modes or among the second encoding mode and the currently defined third encoding modes.
  • the coding mode having the best coding result can be selected.
  • the third encoding modes may include a skip mode, inter 2N ⁇ 2N, inter 2N ⁇ N, inter Nx 2N, inter NxN, intra 2N ⁇ 2N, intra N ⁇ N, and the like.
  • the third encoding modes may include a skip mode, an inter mode, and an intra mode.
  • the mode selector 202 may select one of a first encoding mode, a second encoding mode, and a third encoding mode currently defined for the current block to be encoded.
  • the mode selector 202 has the best encoding performance among the encoding results according to the first encoding mode, the encoding results according to the second encoding mode, and the encoding results according to the currently defined third encoding modes.
  • the encoding mode can be selected.
  • the encoding performance refers to an encoding mode in which the cost function is minimum.
  • the flag setting unit 203 may set a skip mode flag (mb_skip_flag) related to a prediction method currently defined with respect to the second image of the current view to be located in the bitstream before the flag of the first encoding mode.
  • mb_skip_flag a skip mode flag
  • the skip mode associated with the currently defined prediction method is different from the virtual view synthesis skip mode proposed in the embodiment of the present invention.
  • a method of setting a flag will be described in detail with reference to FIG. 10.
  • the image encoder 204 may encode the current block included in the second image of the current view based on the encoding mode. At this time, if the encoding mode of the current block is determined as the skip mode associated with the currently defined prediction method, the encoding mode related to the synthesis prediction may be selectively applied.
  • FIG. 3 is a diagram illustrating a detailed configuration of a decoding apparatus according to an embodiment of the present invention.
  • the decoding apparatus 102 may include a flag extractor 301, a synthesized image generator 302, a mode determiner 303, and an image decoder 304.
  • the flag extractor 301 may extract a flag of a first decoding mode located after a flag of a skip mode associated with a prediction method currently defined for a second image of a current view from a bitstream transmitted from the encoding apparatus 101. have.
  • the first decoding mode will be described later.
  • the composite image generator 302 may synthesize the first images of the neighboring viewpoints, which are already decoded, to generate the composite image of the virtual viewpoint.
  • the neighboring view means a view corresponding to the surrounding image of the second image of the current view to be decoded.
  • the virtual view means the same view as the view of the second image to be decoded.
  • the mode determiner 303 may determine a decoding mode for the second image of the current view encoded in the bitstream transmitted from the encoding apparatus 101.
  • the decoding apparatus 102 may extract a decoding mode of the second image included in the bitstream.
  • the mode determiner 303 searches a zero vector block located at the same position as the current block to be decoded in the composite image of the virtual view from the bitstream, and replaces the current block to be decoded with the zero vector block.
  • the first decoding mode may be determined.
  • the first decoding mode may be defined as a virtual view synthesis skip mode.
  • the mode determiner 303 searches a zero vector block located at the same position as the current block to be decoded in the composite image of the virtual view from the bitstream, and currently decodes among neighboring blocks based on the zero vector block.
  • a second decoding mode for performing residual signal decoding may be determined based on a decoded virtual synthesis vector indicating a prediction block most similar to the current block.
  • the second decoding mode may be defined as a virtual view synthesis residual signal decoding mode.
  • the decoding mode of the current block included in the second image of the current view to be decoded corresponds to the encoding mode transmitted through the bitstream.
  • the image decoder 304 may decode the current block included in the second image of the current view by using the synthesized image of the virtual view, in which the first images of the neighboring views are synthesized according to the decoding mode.
  • FIG. 4 is a diagram illustrating a structure of a multiview video according to an embodiment of the present invention.
  • a multiview video coding method of encoding GOP (Group of Picture) '8' is shown.
  • GOP Group of Picture
  • a hierarchical B picture is basically applied to a temporal axis and a view axis, thereby reducing redundancy between images.
  • the multiview video encoding apparatus 101 first encodes a left picture (I-view), and then a right picture (P-view) and a center picture (Center).
  • a picture corresponding to three viewpoints can be encoded by sequentially encoding Picture: B-view.
  • the left image may be encoded in such a manner that temporal redundancy is removed by searching for similar regions from previous images through motion estimation.
  • the right image since the right image is encoded by using the previously encoded left image as a reference image, the right image may be encoded in such a manner that temporal redundancy based on motion estimation and view redundancy based on disparity estimation are removed. have.
  • the center image since the center image is encoded by using both the left image and the right image, which are already encoded, as a reference image, the inter-view redundancy may be removed according to the estimation of the shift in both directions.
  • an image encoded without using a reference image of another view may be encoded by predicting and encoding a reference image of another view in one direction, such as an I-View and a right image.
  • An image that is predicted and encoded in both directions, such as a P-View and a center image, is defined as a B-View.
  • Frames of MVC are largely classified into six groups according to the prediction structure.
  • the six groups include an I-view anchor frame for intra coding, an I-view non-anchor frame for inter-time inter-coding, a P-view anchor frame for inter-view unidirectional inter coding, and a unidirectional inter-coding between views.
  • the encoding apparatus 101 generates a composite image of a virtual view by synthesizing a first image of a neighboring view, which is a left and right view of the current view to be encoded, and uses the synthesized image to generate a synthesized image.
  • the second image may be encoded.
  • the first image of the neighboring view required for synthesis refers to an image that is already encoded.
  • the encoding apparatus 101 may encode the P-View by synthesizing the already encoded I-View.
  • the encoding apparatus 101 may synthesize a previously encoded I-View and a P-View to encode a B-View.
  • the encoding apparatus 101 may encode a specific image by synthesizing the already encoded image located in the vicinity.
  • FIG. 5 is a diagram illustrating an encoding system to which an encoding apparatus according to an embodiment of the present invention is applied.
  • an additional configuration for synthesizing a virtual view is required to generate a synthesized image of the virtual view.
  • the encoding apparatus 101 may generate a synthesized image of the color image of the current view by using the color image and the depth image of the neighboring view that are already encoded. Can be generated.
  • the encoding apparatus 101 may generate the composite image of the depth image of the current view using the depth image of the neighboring view that is already encoded.
  • FIG. 6 is a diagram illustrating a decoding system to which a decoding apparatus is applied according to an embodiment of the present invention.
  • decoding apparatus 102 of FIG. 6 performs substantially the same operation as the encoding apparatus 101 of FIG. 5, a detailed description thereof will be omitted.
  • FIG. 7 is a view for explaining a virtual view synthesis technique according to an embodiment of the present invention.
  • the synthesized image of the virtual view for the color image and the depth image may be generated using the already encoded color image, the depth image, and camera parameter information.
  • the synthesized image of the virtual view for the color image and the depth image may be generated according to Equation 1-3.
  • D (x, y) means the pixel value of the pixel position (x, y) in the depth image.
  • Znear and Zfar represent the nearest depth information and the farthest depth information, respectively.
  • the encoding apparatus 101 obtains the actual depth information Z, and then combines the pixel (x, y) of the current view in the world coordinate system (u, v, w) to synthesize (r) the image of the reference view into the image of the target view. ) Can be projected.
  • the pixels (x, y) represent pixels of the color image when the virtual view synthesis is performed on the color image, and pixels of the depth image when the virtual view synthesis is performed on the depth image.
  • Equation 2 A (c) denotes an intrinsic camera matrix, R (c) denotes a camera rotation matrix, T (c) denotes a camera translation matrix, and D denotes depth information.
  • the encoding apparatus 101 projects the world coordinate system (u, v, w) into the coordinate system (x ', y', z ') of the reference image. This is done according to equation (3).
  • FIG. 8 is a diagram illustrating a skip mode of a virtual view synthesis prediction technique according to an embodiment of the present invention.
  • the encoding apparatus 101 may generate the synthesized image 804 of the virtual view using the first images 802 and 803 of the neighbor view of the second image 801 of the current view. That is, the composite image 804 of the virtual view has similar characteristics to the second image 801 of the current view.
  • the first images 802 and 803 of the neighboring viewpoint are already encoded before the second image 801 of the current viewpoint is encoded and stored in the frame buffer of FIG. 5 as a reference image for the second image 801. Can be.
  • the encoding apparatus 101 may search for a zero vector block located at the same position as the current block in the synthesized image 804 of the virtual view, and select a first encoding mode in which the current block is replaced with the zero vector block.
  • the first encoding mode replaces the zero vector block included in the synthesized image 804 of the virtual view without encoding the current block included in the second image 801.
  • the first encoding mode represents a virtual view synthesis skip mode.
  • FIG. 9 illustrates a residual signal encoding mode of a virtual view synthesis prediction method according to an embodiment of the present invention.
  • the encoding apparatus 101 may generate the synthesized image 904 of the virtual view using the first images 902 and 903 of the neighboring view of the second image 901 of the current view. That is, the composite image 904 of the virtual view has similar characteristics to the second image 901 of the current view.
  • the first images 902 and 903 of the neighboring viewpoint are already encoded before the encoding of the second image 901 of the current viewpoint and may be stored as a reference image for the second image 901 in the frame buffer of FIG. 5. Can be.
  • the encoding apparatus 101 searches for a zero vector block located at the same position as the current block in the synthesized image 904 of the virtual view, and predicts a prediction block and a prediction block most similar to the current block to be currently encoded based on the zero vector block.
  • a second encoding mode for performing residual signal encoding may be selected based on the virtual synthesis vector indicated.
  • the encoding apparatus 101 finds a block that is most similar to the current block to be currently encoded among blocks belonging to a predetermined region around the zero vector block in the synthesized image 904 of the virtual view.
  • the block most similar to the zero vector block is defined as a prediction block.
  • the encoding apparatus 101 may determine a virtual synthesis vector indicated by the prediction block in the zero vector block.
  • the encoding apparatus 101 may encode the difference signal between the current block and the prediction block included in the second image 901 and the virtual synthesis vector corresponding to the prediction block.
  • the second encoding mode indicates a virtual view synthesis residual signal encoding mode.
  • At least one of a virtual view synthesis skip mode or a virtual view synthesis residual signal encoding mode may be used together with a currently defined encoding mode.
  • FIG. 10 illustrates a flag position of a skip mode for a virtual view synthesis prediction technique according to an embodiment of the present invention.
  • the encoding apparatus 101 may select an encoding mode for the current block included in the second image of the current view.
  • the encoding apparatus 101 may select one of the first encoding mode, the second encoding mode, and the third encoding modes currently defined for the current block to be encoded.
  • the encoding apparatus 101 has the best encoding performance among encoding results according to the first encoding mode, encoding results according to the second encoding mode, and encoding results according to currently defined third encoding modes. You can select the mode.
  • the encoding performance refers to an encoding mode in which the cost function is minimum.
  • the first encoding mode refers to an encoding mode that searches for a zero vector block located at the same position as the current block to be encoded in the synthesized image of the virtual view and replaces the current block to be encoded with the zero vector block.
  • the first encoding mode may be defined as a virtual view synthesis skip mode.
  • the second encoding mode searches for a zero vector block located at the same position as the current block in the composite image of the virtual view, and indicates a prediction block and a prediction block most similar to the current block to be currently encoded based on the zero vector block.
  • the second encoding mode may be defined as a virtual view synthesis residual signal encoding mode.
  • the encoding apparatus 101 may identify the first encoding mode as a bit flag and transmit the first encoding mode to the decoding apparatus 102.
  • an additional bit flag is required to use a virtual synthesis view skip mode determined according to an embodiment of the present invention.
  • the encoding apparatus 101 may place the flag vs_skip_flag of the virtual view synthesis skip mode after the flag mb_skip_flag of the currently defined skip mode.
  • the encoding apparatus 101 sets mb_skip_flag to 1 and the decoding apparatus 102. Can be sent to.
  • the encoding apparatus 101 sets mb_skip_flag to 0 and sets vs_skip_flag to 1. Can be transmitted to the decryption apparatus 102.
  • the encoding apparatus 101 sets mb_skip_flag to 0. And vs_skip_flag to 0 to transmit to the decoding device 102.
  • the encoding device 101 when the optimal encoding mode for the current block of the second image of the current view is the skip mode of the third encoding mode that is currently defined, the encoding device 101 may be configured according to the present invention. According to an embodiment, the virtual view synthesis method may not be used.
  • Methods according to an embodiment of the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

The present invention relates to an encoding/decoding device and method using view synthesis and prediction. The encoding device may synthesize images corresponding to the surrounding views of a current view, encode current blocks that are included in the images of the current view, and apply a skip mode and a residual signal encoding technique.

Description

가상 시점 합성 예측을 이용한 부호화/복호화 장치 및 부호화/복호화 방법Encoding / Decoding Apparatus and Encoding / Decoding Method Using Virtual View Synthesis Prediction
본 발명의 일실시예들은, 3D 비디오를 부호화/복호화하는 부호화/복호화 장치 및 방법에 관한 것으로, 보다 구체적으로는 현재 시점의 주변 시점에 대응하는 영상들을 합성한 결과를 부호화/복호화 과정에 적용하는 장치 및 방법에 관한 것이다.One embodiment of the present invention relates to an encoding / decoding apparatus and method for encoding / decoding a 3D video, and more particularly, to applying a result of synthesizing images corresponding to a neighboring viewpoint of a current view to an encoding / decoding process. An apparatus and method are provided.
입체 영상이란 깊이 및 공간에 대한 형상 정보를 동시에 제공하는 3차원 영상을 의미한다. 스테레오 영상의 경우, 좌우 눈에 각각 다른 시점의 영상을 제공하는 반면에, 입체 영상은 관찰자가 보는 시점을 달리할 때마다 다른 방향에서 본 것과 같은 영상을 제공한다. 따라서, 입체 영상을 생성하기 위해서는 여러 시점에서 촬영한 영상들이 필요하다. The stereoscopic image refers to a 3D image that simultaneously provides shape information about depth and space. In the case of stereo images, images of different viewpoints are provided to the left and right eyes, whereas stereoscopic images provide the same images as viewed from different directions whenever the viewer views different views. Therefore, in order to generate a stereoscopic image, images captured at various viewpoints are required.
입체 영상을 생성하기 위해 여러 시점에서 찍은 영상들은 데이터량이 방대하다. 따라서, 입체 영상을 위해 네트워크 인프라, 지상파 대역폭 등을 고려하면 MPEG-2, H.264/AVC, 그리고 HEVC 등과 같은 단일시점 비디오 압축(Single-View Video Coding)에 최적화된 부호화 장치를 사용하여 압축하더라도 실현이 거의 불가능하다.Images taken from various viewpoints to generate stereoscopic images have a large amount of data. Therefore, considering the network infrastructure, terrestrial bandwidth, etc. for stereoscopic video, even compression is performed using an encoding device optimized for Single-View Video Coding such as MPEG-2, H.264 / AVC, and HEVC. It is almost impossible to realize.
다만, 관찰자가 보는 시점마다 찍은 영상들은 서로 관련성이 있기 때문에 중복되는 정보가 많다. 따라서, 시점간 중복성을 제거할 수 있는 다시점 영상에 최적화된 부호화 장치를 이용하면 보다 적은 양의 데이터를 전송할 수 있다. However, since images taken at each viewpoint viewed by the observer are related to each other, there is a lot of overlapping information. Accordingly, a smaller amount of data may be transmitted by using an encoding apparatus optimized for a multiview image capable of removing inter-view redundancy.
따라서, 입체 영상을 생성하기 위해 최적화된 다시점 영상 부호화 장치가 요구된다. 특히, 시간 및 시점 간의 중복성을 효율적으로 감소시키기 위한 기술 개발이 필요하다.Therefore, a multi-view image encoding apparatus optimized for generating a stereoscopic image is required. In particular, there is a need for technology development to efficiently reduce redundancy between time and time points.
본 발명의 일실시예에 따른 부호화 장치는 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 및 상기 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 블록들을 부호화하는 영상 부호화부를 포함할 수 있다.An encoding apparatus according to an embodiment of the present invention comprises: a synthesized image generator configured to synthesize a first image of an already encoded neighboring view and generate a synthesized image of a virtual view; And an image encoder which encodes blocks included in the second image of the current view by using the synthesized image of the virtual view.
본 발명의 일실시예에 따른 부호화 장치는 현재 정의되어 있는 부호화 모드들과 상기 합성 영상을 이용하여 합성 예측과 관련된 부호화 모드들 중 최적의 부호화 모드를 선택하는 모드 선택부를 더 포함할 수 있다.The encoding apparatus according to an embodiment of the present invention may further include a mode selection unit for selecting an optimal encoding mode among encoding modes related to synthesis prediction using currently defined encoding modes and the synthesized image.
본 발명의 일실시예에 따른 부호화 장치는 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그(mb_skip_flag)를 제1 부호화 모드의 플래그보다 비트스트림에 먼저 위치하도록 설정하는 플래그 설정부를 더 포함할 수 있다.An encoding apparatus according to an embodiment of the present invention sets a skip mode flag (mb_skip_flag) related to a prediction method currently defined with respect to a second image of a current view to be located in a bitstream before a flag of a first encoding mode. The apparatus may further include a flag setting unit.
본 발명의 다른 실시예에 따른 부호화 장치는 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드 또는 가상 시점 합성 잔차 신호 부호화 모드 중 어느 하나를 선택하는 모드 선택부; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부를 포함할 수 있다.According to another exemplary embodiment of the present invention, an encoding apparatus may include: a synthesized image generator configured to synthesize first images of neighboring views, which are already encoded, to generate a synthesized image of a virtual view; A mode selection unit for selecting one of a virtual view synthesis skip mode and a virtual view synthesis residual signal encoding mode associated with the synthesized image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
본 발명의 또 다른 실시예에 따른 부호화 장치는 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드를 선택하는 모드 선택부; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부를 포함할 수 있다.According to another embodiment of the present invention, an encoding apparatus may include: a synthesized image generator configured to synthesize a first image of an encoded neighboring view and generate a synthesized image of a virtual view; A mode selection unit for selecting a virtual view synthesis skip mode associated with the composite image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
본 발명의 또 다른 실시예에 따른 부호화 장치는 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 상기 합성 영상과 관련한 가상 시점 합성 잔차 신호 부호화 모드를 선택하는 모드 선택부; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부를 포함할 수 있다.According to another embodiment of the present invention, an encoding apparatus may include: a synthesized image generator configured to synthesize a first image of an encoded neighboring view and generate a synthesized image of a virtual view; A mode selection unit for selecting a virtual view synthesis residual signal encoding mode associated with the synthesis image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
본 발명의 또 다른 실시예에 따른 부호화 장치는 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드, 가상 시점 합성 잔차 신호 부호화 모드 및 현재 정의되어 있는 부호화 모드들 중 부호화 성능이 가장 좋은 부호화 모드를 선택하는 모드 선택부; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부를 포함할 수 있다.According to another embodiment of the present invention, an encoding apparatus may include: a synthesized image generator configured to synthesize a first image of an encoded neighboring view and generate a synthesized image of a virtual view; A mode selection unit for selecting an encoding mode having the best encoding performance among virtual view synthesis skip modes, virtual view synthesis residual signal encoding modes, and currently defined encoding modes associated with the synthesized image; And an image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
본 발명의 일실시예에 따른 복호화 장치는 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 부호화 장치로부터 수신된 비트스트림에서 현재 시점의 제2 영상에 대한 복호화 모드를 결정하는 모드 결정부; 및 상기 복호화 모드에 따라 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 복호화하는 영상 복호화부를 포함할 수 있다.Decoding apparatus according to an embodiment of the present invention comprises a synthesized image generating unit for generating a composite image of the virtual view by synthesizing the first image of the neighboring viewpoint already decoded; A mode determination unit that determines a decoding mode of a second image of a current view in a bitstream received from an encoding device; And an image decoder configured to decode current blocks included in the second image of the current view based on the synthesized image of the virtual view according to the decoding mode.
본 발명의 일실시예에 따른 복호화 장치는 비트스트림에서 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그 (mb_skip_flag) 뒤에 위치한 제1 복호화 모드의 플래그를 추출하는 플래그 추출부를 더 포함할 수 있다.A decoding apparatus according to an embodiment of the present invention extracts a flag of a first decoding mode located after a flag (mb_skip_flag) of a skip mode associated with a prediction method currently defined for a second image of a current view in a bitstream. It may further include wealth.
본 발명의 다른 일실시예에 따른 복호화 장치는 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 비트스트림으로부터 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드인 복호화 모드를 결정하는 모드 결정부; 및 상기 복호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 복호화하는 영상 복호화부를 포함할 수 있다.Decoding apparatus according to another embodiment of the present invention comprises a synthesized image generating unit for generating a composite image of the virtual view by synthesizing the first image of the neighboring viewpoint already decoded; A mode determination unit that determines a decoding mode that is a virtual view synthesis skip mode associated with the composite image from a bitstream; And an image decoder configured to decode current blocks included in a second image of a current view using the decoding mode.
본 발명의 또 다른 일실시예에 따른 복호화 장치는 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 비트스트림으로부터 상기 합성 영상과 관련한 가상 시점 합성 잔차 신호 복호화 모드인 복호화 모드를 결정하는 모드 결정부; 및 상기 복호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 복호화하는 영상 복호화부를 포함할 수 있다.Decoding apparatus according to another embodiment of the present invention comprises a synthesized image generating unit for generating a synthesized image of the virtual view by synthesizing the first image of the neighboring viewpoint already decoded; A mode determination unit that determines a decoding mode that is a virtual view synthesis residual signal decoding mode associated with the composite image from a bitstream; And an image decoder configured to decode current blocks included in a second image of a current view using the decoding mode.
본 발명의 일실시예에 따른 부호화 방법은 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 및 상기 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록을 부호화하는 단계를 포함할 수 있다.An encoding method according to an embodiment of the present invention comprises the steps of: synthesizing first images of neighboring viewpoints, which are already encoded, to generate a synthetic image of a virtual viewpoint; And encoding the current block included in the second image of the current view by using the synthesized image of the virtual view.
본 발명의 일실시예에 따른 부호화 방법은 현재 정의되어 있는 부호화 모드들과 상기 합성 영상을 이용하여 합성 예측과 관련된 부호화 모드들 중 최적의 부호화 모드를 선택하는 단계를 더 포함할 수 있다.An encoding method according to an embodiment of the present invention may further include selecting an optimal encoding mode among encoding modes associated with synthesis prediction using currently defined encoding modes and the synthesized image.
본 발명의 일실시예에 따른 부호화 방법은 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그를 (mb_skip_flag) 제1 부호화 모드의 플래그보다 비트스트림에 먼저 위치하도록 설정하는 단계를 더 포함할 수 있다.An encoding method according to an embodiment of the present invention sets a flag of a skip mode related to a prediction method currently defined with respect to a second image of a current view to be located in a bitstream before a flag of a first encoding mode (mb_skip_flag). It may further comprise a step.
본 발명의 다른 실시예에 따른 부호화 방법은 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드 또는 가상 시점 합성 잔차 신호 부호화 모드 중 어느 하나를 선택하는 단계; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계를 포함할 수 있다.An encoding method according to another embodiment of the present invention comprises the steps of: synthesizing first images of neighboring views that are already encoded, generating a synthesized image of a virtual view; Selecting one of a virtual view synthesis skip mode or a virtual view synthesis residual signal encoding mode associated with the synthesis image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
본 발명의 또 다른 실시예에 따른 부호화 방법은 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드를 선택하는 단계; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계를 포함할 수 있다.The encoding method according to another embodiment of the present invention comprises the steps of: synthesizing the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; Selecting a virtual view synthesis skip mode associated with the synthesized image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
본 발명의 또 다른 실시예에 따른 부호화 방법은 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 상기 합성 영상과 관련한 가상 시점 합성 잔차 신호 부호화 모드를 선택하는 단계; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계를 포함할 수 있다.The encoding method according to another embodiment of the present invention comprises the steps of: synthesizing the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; Selecting a virtual view synthesis residual signal encoding mode associated with the synthesis image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
본 발명의 또 다른 실시예에 따른 부호화 방법은 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 상기 합성 영상과 관련한 가상 시점 합성 스킵 모드, 가상 시점 합성 잔차 신호 부호화 모드 및 현재 정의되어 있는 부호화 모드들 중 부호화 성능이 가장 좋은 부호화 모드를 선택하는 단계; 및 상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계를 포함할 수 있다.The encoding method according to another embodiment of the present invention comprises the steps of: synthesizing the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; Selecting an encoding mode having the best encoding performance among virtual view synthesis skip modes, virtual view synthesis residual signal encoding modes, and currently defined encoding modes associated with the synthesized image; And encoding the current blocks included in the second image of the current view by using the encoding mode.
본 발명의 일실시예에 따른 복호화 방법은 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 부호화 장치로부터 수신된 비트스트림에서 현재 시점의 제2 영상에 대한 복호화 모드를 결정하는 단계; 및 상기 복호화 모드에 따라 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 복호화하는 단계를 포함할 수 있다.A decoding method according to an embodiment of the present invention comprises the steps of: synthesizing first images of neighboring viewpoints, which are already decoded, to generate a composite image of a virtual viewpoint; Determining a decoding mode of a second image of a current view in a bitstream received from an encoding apparatus; And decoding current blocks included in the second image of the current view using the synthesized image of the virtual view according to the decoding mode.
본 발명의 일실시예에 따른 복호화 방법은 비트스트림에서 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그 뒤에 위치한 제1 복호화 모드의 플래그를 추출하는 단계를 더 포함할 수 있다.The decoding method according to an embodiment of the present invention may further include extracting a flag of the first decoding mode located after the flag of the skip mode related to the prediction method currently defined for the second image of the current view in the bitstream. Can be.
본 발명의 일실시예에 따르면, 부호화하고자 하는 현재 시점의 블록들을 부호화할 때 주변 시점의 영상을 합성하여 가상 시점의 합성 영상을 생성하고, 가상 시점의 합성 영상을 이용하여 부호화함으로써 시점간의 중복성을 제거하여 부호화 효율을 향상시킬 수 있다.According to an embodiment of the present invention, when encoding blocks of a current view to be encoded, a composite image of a virtual view is generated by synthesizing an image of a neighboring view, and encoding by using the synthesized image of a virtual view. The coding efficiency can be improved by eliminating it.
도 1은 본 발명의 일실시예에 따른 부호화 장치와 복호화 장치의 동작을 설명하기 위한 도면이다.1 is a view for explaining the operation of the encoding apparatus and the decoding apparatus according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 따른 부호화 장치의 세부 구성을 도시한 도면이다.2 is a diagram illustrating a detailed configuration of an encoding apparatus according to an embodiment of the present invention.
도 3은 본 발명의 일실시예에 따른 복호화 장치의 세부 구성을 도시한 도면이다.3 is a diagram illustrating a detailed configuration of a decoding apparatus according to an embodiment of the present invention.
도 4는 본 발명의 일실시예에 따른 다시점 비디오의 구조를 도시한 도면이다.4 is a diagram illustrating a structure of a multiview video according to an embodiment of the present invention.
도 5는 본 발명의 일실시예에 따른 부호화 장치가 적용된 부호화 시스템을 도시한 도면이다.5 is a diagram illustrating an encoding system to which an encoding apparatus according to an embodiment of the present invention is applied.
도 6은 본 발명의 일실시예에 따른 복호화 장치가 적용된 복호화 시스템을 도시한 도면이다.6 is a diagram illustrating a decoding system to which a decoding apparatus is applied according to an embodiment of the present invention.
도 7은 본 발명의 일실시예에 따른 가상 시점 합성 기법을 설명하기 위한 도면이다.7 is a view for explaining a virtual view synthesis technique according to an embodiment of the present invention.
도 8은 본 발명의 일실시예에 따라 가상 시점 합성 예측 기법의 스킵 모드를 도시한 도면이다.8 is a diagram illustrating a skip mode of a virtual view synthesis prediction technique according to an embodiment of the present invention.
도 9는 본 발명의 일실시예에 따라 가상 시점 합성 예측 기법의 잔차 신호 부호화 모드를 도시한 도면이다.9 illustrates a residual signal encoding mode of a virtual view synthesis prediction method according to an embodiment of the present invention.
도 10은 본 발명의 일실시예에 따라 가상 시점 합성 예측 기법에 대한 스킵 모드의 플래그 위치를 도시한 도면이다.FIG. 10 illustrates a flag position of a skip mode for a virtual view synthesis prediction technique according to an embodiment of the present invention.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일실시예에 따른 부호화 장치와 복호화 장치의 동작을 설명하기 위한 도면이다.1 is a view for explaining the operation of the encoding apparatus and the decoding apparatus according to an embodiment of the present invention.
본 발명의 일실시예에 따른 부호화 장치(101)는 3D 비디오를 부호화한 후 부호화된 데이터를 비트스트림 형태로 복호화 장치(102)에 전송할 수 있다. 본 발명의 일실시예에 따른 부호화 장치(101)는 3D 비디오를 부호화할 때 영상들 간의 중복성을 최대한 제거함으로써 부호화 효율을 향상시킬 수 있다.The encoding apparatus 101 according to an embodiment of the present invention may encode 3D video and then transmit the encoded data to the decoding apparatus 102 in the form of a bitstream. The encoding apparatus 101 according to an embodiment of the present invention may improve encoding efficiency by removing redundancy between images as much as possible when encoding 3D video.
이러한 영상들 간의 중복성을 제거하기 위해, 인트라(Intra), 인터(Inter), 인터뷰(Inter-View) 예측 방법이 활용될 수 있다. 그리고, 블록을 예측할 때 여러 가지 부호화 모드(SKIP, 2NX2N, NXN, 2NxN, NX2N, 인트라 모드)들이 사용될 수 있다. 이 중 스킵 모드는 블록 정보들을 부호화하지 않기 때문에 다른 부호화 모드에 비해 비트량이 감소할 수 있다. 따라서, 영상을 부호화할 때 보다 많은 블록들이 스킵 모드로 부호화되는 경우, 보다 좋은 부호화 성능이 나타날 수 있다.Intra, Inter, and Inter-View prediction methods may be used to remove the redundancy between the images. In addition, various coding modes (SKIP, 2NX2N, NXN, 2NxN, NX2N, and intra modes) may be used when predicting a block. Since the skip mode does not encode block information, the bit amount may be reduced compared to other encoding modes. Therefore, when more blocks are encoded in a skip mode when encoding an image, better encoding performance may appear.
본 발명의 실시예에 의하면, 현재 정의되어 있는 스킵 모드와 더불어, 가상 시점의 합성 영상에 기초한 가상 시점 합성 스킵 모드를 정의함으로써 현재 영상을 구성하는 더 많은 블록들이 스킵 모드로 부호화될 수 있는 확률이 증가한다. 이 때, 부호화 장치(101)는 이미 부호화된 주변 시점의 영상들을 합성하여 가상 시점의 합성 영상을 생성하고, 생성된 합성 영상을 이용하여 현재 시점의 영상을 부호화할 수 있다. According to an embodiment of the present invention, in addition to the currently defined skip mode, by defining a virtual view synthesis skip mode based on the synthetic image of the virtual view, there is a probability that more blocks constituting the current image can be encoded in the skip mode. Increases. In this case, the encoding apparatus 101 may synthesize the images of the neighboring views, which are already encoded, generate a synthesized image of the virtual view, and encode the image of the current view by using the generated synthesized image.
이하에서는, 부호화 장치에서 부호화하고자 하는 현재 시점의 영상을 제1 영상, 이미 부호화된 주변 시점의 영상들을 제2 영상, 주변 시점의 영상들을 합성한 영상을 합성 영상으로 정의한다. 합성 영상은 제1 영상과 동일한 현재 시점을 나타낸다.Hereinafter, the encoding apparatus defines a first image as an image of a current view to be encoded, a second image as an image of a neighboring view that is already encoded, and an image obtained by combining images of a neighboring view as a synthesized image. The composite image represents the same current view as the first image.
도 2는 본 발명의 일실시예에 따른 부호화 장치의 세부 구성을 도시한 도면이다.2 is a diagram illustrating a detailed configuration of an encoding apparatus according to an embodiment of the present invention.
도 2를 참고하면, 부호화 장치(101)는 합성 영상 생성부(201), 모드 선택부(202), 플래그 설정부(203), 영상 부호화부(204)를 포함할 수 있다.Referring to FIG. 2, the encoding apparatus 101 may include a synthesized image generator 201, a mode selector 202, a flag setter 203, and an image encoder 204.
합성 영상 생성부(201)는 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성할 수 있다. 여기서, 주변 시점은 부호화하고자 하는 현재 시점의 제2 영상의 주변 영상에 대응하는 시점을 의미한다. 그리고, 가상 시점은 부호화하고자 하는 제2 영상의 시점과 동일한 시점을 의미한다.The synthesized image generator 201 may generate the synthesized image of the virtual view by synthesizing the first images of the neighboring views that are already encoded. Here, the neighboring view means a view corresponding to the surrounding image of the second image of the current view to be encoded. The virtual view means the same view as that of the second image to be encoded.
모드 선택부(202)는, 현재 정의되어 있는 부호화 모드들과 합성 영상을 이용하여 합성 예측과 관련된 부호화 모드들 중 최적의 부호화 모드를 선택할 수 있다. The mode selector 202 may select an optimal encoding mode among encoding modes related to synthesis prediction by using currently defined encoding modes and a synthesized image.
일례로, 모드 선택부(202)는 가상 시점의 합성 영상에서 현재 부호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 현재 부호화하고자 하는 현재 블록을 영벡터 블록으로 대체하는 제1 부호화 모드를 결정할 수 있다. 여기서, 제1 부호화 모드는 가상 시점 합성 스킵 모드로 정의될 수 있다.For example, the mode selector 202 searches for a zero vector block located at the same position as the current block to be currently encoded in the composite image of the virtual view, and replaces the current block to be currently encoded with the zero vector block. The mode can be determined. Here, the first encoding mode may be defined as a virtual view synthesis skip mode.
그리고, 모드 선택부(202)는 가상 시점의 합성 영상에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 영벡터 블록을 기준으로 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 예측 블록을 가리키는 가상 합성 벡터에 기초하여 잔차 신호 부호화를 수행하는 제2 부호화 모드를 결정할 수 있다. 여기서, 제2 부호화 모드는 가상 시점 합성 잔차 신호 부호화 모드로 정의될 수 있다.The mode selector 202 searches for a zero vector block located at the same position as the current block in the composite image of the virtual view, and selects a prediction block and a prediction block most similar to the current block to be currently encoded based on the zero vector block. A second encoding mode for performing residual signal encoding may be determined based on the virtual synthesis vector indicated. Here, the second encoding mode may be defined as a virtual view synthesis residual signal encoding mode.
또한, 모드 선택부(202)는 제1 부호화 모드 및 현재 정의되어 있는 제3 부호화 모드들 중 가장 부호화 결과가 좋은 부호화 모드를 선택하거나 또는 제2 부호화 모드 및 현재 정의되어 있는 제3 부호화 모드들 중 가장 부호화 결과가 좋은 부호화 모드를 선택하거나 할 수 있다. In addition, the mode selector 202 selects an encoding mode having the best encoding result among the first encoding mode and the currently defined third encoding modes or among the second encoding mode and the currently defined third encoding modes. The coding mode having the best coding result can be selected.
일실시예로, 제3 부호화 모드들은 스킵 모드, 인터2Nx2N, 인터2NxN, 인터Nx2N, 인터NxN, 인트라2Nx2N, 인트라NxN 등을 포함할 수 있다. 다른 실시예로, 제3 부호화 모드들은 스킵 모드, 인터 모드, 인트라 모드를 포함할 수 있다.According to an embodiment, the third encoding modes may include a skip mode, inter 2N × 2N, inter 2N × N, inter Nx 2N, inter NxN, intra 2N × 2N, intra N × N, and the like. In another embodiment, the third encoding modes may include a skip mode, an inter mode, and an intra mode.
그리고, 모드 선택부(202)는 현재 부호화하고자 하는 현재 블록에 대해 제1 부호화 모드, 제2 부호화 모드 및 현재 정의되어 있는 제3 부호화 모드들 중 어느 하나의 부호화 모드를 선택할 수 있다. 이 때, 모드 선택부(202)는 제1 부호화 모드에 따라 부호화한 결과, 제2 부호화 모드에 따라 부호화한 결과 및 현재 정의되어 있는 제3 부호화 모드들에 따라 부호화한 결과 중 부호화 성능이 가장 좋은 부호화 모드를 선택할 수 있다. 여기서, 부호화 성능은 비용 함수가 최소인 부호화 모드를 의미한다.The mode selector 202 may select one of a first encoding mode, a second encoding mode, and a third encoding mode currently defined for the current block to be encoded. In this case, the mode selector 202 has the best encoding performance among the encoding results according to the first encoding mode, the encoding results according to the second encoding mode, and the encoding results according to the currently defined third encoding modes. The encoding mode can be selected. Here, the encoding performance refers to an encoding mode in which the cost function is minimum.
플래그 설정부(203)는 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그(mb_skip_flag)를 제1 부호화 모드의 플래그보다 비트스트림에 먼저 위치하도록 설정할 수 있다.The flag setting unit 203 may set a skip mode flag (mb_skip_flag) related to a prediction method currently defined with respect to the second image of the current view to be located in the bitstream before the flag of the first encoding mode.
여기서, 현재 정의되어 있는 예측 방식과 관련된 스킵 모드는 본 발명의 일실시예에서 제안한 가상 시점 합성 스킵 모드와 다르다. 플래그를 설정하는 방법은 도 10에서 구체적으로 설명하기로 한다.Here, the skip mode associated with the currently defined prediction method is different from the virtual view synthesis skip mode proposed in the embodiment of the present invention. A method of setting a flag will be described in detail with reference to FIG. 10.
영상 부호화부(204)는 부호화 모드에 기초하여 현재 시점의 제2 영상에 포함된 현재 블록을 부호화할 수 있다. 이 때, 현재 블록의 부호화 모드가 현재 정의되어 있는 예측 방식과 관련된 스킵 모드로 결정되면, 합성 예측과 관련된 부호화 모드를 선택적으로 적용할 수 있다. The image encoder 204 may encode the current block included in the second image of the current view based on the encoding mode. At this time, if the encoding mode of the current block is determined as the skip mode associated with the currently defined prediction method, the encoding mode related to the synthesis prediction may be selectively applied.
도 3은 본 발명의 일실시예에 따른 복호화 장치의 세부 구성을 도시한 도면이다.3 is a diagram illustrating a detailed configuration of a decoding apparatus according to an embodiment of the present invention.
도 3을 참고하면, 복호화 장치(102)는 플래그 추출부(301), 합성 영상 생성부(302), 모드 결정부(303), 및 영상 복호화부(304)를 포함할 수 있다.Referring to FIG. 3, the decoding apparatus 102 may include a flag extractor 301, a synthesized image generator 302, a mode determiner 303, and an image decoder 304.
플래그 추출부(301)는 부호화 장치(101)에서 전송된 비트스트림에서 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그 뒤에 위치한 제1 복호화 모드의 플래그를 추출할 수 있다. 제1 복호화 모드에 대해서는 이후에 설명하기로 한다.The flag extractor 301 may extract a flag of a first decoding mode located after a flag of a skip mode associated with a prediction method currently defined for a second image of a current view from a bitstream transmitted from the encoding apparatus 101. have. The first decoding mode will be described later.
합성 영상 생성부(302)는 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성할 수 있다. 여기서, 주변 시점은 복호화하고자 하는 현재 시점의 제2 영상의 주변 영상에 대응하는 시점을 의미한다. 그리고, 가상 시점은 복호화하고자 하는 제2 영상의 시점과 동일한 시점을 의미한다.The composite image generator 302 may synthesize the first images of the neighboring viewpoints, which are already decoded, to generate the composite image of the virtual viewpoint. Here, the neighboring view means a view corresponding to the surrounding image of the second image of the current view to be decoded. The virtual view means the same view as the view of the second image to be decoded.
모드 결정부(303)는 부호화 장치(101)에서 전송된 비트스트림에서 부호화된 현재 시점의 제2 영상에 대한 복호화 모드를 결정할 수 있다. 복호화 장치(102)는 비트스트림에 포함된 제2 영상의 복호화 모드를 추출할 수 있다.The mode determiner 303 may determine a decoding mode for the second image of the current view encoded in the bitstream transmitted from the encoding apparatus 101. The decoding apparatus 102 may extract a decoding mode of the second image included in the bitstream.
일례로, 모드 결정부(303)는 비트스트림으로부터 가상 시점의 합성 영상에서 현재 복호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 현재 복호화하고자 하는 현재 블록을 영벡터 블록으로 대체하는 제1 복호화 모드를 결정할 수 있다. 여기서, 제1 복호화 모드는 가상 시점 합성 스킵 모드로 정의될 수 있다.For example, the mode determiner 303 searches a zero vector block located at the same position as the current block to be decoded in the composite image of the virtual view from the bitstream, and replaces the current block to be decoded with the zero vector block. The first decoding mode may be determined. Here, the first decoding mode may be defined as a virtual view synthesis skip mode.
그리고, 모드 결정부(303)는 비트스트림으로부터 가상 시점의 합성 영상에서 현재 복호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 영벡터 블록을 기준으로 주변 블록들 중 현재 복호화하고자 하는 현재 블록과 가장 유사한 예측 블록을 가리키는 복호화된 가상 합성 벡터에 기초하여 잔차 신호 복호화를 수행하는 제2 복호화 모드를 결정할 수 있다. 여기서, 제2 복호화 모드는 가상 시점 합성 잔차 신호 복호화 모드로 정의될 수 있다.The mode determiner 303 searches a zero vector block located at the same position as the current block to be decoded in the composite image of the virtual view from the bitstream, and currently decodes among neighboring blocks based on the zero vector block. A second decoding mode for performing residual signal decoding may be determined based on a decoded virtual synthesis vector indicating a prediction block most similar to the current block. Here, the second decoding mode may be defined as a virtual view synthesis residual signal decoding mode.
본 발명의 일실시예에 따르면, 복호화하고자 하는 현재 시점의 제2 영상에 포함된 현재 블록의 복호화 모드는 비트스트림을 통해 전송되는 부호화 모드와 대응된다.According to an embodiment of the present invention, the decoding mode of the current block included in the second image of the current view to be decoded corresponds to the encoding mode transmitted through the bitstream.
영상 복호화부(304)는 복호화 모드에 따라 주변 시점의 제1 영상들을 합성한 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록을 복호화할 수 있다.The image decoder 304 may decode the current block included in the second image of the current view by using the synthesized image of the virtual view, in which the first images of the neighboring views are synthesized according to the decoding mode.
도 4는 본 발명의 일실시예에 따른 다시점 비디오의 구조를 도시한 도면이다.4 is a diagram illustrating a structure of a multiview video according to an embodiment of the present invention.
도 4를 참고하면, 3개 시점(Left, Center, Right)의 영상을 입력받았을 때, GOP(Group of Picture) '8'로 부호화하는 다시점 비디오 부호화 방식(Multiview Video Coding)을 나타낸다. 다시점(Multi-view) 영상을 부호화기 위해서는 기본적으로 시간(Temporal)축과 시점(View)축으로 계층적 B 영상(Hierarchical B Picture)을 적용하기 때문에 영상 간의 중복성(Redundancy)을 줄일 수 있다. Referring to FIG. 4, when a video of three viewpoints (Left, Center, Right) is received, a multiview video coding method of encoding GOP (Group of Picture) '8' is shown. In order to encode a multi-view image, a hierarchical B picture is basically applied to a temporal axis and a view axis, thereby reducing redundancy between images.
도 4에 도시된 다시점 비디오의 구조에 따라 다시점 비디오 부호화 장치(101)는 좌측 영상(Left Picture: I-view)을 먼저 부호화하고 우측 영상(Right Picture: P-view)과 중앙 영상(Center Picture: B-view)를 차례대로 부호화함으로써 3개 시점에 대응하는 영상을 부호화할 수 있다. According to the structure of a multiview video illustrated in FIG. 4, the multiview video encoding apparatus 101 first encodes a left picture (I-view), and then a right picture (P-view) and a center picture (Center). A picture corresponding to three viewpoints can be encoded by sequentially encoding Picture: B-view.
이 때, 좌측 영상은 움직임 추정(Motion Estimation)을 통해 이전 영상들로부터 비슷한 영역을 검색함으로써 시간적 중복성(Temporal Redundancy)이 제거되는 방식으로 부호화될 수 있다. 그리고, 우측 영상은 이미 부호화된 좌측 영상을 참조 영상으로 사용하여 부호화되기 때문에, 움직임 추정에 기초한 시간적 중복성과 변이 추정(Disparity Estimation)에 기초한 시점 간 중복성(View Redundancy)이 제거되는 방식으로 부호화될 수 있다. 또한, 중앙 영상은 이미 부호화된 좌측 영상과 우측 영상을 모두 참조 영상으로 이용하여 부호화되기 때문에, 양방향으로의 변이 추정에 따라 시점 간 중복성이 제거될 수 있다.In this case, the left image may be encoded in such a manner that temporal redundancy is removed by searching for similar regions from previous images through motion estimation. In addition, since the right image is encoded by using the previously encoded left image as a reference image, the right image may be encoded in such a manner that temporal redundancy based on motion estimation and view redundancy based on disparity estimation are removed. have. In addition, since the center image is encoded by using both the left image and the right image, which are already encoded, as a reference image, the inter-view redundancy may be removed according to the estimation of the shift in both directions.
도 4를 참고하면, 다시점 비디오 부호화 방식에서, 좌측 영상과 같이 다른 시점의 참조 영상을 이용하지 않고 부호화되는 영상은 I-View, 우측 영상과 같이 다른 시점의 참조 영상을 단방향으로 예측하여 부호화하는 영상은 P-View, 중앙 영상과 같이 좌우 시점의 참조 영상을 양방향으로 예측하여 부호화하는 영상은 B-View이라고 정의된다.Referring to FIG. 4, in a multi-view video encoding method, an image encoded without using a reference image of another view, such as a left image, may be encoded by predicting and encoding a reference image of another view in one direction, such as an I-View and a right image. An image that is predicted and encoded in both directions, such as a P-View and a center image, is defined as a B-View.
MVC의 프레임은 예측 구조에 따라 크게 6가지 그룹으로 분류된다. 구체적으로, 6가지 그룹은 인트라 부호화를 위한 I-시점 Anchor 프레임, 시간축간 인터 부호화를 위한 I-시점 Non-anchor 프레임, 시점간 단방향 인터 부호화를 위한 P-시점 Anchor 프레임, 시점간 단방향 인터 부호화와 시간축간 양방향 인터 부호화를 위한 P-시점 Non-anchor 프레임, 시점간 양방향 인터 부호화를 위한 B-시점 Anchor 프레임 및 시점간 양방향 인터 부호화와 시간축간 양방향 인터 부호화를 위한 B-시점 Non-anchor 프레임으로 분류될 수 있다.Frames of MVC are largely classified into six groups according to the prediction structure. Specifically, the six groups include an I-view anchor frame for intra coding, an I-view non-anchor frame for inter-time inter-coding, a P-view anchor frame for inter-view unidirectional inter coding, and a unidirectional inter-coding between views. Classified into P-view non-anchor frame for bi-directional inter-coding between time bases, B-view anchor frame for bi-directional inter-coding between views, and B-view non-anchor frame for bi-directional inter coding between time-bases. Can be.
본 발명의 일실시예에 따르면, 부호화 장치(101)는 부호화하고자 하는 현재 시점의 좌우 시점인 주변 시점의 제1 영상을 합성하여 가상 시점의 합성 영상을 생성하고, 합성 영상을 이용하여 현재 시점의 제2 영상을 부호화할 수 있다. 여기서, 합성에 필요한 주변 시점의 제1 영상은 이미 부호화된 영상을 의미한다. 구체적으로, 부호화 장치(101)는 이미 부호화된 I-View를 합성하여 P-View를 부호화할 수 있다. 또는, 부호화 장치(101)는 이미 부호화된 I-View와 P-View를 합성하여 B-View를 부호화할 수 있다. 결국, 부호화 장치(101)는 주변에 위치한 이미 부호화된 영상을 합성하여 특정 영상을 부호화할 수 있다.According to an embodiment of the present invention, the encoding apparatus 101 generates a composite image of a virtual view by synthesizing a first image of a neighboring view, which is a left and right view of the current view to be encoded, and uses the synthesized image to generate a synthesized image. The second image may be encoded. Here, the first image of the neighboring view required for synthesis refers to an image that is already encoded. In detail, the encoding apparatus 101 may encode the P-View by synthesizing the already encoded I-View. Alternatively, the encoding apparatus 101 may synthesize a previously encoded I-View and a P-View to encode a B-View. As a result, the encoding apparatus 101 may encode a specific image by synthesizing the already encoded image located in the vicinity.
도 5는 본 발명의 일실시예에 따른 부호화 장치가 적용된 부호화 시스템을 도시한 도면이다.5 is a diagram illustrating an encoding system to which an encoding apparatus according to an embodiment of the present invention is applied.
도 5를 참고하면, 가상 시점의 합성 영상을 생성하기 위해 가상 시점 합성을 위한 추가 구성이 필요하다. 도 5를 참고하면, 현재 시점의 컬러 영상에 대한 합성 영상을 생성하기 위해서, 부호화 장치(101)는 이미 부호화된 주변 시점의 컬러 영상과 깊이 영상을 이용하여 현재 시점의 컬러 영상에 대한 합성 영상을 생성할 수 있다. 그리고, 현재 시점의 깊이 영상에 대한 합성 영상을 생성하기 위해서, 부호화 장치(101)는 이미 부호화된 주변 시점의 깊이 영상을 이용하여 현재 시점의 깊이 영상에 대한 합성 영상을 생성할 수 있다. Referring to FIG. 5, an additional configuration for synthesizing a virtual view is required to generate a synthesized image of the virtual view. Referring to FIG. 5, in order to generate a composite image of a color image of the current view, the encoding apparatus 101 may generate a synthesized image of the color image of the current view by using the color image and the depth image of the neighboring view that are already encoded. Can be generated. In order to generate the composite image of the depth image of the current view, the encoding apparatus 101 may generate the composite image of the depth image of the current view using the depth image of the neighboring view that is already encoded.
도 6은 본 발명의 일실시예에 따른 복호화 장치가 적용된 복호화 시스템을 도시한 도면이다.6 is a diagram illustrating a decoding system to which a decoding apparatus is applied according to an embodiment of the present invention.
도 6의 복호화 장치(102)는 도 5의 부호화 장치(101)와 실질적으로 동일한 동작을 수행하기 때문에, 구체적인 설명은 생략하기로 한다. Since the decoding apparatus 102 of FIG. 6 performs substantially the same operation as the encoding apparatus 101 of FIG. 5, a detailed description thereof will be omitted.
도 7은 본 발명의 일실시예에 따른 가상 시점 합성 기법을 설명하기 위한 도면이다.7 is a view for explaining a virtual view synthesis technique according to an embodiment of the present invention.
컬러 영상과 깊이 영상에 대한 가상 시점의 합성 영상은 이미 부호화된 컬러 영상과 깊이 영상 및 카메라 파라미터 정보를 이용하여 생성될 수 있다. 구체적으로, 컬러 영상과 깊이 영상에 대한 가상 시점의 합성 영상은 하기 수학식 1-3에 따라 생성될 수 있다.The synthesized image of the virtual view for the color image and the depth image may be generated using the already encoded color image, the depth image, and camera parameter information. In detail, the synthesized image of the virtual view for the color image and the depth image may be generated according to Equation 1-3.
Figure PCTKR2011010204-appb-I000001
Figure PCTKR2011010204-appb-I000001
D(x,y)는 깊이 영상에서 픽셀 위치 (x,y)의 픽셀 값을 의미한다. Znear와 Zfar는 가장 가까운 깊이 정보 및 가장 먼 깊이 정보를 각각 나타낸다. D (x, y) means the pixel value of the pixel position (x, y) in the depth image. Znear and Zfar represent the nearest depth information and the farthest depth information, respectively.
부호화 장치(101)는 실제 깊이 정보 Z를 얻은 뒤 Reference 시점의 (r) 영상을 Target 시점의 영상으로 (t) 합성하기 위해 현재 시점의 픽셀 (x,y)를 world 좌표계(u,v,w)로 투영할 수 있다.  이 때, 픽셀(x,y)은 칼라 영상에 대한 가상 시점 합성을 할 경우에는 칼라 영상의 픽셀을, 깊이 영상에 대한 가상 시점 합성을 할 경우에는 깊이 영상의 픽셀을 나타낸다 The encoding apparatus 101 obtains the actual depth information Z, and then combines the pixel (x, y) of the current view in the world coordinate system (u, v, w) to synthesize (r) the image of the reference view into the image of the target view. ) Can be projected. In this case, the pixels (x, y) represent pixels of the color image when the virtual view synthesis is performed on the color image, and pixels of the depth image when the virtual view synthesis is performed on the depth image.
Figure PCTKR2011010204-appb-I000002
Figure PCTKR2011010204-appb-I000002
Figure PCTKR2011010204-appb-I000003
Figure PCTKR2011010204-appb-I000003
수학식 2에서 A(c)는 내부(intrinsic) 카메라 행렬, R(c)는 카메라 회전(rotation) 행렬, T(c)는 카메라 이동(translation) 행렬, 그리고 D는 깊이 정보를 나타낸다.In Equation 2, A (c) denotes an intrinsic camera matrix, R (c) denotes a camera rotation matrix, T (c) denotes a camera translation matrix, and D denotes depth information.
 그러면, 부호화 장치(101)는 World 좌표계(u,v,w)를 참조 영상의 좌표계(x',y',z')로 투영한다. 이는 수학식 3에 따라 수행된다.Then, the encoding apparatus 101 projects the world coordinate system (u, v, w) into the coordinate system (x ', y', z ') of the reference image. This is done according to equation (3).
Figure PCTKR2011010204-appb-I000004
Figure PCTKR2011010204-appb-I000004
최종적으로 Target 시점의 영상에서 대응되는 픽셀은 (x'/z',y'/z')이 된다.Finally, the corresponding pixel in the image of the target viewpoint becomes (x '/ z', y '/ z').
도 8은 본 발명의 일실시예에 따라 가상 시점 합성 예측 기법의 스킵 모드를 도시한 도면이다.8 is a diagram illustrating a skip mode of a virtual view synthesis prediction technique according to an embodiment of the present invention.
도 8을 참고하면, 부호화 장치(101)는 현재 시점의 제2 영상(801)의 주변 시점의 제1 영상(802, 803)을 이용하여 가상 시점의 합성 영상(804)을 생성할 수 있다. 즉, 가상 시점의 합성 영상(804)은 현재 시점의 제2 영상(801)과 유사한 특징을 가진다. 여기서, 주변 시점의 제1 영상(802, 803)은 현재 시점의 제2 영상(801)을 부호화하기 전에 이미 부호화된 것으로 도 5의 프레임 버퍼에 제2 영상(801)에 대한 참조 영상으로 저장될 수 있다.Referring to FIG. 8, the encoding apparatus 101 may generate the synthesized image 804 of the virtual view using the first images 802 and 803 of the neighbor view of the second image 801 of the current view. That is, the composite image 804 of the virtual view has similar characteristics to the second image 801 of the current view. Here, the first images 802 and 803 of the neighboring viewpoint are already encoded before the second image 801 of the current viewpoint is encoded and stored in the frame buffer of FIG. 5 as a reference image for the second image 801. Can be.
부호화 장치(101)는 가상 시점의 합성 영상(804)에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 현재 블록을 영벡터 블록으로 대체하는 제1 부호화 모드를 선택할 수 있다. 실제로, 제1 부호화 모드는 제2 영상(801)에 포함된 현재 블록을 부호화하지 않고 가상 시점의 합성 영상(804)에 포함된 영벡터 블록을 대체한다. 제1 부호화 모드는 가상 시점 합성 스킵 모드를 나타낸다.The encoding apparatus 101 may search for a zero vector block located at the same position as the current block in the synthesized image 804 of the virtual view, and select a first encoding mode in which the current block is replaced with the zero vector block. In practice, the first encoding mode replaces the zero vector block included in the synthesized image 804 of the virtual view without encoding the current block included in the second image 801. The first encoding mode represents a virtual view synthesis skip mode.
도 9는 본 발명의 일실시예에 따라 가상 시점 합성 예측 기법의 잔차 신호 부호화 모드를 도시한 도면이다.9 illustrates a residual signal encoding mode of a virtual view synthesis prediction method according to an embodiment of the present invention.
도 9를 참고하면, 부호화 장치(101)는 현재 시점의 제2 영상(901)의 주변 시점의 제1 영상(902, 903)을 이용하여 가상 시점의 합성 영상(904)을 생성할 수 있다. 즉, 가상 시점의 합성 영상(904)는 현재 시점의 제2 영상(901)과 유사한 특징을 가진다. 여기서, 주변 시점의 제1 영상(902, 903)은 현재 시점의 제2 영상(901)을 부호화하기 전에 이미 부호화된 것으로 도 5의 프레임 버퍼에 제2 영상(901)에 대한 참조 영상으로 저장될 수 있다.Referring to FIG. 9, the encoding apparatus 101 may generate the synthesized image 904 of the virtual view using the first images 902 and 903 of the neighboring view of the second image 901 of the current view. That is, the composite image 904 of the virtual view has similar characteristics to the second image 901 of the current view. Here, the first images 902 and 903 of the neighboring viewpoint are already encoded before the encoding of the second image 901 of the current viewpoint and may be stored as a reference image for the second image 901 in the frame buffer of FIG. 5. Can be.
부호화 장치(101)는 가상 시점의 합성 영상(904)에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 영벡터 블록을 기준으로 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 예측 블록을 가리키는 가상 합성 벡터에 기초하여 잔차 신호 부호화를 수행하는 제2 부호화 모드를 선택할 수 있다.The encoding apparatus 101 searches for a zero vector block located at the same position as the current block in the synthesized image 904 of the virtual view, and predicts a prediction block and a prediction block most similar to the current block to be currently encoded based on the zero vector block. A second encoding mode for performing residual signal encoding may be selected based on the virtual synthesis vector indicated.
구체적으로, 부호화 장치(101)는 가상 시점의 합성 영상(904)에서 영벡터 블록을 중심으로 일정 영역에 속한 블록들 중 현재 부호화하고자 하는 현재 블록과 가장 유사한 블록을 찾는다. 여기서, 영벡터 블록과 가장 유사한 블록을 예측 블록이라고 정의한다. 그리고 부호화 장치(101)는 영벡터 블록에서 예측 블록으로 가리키는 가상 합성 벡터를 결정할 수 있다. 부호화 장치(101)는 제2 영상(901)에 포함된 현재 블록과 예측 블록 간의 차분 신호 및 예측 블록에 대응하는 가상 합성 벡터를 함께 부호화할 수 있다. 여기서, 제2 부호화 모드는 가상 시점 합성 잔차 신호 부호화 모드를 나타낸다.In detail, the encoding apparatus 101 finds a block that is most similar to the current block to be currently encoded among blocks belonging to a predetermined region around the zero vector block in the synthesized image 904 of the virtual view. Here, the block most similar to the zero vector block is defined as a prediction block. The encoding apparatus 101 may determine a virtual synthesis vector indicated by the prediction block in the zero vector block. The encoding apparatus 101 may encode the difference signal between the current block and the prediction block included in the second image 901 and the virtual synthesis vector corresponding to the prediction block. Here, the second encoding mode indicates a virtual view synthesis residual signal encoding mode.
본 발명의 일실시예에 따른 가상 시점 합성 스킵 모드 또는 가상 시점 합성 잔차 신호 부호화 모드 중 적어도 하나는 현재 정의되어 있는 부호화 모드와 함께 사용될 수 있다. At least one of a virtual view synthesis skip mode or a virtual view synthesis residual signal encoding mode according to an embodiment of the present invention may be used together with a currently defined encoding mode.
도 10은 본 발명의 일실시예에 따라 가상 시점 합성 예측 기법에 대한 스킵 모드의 플래그 위치를 도시한 도면이다.FIG. 10 illustrates a flag position of a skip mode for a virtual view synthesis prediction technique according to an embodiment of the present invention.
앞서 설명하였듯이, 부호화 장치(101)는 현재 시점의 제2 영상에 포함된 현재 블록에 대해 부호화 모드를 선택할 수 있다. 여기서, 부호화 장치(101)는 현재 부호화하고자 하는 현재 블록에 대해 제1 부호화 모드, 제2 부호화 모드 및 현재 정의되어 있는 제3 부호화 모드들 중 어느 하나의 부호화 모드를 선택할 수 있다. As described above, the encoding apparatus 101 may select an encoding mode for the current block included in the second image of the current view. Here, the encoding apparatus 101 may select one of the first encoding mode, the second encoding mode, and the third encoding modes currently defined for the current block to be encoded.
이 때, 부호화 장치(101)는 제1 부호화 모드에 따라 부호화한 결과, 제2 부호화 모드에 따라 부호화한 결과 및 현재 정의되어 있는 제3 부호화 모드들에 따라 부호화한 결과 중 부호화 성능이 가장 좋은 부호화 모드를 선택할 수 있다. 여기서, 부호화 성능은 비용 함수가 최소인 부호화 모드를 의미한다.In this case, the encoding apparatus 101 has the best encoding performance among encoding results according to the first encoding mode, encoding results according to the second encoding mode, and encoding results according to currently defined third encoding modes. You can select the mode. Here, the encoding performance refers to an encoding mode in which the cost function is minimum.
여기서, 제1 부호화 모드는 가상 시점의 합성 영상에서 현재 부호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 현재 부호화하고자 하는 현재 블록을 영벡터 블록으로 대체하는 부호화 모드를 의미한다. 제1 부호화 모드는 가상 시점 합성 스킵 모드로 정의될 수 있다.Here, the first encoding mode refers to an encoding mode that searches for a zero vector block located at the same position as the current block to be encoded in the synthesized image of the virtual view and replaces the current block to be encoded with the zero vector block. The first encoding mode may be defined as a virtual view synthesis skip mode.
그리고, 제2 부호화 모드는 가상 시점의 합성 영상에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 영벡터 블록을 기준으로 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 예측 블록을 가리키는 가상 합성 벡터에 기초하여 잔차 신호 부호화를 수행하는 부호화 모드를 의미한다. 제2 부호화 모드는 가상 시점 합성 잔차 신호 부호화 모드로 정의될 수 있다.The second encoding mode searches for a zero vector block located at the same position as the current block in the composite image of the virtual view, and indicates a prediction block and a prediction block most similar to the current block to be currently encoded based on the zero vector block. A coding mode for performing residual signal coding based on a synthesis vector. The second encoding mode may be defined as a virtual view synthesis residual signal encoding mode.
특히, 부호화 모드가 제1 부호화 모드로 선택된 경우, 부호화 장치(101)는 제1 부호화 모드를 비트 플래그로 식별하여 복호화 장치(102)에 전달할 수 있다.In particular, when the encoding mode is selected as the first encoding mode, the encoding apparatus 101 may identify the first encoding mode as a bit flag and transmit the first encoding mode to the decoding apparatus 102.
도 10을 참고하면, 본 발명의 일실시예에 따라 결정된 가상 시점 합성 스킵 모드(Virtual Synthesis View Skip mode)를 사용하기 위해서는 추가적인 비트 플래그가 필요하다. 본 발명의 일실시예에 따르면, 부호화 장치(101)는 가상 시점 합성 스킵 모드의 플래그(vs_skip_flag)를 현재 정의되어 있는 스킵 모드의 플래그(mb_skip_flag) 뒤에 위치시킬 수 있다.Referring to FIG. 10, an additional bit flag is required to use a virtual synthesis view skip mode determined according to an embodiment of the present invention. According to an embodiment of the present invention, the encoding apparatus 101 may place the flag vs_skip_flag of the virtual view synthesis skip mode after the flag mb_skip_flag of the currently defined skip mode.
만약, 현재 시점의 제2 영상에서 현재 부호화하고자 하는 현재 블록의 부호화 모드가 현재 정의되어 있는 제3 부호화 모드의 스킵 모드인 경우, 부호화 장치(101)는 mb_skip_flag를 1로 설정하여 복호화 장치(102)에 전송할 수 있다. 그리고, 현재 시점의 제2 영상에서 현재 부호화하고자 하는 현재 블록의 부호화 모드가 제1 부호화 모드인 가상 시점 합성 스킵 모드인 경우, 부호화 장치(101)는 mb_skip_flag를 0으로 설정하고, vs_skip_flag를 1로 설정하여 복호화 장치(102)에 전송할 수 있다.If the encoding mode of the current block to be currently encoded in the second image of the current view is the skip mode of the currently defined third encoding mode, the encoding apparatus 101 sets mb_skip_flag to 1 and the decoding apparatus 102. Can be sent to. When the encoding mode of the current block to be currently encoded in the second image of the current view is the virtual view synthesis skip mode that is the first encoding mode, the encoding apparatus 101 sets mb_skip_flag to 0 and sets vs_skip_flag to 1. Can be transmitted to the decryption apparatus 102.
만약, 현재 시점의 제2 영상에서 현재 부호화하고자 하는 현재 블록의 부호화 모드가 제 3 부호화 모드인 스킵 모드와 제1 부호화 모드인 가상 시점 합성 스킵 모드가 아닌 경우, 부호화 장치(101)는 mb_skip_flag를 0으로 설정하고, vs_skip_flag를 0로 설정하여 복호화 장치(102)에 전송할 수 있다.If the encoding mode of the current block to be currently encoded in the second image of the current view is not the skip mode that is the third encoding mode or the virtual view synthesis skip mode that is the first encoding mode, the encoding apparatus 101 sets mb_skip_flag to 0. And vs_skip_flag to 0 to transmit to the decoding device 102.
그리고, 본 발명의 일실시예에 따르면, 현재 시점의 제2 영상의 현재 블록에 대한 최적의 부호화 모드가 현재 정의되어 있는 제3 부호화 모드의 스킵 모드인 경우, 부호화 장치(101)는 본 발명의 일실시예에 따른 가상 시점 합성 방식을 사용하지 않을 수 있다. According to an embodiment of the present invention, when the optimal encoding mode for the current block of the second image of the current view is the skip mode of the third encoding mode that is currently defined, the encoding device 101 may be configured according to the present invention. According to an embodiment, the virtual view synthesis method may not be used.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. Methods according to an embodiment of the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.

Claims (31)

  1. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부; 및A synthesized image generator configured to synthesize the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view; And
    상기 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부An image encoder which encodes current blocks included in a second image of a current view by using the synthesized image of the virtual view.
    를 포함하는 부호화 장치.Encoding apparatus comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 합성 영상을 이용하여 합성 예측과 관련된 현재 블록들의 부호화 모드를 선택하는 모드 선택부A mode selection unit for selecting an encoding mode of current blocks related to synthesis prediction using the synthesized image
    를 더 포함하고,More,
    상기 영상 부호화부는,The image encoder,
    상기 부호화 모드에 기초하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 것을 특징으로 하는 부호화 장치.And encoding current blocks included in a second image of a current view based on the encoding mode.
  3. 제2항에 있어서,The method of claim 2,
    상기 모드 선택부는,The mode selector,
    가상 시점의 합성 영상에서 제2 영상에 포함된 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 상기 현재 블록을 영벡터 블록으로 대체하는 제1 부호화 모드를 결정하는 것을 특징으로 하는 부호화 장치.And a zero vector block located at the same position as the current block included in the second image in the synthesized image of the virtual view, and determining a first encoding mode in which the current block is replaced with the zero vector block.
  4. 제2항에 있어서,The method of claim 2,
    상기 모드 선택부는,The mode selector,
    가상 시점의 합성 영상에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 영벡터 블록을 기준으로 제2 영상에 포함된 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 상기 예측 블록을 가리키는 가상 합성 벡터에 기초하여 잔차 신호 부호화를 수행하는 제2 부호화 모드를 결정하는 것을 특징으로 하는 부호화 장치.Search for a zero vector block located at the same position as the current block in the synthesized image of the virtual view, and predict the prediction block most similar to the current block to be currently encoded in the second image based on the zero vector block and the virtual block indicating the prediction block. And a second encoding mode for performing residual signal encoding based on the synthesis vector.
  5. 제2항에 있어서,The method of claim 2,
    상기 모드 선택부는,The mode selector,
    상기 현재 블록을 영벡터 블록으로 대체하는 제1 부호화 모드와 상기 영벡터 블록을 기준으로 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 상기 예측 블록을 가리키는 가상 합성 벡터 기초하여 잔차 신호 부호화를 수행하는 제2 부호화 모드 중 비용 함수가 최소인 부호화 모드를 결정하는 것을 특징으로 하는 부호화 장치.Residual signal encoding is performed based on a first encoding mode that replaces the current block with a zero vector block, a prediction block most similar to a current block to be currently encoded based on the zero vector block, and a virtual synthesis vector indicating the prediction block. And an encoding mode having a minimum cost function among the second encoding modes.
  6. 제3항 또는 제5항 중 어느 한 항에 있어서,The method according to any one of claims 3 to 5,
    현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그를 제1 부호화 모드의 플래그보다 비트스트림에 먼저 위치하도록 설정하는 플래그 설정부A flag setting unit for setting a flag of a skip mode related to a prediction method currently defined with respect to the second image of the current view to be located in the bitstream before the flag of the first encoding mode.
    를 더 포함하는 부호화 장치.Encoding apparatus further comprising.
  7. 제2항에 있어서,The method of claim 2,
    상기 영상 부호화부는,The image encoder,
    상기 현재 블록의 부호화 모드가 현재 정의되어 있는 예측 방식과 관련된 스킵 모드로 결정되면, 합성 예측과 관련된 부호화 모드를 선택적으로 적용하는 것을 특징으로 하는 부호화 장치.And when the encoding mode of the current block is determined to be a skip mode associated with a currently defined prediction method, selectively applies an encoding mode related to synthesis prediction.
  8. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부;A synthesized image generator configured to synthesize the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view;
    상기 합성 영상과 관련한 가상 시점 합성 스킵 모드 또는 가상 시점 합성 잔차 신호 부호화 모드 중 어느 하나를 선택하는 모드 선택부; 및A mode selection unit for selecting one of a virtual view synthesis skip mode and a virtual view synthesis residual signal encoding mode associated with the synthesized image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부An image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
    를 포함하는 부호화 장치.Encoding apparatus comprising a.
  9. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부;A synthesized image generator configured to synthesize the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view;
    상기 합성 영상과 관련한 가상 시점 합성 스킵 모드를 선택하는 모드 선택부; 및A mode selection unit for selecting a virtual view synthesis skip mode associated with the composite image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부An image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
    를 포함하는 부호화 장치.Encoding apparatus comprising a.
  10. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부;A synthesized image generator configured to synthesize the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view;
    상기 합성 영상과 관련한 가상 시점 합성 잔차 신호 부호화 모드를 선택하는 모드 선택부; 및A mode selection unit for selecting a virtual view synthesis residual signal encoding mode associated with the synthesis image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부An image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
    를 포함하는 부호화 장치.Encoding apparatus comprising a.
  11. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부;A synthesized image generator configured to synthesize the first images of the neighboring views, which are already encoded, to generate a synthesized image of the virtual view;
    상기 합성 영상과 관련한 가상 시점 합성 스킵 모드, 가상 시점 합성 잔차 신호 부호화 모드 및 현재 정의되어 있는 부호화 모드들 중 부호화 성능이 가장 좋은 부호화 모드를 선택하는 모드 선택부; 및A mode selection unit for selecting an encoding mode having the best encoding performance among virtual view synthesis skip modes, virtual view synthesis residual signal encoding modes, and currently defined encoding modes associated with the synthesized image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 영상 부호화부An image encoder which encodes current blocks included in a second image of a current view using the encoding mode.
    를 포함하는 부호화 장치.Encoding apparatus comprising a.
  12. 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 합성 영상 생성부;A synthesized image generator configured to synthesize first images of neighboring viewpoints, which are already decoded, to generate a synthesized image of a virtual view;
    부호화 장치로부터 수신된 비트스트림에서 현재 시점의 제2 영상에 대한 복호화 모드를 결정하는 모드 결정부; 및A mode determination unit that determines a decoding mode of a second image of a current view in a bitstream received from an encoding device; And
    상기 복호화 모드에 따라 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 복호화하는 영상 복호화부An image decoder which decodes the current blocks included in the second image of the current view by using the synthesized image of the virtual view according to the decoding mode.
    를 포함하는 복호화 장치.Decoding apparatus comprising a.
  13. 제12항에 있어서,The method of claim 12,
    상기 모드 결정부는,The mode determination unit,
    비트스트림으로부터 가상 시점의 합성 영상에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 상기 현재 블록을 영벡터 블록으로 대체하는 제1 복호화 모드를 결정하는 것을 특징으로 하는 복호화 장치.And a first decoding mode for retrieving a zero vector block at the same position as the current block from the bitstream in the synthesized image of the virtual view, and determining a first decoding mode in which the current block is replaced with the zero vector block.
  14. 제12항에 있어서,The method of claim 12,
    상기 모드 결정부는,The mode determination unit,
    비트스트림으로부터 가상 시점의 합성 영상에서 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 상기 영벡터 블록을 기준으로 주변 블록들 중 현재 복호화하고자 하는 현재 블록과 가장 유사한 예측 블록을 가리키는 복호화된 가상 합성 벡터에 기초하여 잔차 신호 복호화를 수행하는 제2 복호화 모드를 결정하는 것을 특징으로 하는 복호화 장치.Decoded virtual that searches for a zero vector block at the same position as the current block in the composite image of the virtual view from the bitstream, and indicates a prediction block most similar to the current block to be currently decoded among neighboring blocks based on the zero vector block. And a second decoding mode for performing residual signal decoding based on the composite vector.
  15. 제13항에 있어서,The method of claim 13,
    비트스트림에서 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그 뒤에 위치한 제1 복호화 모드의 플래그를 추출하는 플래그 추출부A flag extractor for extracting a flag of a first decoding mode located after a flag of a skip mode associated with a prediction method currently defined for a second image of a current view in a bitstream.
    를 더 포함하는 복호화 장치.Decoding apparatus further comprising.
  16. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계; 및Generating a synthesized image of the virtual view by synthesizing the first images of the previously encoded neighboring views; And
    상기 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계Encoding current blocks included in a second image of a current view using the synthesized image of the virtual view
    를 포함하는 부호화 방법.Encoding method comprising a.
  17. 제16항에 있어서,The method of claim 16,
    상기 합성 영상을 이용하여 합성 예측과 관련된 현재 블록들의 부호화 모드를 선택하는 단계Selecting an encoding mode of current blocks related to synthesis prediction using the synthesized image
    를 더 포함하고,More,
    상기 현재 시점의 제2 영상에 포함된 블록을 부호화하는 단계는,Encoding a block included in the second image of the current view,
    상기 부호화 모드에 기초하여 현재 시점의 제2 영상에 포함된 현재 블록을 부호화하는 것을 특징으로 하는 부호화 방법.And a current block included in the second image of the current view based on the encoding mode.
  18. 제17항에 있어서,The method of claim 17,
    상기 블록의 부호화 모드를 선택하는 단계는,Selecting the encoding mode of the block,
    가상 시점의 합성 영상에서 현재 부호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 상기 현재 블록을 영벡터 블록으로 대체하는 제1 부호화 모드를 결정하는 것을 특징으로 하는 부호화 방법.And a zero vector block located at the same position as the current block to be currently encoded in the synthesized image of the virtual view, and determining a first encoding mode in which the current block is replaced with the zero vector block.
  19. 제17항에 있어서,The method of claim 17,
    상기 블록의 부호화 모드를 선택하는 단계는,Selecting the encoding mode of the block,
    가상 시점의 합성 영상에서 현재 부호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 영벡터 블록을 기준으로 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 상기 예측 블록을 가리키는 가상 합성 벡터 기초하여 잔차 신호 부호화를 수행하는 제2 부호화 모드를 결정하는 것을 특징으로 하는 부호화 방법.Search for a zero vector block located at the same position as the current block to be currently encoded in the synthesized image of the virtual view, and predict the most similar block to the current block to be currently encoded based on the zero vector block and a virtual synthesized vector indicating the prediction block. And a second encoding mode for performing residual signal encoding based on the encoding method.
  20. 제17항에 있어서,The method of claim 17,
    상기 블록의 부호화 모드를 선택하는 단계는,Selecting the encoding mode of the block,
    상기 블록을 영벡터 블록으로 대체하는 제1 부호화 모드와 상기 영벡터 블록을 기준으로 현재 부호화하고자 하는 현재 블록과 가장 유사한 예측 블록 및 상기 예측 블록을 가리키는 가상 합성 벡터에 기초하여 잔차 신호 부호화를 수행하는 제2 부호화 모드 중 비용 함수가 최소인 부호화 모드를 결정하는 것을 특징으로 하는 부호화 방법.Residual signal encoding is performed based on a first encoding mode in which the block is replaced with a zero vector block, a prediction block most similar to a current block to be currently encoded based on the zero vector block, and a virtual synthesis vector indicating the prediction block. A coding method, characterized in that for determining the coding mode of the minimum cost function of the second coding mode.
  21. 제18항 또는 제20항 중 어느 한 항에 있어서,The method according to any one of claims 18 or 20,
    현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그를 제1 부호화 모드의 플래그보다 비트스트림에 먼저 위치하도록 설정하는 단계Setting a flag of a skip mode related to a prediction method currently defined with respect to a second image of a current view to be positioned in a bitstream before a flag of a first encoding mode
    를 더 포함하는 부호화 방법.Encoding method further comprising.
  22. 제17항에 있어서,The method of claim 17,
    상기 현재 시점의 제2 영상에 포함된 현재 블록을 부호화하는 단계는,Encoding the current block included in the second image of the current view,
    상기 현재 블록의 부호화 모드가 현재 정의되어 있는 예측 방식과 관련된 스킵 모드로 결정되면, 합성 예측과 관련된 부호화 모드를 선택적으로 적용하는 것을 특징으로 하는 부호화 방법.And when the encoding mode of the current block is determined to be a skip mode associated with a currently defined prediction method, selectively applies an encoding mode related to synthesis prediction.
  23. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계;Generating a synthesized image of the virtual view by synthesizing the first images of the previously encoded neighboring views;
    상기 합성 영상과 관련한 가상 시점 합성 스킵 모드 또는 가상 시점 합성 잔차 신호 부호화 모드 중 어느 하나를 선택하는 단계; 및Selecting one of a virtual view synthesis skip mode or a virtual view synthesis residual signal encoding mode associated with the synthesis image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계Encoding current blocks included in a second image of a current view using the encoding mode
    를 포함하는 부호화 방법.Encoding method comprising a.
  24. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계;Generating a synthesized image of the virtual view by synthesizing the first images of the previously encoded neighboring views;
    상기 합성 영상과 관련한 가상 시점 합성 스킵 모드를 선택하는 단계; 및Selecting a virtual view synthesis skip mode associated with the synthesized image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계Encoding current blocks included in a second image of a current view using the encoding mode
    를 포함하는 부호화 방법.Encoding method comprising a.
  25. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계;Generating a synthesized image of the virtual view by synthesizing the first images of the previously encoded neighboring views;
    상기 합성 영상과 관련한 가상 시점 합성 잔차 신호 부호화 모드를 선택하는 단계; 및Selecting a virtual view synthesis residual signal encoding mode associated with the synthesis image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계Encoding current blocks included in a second image of a current view using the encoding mode
    를 포함하는 부호화 방법.Encoding method comprising a.
  26. 이미 부호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계;Generating a synthesized image of the virtual view by synthesizing the first images of the previously encoded neighboring views;
    상기 합성 영상과 관련한 가상 시점 합성 스킵 모드, 가상 시점 합성 잔차 신호 부호화 모드 및 현재 정의되어 있는 부호화 모드들 중 부호화 성능이 가장 좋은 부호화 모드를 선택하는 단계; 및Selecting an encoding mode having the best encoding performance among virtual view synthesis skip modes, virtual view synthesis residual signal encoding modes, and currently defined encoding modes associated with the synthesized image; And
    상기 부호화 모드를 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 부호화하는 단계Encoding current blocks included in a second image of a current view using the encoding mode
    를 포함하는 부호화 방법.Encoding method comprising a.
  27. 이미 복호화된 주변 시점의 제1 영상들을 합성하여 가상 시점의 합성 영상을 생성하는 단계;Synthesizing the first images of the neighboring viewpoints, which are already decoded, to generate a composite image of the virtual viewpoint;
    부호화 장치로부터 수신된 비트스트림에서 현재 시점의 제2 영상에 대한 복호화 모드를 결정하는 단계; 및Determining a decoding mode of a second image of a current view in a bitstream received from an encoding apparatus; And
    상기 복호화 모드에 따라 주변 시점의 제1 영상들을 합성한 가상 시점의 합성 영상을 이용하여 현재 시점의 제2 영상에 포함된 현재 블록들을 복호화하는 단계Decoding current blocks included in a second image of a current view using a synthesized image of a virtual view synthesized with first images of a neighboring view according to the decoding mode
    를 포함하는 복호화 방법.Decryption method comprising a.
  28. 제27항에 있어서,The method of claim 27,
    상기 현재 시점의 제2 영상에 대한 복호화 모드를 결정하는 단계는,The determining of the decoding mode for the second image of the current view may include:
    비트스트림으로부터 가상 시점의 합성 영상에서 복호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 상기 현재 블록을 영벡터 블록으로 대체하는 제1 복호화 모드를 결정하는 것을 특징으로 하는 복호화 방법.And retrieving a zero vector block located at the same position as the current block to be decoded in the composite image of the virtual view from the bitstream, and determining a first decoding mode in which the current block is replaced with the zero vector block.
  29. 제27항에 있어서,The method of claim 27,
    상기 현재 시점의 제2 영상에 대한 복호화 모드를 결정하는 단계는,The determining of the decoding mode for the second image of the current view may include:
    비트스트림으로부터 가상 시점의 합성 영상에서 복호화하고자 하는 현재 블록과 동일한 위치에 있는 영벡터 블록을 검색하고, 상기 영벡터 블록을 기준으로 주변 블록들 중 현재 복호화하고자 하는 현재 블록과 가장 유사한 예측 블록을 가리키는 복호화된 가상 합성 벡터에 기초하여 잔차 신호 복호화를 수행하는 제2 복호화 모드를 결정하는 것을 특징으로 하는 복호화 방법.Search for a zero vector block at the same position as the current block to be decoded in the composite image of the virtual view from the bitstream, and indicate a prediction block most similar to the current block to be currently decoded among neighboring blocks based on the zero vector block. And a second decoding mode for performing residual signal decoding based on the decoded virtual synthesis vector.
  30. 제27항에 있어서,The method of claim 27,
    비트스트림에서 현재 시점의 제2 영상에 대해 현재 정의되어 있는 예측 방식과 관련된 스킵 모드의 플래그 뒤에 위치한 제1 복호화 모드의 플래그를 추출하는 단계Extracting a flag of a first decoding mode located after a flag of a skip mode associated with a prediction method currently defined for a second image of a current view in a bitstream
    를 더 포함하는 복호화 방법.Decryption method further comprising.
  31. 제16항 내지 제20항 및 제22항 내지 제30항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the method of any one of claims 16 to 20 and 22 to 30.
PCT/KR2011/010204 2011-08-26 2011-12-28 Encoding/decoding device and method using virtual view synthesis and prediction WO2013032071A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/241,320 US20140301455A1 (en) 2011-08-26 2011-12-28 Encoding/decoding device and method using virtual view synthesis and prediction

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110085963A KR20130022923A (en) 2011-08-26 2011-08-26 Apparatus and method for encoding/decoding using virtual view synthesis prediction
KR10-2011-0085963 2011-08-26

Publications (1)

Publication Number Publication Date
WO2013032071A1 true WO2013032071A1 (en) 2013-03-07

Family

ID=47756520

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/010204 WO2013032071A1 (en) 2011-08-26 2011-12-28 Encoding/decoding device and method using virtual view synthesis and prediction

Country Status (3)

Country Link
US (1) US20140301455A1 (en)
KR (1) KR20130022923A (en)
WO (1) WO2013032071A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9480731B2 (en) * 2013-12-12 2016-11-01 Medy-Tox, Inc. Long lasting effect of new botulinum toxin formulations
RU2019110875A (en) 2016-09-13 2020-10-15 Аллерган, Инк. NON-PROTEIN CLOSTRIDIAL TOXIN COMPOSITIONS

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080159638A1 (en) * 2007-01-03 2008-07-03 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-view images based on global disparity vector
US20080170618A1 (en) * 2007-01-11 2008-07-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-view images
WO2010068020A2 (en) * 2008-12-08 2010-06-17 한국전자통신연구원 Multi- view video coding/decoding method and apparatus
KR20110011496A (en) * 2009-07-28 2011-02-08 삼성전자주식회사 Method and apparatus for encoding/decoding image based on skip mode

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7671894B2 (en) * 2004-12-17 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using skip and direct modes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080159638A1 (en) * 2007-01-03 2008-07-03 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-view images based on global disparity vector
US20080170618A1 (en) * 2007-01-11 2008-07-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-view images
WO2010068020A2 (en) * 2008-12-08 2010-06-17 한국전자통신연구원 Multi- view video coding/decoding method and apparatus
KR20110011496A (en) * 2009-07-28 2011-02-08 삼성전자주식회사 Method and apparatus for encoding/decoding image based on skip mode

Also Published As

Publication number Publication date
KR20130022923A (en) 2013-03-07
US20140301455A1 (en) 2014-10-09

Similar Documents

Publication Publication Date Title
WO2010068020A9 (en) Multi- view video coding/decoding method and apparatus
WO2015142054A1 (en) Method and apparatus for processing multiview video signals
WO2012081877A2 (en) Multi-view video encoding/decoding apparatus and method
WO2012144821A2 (en) Method and apparatus for unified scalable video encoding for multi-view video and method and apparatus for unified scalable video decoding for multi-view video
WO2010087589A2 (en) Method and apparatus for processing video signals using boundary intra coding
WO2010123203A2 (en) Reference picture list changing method of multi-view video
EP1596609A2 (en) Moving picture encoding apparatus and method, moving picture decoding apparatus and method
WO2014107083A1 (en) Video signal processing method and device
KR20120080122A (en) Apparatus and method for encoding and decoding multi-view video based competition
WO2013162273A1 (en) Method and apparatus for processing video signal
JP2015525997A (en) Method and apparatus for inter-view candidate derivation in 3D video coding
WO2014010935A1 (en) Method and apparatus for processing video signal
WO2014010918A1 (en) Method and device for processing video signal
WO2016056822A1 (en) 3d video coding method and device
WO2014168443A1 (en) Method and apparatus for processing video signal
WO2013176485A1 (en) Method and device for processing video signal
KR20080114482A (en) Method and apparatus for illumination compensation of multi-view video coding
WO2013191436A1 (en) Method and device for processing video signal
WO2013133587A1 (en) Method and apparatus for processing video signals
WO2016003209A1 (en) Method and device for processing multi-view video signal
WO2015009098A1 (en) Method and apparatus for processing video signal
WO2013032071A1 (en) Encoding/decoding device and method using virtual view synthesis and prediction
WO2009108028A1 (en) Method for decoding free viewpoint image, and apparatus for implementing the same
WO2015009091A1 (en) Method and apparatus for processing video signal
WO2014109547A1 (en) Method and apparatus for processing video signal

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11871653

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14241320

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 11871653

Country of ref document: EP

Kind code of ref document: A1