KR101223205B1 - Device and method for transmitting stereoscopic video - Google Patents
Device and method for transmitting stereoscopic video Download PDFInfo
- Publication number
- KR101223205B1 KR101223205B1 KR1020100103027A KR20100103027A KR101223205B1 KR 101223205 B1 KR101223205 B1 KR 101223205B1 KR 1020100103027 A KR1020100103027 A KR 1020100103027A KR 20100103027 A KR20100103027 A KR 20100103027A KR 101223205 B1 KR101223205 B1 KR 101223205B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- eye image
- binocular video
- binocular
- left eye
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/139—Format conversion, e.g. of frame-rate or size
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
본 발명의 실시예에 따르면, 양안식 비디오 송신 장치는 제1 입력 영상 및 제2 입력 영상 각각을 다운 샘플링한 후, 다운 샘플링된 영상의 특성을 고려한 템플릿 매칭을 수행한다.
또한, 템플릿 매칭을 이용한 부호화시 우안 영상의 예측 블록 탐색시 좌안 영상으로 탐색 범위를 제한한다.
또한, 가로 해상도를 축소하는 'Side by Side' 포맷의 다운 샘플링을 수행한 후, 좌우 결합이 아닌 상하 방향으로 결합하여 부호화 순서를 변경한다.According to an embodiment of the present invention, the binocular video transmission apparatus downsamples each of the first input image and the second input image, and then performs template matching considering characteristics of the downsampled image.
In addition, the search range is limited to the left eye image when searching for the prediction block of the right eye image when encoding using template matching.
In addition, after down-sampling a 'Side by Side' format that reduces horizontal resolution, the coding order is changed by combining in a vertical direction instead of a left-right combination.
Description
본 발명은 양안식 비디오 송신 장치 및 그 방법에 관한 것으로서, 더욱 자세하게는 양안식 영상을 부호화하여 송신하는 장치 및 그 방법에 관한 것이다.The present invention relates to a binocular video transmission apparatus and a method thereof, and more particularly, to an apparatus and method for encoding and transmitting a binocular video.
양안식 비디오 시스템은 인간의 시각 구조를 모방한 좌, 우 두 개의 2차원 영상을 이용해 3차원 영상을 입출력한다. 양안식 입체 영상의 기본 원리는 인간의 시각 시스템이 왼쪽 눈과 오른쪽 눈의 위치 차이에 의해 서로 다른 영상이 들어오고, 뇌는 그것을 입체로 받아들여 거리감을 갖게되는 과정에서 입체감을 형성하게 된다는 것이다. 이러한 양안식 비디오 시스템은 현재 3D 입체영화 및 3D 입체방송에 이용되고 있다.The binocular video system inputs and outputs a 3D image using two left and right two-dimensional images that mimic the human visual structure. The basic principle of the binocular stereoscopic image is that the human visual system receives different images due to the difference between the position of the left eye and the right eye, and the brain takes it as a stereoscopic image and forms a stereoscopic sense in the process of having a sense of distance. Such binocular video systems are currently used in 3D stereoscopic movies and 3D stereoscopic broadcasting.
그런데 양안식 비디오 시스템의 경우, 기존의 2차원 영상의 두 배에 해당하는 데이터를 입력으로 사용하기 때문에 부호화후 전송해야 하는 데이터의 양이 기존 2차원 비디오 시스템의 두 배이다. 따라서, 양안식 영상의 전송을 위해서는 기존의 2차원 비디오 시스템보다 큰 대역폭이 필요하다. However, in the binocular video system, since the data corresponding to twice the existing two-dimensional image is used as an input, the amount of data to be transmitted after encoding is twice that of the conventional two-dimensional video system. Therefore, the transmission of binocular image requires a larger bandwidth than the conventional two-dimensional video system.
그런데 최근 미디어 처리 시스템이 사용하는 영상의 크기가 빠르게 증가하는 것과 함께 보다 많은 영상 프레임을 요구하는 것을 고려할 때, 시스템에서 요구하는 메모리의 대역폭을 줄이는 기술이 필요한 실정이다.However, considering the recent increase in the size of the image used by the media processing system and the demand for more image frames, a technique for reducing the bandwidth of the memory required by the system is needed.
한편, 양안식 비디오 시스템은 송신단에서는 좌우 영상을 입력받아 부호화를 수행한 후 전송하고, 수신단에서는 전송받은 비트 스트림을 복호한 후 양안식 입체 디스플레이에서 지원하는 포맷으로 변환하여 출력한다.On the other hand, the binocular video system receives a left and right image from the transmitter and performs encoding after transmission, and the receiver receives the decoded bit stream and converts it into a format supported by the binocular stereoscopic display and outputs the converted bit stream.
여기서, 양안식 입체 디스플레이는 다음 표 1과 같은 다양한 포맷으로 제공되고 있으나 현재까지는 표준화된 규격은 존재하고 있지 않다.Here, the binocular stereoscopic display is provided in various formats as shown in Table 1 below, but there is no standardized standard.
위 표 1에 보인 포맷 중에서 상업적으로 가장 많이 사용되는 포맷은 'Side by Side'와 'Top and Bottom'이며, 도 1을 통해 도식화하였다.Among the formats shown in Table 1 above, commercially used formats are 'Side by Side' and 'Top and Bottom', and are illustrated in FIG. 1.
도 1은 종래의 양안식 영상 포맷 구성을 나타낸다.1 shows a conventional binocular image format configuration.
도 1을 참조하면, 가로 'W', 세로 'H'의 해상도를 가진 좌안 영상 및 우안 영상을 'Top and Bottom' 포맷으로 변환하면, 도 1의 (a)와 같다. 즉 좌안 영상 및 우안 영상 각각의 세로 해상도를 'H/2'만큼 다운 샘플링한 후 수직 방향으로 결합하여 하나의 영상으로 변환하는 것이다.Referring to FIG. 1, when a left eye image and a right eye image having a resolution of horizontal “W” and vertical “H” are converted into a “Top and Bottom” format, it is as shown in FIG. 1A. In other words, the vertical resolution of each of the left eye image and the right eye image is downsampled by 'H / 2', and then combined in the vertical direction to be converted into a single image.
또한, 가로 'W', 세로 'H'의 해상도를 가진 좌안 영상 및 우안 영상을 'Side by Side' 포맷으로 변환하면, 도 1의 (b)와 같다. 즉 좌안 영상 및 우안 영상 각각의 가로 해상도를 'W/2'만큼 다운 샘플링한 후 좌우 방향으로 결합하여 하나의 영상으로 변환하는 것이다.In addition, when the left eye image and the right eye image having the resolution of horizontal 'W' and vertical 'H' are converted into 'Side by Side' format, it is as shown in FIG. In other words, the horizontal resolution of each of the left eye image and the right eye image is down-sampled by 'W / 2', and then combined in the left and right directions to be converted into a single image.
한편, 종래에 화면의 부호화 및 복호화를 위한 방법으로 템플릿 매칭(template matching)이 사용되고 있다. 템플릿 매칭은 주변의 화소값을 이용해 가장 최적의 예측 블록을 탐색하는 방식이다.Meanwhile, template matching has been conventionally used as a method for encoding and decoding a picture. Template matching uses a neighboring pixel value to search for the most optimal prediction block.
이때, 예측 블록의 탐색은 왼쪽->오른쪽으로, 그리고 위->아래로 순차적으로 이루어진다. At this time, the search of the prediction block is performed sequentially from left to right and up to down.
도 2는 종래의 양안식 영상 포맷 영상의 부호화를 위한 탐색 영역을 나타낸다. 즉 종래의 'Side by Side' 포맷의 양안식 영상에 대한 탐색 영역 방식을 적용한 예를 나타낸다.2 illustrates a search region for encoding a conventional binocular image format image. That is, an example of applying a conventional search area method for a binocular image having a 'Side by Side' format is shown.
도 2를 참조하면, 탐색 영역(10) 내에서 'Side by Side' 포맷의 우안 영상의 참조 블록(20)의 주변 화소(30)와 유사한 주변 화소(30)를 가지는 예측 블록을 탐색한다. Referring to FIG. 2, a prediction block having a
그런데 좌안 영상과 우안 영상은 각기 다른 카메라를 이용하여 다른 각도, 시점에서 촬영된 영상이므로, 동일한 위치에 존재하는 물체라도 그 위치가 다르게 표현될 수 있다. However, since the left eye image and the right eye image are images captured at different angles and viewpoints using different cameras, the positions of the left eye image and the right eye image may be expressed differently.
예를 들어, 화면 내에서 동일한 인물의 위치가 우안 영상에서 좌안 영상보다 높은 위치에 표현될 수 있다. 이런 경우, 우안 영상의 참조 블록(20)의 주변 화소(30)와 유사한 좌안 영상의 주변 화소(30) 중에서 일부(40)는 아직 탐색 영역(10)에 포함되지 않는 문제가 발생한다.For example, the position of the same person in the screen may be expressed at a position higher than the left eye image in the right eye image. In this case, some of the
따라서, 예측 블록을 탐색하지 못할 뿐만 아니라 이처럼 매칭하지 않는 예측 블록 탐색하는데 소요되는 불필요한 시간으로 인해 전체 탐색 시간이 증가하는 문제가 있다.Accordingly, not only the prediction block may be searched but also the unnecessary search time for searching such a mismatched prediction block may increase the overall search time.
따라서, 본 발명이 이루고자 하는 기술적 과제는 메모리 대역폭을 감소시키고, 예측 블록 탐색 시간을 감소시킨 양안식 비디오 송신 장치 및 그 방법을 제공하는 것이다.Accordingly, an object of the present invention is to provide a binocular video transmission apparatus and method for reducing memory bandwidth and reducing prediction block search time.
본 발명의 한 특징에 따르면 양안식 비디오 송신 장치가 제공된다. 이 장치는, 제1 입력 영상 및 제2 입력 영상 각각을 다운 샘플링-여기서 다운 샘플링은 고 해상도의 영상을 저 해상도의 영상으로 변환함-한 후 하나의 영상으로 결합하여 양안식 비디오 영상을 생성하는 변환부; 상기 변환부로부터 전달받은 양안식 비디오 영상을 부호화하는 부호화부; 및 부호화된 상기 양안식 비디오 영상을 네트워크를 통해 상기 양안식 비디오 영상을 재생하는 양안식 비디오 수신 장치로 송신하는 전송부를 포함한다.According to one aspect of the invention there is provided a binocular video transmission apparatus. The apparatus comprises: downsampling each of the first input image and the second input image, where downsampling converts a high resolution image into a low resolution image and then combines them into a single image to generate a binocular video image. A conversion unit; An encoder for encoding a binocular video image received from the converter; And a transmitter for transmitting the encoded binocular video image to a binocular video receiving apparatus for reproducing the binocular video image over a network.
본 발명의 다른 특징에 따르면 양안식 비디오 송신 방법이 제공된다. 이 방법은, 양안식 비디오 송신 장치가 제1 입력 영상 및 제2 입력 영상 각각을 다운 샘플링-여기서 다운 샘플링은 고 해상도의 영상을 저 해상도의 영상으로 변환함-하는 단계; 다운 샘플링된 상기 제1 입력 영상 및 상기 제2 입력 영상을 양안식 비디오 영상을 생성하는 단계; 상기 양안식 비디오 영상을 부호화하는 단계; 및 부호화된 양안식 비디오 영상을 네트워크를 통해 상기 양안식 비디오 영상을 재생하는 양안식 비디오 수신 장치로 송신하는 단계를 포함한다.According to another aspect of the present invention, a binocular video transmission method is provided. The method includes: downsampling each of the first input image and the second input image by the binocular video transmission apparatus, wherein the down sampling converts a high resolution image into a low resolution image; Generating a binocular video image from the down-sampled first input image and the second input image; Encoding the binocular video image; And transmitting the encoded binocular video image to a binocular video receiving apparatus for reproducing the binocular video image over a network.
본 발명의 실시예에 따르면, 부호화 이전에 입력 영상을 다운 샘플링하여 데이터 크기를 줄이고, 다운 샘플링된 영상의 특성을 고려한 템플릿 매칭을 수행하여 전송해야 하는 데이터량을 감소시킴으로써 메모리 대역폭을 효율적으로 줄일 수 있다.According to an exemplary embodiment of the present invention, memory bandwidth can be efficiently reduced by downsampling an input image prior to encoding to reduce data size and by performing template matching considering the characteristics of the downsampled image to reduce the amount of data to be transmitted. have.
또한, 'Side by Side' 포맷의 다운 샘플링을 수행한 후, 좌우 결합이 아닌 상하 방향으로 결합하여 부호화 순서를 변경할 수 있으므로, 코덱에 추가적인 조건문을 삽입하지 않고도 부호화 순서 변경이 용이하다. 그리고 사전에 보정되지 않은 영상이나 사전 보정에 오차가 있는 영상일지라도 템플릿 매칭시 예측 블록의 탐색이 용이하다.In addition, since downsampling of the 'Side by Side' format is performed, the coding order may be changed by combining in the vertical direction instead of the left and right combination, so that the coding order may be easily changed without inserting an additional conditional sentence into the codec. In addition, even if the image is not corrected in advance or the image has an error in pre-correction, it is easy to search the prediction block during template matching.
또한, 템플릿 매칭을 이용한 우안 영상의 예측 블록 탐색시 좌안 영상으로 탐색 범위를 제한하여 탐색하는데 소요되는 시간을 줄일 수 있다.In addition, when searching for the prediction block of the right eye image using template matching, the time required for searching by limiting the search range to the left eye image can be reduced.
도 1은 종래의 양안식 영상 포맷 구성을 나타낸다.
도 2는 종래의 양안식 영상 포맷 영상의 부호화를 위한 탐색 영역을 나타낸다.
도 3은 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템의 구성도이다.
도 4는 본 발명의 실시예에 따른 양안식 영상 포맷 구성을 나타낸다.
도 5는 본 발명의 실시예에 따른 양안식 영상 포맷 영상의 부호화를 위한 탐색 영역을 나타낸다.
도 6은 본 발명의 실시예에 따른 양안식 비디오 송수신 방법의 과정을 나타낸 흐름도이다.
도 7 및 도 8은 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템의 성능을 나타낸 그래프이다.1 shows a conventional binocular image format configuration.
2 illustrates a search region for encoding a conventional binocular image format image.
3 is a block diagram of a binocular video transmission and reception system according to an embodiment of the present invention.
4 illustrates a binocular video format configuration according to an embodiment of the present invention.
5 illustrates a search region for encoding a binocular video format image according to an embodiment of the present invention.
6 is a flowchart illustrating a process of a binocular video transmission and reception method according to an embodiment of the present invention.
7 and 8 are graphs showing the performance of the binocular video transmission and reception system according to an embodiment of the present invention.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and like reference numerals designate like parts throughout the specification.
명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when an element is referred to as "comprising ", it means that it can include other elements as well, without excluding other elements unless specifically stated otherwise.
이하, 도면을 참조로 하여 본 발명의 실시예에 따른 양안식 비디오 송신 장치 및 그 방법에 대하여 상세히 설명한다.Hereinafter, a binocular video transmission apparatus and method thereof according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.
도 3은 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템의 구성도이고, 도 4는 본 발명의 실시예에 따른 양안식 영상 포맷 구성을 나타내며, 도 5는 본 발명의 실시예에 따른 양안식 영상 포맷 영상의 부호화를 위한 탐색 영역을 나타낸다.3 is a block diagram of a binocular video transmission and reception system according to an embodiment of the present invention, Figure 4 shows a binocular video format configuration according to an embodiment of the present invention, Figure 5 is a binocular according to an embodiment of the present invention A search area for encoding an image format image.
먼저, 도 3을 참조하면, 양안식 비디오 송수신 시스템은 양안식 비디오 송신 장치(100) 및 양안식 비디오 수신 장치(200)를 포함하고, 양안식 비디오 송신 장치(100)와 양안식 비디오 수신 장치(200)는 네트워크(300)을 통해 연결된다.First, referring to FIG. 3, the binocular video transmission / reception system includes a binocular
여기서, 양안식 비디오 송신 장치(100)는 제1 입력 영상 취득부(110), 제2 입력 영상 취득부(130), 변환부(150), 부호화부(170) 및 전송부(190)를 포함한다.Here, the binocular
제1 입력 영상 취득부(110) 및 제2 입력 영상 취득부(130)는 양안식 입체 영상 카메라 장치(미도시)로부터 각각 제1 입력 영상 및 제2 입력 영상을 입력받는다. 이러한 제1 입력 영상 및 제2 입력 영상은 두 개의 카메라를 이용하여 좌우 시점에서 촬영된 좌안 영상 및 우안 영상이며, 다른 시점에서 촬영되므로 다른 각도로 촬영된 영상이다.The first input
여기서, 양안식 입체 영상 카메라 장치(미도시)는 두 대의 카메라를 이용하여 고화질의 3차원 입체 영상을 획득하기 위한 장치로서, 두 대의 서로 다른 카메라의 초점과 주시각 제어를 위하여, 입체 영상 촬영시 카메라 전체가 각각 좌측과 우측으로 서로 이격되어 이동하도록 구성되어 있다.Here, the binocular stereoscopic camera device (not shown) is a device for obtaining a high-quality three-dimensional stereoscopic image by using two cameras, in order to control the focus and viewing angle of two different cameras, The whole camera is configured to be moved away from each other to the left and right, respectively.
변환부(150)는 제1 입력 영상 취득부(110) 및 제2 입력 영상 취득부(130) 각각으로부터 전달받은 제1 입력 영상(또는 좌안 영상) 및 제2 입력 영상(또는 우안 영상)을 다운 샘플링한 후, 하나의 영상으로 결합하여 양안식 포맷의 비디오 영상을 생성한다.The
이때, 다운 샘플링 포맷은 상업적으로 가장 많이 사용되는 'Side by Side'와 'Top and Bottom'을 비롯하여 'Field Sequence', 'Interlaced', '색분리 방식'을 포함할 수 있다.In this case, the down sampling format may include 'Side by Side' and 'Top and Bottom' which are most used commercially, as well as 'Field Sequence', 'Interlaced' and 'Color Separation'.
여기서, 변환부(150)는 도 4에 보인 것처럼, 가로 해상도를 W/2 만큼 축소하는 'Side by Side' 포맷의 다운 샘플링을 수행한 후, 좌우 결합이 아닌 상하 방향으로 결합하여 부호화 순서를 변경한다. Here, the
즉 종래에는 좌우 결합되므로, 부호화가 좌안 영상과 우안 영상이 동시에 좌->우 그리고 상->하 방향으로 이루어졌으나, 본 명세서에서는 좌안 영상과 우안 영상을 상하 결합함으로써 좌안 영상을 먼저 부호화하고 그 다음에 우안 영상의 부호화가 이루어진다.That is, since the left-eye image and the right-eye image are encoded in the left-> right and up-> downward directions simultaneously in the related art, in the present specification, the left-eye image is first encoded by combining the left-eye image and the right-eye image up and down, and then The encoding of the right eye image is performed at.
부호화부(170)는 변환부(150)로부터 전달받은 양안식 비디오 영상을 템플릿 매칭 방법을 이용하여 도 5에 보인 것처럼 부호화를 수행한다.The
여기서, 도 5의 (a)는 종래에 부호화 탐색 범위를 나타낸다. 즉 종래에 상하 방향으로 결합된 양안식 비디오 영상에서는 상->하 방향으로 차례로 부호화를 수행한다. 그리고 탐색 범위(10) 내에서 부호화 대상(target)인 참조 블록(20)의 주변 화소(30)와 유사한 예측 블록을 탐색한다.5A shows a coded search range in the related art. That is, in the conventional binocular video image combined in the up-down direction, encoding is sequentially performed in the up-> down direction. In the
반면, 도 5(b)에 보인 것처럼, 본 발명의 실시예에 따르면, 부호화부(170)는 양안식 비디오 영상 중 제1 입력 영상에 대해 먼저 부호화를 수행한다. 그리고 템플릿 매칭 방법을 이용하여 제2 입력 영상의 참조 블록(20)과 유사한 예측 블록을 부호화된 제1 입력 영상 중에서 탐색한다. 즉 탐색 범위(10)를 이미 부호화가 수행된 제1 입력 영상으로 제한한다.On the other hand, as shown in Figure 5 (b), according to an embodiment of the present invention, the
전송부(190)는 부호화부(170)로부터 전달받은 부호화된 양안식 비디오 영상을 네트워크(300)를 통해 양안식 비디오 수신 장치(200)로 송신한다.The
한편, 양안식 비디오 수신 장치(200)는 수신부(210), 복호화부(230) 및 양안식 영상 출력부(250)를 포함한다.Meanwhile, the binocular
수신부(210)는 양안식 비디오 송신 장치(100)로부터 이미 다운 샘플링 후 부호화된 양안식 비디오 영상을 수신한다.The
복호화부(230)는 수신부(210)가 수신한 양안식 비디오 영상 즉 다운 샘플링 후 결합된 각각의 제1 입력 영상 및 제2 입력 영상을 템플릿 매칭을 이용하여 복호화를 수행하여 복원한다.The
양안식 영상 출력부(250)는 복호화부(230)가 복원한 제1 입력 영상 및 제2 입력 영상의 시차에 대한 정보를 생성하여 양안식 영상에서의 깊이를 조절한 후, 조절된 깊이에 따라 양안식 영상을 재생한다.The binocular
이상 설명한, 양안식 비디오 송수신 장치의 동작을 일련의 과정으로 설명하면 다음과 같다.The operation of the binocular video transceiver as described above is described as a series of processes as follows.
도 6은 본 발명의 실시예에 따른 양안식 비디오 송수신 방법의 과정을 나타낸 흐름도이다.6 is a flowchart illustrating a process of a binocular video transmission and reception method according to an embodiment of the present invention.
도 6을 참조하면, 양안식 비디오 송신 장치(100)는 제1 입력 영상 및 제2 입력 영상을 입력(S101)받아 각 영상의 해상도를 고 해상도에서 저 해상도로 변환하는 다운 샘플링을 수행한다(S103). 그리고 다운 샘플링된 각 영상을 결합하여 하나의 영상 즉 양안식 비디오 영상을 생성한다(S105).Referring to FIG. 6, the binocular
이후, 양안식 비디오 송신 장치(100)는 S105 단계에서 생성한 양안식 비디오 영상을 템플릿 매칭을 이용한 부호화를 수행(S107)한 후 양안식 비디오 수신 장치(200)에게 전송한다(S109).Thereafter, the binocular
그러면, 양안식 비디오 수신 장치(200)는 수신된 양안식 비디오 영상을 템플릿 매칭을 이용하여 복호화(S111)한 후, 화면에 출력한다(S113).Then, the binocular
한편, 실험을 통해 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템은 기존의 양안식 비디오 송수신 시스템에서 요구하는 메모리 대역폭에 비해 Side-by-side 포맷인 경우 평균 18.52%, To-down 포맷인 경우 평균 18.94%의 데이터량을 감소시킴을 확인하였다.On the other hand, the binocular video transmission and reception system according to an embodiment of the present invention through the experiment in the case of the side-by-side format compared to the memory bandwidth required by the conventional binocular video transmission and reception system 18.52%, the case of the To-down format The average amount of data was reduced by 18.94%.
또한, 도 7 및 도 8은 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템의 성능을 나타낸 그래프이다.7 and 8 are graphs showing the performance of the binocular video transmission / reception system according to the embodiment of the present invention.
도 7 및 도 8을 참조하면, 종래의 양안식 비디오 송수신 시스템과 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템의 성능 비교를 나타낸다.7 and 8 illustrate a performance comparison between a conventional binocular video transmission / reception system and a binocular video transmission / reception system according to an embodiment of the present invention.
이때, 실험 영상으로는 Balloons(1024*768), Kendo(1024*768)를 100 프레임을 사용하고, 'Side-by-side' 포맷 및 'Top and Bottom' 포맷을 입력 영상으로 하였다. 그리고 부호기는 H.264/AVC를 사용하고, 템플릿 매칭을 이용하여 화면내 부호화를 수행하였다. In this case, 100 frames were used for Balloons (1024 * 768) and Kendo (1024 * 768), and the 'Side-by-side' format and the 'Top and Bottom' format were input images. The encoder uses H.264 / AVC and performs intra-picture encoding using template matching.
이때, 도 7 및 도 8은 x축은 비트율을 나타내고, y 축은 화질(PSNR)을 나타내는 비트율-왜곡 곡선 그래프이다.7 and 8 are bit rate-distortion curve graphs in which the x-axis represents the bit rate and the y-axis represents the image quality (PSNR).
도 7의 (a), (b) 및 도 8의 (a), (b) 모두 동일한 비트율일 때, 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템이 종래의 양안식 비디오 송수신 시스템보다 PSNR(Peak Signal to Noise Ratio)이 더 높은 값을 가짐을 알 수 있다. 즉 화질이 더 좋다. When (a), (b) of FIG. 7 and (a), (b) of FIG. 8 are all the same bit rate, the binocular video transmission / reception system according to the embodiment of the present invention is more effective than the conventional binocular video transmission / reception system. It can be seen that Peak Signal to Noise Ratio) has a higher value. In other words, the picture quality is better.
또한, PSNR이 동일할 때, 본 발명의 실시예에 따른 양안식 비디오 송수신 시스템이 종래의 양안식 비디오 송수신 시스템보다 비트율이 더 작다. 즉 동일한 화질의 화면을 전송하는데 기존의 시스템보다 적은 비트만 송신해도 된다. In addition, when the PSNR is the same, the binocular video transmission / reception system according to the embodiment of the present invention has a smaller bit rate than the conventional binocular video transmission / reception system. In other words, it is possible to transmit fewer bits than the existing system to transmit the screen of the same quality.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, It belongs to the scope of right.
100: 양안식 비디오 송신 장치 110: 제1 입력 영상 취득부
130: 제2 입력 영상 취득부 150: 변환부
170: 부호화부 190: 전송부
200: 양안식 비디오 수신 장치 210: 수신부
230: 복호화부 250: 양안식 영상 출력부
300: 네트워크100: binocular video transmission device 110: first input image acquisition unit
130: second input image acquisition unit 150: conversion unit
170: encoder 190: transmitter
200: binocular video receiver 210: receiver
230: decoder 250: binocular video output unit
300: Network
Claims (7)
상기 변환부로부터 전달받은 상기 좌안 영상 및 상기 우안 영상이 상하 방향으로 결합된 영상을 위에서 아래 방향으로 순차적으로 템플릿 매칭 방법을 이용한 예측 블록 탐색을 통해 부호화하는 부호화부; 및
부호화된 영상을 네트워크를 통해 양안식 비디오 수신 장치로 송신하는 전송부
를 포함하는 양안식 비디오 송신 장치.A down-sampling unit for reducing the horizontal resolution of the left eye image and the right eye image, respectively, wherein the down sampling converts a high resolution image into a low resolution image and then combines the up and down directions;
An encoder which encodes the image of the left eye image and the right eye image received from the converter in a vertical direction from the top to the bottom by sequentially searching a predicted block using a template matching method; And
Transmitter for transmitting the encoded video to the binocular video receiving device over the network
Binocular video transmission device comprising a.
상기 부호화부는,
상기 우안 영상의 예측 블록 탐색시 탐색 범위를 먼저 부호화된 상기 좌안 영상으로 제한하는 양안식 비디오 송신 장치.The method of claim 1,
Wherein the encoding unit comprises:
And a search range for limiting a search range to the first encoded left eye image when searching for a prediction block of the right eye image.
좌안 영상 및 우안 영상의 가로 해상도를 각각 축소하는 다운 샘플링-여기서 다운 샘플링은 고 해상도의 영상을 저 해상도의 영상으로 변환함-을 하는 단계;
다운 샘플링된 상기 좌안 영상 및 상기 우안 영상을 상하 방향으로 결합하는 단계;
상기 좌안 영상 및 상기 우안 영상이 상하 방향으로 결합된 양안식 비디오 영상을 위에서 아래 방향으로 순차적으로 템플릿 매칭 방법을 이용한 예측 블록 탐색을 통해 부호화하는 단계; 및
부호화된 양안식 비디오 영상을 네트워크를 통해 상기 양안식 비디오 영상을 재생하는 양안식 비디오 수신 장치로 송신하는 단계
를 포함하는 양안식 비디오 송신 방법.A binocular video transmission method of a binocular video transmission apparatus,
Downsampling the horizontal resolution of the left eye image and the right eye image, respectively, wherein down sampling converts the high resolution image into a low resolution image;
Combining the down-sampled left eye image and the right eye image in a vertical direction;
Encoding a binocular video image obtained by combining the left eye image and the right eye image in a vertical direction from the top to the bottom by sequentially predicting a block search using a template matching method; And
Transmitting an encoded binocular video image to a binocular video receiving apparatus for reproducing the binocular video image over a network;
The binocular video transmission method comprising a.
상기 부호화하는 단계는,
상기 좌안 영상에 대해 먼저 부호화를 수행하는 단계; 및
템플릿 매칭 방법을 이용하여 상기 우안 영상의 부호화 대상인 참조 블록과 유사한 예측 블록을 부호화된 상기 좌안 영상으로 제한하여 탐색하는 단계
를 포함하는 양안식 비디오 송신 방법.The method of claim 5,
Wherein the encoding comprises:
First encoding the left eye image; And
Limiting and searching a prediction block similar to a reference block to be encoded of the right eye image to the encoded left eye image using a template matching method
The binocular video transmission method comprising a.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100103027A KR101223205B1 (en) | 2010-10-21 | 2010-10-21 | Device and method for transmitting stereoscopic video |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100103027A KR101223205B1 (en) | 2010-10-21 | 2010-10-21 | Device and method for transmitting stereoscopic video |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120041532A KR20120041532A (en) | 2012-05-02 |
KR101223205B1 true KR101223205B1 (en) | 2013-01-17 |
Family
ID=46262593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100103027A KR101223205B1 (en) | 2010-10-21 | 2010-10-21 | Device and method for transmitting stereoscopic video |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101223205B1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040106398A (en) * | 2002-04-25 | 2004-12-17 | 샤프 가부시키가이샤 | Image encoder, image decoder, record medium, and image recorder |
KR100579125B1 (en) | 2000-12-27 | 2006-05-12 | 한국전자통신연구원 | Apparatuses and Methods for Digital Stereo Video Processing using Decimation/Interpolation Filtering |
KR100587952B1 (en) * | 2003-12-05 | 2006-06-08 | 한국전자통신연구원 | Video encoding/decoding apparatus and method using compensation for the asymmetric decimated left/right-view images |
KR100748946B1 (en) | 2005-09-06 | 2007-08-13 | (주)다산알앤디 | Method of processing three-D image |
-
2010
- 2010-10-21 KR KR1020100103027A patent/KR101223205B1/en not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100579125B1 (en) | 2000-12-27 | 2006-05-12 | 한국전자통신연구원 | Apparatuses and Methods for Digital Stereo Video Processing using Decimation/Interpolation Filtering |
KR20040106398A (en) * | 2002-04-25 | 2004-12-17 | 샤프 가부시키가이샤 | Image encoder, image decoder, record medium, and image recorder |
KR100587952B1 (en) * | 2003-12-05 | 2006-06-08 | 한국전자통신연구원 | Video encoding/decoding apparatus and method using compensation for the asymmetric decimated left/right-view images |
KR100748946B1 (en) | 2005-09-06 | 2007-08-13 | (주)다산알앤디 | Method of processing three-D image |
Also Published As
Publication number | Publication date |
---|---|
KR20120041532A (en) | 2012-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111837396B (en) | Error suppression in video coding based on sub-image code stream view correlation | |
JP5763184B2 (en) | Calculation of parallax for 3D images | |
US8644386B2 (en) | Method of estimating disparity vector, and method and apparatus for encoding and decoding multi-view moving picture using the disparity vector estimation method | |
US20110134227A1 (en) | Methods and apparatuses for encoding, decoding, and displaying a stereoscopic 3d image | |
EP2163103B1 (en) | Method and system for encoding a 3d video signal, enclosed 3d video signal, method and system for decoder for a 3d video signal | |
KR102343700B1 (en) | Video transmission based on independently encoded background updates | |
US20100238264A1 (en) | Three dimensional video communication terminal, system, and method | |
KR100779875B1 (en) | Method for setting reference frame order for multi-view coding and computer readable medium storing thereof | |
US9961347B2 (en) | Method and apparatus for bi-prediction of illumination compensation | |
US20070008575A1 (en) | Transport stream structure including image data and apparatus and method for transmitting and receiving image data | |
US20070041443A1 (en) | Method and apparatus for encoding multiview video | |
US9736498B2 (en) | Method and apparatus of disparity vector derivation and inter-view motion vector prediction for 3D video coding | |
US20150312547A1 (en) | Apparatus and method for generating and rebuilding a video stream | |
US8774539B2 (en) | Encoder, decoder, encoder system, decoder system, transmission adapter, encoding method, decoding method, and imaging apparatus | |
CN102918846A (en) | Multiview video encoding method, multiview video decoding method, multiview video encoding apparatus, multiview video decoding apparatus, and program | |
US9338430B2 (en) | Encoding device, encoding method, decoding device, and decoding method | |
WO2007035054A1 (en) | Method of estimating disparity vector, and method and apparatus for encoding and decoding multi-view moving picture using the disparity vector estimation method | |
US20130259131A1 (en) | Image processing apparatus and method | |
US9762884B2 (en) | Encoding device, encoding method, decoding device, and decoding method for encoding multiple viewpoints for compatibility with existing mode allowing fewer viewpoints | |
CN104284193A (en) | Encoding device and encoding method, and decoding device and decoding method | |
US20170188007A1 (en) | Multi-view image transmitter and receiver and method of multiplexing multi-view image | |
KR101152952B1 (en) | Real-time three dimension formating module for ultra high-definition image and system using thereof | |
KR101223205B1 (en) | Device and method for transmitting stereoscopic video | |
KR20110118744A (en) | 3d tv video encoding method, decoding method | |
KR102468223B1 (en) | Apparatus for transmitting 3dtv broadcasting and method for selecting reference video thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20151217 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20161219 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |