KR20070115309A - Multi-reference frame omitting method to improve coding rate of h.264 - Google Patents
Multi-reference frame omitting method to improve coding rate of h.264 Download PDFInfo
- Publication number
- KR20070115309A KR20070115309A KR1020060049522A KR20060049522A KR20070115309A KR 20070115309 A KR20070115309 A KR 20070115309A KR 1020060049522 A KR1020060049522 A KR 1020060049522A KR 20060049522 A KR20060049522 A KR 20060049522A KR 20070115309 A KR20070115309 A KR 20070115309A
- Authority
- KR
- South Korea
- Prior art keywords
- mode
- inter
- motion estimation
- reference image
- image
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
도 1은 일반적인 다중 참조 영상 사용 방법을 나타낸 도면,1 is a diagram illustrating a method of using a general multi-reference image;
도 2는 H.264의 움직임 추정시 사용되는 가변 블록의 크기를 나타낸 도면,2 is a view showing the size of a variable block used in motion estimation of H.264;
도 3은 H.264의 다중 참조 영상을 사용한 표준 움직임 추정 과정을 도시한 도면,3 is a diagram illustrating a standard motion estimation process using multiple reference images of H.264;
도 4는 본 발명의 실시예에 따른 H.264에서의 참조 영상 생략 방법을 도시한 도면,4 illustrates a method of omitting a reference image in H.264 according to an embodiment of the present invention;
도 5a,b는 H.264에서의 매크로블록 모드에 대한 세분화 방향을 도시한 도면,5A and 5B show the segmentation direction for the macroblock mode in H.264;
도 6은 본 발명의 실시예에 따른 H.264에서의 참조 영상 생략 방법의 알고리듬을 도시한 순서도,6 is a flowchart illustrating an algorithm of a method of omitting a reference image in H.264 according to an embodiment of the present invention;
도 7은 본 발명의 실시예에 따른 H.264에서의 실험결과를 나타낸 도면.7 is a view showing the experimental results in H.264 according to an embodiment of the present invention.
** 도면의 주요부분에 대한 부호의 설명 **** Explanation of symbols for main parts of drawings **
1 : 인터16x16모드(모드1) 2 : 인터16x8모드(모드2)1: Inter 16x16 mode (Mode 1) 2: Inter 16x8 mode (Mode 2)
3 : 인터8x16모드(모드3) 4 : 인터8x8모드(모드4)3: Inter 8x16 mode (mode 3) 4: Inter 8x8 mode (mode 4)
5 : 인터8x4모드(모드5) 6 : 인터4x8모드(모드6)5: Inter 8x4 mode (mode 5) 6: Inter 4x8 mode (mode 6)
7 : 인터4x4모드(모드7)7: Inter 4x4 mode (mode 7)
본 발명은 동영상 신호 부호화 방법에 관한 것으로, 더욱 상세하게는 H.264의 동영상 신호 부호화 방법에 있어서, 다중 참조 영상에서의 참조 영상의 개수와 모드의 개수를 줄여 연산량을 감소시킴으로써 부호화 속도를 향상시킬 수 있는 다중 참조 영상 간 모드 생략 방법에 관한 것이다.The present invention relates to a video signal encoding method, and more particularly, to a video signal encoding method of H.264, to improve encoding speed by reducing the number of operations by reducing the number of reference images and the number of modes in a multi-reference image. The present invention relates to a mode skip method between multiple reference pictures.
최근에는 이동통신 및 위성통신의 급속한 발달로 정보화 사회에서 무선통신 서비스의 역할이 더욱 중요하게 되고, 종래의 음성이나 문자 정보의 전송뿐만 아니라 무선으로 인터넷에 접속하거나 동영상 통신이 가능한 멀티미디어 무선통신 서비스가 보급되고 있다. 특히, IMT-2000 사업과 위성 DMB(Digital Multimedia Broadcasting) 시스템을 이용한 4세대 이동통신 등에서는 고화질의 동영상을 실시간으로 전송할 수 있는 환경이 구축되고 있다.Recently, due to the rapid development of mobile communication and satellite communication, the role of the wireless communication service becomes more important in the information society, and the multimedia wireless communication service capable of wirelessly accessing the Internet or video communication as well as the transmission of conventional voice or text information It is spreading. In particular, in the 4th generation mobile communication using IMT-2000 business and satellite digital multimedia broadcasting (DMB) system, an environment capable of transmitting high quality video in real time is being established.
이와 같은 기술이 상용화될 수 있었던 것은 무엇보다 아날로그 영상 신호를 양자화나 가변장 부호화(Encoding) 등으로 디지털 처리를 한 다음, 이를 디지털 신호로 송신하고, 수신된 단말기에서는 이를 다시 복호화(Decoding)함으로써, 빠른 전송 속도와 풍부한 정보를 전송할 수 있는 동영상 압축 기술의 발달로 인하여 가능하게 되었다. 즉, 디지털방송에 있어서의 특징은 동영상 정보를 디지털화하여 압축함으로써 제한된 전송로에서 효율적인 서비스가 가능하게 된 것으로, 동영상의 압축 기술은 서비스의 성격 및 품질을 좌우하는 중요한 기술로 인정되고 있다.This technology has been commercially available above all by digitally processing analog video signals by quantization or variable-length encoding, and then transmitting them as digital signals, which are then decoded by the received terminal. This is made possible by the rapid transmission speed and the development of video compression technology capable of transmitting abundant information. In other words, the characteristics of digital broadcasting enable efficient service in a limited transmission path by digitizing and compressing moving picture information. Moving picture compression technology is recognized as an important technology that determines the nature and quality of service.
그 동안 방대한 정보를 저장하고 전송하기 위한 여러가지 압축 기술이 개발되어 왔으며, 특히 1980년대 후반부터는 디지털 동영상 정보의 부호화 및 기술표준 규격을 제정해야 한다는 요구가 제시되면서 기술 발전이 가속화되기 시작했다.Various compression techniques have been developed for storing and transmitting huge amounts of information. Especially, in the late 1980s, the development of technology has been accelerated as the demand for encoding and specification of digital video information has been proposed.
이에 따라 국제전기통신연합(ITU)은 유무선 통신망 환경에서 동영상 서비스를 위한 표준으로 H.261과 H.263을 제정했고, 국제표준화기구(ISO)도 동영상 표준 규격인 MPEG-1, MPEG-2, MPEG-4를 마련하는 등 국제적인 표준화 논의가 활발하게 진행되었다. H.263+ 와 MPEG-4 표준이 개발된 후 무선통신이 급격히 확산되었으며, 이에 따라 종전의 압축 방식에 비해 더욱 향상된 압축 효율을 제공하고 다양한 통신 환경을 수용할 수 있는 동영상 압축 기술 규격의 필요성이 대두되었다.Accordingly, the International Telecommunication Union (ITU) enacted H.261 and H.263 as standards for video services in wired and wireless network environments, and the International Organization for Standardization (ISO) also adopted MPEG-1, MPEG-2, International standardization discussions have been actively conducted, including the provision of MPEG-4. Since the development of the H.263 + and MPEG-4 standards, wireless communication has proliferated rapidly. Accordingly, there is a need for a video compression technology specification that provides improved compression efficiency and accommodates various communication environments compared to conventional compression methods. It has emerged.
이 후, 국제전기통신연합(ITU)과 국제표준화기구/국제전자기술위원회(ISO / IEC)가 공동 결정한 JVT(Joint Video Team)에서는 기존의 방식보다 압축 효율이 뛰어난 H.264(MPEG-4 part 10, 이하에서는 H.264라 함)라는 표준을 승인하게 되었다.Subsequently, the Joint Video Team (JVT) jointly decided by the International Telecommunication Union (ITU) and the International Organization for Standardization and the International Electrotechnical Commission (ISO / IEC) provided H.264 (MPEG-4 part) with higher compression efficiency than conventional methods. 10, hereinafter referred to as H.264).
H.264 는 현재 디지털방송의 표준 동영상 압축 기술로서 다양한 네트워크 환경에 쉽게 부응할 수 있는 유연성과 동영상의 부호화 효율 측면에서 H263+ 나 MPEG-2/4 등 기존 기술 표준들에 비해 많은 진보가 있었다. 즉, H.264는 기존의 표준 기술들과 마찬가지로 하이브리드 MCP(Motion Compensated Prediction) 모델을 채택하였으나, 기존 H.263+ 또는 MPEG-4(part2) 대비 50%의 압축효율을 가지며, 지속적인 고품질 동영상 전송을 보장한다. 또한, H.264는 패킷망에서의 패킷 손실 및 무선 네트워크에서의 비트 에러 복구능력이 뛰어나고, 네트워크 적응 계층(Network Application Layer)을 통해 상이한 네트워크에서의 전송이 용이한 장점을 가진다.H.264 is the standard video compression technology of digital broadcasting. There are many advances over existing technical standards such as H263 + and MPEG-2 / 4 in terms of flexibility and video coding efficiency that can easily meet various network environments. In other words, H.264 adopts Hybrid Motion Compensated Prediction (MCP) model like existing standard technologies, but has 50% compression efficiency compared to existing H.263 + or MPEG-4 (part2) and continuously transmits high quality video. To ensure. In addition, H.264 has the advantages of excellent packet loss in packet networks and bit error recovery in a wireless network, and easy transmission in different networks through a network application layer.
이러한 H.264 표준은 기존의 압축방식에 비해 16x16에서 4x4까지의 더 작은 블록과 화소 정밀도의 미세한 움직임 보상을 제공한다.This H.264 standard provides smaller motion compensation with 16x16 to 4x4 smaller blocks and pixel precision than conventional compression schemes.
또한, 기존에는 영상 간의 움직임 추정시, 바로 이전 혹은 이후의 참조 영상을 이용하는 반면, H.264에서는 보다 정확히 움직임을 찾을 수 있도록 도 1에 도시된 바와 같이 여러 장의 참조 영상을 사용함으로써, 움직임이 반복적으로 나오는 영상에서 보다 효율적인 움직임 추정값을 이용한다. 그리고 1/4 화소 단위로 영상간의 비교가 가능하여 더욱 정밀하고 정확하게 중복된 블록들을 찾을 수 있다.In addition, in the past, when the motion between images is used, the previous or next reference image is used, whereas in H.264, by using several reference images as shown in FIG. A more efficient motion estimation value is used in the image. In addition, it is possible to compare images in units of 1/4 pixels so that more precise and accurate overlapping blocks can be found.
한편, H.264 동영상 표준 부호화 방식의 움직임 추정은 도 2에 도시된 바와 같이 가변 블록 크기의 7가지 모드를 사용하기 때문에 모든 모드에 대해 탐색을 실시하여 최적의 모드를 추정하게 된다. 이 경우 기존의 동영상 부호화 보다 세밀히 움직임을 추정할 수 있으나 7가지 모드에 따른 많은 연산량을 필요로 한다. 또한, 다중 참조 영상 방식을 사용하여 움직임 추정을 수행하였을 때 얻을 수 있는 예측 이득은 상황에 따라 매우 크게 작용하지만, 그렇지 않을 경우 참조 영상의 개수에 따라 연산량은 더욱 증가하게 되어, 결론적으로 부호기의 복잡도가 증가하고 동영상 부호화의 속도가 저하되는 문제점이 발생하게 된다.On the other hand, since the motion estimation of the H.264 video coding method uses 7 modes of variable block sizes as shown in FIG. 2, the search is performed for all modes to estimate the optimal mode. In this case, the motion can be estimated more precisely than conventional video encoding, but it requires a large amount of computation according to seven modes. In addition, the prediction gain that can be obtained when the motion estimation is performed using the multi-reference image method is very large depending on the situation, but otherwise, the amount of computation increases according to the number of reference images, and consequently the complexity of the encoder Increases and the speed of video encoding decreases.
본 발명은 상기와 같은 문제점을 해결하기 위하여 제안된 것으로, 움직임 추정을 위한 다중 참조 영상 선택 기법에서 가용성이 높은 후보 참조 영상들을 추출 하여 참조 영상의 개수를 줄이고, 모드 선택 간에도 7 가지의 전체를 사용하지 않고 모드의 개수를 줄임으로써, 움직임 추정시 속도를 향상시켜 실시간 전송이 가능하도록 하는 H.264에서의 다중 참조 영상 간 모드 생략 방법을 제공하는 것을 목적으로 한다.The present invention has been proposed to solve the above problems, and reduces the number of reference pictures by extracting highly available candidate reference pictures in a multi-reference picture selection method for motion estimation, and uses all seven types between mode selections. It is an object of the present invention to provide a method of eliminating a mode between multiple reference images in H.264, which improves the speed of motion estimation and enables real time transmission by reducing the number of modes.
상기와 같은 목적을 달성하기 위한 본 발명은 H.264 표준의 동영상 부호화의 다중 참조 영상 간 모드 생략 방법에 있어서, 인터 16x16 모드의 다중 참조 영상 전체(제1 참조 영상)에 대해서 움직임 추정을 수행하여 제2 참조 영상을 선택하는 단계;와, 선택된 상기 제2 참조 영상을 이용하여 인터 16x8 모드와 인터 8x16 모드에 대하여 움직임 추정을 수행하는 단계; 상기 인터 16x16 모드와 인터 16x8 모드, 인터 8x16 모드에서 움직임 추정된 결과를 비교하여 결과값이 가장 좋은 모드를 제3 참조 영상으로 선택하는 단계; 및 상기 선택된 각 모드의 제3 참조 영상에 따라 하위 모드의 움직임 추정을 수행한 후, 상위 결과값과 비교하여 가장 좋은 결과값을 가지는 모드를 최종 영상 모드로 선택하는 단계; 를 포함하여 구성되는 것을 특징으로 한다.In order to achieve the above object, the present invention provides a method of omitting a mode of inter-reference video of video encoding according to the H.264 standard, by performing motion estimation on the entire multi-reference picture (first reference picture) of inter 16x16 mode. Selecting a second reference image; and performing motion estimation on an inter 16x8 mode and an inter 8x16 mode using the selected second reference image; Comparing a motion estimation result in the inter 16x16 mode, the inter 16x8 mode, and the inter 8x16 mode, and selecting a mode having the best result as a third reference image; And after performing motion estimation of the lower mode according to the third reference image of each selected mode, selecting a mode having the best result as the final image mode by comparing with the upper result value; Characterized in that comprises a.
전술한 구성에 있어서, 상기 제3 참조 영상으로 선택하는 단계에서 선택된 모드가 인터 16x16 모드일 경우, 선택된 상기 제3 참조 영상에 따라 인터 8x8 모드에서 움직임 추정을 수행하여 다시 가장 좋은 결과값을 가지는 제4 참조 영상을 선택하고, 선택된 상기 제4 참조 영상에 따라 인터 4x4 모드에서 움직임 추정을 수행 하여 상위 결과값과 비교하여 가장 좋은 결과값을 가지는 모드를 최종 영상 모드로 선택하는 것을 특징으로 한다.In the above-described configuration, when the mode selected in the step of selecting the third reference image is the inter 16x16 mode, a motion estimation is performed again in the inter 8x8 mode according to the selected third reference image to have the best result again. A fourth reference picture is selected, and motion estimation is performed in the inter 4x4 mode according to the selected fourth reference picture, and the mode having the best result value is selected as the final picture mode by comparing with the upper result value.
전술한 구성에 있어서, 상기 제3 참조 영상으로 선택하는 단계에서 선택된 모드가 인터 16x8 모드일 경우, 선택된 상기 제3 참조 영상에 따라 인터 8x4 모드에서 움직임 추정을 수행하고 상위 결과값과 비교하여 가장 좋은 결과값을 가지는 모드를 최종 영상 모드로 선택하는 것을 특징으로 한다.In the above-described configuration, when the mode selected in the step of selecting the third reference image is the inter 16x8 mode, motion estimation is performed in the inter 8x4 mode according to the selected third reference image and compared with the upper result value. The mode having the resultant value may be selected as the final image mode.
전술한 구성에 있어서, 상기 제3 참조 영상으로 선택하는 단계에서 선택된 모드가 인터 8x16 모드일 경우, 선택된 상기 제3 참조 영상에 따라 인터 4x8 모드에서 움직임 추정을 수행하고 상위 결과값과 비교하여 가장 좋은 결과값을 가지는 모드를 최종 영상 모드로 선택하는 것을 특징으로 한다.In the above-described configuration, when the mode selected in the step of selecting the third reference image is the inter 8x16 mode, motion estimation is performed in the inter 4x8 mode according to the selected third reference image and compared with the upper result value. The mode having the resultant value may be selected as the final image mode.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 3은 H.264의 다중 참조 영상을 사용한 표준 움직임 추정 과정을 도시한 도면이고, 도 4는 본 발명의 실시예에 따른 H.264에서의 참조 영상 생략 방법을 도시한 도면이며, 도 5a,b는 H.264에서의 매크로블록 모드에 대한 세분화 방향을 도시한 도면이다.3 is a diagram illustrating a standard motion estimation process using multiple reference images of H.264, and FIG. 4 is a diagram illustrating a method of omitting a reference image in H.264 according to an embodiment of the present invention. b is a diagram showing the direction of segmentation for the macroblock mode in H.264.
본 발명에서는 인터 16x16 모드에서 선택된 최적의 참조 영상이 인터 16x16 모드 이하의 다른 모드에서도 참조 영상이 될 가능성이 높다는 점과 모드 선택 간 가로 및 세로 방향의 방향성을 고려하여 모드의 개수를 줄이는 방법을 이용하여 전 체적인 연산량을 줄이는 것을 특징으로 한다.The present invention uses a method of reducing the number of modes in consideration of the fact that the optimal reference picture selected in the inter 16x16 mode is likely to be the reference picture in other modes below the inter 16x16 mode and the directionality in the horizontal and vertical directions between mode selections. It is characterized by reducing the overall calculation amount.
도 3을 참조하면, H.264 표준에서는 7가지의 모드에 대한 참조 영상의 개수에 따라서 즉, 인터 16x16 모드부터 인터 4x4 모드(1 내지 7)까지 7가지의 각각의 모드에 대한 N개의 참조 영상에 따라서 움직임 추정 과정을 수행하여 최적의 결과를 얻게 된다. 움직임이 심한 영상의 경우 바로 이전 혹은 이후의 참조 영상을 이용하여 움직임 추정을 수행할 때 좋은 결과를 얻을 수 없으므로, 여러 장의 참조 영상을 사용하게 된다. 그러나 이 경우 참조 영상의 개수에 비례하여 연산량이 증가하게 되며, 이로 인하여 좋은 결과의 예측을 가능하게 하지만 많은 연산으로 인한 복잡도 증가를 초래하게 된다.Referring to FIG. 3, in the H.264 standard, N reference pictures for each of seven modes, that is, depending on the number of reference pictures for seven modes, that is, inter 16x16 mode to inter 4x4 mode (1 to 7). According to the motion estimation process, optimal results are obtained. In the case of a severe motion image, a good result cannot be obtained when the motion estimation is performed using the immediately preceding or subsequent reference image. Therefore, multiple reference images are used. However, in this case, the amount of calculation increases in proportion to the number of reference images, thereby enabling prediction of good results, but increasing complexity due to many operations.
[표 1]은 H.264 표준에서 움직임 추정시, 하나의 매크로블록에서 SAD(Sum of Absolute Difference)값을 구하기 위한 연산량을 나타낸 것으로, 연산량은 서브블록으로 갈수록 비례적으로 증가하게 되고, 다중 참조 영상을 사용하게 되면 참조 영상의 개수에 비례하여 연산량도 증가하게 된다.[Table 1] shows the amount of calculation for calculating the SAD (Sum of Absolute Difference) value in one macroblock when the motion is estimated in the H.264 standard. Using images increases the amount of computation in proportion to the number of reference images.
(여기서, 움직임 추정시 Full Screen을 사용하고, 탐색 범위는 16으로 하였다.)(In this case, the full screen is used for the motion estimation and the search range is set to 16.)
이를 줄이기 위하여 본 발명에서는 각 모드별로 움직임 추정을 수행할 참조 영상을 선택하여 사용하게 되는 것으로, 기존의 고속 알고리듬은 인터라 모드와 인터 모드 간 상관성을 고려한 모드의 개수를 생략하여 속도를 향상시키거나 모드의 방향성을 고려하여 모드의 개수를 줄여 H.264의 부호화 시간을 단축하였다.In order to reduce this problem, the present invention selects and uses a reference image to perform motion estimation for each mode. The existing fast algorithm improves speed by omitting the number of modes in consideration of the inter-mode and inter-mode correlation. In consideration of the directionality of the modes, the number of modes is reduced to shorten the encoding time of H.264.
즉, 기존의 알고리듬들은 참조 영상의 개수를 고려하지 않고 모드의 개수를 줄여 속도를 향상시켰으나, H.264에서 다중 참조 영상을 사용하여 영상의 개수를 증가시켰을 때의 부호화 시간은 참조 영상의 개수 많큼 비례적으로 증가하여 부호화 시간은 효율적으로 감소시킬 수가 없었다.That is, the existing algorithms improve the speed by reducing the number of modes without considering the number of reference pictures, but the encoding time when the number of pictures is increased by using multiple reference pictures in H.264 is large. As it increases proportionally, the encoding time cannot be effectively reduced.
따라서 본 발명에서는 움직임 추정 수행시 참조되는 영상의 개수를 줄임으로써 부호화 시간을 효율적으로 줄이게 되는 것으로, 기존의 움직임 추정 과정과 같이 각 움직임 추정 모드에 대해 다중 참조 영상을 사용하여 각 모드별로 [수학식 1]과 같이 SAD(Sum of Absolute Difference)값을 계산하고, 가장 작은 SAD 값을 바탕으로 세분화되는 블록에 대한 참조 영상을 선택하는 것이다.Therefore, in the present invention, the coding time is efficiently reduced by reducing the number of images referred to when performing motion estimation. As in the conventional motion estimation process, multiple reference images are used for each motion estimation mode for each mode. As shown in [1], a SAD (Sum of Absolute Difference) value is calculated and a reference image for a block segmented based on the smallest SAD value is selected.
(여기서, N은 매크로블록의 크기, Cij는 현재영상, Pij는 참조영상을 각각 나타낸다.)(N is the size of the macroblock, C ij is the current picture, P ij is a reference picture.)
이를 위하여 도 4에 도시된 바와 같이, 인터 16x16 모드(1)에 대해서 N 장의 전체 참조 영상에 대한 움직임 추정을 수행하고, N 장의 전체 영상에서 X 장을 제 외한 최적의 결과를 갖는 M(N-X) 장의 참조 영상을 다시 선택하여, M(N-X) 장의 참조 영상에 대해 인터 16x8 모드(2)와 인터 8x16 모드(3)에서 움직임 추정을 수행한다.To this end, as shown in FIG. 4, motion estimation is performed on all N reference images in the inter 16x16 mode (1), and M (NX) having an optimal result excluding X fields in all N images. The reference picture of the chapter is selected again, and motion estimation is performed in the
이 두개의 모드(2,3)에서 다시 Y 장을 제외한 최적의 참조 영상 D(N-X-Y)장을 선택하여 인터 8x8 모드와 인터 8x4 모드, 인터 4x8 모드에 대한 움직임 추정을 수행한다. 그리고 인터 4x4 모드는 인터 8x8 모드에서의 결과값이 좋은 영상을 가지고 다시 P 장을 제외한 최적의 참조 영상 Z(N-X-Y-P) 장을 선택하여 움직임 추정을 수행한다.In these two modes (2, 3), the optimal reference image D (N-X-Y) field except for the Y field is selected again to perform motion estimation for the inter 8x8 mode, the inter 8x4 mode, and the inter 4x8 mode. In the inter 4x4 mode, the result of the inter 8x8 mode is good, and motion estimation is performed by selecting an optimal reference image Z (N-X-Y-P) field except for P field.
이 후 서브블록의 각 모드들은 인터 16x16 모드(1)에서 선택된 M 장의 참조 영상에서 다시 인터 16x8 모드(2)와 인터 8x16 모드(3)로 결정된 D 장의 참조 영상 및 P 장의 영상을 이용하여 움직임 추정을 수행하더라도 전체 참조 영상 N 장을 이용하여 움직임 추정을 수행한 결과와 유사한 결과를 얻을 수 있다. 따라서 M 장이나 D 장의 참조 영상을 사용할 경우 H.264 표준에 비하여 7가지 각 모드에 사용된 참조 영상의 수를 줄임으로써 연산량을 줄일 수 있는 것이다.Subsequently, each mode of the subblock is motion estimation using the D reference picture and the P picture determined from the M reference pictures selected in the inter 16x16 mode (1) and the inter 16x8 mode (2) and the inter 8x16 mode (3). Even if we perform, the result similar to the result of the motion estimation using the entire reference image N chapters can be obtained. Therefore, when using the reference pictures of chapter M or D, the amount of computation can be reduced by reducing the number of reference pictures used in each of seven modes compared to the H.264 standard.
또한, 본 발명에서는 움직임 추정시 도 5a,b에 도시된 바와 같이, 매크로블록이 가로 방향으로 세분화 되는지(도 5a) 혹은 세로 방향으로 세분화 되는지(도 5b)에 따른 매크로블록의 연관성을 고려하여 서브블록 모드 선택시 매크로블록 모드에서 선택된 모드에 따라 서브블록의 모드를 생략하는 방법을 사용한다.In addition, in the present invention, as shown in FIGS. 5A and 5B, when the motion estimation is performed, the macroblock is divided in the horizontal direction (FIG. 5A) or in the vertical direction (FIG. 5B). When the block mode is selected, a method of omitting the mode of the subblock according to the mode selected in the macroblock mode is used.
본 발명의 실시예에 따른 알고리듬은 움직임 추정 단계에서 인터 16x16 모드 는 하위 서브블록의 인터 8x8 모드와 인터 4x4 모드의 연관성을 고려하였고, 인터 16x8 모드와 인터 8x16 모드는 각각 하위 서브블록인 인터 8x4 모드와 인터 4x8 모드와의 연관성을 고려하였다.The algorithm according to an embodiment of the present invention considers the correlation between the inter 8x8 mode and the inter 4x4 mode of the lower subblock in the motion estimation step, and the inter 16x8 mode and the inter 8x16 mode are the lower subblocks, respectively. Considering the interrelation with and 4x8 mode.
기존의 고속 알고리듬은 인트라 모드와 인터 모드간 상관성을 고려하여 모드를 선택하는 경우 모드간 상관성이 없을 경우에는 7가지의 전체 모드에 대하여 움직임 추정을 수행하게 되어, 부호화 시간을 효율적으로 단축시킬 수 없게 된다. 그러나 본 발명에서의 알고리듬은 인트라 모드와 인터 모드간의 상관성을 고려하지 않고 부호화 되는 과정에서 7가지 모드간 상관성을 고려하여 모드를 줄이는 방식으로 항상 일정하게 모드의 개수를 줄일 수 있어 부호화 속도를 향상시키게 된다.In case of selecting a mode in consideration of the correlation between intra mode and inter mode, the existing fast algorithm performs motion estimation on all seven modes when there is no inter mode correlation. do. However, the algorithm in the present invention can always reduce the number of modes in a manner of reducing the mode in consideration of the correlation between the seven modes in the encoding process without considering the correlation between the intra mode and the inter mode, thereby improving the encoding speed. do.
즉, 매크로블록 모드에서 인터 16x16 모드가 최적의 결과값을 갖게 될 경우, 서브블록 모드는 인터 8x8 모드와 인터 4x4 모드에 대한 움직임 추정을 수행하고 나머지 서브블록 모드에 대해서는 생략할 수 있다. 또한, 매크로블록 모드에서 인터 16x8 모드가 인터 8x16 모드보다 최적의 결과를 갖게 되면, 서브블록 모드의 인터 8x4 모드가 인터 4x8 모드에 대한 움직임 추정을 수행하고 나머지 서브블록 모드에 대해서는 생략할 수 있다.That is, when the inter 16x16 mode has an optimal result in the macroblock mode, the subblock mode may perform motion estimation for the inter 8x8 mode and the inter 4x4 mode, and may omit the remaining subblock modes. In addition, when the inter 16x8 mode has a more optimal result than the inter 8x16 mode in the macroblock mode, the inter 8x4 mode of the subblock mode may perform motion estimation for the inter 4x8 mode and omit the remaining subblock modes.
도 6은 본 발명의 실시예에 따른 H.264에서의 참조 영상 생략 방법에 대한 알고리듬을 도시한 순서도이다. 6 is a flowchart illustrating an algorithm for a method of omitting a reference image in H.264 according to an embodiment of the present invention.
도 6에 도시된 바와 같이, 본 발명의 실시예에 따른 H.264에서의 참조 영상 간 모드 생략 방법은 먼저 인터 16x16 모드에서 N장의 다중 참조 영상 전체에 대하 여 움직임 추정을 수행하여 M장의 후보 참조 영상을 선택하고(S11,S12), 선택된 M장의 후보 영상을 이용하여 다시 인터 16x8 모드와 인터 8x16 모드에 대하여 움직임 추정을 수행하게 된다(S13). As shown in FIG. 6, in the H.264 inter-mode skip mode method according to an embodiment of the present invention, first, by performing motion estimation on the entirety of N multiple reference pictures in inter 16x16 mode, M candidates are referred to. An image is selected (S11, S12), and motion estimation is performed again on the inter 16x8 mode and the inter 8x16 mode by using the selected M candidate images (S13).
이렇게 인터 16x16 모드와 인터 16x8 모드, 인터 8x16 모드에서 움직임 추정된 결과를 비교하여 결과값이 가장 좋은 모드 D장을 참조 영상으로 선택한다(S14).In this way, the motion estimation results are compared in the inter 16x16 mode, the inter 16x8 mode, and the inter 8x16 mode, and the best mode D is selected as the reference image (S14).
한편, 인터 16x16 모드와 인터 16x8 모드, 인터 8x16 모드에서의 가장 좋은 결과값을 가지는 참조 영상을 선택하기 위하여, 우선 각 모드에서의 SAD 값을 비교하게 된다(S15,S16,S17).Meanwhile, in order to select a reference image having the best result in inter 16x16 mode, inter 16x8 mode, and inter 8x16 mode, first, the SAD values of the respective modes are compared (S15, S16, and S17).
여기서 인터 16x16 모드 결과값이 가장 좋은 경우 D장의 참조 영상을 이용하여 인터 8x8 모드에 대한 움직임 추정을 수행하게 되고(S18), 다시 Z장의 참조 영상을 선택한다(S19). 이렇게 선택된 Z장의 참조 영상을 이용하여 인터 4x4 모드에 대한 움직임 추정을 수행하고(S20), 그 결과를 상위 결과값과 비교하여 최종적으로 최적의 영상을 선택한다(S23).If the result value of the inter 16x16 mode is the best, the motion estimation for the inter 8x8 mode is performed using the reference image of chapter D (S18), and the reference image of the Z chapter is selected again (S19). The motion estimation for the inter 4x4 mode is performed by using the Z-reference image selected as described above (S20), and the optimal image is finally selected by comparing the result with the upper result value (S23).
이 경우 사용된 모드는 인터 16x16 모드(1)와 인터 16x8 모드(2), 인터 8x16 모드(3), 인터 8x8 모드(4), 인터 4x4 모드(7)로 5가지의 모드만이 사용되며, 인터 8x4 모드와 인터 4x8 모드는 생략되어 연산량을 줄일 수 있다. In this case, only five modes are used: inter 16x16 mode (1), inter 16x8 mode (2), inter 8x16 mode (3), inter 8x8 mode (4), inter 4x4 mode (7), The inter 8x4 mode and the inter 4x8 mode are omitted to reduce the amount of computation.
또한, 인터 16x16 모드와 인터 16x8 모드, 인터 8x16 모드를 비교한 결과에서 인터 16x8 모드의 값이 가장 좋은 경우 D장의 참조 영상을 이용하여 인터 8x4 모드에 대한 움직임 추정을 수행하고(S21), 그 결과값을 상위 결과값과 비교하여 최종적으로 최적의 영상을 선택한다(S23). In addition, when the value of the inter 16x8 mode is the best as a result of comparing the inter 16x16 mode, the inter 16x8 mode, and the inter 8x16 mode, motion estimation for the inter 8x4 mode is performed using the reference image of Chapter D (S21). The optimal image is finally selected by comparing the value with the upper result value (S23).
이 경우 사용된 모드는 인터 16x16 모드(1)와 인터 16x8 모드(2), 인터 8x16 모드(3), 인터 8x4 모드(5)로 4가지의 모드만이 사용되며, 인터 8x8 모드와 인터 4x8 모드, 인터 4x4 모드는 생략되어 연산량을 줄일 수 있다.In this case, only four modes are used: inter 16x16 mode (1), inter 16x8 mode (2), inter 8x16 mode (3), inter 8x4 mode (5), and inter 8x8 mode and inter 4x8 mode. In this case, the inter 4x4 mode can be omitted to reduce the amount of computation.
마찬가지로, 인터 16x16 모드와 인터 16x8 모드, 인터 8x16 모드를 비교한 결과에서 인터 8x16 모드의 값이 가장 좋은 경우 D장의 참조 영상을 이용하여 인터 4x8 모드에 대한 움직임 추정을 수행하고(S22), 그 결과값을 상위 결과값과 비교하여 최종적으로 최적의 영상을 선택한다(S23). Similarly, if the value of the inter 8x16 mode is the best as a result of comparing the inter 16x16 mode, the inter 16x8 mode, and the inter 8x16 mode, the motion estimation for the inter 4x8 mode is performed using the reference image of Chapter D (S22). The optimal image is finally selected by comparing the value with the upper result value (S23).
이 경우 사용된 모드는 인터 16x16 모드(1)와 인터 16x8 모드(2), 인터 8x16 모드(3), 인터 4x8 모드(6)로 4가지의 모드만이 사용되며, 인터 8x8 모드와 인터 8x4 모드, 인터 4x4 모드는 생략되어 연산량을 줄일 수 있다.In this case, only four modes are used: inter 16x16 mode (1), inter 16x8 mode (2), inter 8x16 mode (3), inter 4x8 mode (6), and inter 8x8 mode and inter 8x4 mode. In this case, the inter 4x4 mode can be omitted to reduce the amount of computation.
따라서 본 발명의 실시예에 의하면 각 블록에 사용되는 모드의 수를 4 내지 5 가지의 모드로 줄일 수 있었다.Therefore, according to the embodiment of the present invention, the number of modes used for each block can be reduced to 4 to 5 modes.
도 7은 본 발명의 실시예에 따른 다중 참조 영상의 수와 각 블록에 사용되는 모드의 수를 줄이는 방법을 이용한 원본 영상과 결과 영상을 비교하여 나타낸 도면이다.7 is a diagram illustrating a comparison between an original image and a resultant image using a method of reducing the number of multiple reference images and the number of modes used for each block according to an embodiment of the present invention.
도 7의 실시예에 있어서, 대상1 내지 대상4의 4가지 QCIF 영상에 대하여 각 8장의 참조 영상을 사용하였으며, 이에 따른 결과는 [표 2]와 같다.In the example of FIG. 7, eight reference images were used for four QCIF images of
즉, 기존의 H.264에 따른 비교예에서는 각각 8장의 참조 영상을 사용하는 것에 비하여 본 발명의 실시예에서는 16x16 매크로블록 모드의 경우에만 8장을 사용하고, 16x8과 8x16 매크로블록 모드에서는 4장의 참조 영상을, 그 이하의 서브블록 모드에서는 2장의 참조 영상을 각각 사용하여, 사용되는 영상의 수를 획기적으로 줄일 수 있었고, 총 7개의 모드 중 서브블록 모드를 생략할 수 있었다.That is, in the present embodiment, eight sheets are used only in the 16x16 macroblock mode, and four sheets are used in the 16x8 and 8x16 macroblock modes, compared to using eight reference images in the conventional H.264. In the subblock modes below, the number of images used can be drastically reduced by using two reference images, respectively, and the subblock mode can be omitted among the seven modes.
이에 따라 영상의 부호화 시간은 기존의 H.264에 비하여 평균 55% 이상 절약할 수 있었으며, 영상의 PSNR(Peak Signal to Noise Ratio)은 [표 3]에서와 같이 기존의 H.264(비교예)와 비교하여 0.1 내지 1.8DB 정도의 미세한 차이가 나타남을 확인할 수 있었다. As a result, the encoding time of the image could be saved by more than 55% on average compared to the existing H.264, and the PSNR (Peak Signal to Noise Ratio) of the image is as shown in [Table 3]. It can be seen that a slight difference of about 0.1 to 1.8DB appears.
따라서 본 발명의 실시예에서는 H.264 움직임 추정시 다중 참조 영상과 사용되는 모드의 수를 줄임으로써 압축 효율을 향상시키고, 이에 따라 실시간 전송이 가능하게 되는 것이다. Accordingly, in the embodiment of the present invention, the compression efficiency is improved by reducing the number of multiple reference images and the modes used for H.264 motion estimation, thereby enabling real time transmission.
이상에서 본 발명을 구체적인 실시예를 통하여 상세히 설명하였으나, 본 발명은 상술한 실시예에 한정되지 않고 기술적 사상이 허용되는 범위 내에서 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의하여 다양하게 변경되어 실시될 수 있다.Although the present invention has been described in detail through specific embodiments, the present invention is not limited to the above-described embodiments, and various changes may be made by those skilled in the art to which the present invention pertains without departing from the spirit and scope of the present invention. It may be changed and implemented.
이상에서 설명한 바와 같이 H.264 표준의 동영상 부호화의 다중 참조 영상 간 모드 생략 방법에 의하면, 움직임 추정을 위한 다중 참조 영상 선택 기법에서 가용성이 높은 후보 참조 영상들을 추출하여 참조 영상의 개수를 줄이고, 모드 선택 간에도 7 가지의 전체를 사용하지 않고 4 혹은 5 가지로 줄임으로써, 연산량을 획기적으로 줄여 종래의 H.264에 비하여 동영상 부호화의 속도를 현저하게 향상시킬 수 있는 효과가 있다.As described above, according to the method of eliminating the mode between the multiple reference pictures in the H.264 standard video encoding, the candidate reference pictures having high availability are extracted from the multiple reference picture selection method for motion estimation, thereby reducing the number of reference pictures. By reducing the number of calculations to four or five instead of using all seven, there is an effect that the operation amount can be drastically reduced and the speed of video coding can be remarkably improved compared to the conventional H.264.
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060049522A KR100824616B1 (en) | 2006-06-01 | 2006-06-01 | Multi-Reference Frame Omitting Method to Improve Coding Rate of H.264 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060049522A KR100824616B1 (en) | 2006-06-01 | 2006-06-01 | Multi-Reference Frame Omitting Method to Improve Coding Rate of H.264 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070115309A true KR20070115309A (en) | 2007-12-06 |
KR100824616B1 KR100824616B1 (en) | 2008-04-24 |
Family
ID=39141789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060049522A KR100824616B1 (en) | 2006-06-01 | 2006-06-01 | Multi-Reference Frame Omitting Method to Improve Coding Rate of H.264 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100824616B1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009110721A3 (en) * | 2008-03-03 | 2009-10-29 | 삼성전자 주식회사 | Encoding method and device employing motion prediction by means of multi-referencing, and a decoding method and device employing motion prediction by means of multi-referencing |
KR100955828B1 (en) * | 2008-02-28 | 2010-05-06 | 아주대학교산학협력단 | Reference Frame Selection Method for Motion Estimation of High Performance Multimedia Codec |
KR100982652B1 (en) * | 2008-07-22 | 2010-09-16 | 중앙대학교 산학협력단 | Video coding method using multiple reference frame and appraratus therefor |
KR101036137B1 (en) * | 2009-09-16 | 2011-05-23 | 중앙대학교 산학협력단 | Multiple Reference Frame Selection Method for Video Coding |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102439252B1 (en) | 2010-05-26 | 2022-08-31 | 엘지전자 주식회사 | Method and apparatus for processing a video signal |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101044934B1 (en) * | 2003-12-18 | 2011-06-28 | 삼성전자주식회사 | Motion vector estimation method and encoding mode determining method |
KR20050061762A (en) * | 2003-12-18 | 2005-06-23 | 학교법인 대양학원 | Method of encoding mode determination and motion estimation, and encoding apparatus |
-
2006
- 2006-06-01 KR KR1020060049522A patent/KR100824616B1/en not_active IP Right Cessation
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100955828B1 (en) * | 2008-02-28 | 2010-05-06 | 아주대학교산학협력단 | Reference Frame Selection Method for Motion Estimation of High Performance Multimedia Codec |
WO2009110721A3 (en) * | 2008-03-03 | 2009-10-29 | 삼성전자 주식회사 | Encoding method and device employing motion prediction by means of multi-referencing, and a decoding method and device employing motion prediction by means of multi-referencing |
US8204127B2 (en) | 2008-03-03 | 2012-06-19 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image by using multiple reference-based motion prediction |
KR100982652B1 (en) * | 2008-07-22 | 2010-09-16 | 중앙대학교 산학협력단 | Video coding method using multiple reference frame and appraratus therefor |
KR101036137B1 (en) * | 2009-09-16 | 2011-05-23 | 중앙대학교 산학협력단 | Multiple Reference Frame Selection Method for Video Coding |
Also Published As
Publication number | Publication date |
---|---|
KR100824616B1 (en) | 2008-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101037816B1 (en) | Coding and decoding for interlaced video | |
CN101485202B (en) | Method and apparatus for unified error concealment framework | |
US20060002474A1 (en) | Efficient multi-block motion estimation for video compression | |
US20050114093A1 (en) | Method and apparatus for motion estimation using variable block size of hierarchy structure | |
EP1880346A2 (en) | Temporal error concealment for bi-directionally predicted frames | |
MXPA06002211A (en) | Method and apparatus for minimizing number of reference pictures used for inter-coding. | |
MXPA02010964A (en) | Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder. | |
MXPA06010360A (en) | Methods and apparatus for performing fast mode decisions in video codecs. | |
WO2013089129A1 (en) | Method, device, and program for coding and decoding of images | |
KR20090066035A (en) | Method of constituting intra prediction mode using spatial edge detection | |
Wu et al. | A temporal error concealment method for H. 264/AVC using motion vector recovery | |
KR100824616B1 (en) | Multi-Reference Frame Omitting Method to Improve Coding Rate of H.264 | |
CN107343202B (en) | Feedback-free distributed video coding and decoding method based on additional code rate | |
KR100689215B1 (en) | Fast Prediction Mode Decision Method Using Down Sampling and Edge Direction for H.264 | |
KR20060132962A (en) | Motion estimation and segmentation for video data | |
KR100896978B1 (en) | The Motion Vector Prediction Method and The Mode Prediction Method and Recording Medium Thereof in Fast MPEG-2 to H.264/AVC Transcoding | |
CN110913215A (en) | Method and device for selecting prediction mode and readable storage medium | |
Regunathan et al. | Scalable video coding with robust mode selection | |
de-Frutos-López et al. | An improved fast mode decision algorithm for intraprediction in H. 264/AVC video coding | |
KR101037834B1 (en) | Coding and decoding for interlaced video | |
KR100718468B1 (en) | Method and device for video down-sampling transcoding | |
Ning et al. | Enhanced fast mode decision based on edge map and motion detail analysis for H. 264/JVT | |
KR100931269B1 (en) | Real-Time Edge Detection in H.264 / ACC Compression Domain | |
Liu et al. | Efficient probability based macroblock mode selection in H. 264/AVC | |
Shahriari et al. | Adaptive error concealment with radial basis neuro-fuzzy networks for video communication over lossy channels |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130417 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140410 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170403 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |