KR100643126B1 - Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same - Google Patents
Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same Download PDFInfo
- Publication number
- KR100643126B1 KR100643126B1 KR1020040056821A KR20040056821A KR100643126B1 KR 100643126 B1 KR100643126 B1 KR 100643126B1 KR 1020040056821 A KR1020040056821 A KR 1020040056821A KR 20040056821 A KR20040056821 A KR 20040056821A KR 100643126 B1 KR100643126 B1 KR 100643126B1
- Authority
- KR
- South Korea
- Prior art keywords
- prediction mode
- prediction
- size
- block
- decoded
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
DCT 계수를 기초로 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법이 개시된다. 복호화부는 입력 동영상 스트림을 복호한다. 정보추출부는 복호화부에 의해 복호된 제1크기의 블록에 대한 DCT 계수를 추출한다. 에지방향산출부는 추출된 DCT 계수를 기초로 제1크기의 블록내에 존재하는 에지의 방향을 산출한다. 예측모드결정부는 산출된 에지방향에 대응하는 예측모드를 결정한다. 부호화부는 결정된 예측모드를 기초로 동영상을 부호화하여 출력한다. 본 발명에 따르면, 인트라 예측 모드를 효율적으로 추정하여 계산량을 최소화하며 부호화 효율을 유지할 수 있다.A transcoder and transcoding method for determining an intra prediction mode based on DCT coefficients is disclosed. The decoder decodes the input video stream. The information extracting unit extracts a DCT coefficient for the block of the first size decoded by the decoding unit. The edge direction calculation unit calculates the direction of the edge existing in the block of the first size based on the extracted DCT coefficient. The prediction mode determiner determines a prediction mode corresponding to the calculated edge direction. The encoder encodes and outputs a video based on the determined prediction mode. According to the present invention, it is possible to efficiently estimate the intra prediction mode to minimize the amount of computation and maintain the coding efficiency.
트랜스코더, MPEG, 인트라 예측 모드, AC 계수, 에지Transcoder, MPEG, Intra Prediction Mode, AC Coefficients, Edge
Description
도 1은 MPEG-4 Part 10(H.264)에서 사용하는 인트라 예측 모드를 도시한 도면,1 is a diagram illustrating an intra prediction mode used in MPEG-4 Part 10 (H.264),
도 2는 본 발명에 따른 트랜스코더의 바람직한 실시예의 상세한 구성을 도시한 블록도,2 is a block diagram showing the detailed configuration of a preferred embodiment of a transcoder according to the present invention;
도 3은 가변길이디코더에 의해 복호된 4개의 8×8 블록을 1개의 8×8 블록으로 다운샘플링하는 경우에 복호된 블록의 AC 계수와 추출방향을 도시한 도면,3 is a diagram showing AC coefficients and extraction directions of a decoded block when downsampling four 8x8 blocks decoded by a variable length decoder into one 8x8 block;
도 4는 에지의 방향과 AC01, AC10, AC02, 및 AC20의 값의 조합과의 관계를 도시한 도면, 그리고,4 shows the relationship between the direction of the edge and the combination of the values of AC 01 , AC 10 , AC 02 , and AC 20 , and
도 5는 본 발명에 따른 트랜스코딩 방법의 바람직한 실시예의 수행과정을 도시한 흐름도이다.5 is a flowchart illustrating the implementation of a preferred embodiment of a transcoding method according to the present invention.
본 발명은 DCT 계수를 기초로 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법에 관한 것으로, 보다 상세하게는, 동영상의 트랜스코딩 시 계산의 복잡도 감소 및 화질의 극대화를 위해 입력 스트림에서 복호화된 DCT 계수를 기초로 출력 부호화 파라미터인 인트라예측모드를 결정하는 트랜스코더 및 트랜스코딩 방법에 관한 것이다.The present invention relates to a transcoder and a transcoding method for determining an intra prediction mode based on DCT coefficients. More particularly, the present invention relates to a DCT decoded in an input stream to reduce computational complexity and maximize image quality during transcoding of a video. The present invention relates to a transcoder and a transcoding method for determining an intra prediction mode that is an output encoding parameter based on coefficients.
이동 통신 기술의 발전 및 디지털 미디어 서비스의 다양화로 인해 멀티미디어 전송 및 저장 시 전송 환경이나 어플리케이션에 따라 동영상 데이터의 변형의 필요성이 증가하고 있다. 트랜스코딩 시스템이란 동영상 데이터를 적절한 포맷으로 변형하거나 비트율을 변화시키는 시스템이다. 하지만 실시간으로 동영상 데이터를 변경함에 있어서 데이터의 변경을 위한 계산의 복잡도를 감소시키는 동시에 화질을 극대화시키기는 용이하지 않다. 즉, 입력 동영상을 복호화한 후 다시 부호화하는 트랜스코딩 시스템에서의 복호화 및 부호화에 따른 많은 계산량으로 인해 실시간으로 동영상을 변경하면서 최대의 화질을 얻은 것은 거의 불가능에 가깝다. 따라서 트랜스코딩 시스템에 관한 연구는 부호화 과정에서 많은 계산량을 필요로 하는 움직임 예측 및 매크로블록 종류 결정을 효율적으로 개선하는데 그 목표를 두고 있다.Due to the development of mobile communication technology and diversification of digital media services, the necessity of transforming video data according to a transmission environment or an application is increasing. A transcoding system is a system that transforms video data into an appropriate format or changes a bit rate. However, in changing the video data in real time, it is not easy to maximize the image quality while reducing the complexity of the calculation for changing the data. That is, it is almost impossible to obtain the maximum image quality while changing the video in real time due to a large amount of calculations due to the decoding and encoding in the transcoding system that decodes and re-encodes the input video. Therefore, the research on the transcoding system aims to efficiently improve the motion prediction and macroblock type determination which require a large amount of computation in the encoding process.
기존에 제안된 트랜스코딩 알고리즘에는 그 처리 영역에 따라 공간 영역 트랜스코딩 기법과 DCT 영역의 트랜스코딩 기법이 존재한다. 또한 각각의 트랜스코딩 기법에 있어서 부호화 과정에서 사용하게 될 출력 파라미터들을 효과적으로 설정하기 위한 알고리즘들이 제안된 바 있다. 출력 파라미터 산출 알고리즘은 트랜스코딩 처리 영역과는 무관하게 적용할 수 있는 알고리즘이다. 출력 파라미터 산출 알고리즘은 주로 부호화 과정에서 복잡한 연산을 필요로 하는 매크로블록 종류와 움직임벡터 설정에 초점을 두고 개발되었다. In the conventionally proposed transcoding algorithm, there are a spatial domain transcoding scheme and a DCT domain transcoding scheme according to the processing region. In addition, algorithms for effectively setting output parameters to be used in encoding in each transcoding scheme have been proposed. The output parameter calculation algorithm is an algorithm that can be applied regardless of the transcoding processing area. The output parameter calculation algorithm is mainly developed for macroblock type and motion vector setting which require complex operation in encoding process.
한편 기존의 트랜스코더에는 인트라 예측 모드를 효율화하는 알고리즘이 존재하지 않았다. 따라서 기존의 트랜스코더에서의 인트라 예측 모드 결정은 부호화 알고리즘에 기반하여 행해졌다. MPEG-4 Part 10(H.264)의 부호화 압축 방식에서 인트라 예측 모드는 도 1에 도시된 같이 9개의 4Х4 예측 모드와 4개의 8Х8 예측 모드를 가지고 있다. Intra 4×4 모드의 9가지 예측모드는 각각의 모드 이름에 대응되도록, 수직방향, 수평방향 또는 대각선 방향 등으로 블록의 예측이 수행된다.On the other hand, the existing transcoder does not have an algorithm for efficient intra prediction mode. Therefore, intra prediction mode determination in the existing transcoder was performed based on the encoding algorithm. In the encoding compression scheme of MPEG-4 Part 10 (H.264), the intra prediction mode has nine 4Х4 prediction modes and four 8Х8 prediction modes as shown in FIG. 1. In the nine prediction modes of the Intra 4x4 mode, block prediction is performed in a vertical direction, a horizontal direction, or a diagonal direction so as to correspond to each mode name.
Intra 4×4 모드는 vertical 모드, horizontal 모드, DC 모드, diagonal_down_left 모드, diagonal_down_right 모드, vertical_right 모드, horizontal_down 모드, vertical_up 모드, 및 horizontal_up 모드가 있다. 이 때, Intra 4×4 모드에서는 9가지 예측방향에 대해서 모두 비트율-왜곡을 구하기 위해 소요되는 비용을 계산하여 최적의 모드를 선택한다. 예를 들어, 4Х4 예측 모드 중 예측 모드 0을 설명하면, 예측 모드 0은 90° 방향으로 예측을 실시한다. 4Х4 블록 내의 픽셀 값은 열(column)로 분류하여 첫 번째 열은 A값을 프리딕터(predictor)로 하여 예측을 실행하게 된다. 즉, 도 1에 도시된 바와 같이 화살표 방향에 따라 프리딕터를 결정하고, 화살표 방향에 속한 픽셀 값은 그 프리딕터에 의해 예측을 실행하게 된다. MPEG-4 Part 10(H.264)에서는 이와 같이 모든 예측 모드에 따라 예측을 실행한 후 비트율과 왜곡이 최적화되는 인트라 예측 모드를 선택 하게 된다.Intra 4 × 4 modes include a vertical mode, a horizontal mode, a DC mode, a diagonal_down_left mode, a diagonal_down_right mode, a vertical_right mode, a horizontal_down mode, a vertical_up mode, and a horizontal_up mode. In this case, the Intra 4x4 mode selects an optimal mode by calculating the cost required to obtain bit rate-distortion for all nine prediction directions. For example, if
이와 같은 기존의 트랜스코더는 인트라 예측 모드를 종류별로 실행한 후 비트율-왜곡(Rate-Distortion) 최적화에 기반하여 비교하여 최적인 예측 모드를 선정한다. 이 때, 예측 모드 별로 비트율과 왜곡을 구하는 과정은 많은 계산량을 요구하게 되므로, 실시간으로 동영상을 변경하면서 최대의 화질을 얻기가 곤란하다는 문제가 있다. Such a conventional transcoder selects an optimal prediction mode by performing intra prediction modes for each type and comparing them based on a rate-distortion optimization. At this time, the process of obtaining the bit rate and the distortion for each prediction mode requires a large amount of computation, and thus it is difficult to obtain the maximum image quality while changing the video in real time.
본 발명이 이루고자 하는 기술적 과제는, 어플리케이션에 따라 해상도 감소 및 비트율 감소를 위한 동영상 트랜스코딩에 적합한 트랜스코더 및 트랜스코딩 방법을 제공하는 데 있다.An object of the present invention is to provide a transcoder and a transcoding method suitable for video transcoding for resolution reduction and bit rate reduction according to an application.
본 발명이 이루고자 하는 다른 기술적 과제는, 어플리케이션에 따라 해상도 감소 및 비트율 감소를 위한 동영상 트랜스코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.Another object of the present invention is to provide a computer-readable recording medium having recorded thereon a program for executing a video transcoding method for resolution reduction and bit rate reduction according to an application.
상기의 기술적 과제를 달성하기 위한 본 발명에 따른 트랜스코더는 입력 동영상 스트림을 복호하는 복호화부; 상기 복호화부에 의해 복호된 제1크기의 블록에 대한 DCT 계수를 추출하는 정보추출부; 상기 추출된 DCT 계수를 기초로 상기 제1크기의 블록내에 존재하는 에지의 방향을 산출하는 에지방향산출부; 상기 산출된 에지방향에 대응하는 예측모드를 결정하는 예측모드결정부; 및 상기 결정된 예측모드를 기초로 동영상을 부호화하여 출력하는 부호화부;를 구비한다. According to an aspect of the present invention, a transcoder includes: a decoder configured to decode an input video stream; An information extraction unit for extracting a DCT coefficient for the block of the first size decoded by the decoder; An edge direction calculation unit calculating a direction of an edge existing in the block of the first size based on the extracted DCT coefficients; A prediction mode determination unit determining a prediction mode corresponding to the calculated edge direction; And an encoder which encodes and outputs a video based on the determined prediction mode.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 트랜스코딩 방법은 입력 동영상 스트림을 복호하는 단계; 상기 복호된 제1크기의 블록에 대한 DCT계수를 추출하는 단계; 상기 추출된 DCT 계수를 기초로 상기 제1크기의 블록내에 존재하는 에지의 방향을 산출하는 단계; 상기 산출된 에지방향에 대응하는 예측모드를 결정하는 단계; 및 상기 결정된 예측모드를 기초로 동영상을 부호화하여 출력하는 단계;를 포함한다. According to another aspect of the present invention, there is provided a transcoding method, comprising: decoding an input video stream; Extracting a DCT coefficient for the decoded first size block; Calculating a direction of an edge existing in the block of the first size based on the extracted DCT coefficients; Determining a prediction mode corresponding to the calculated edge direction; And encoding and outputting a video based on the determined prediction mode.
이에 의해, 입력 동영상 스트림을 복호화 시 추출된 정보를 통하여 선택한 에지의 방향에 따라 인트라 예측 모드를 결정하여 트랜스코더의 복잡도를 최소화하고 화질을 유지할 수 있다.Accordingly, the intra prediction mode may be determined according to the direction of the edge selected through the extracted information when decoding the input video stream, thereby minimizing the complexity of the transcoder and maintaining the image quality.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 트랜스코더 및 트랜스코딩 방법의 바람직한 실시예에 대해 상세하게 설명한다.Hereinafter, exemplary embodiments of a transcoder and a transcoding method according to the present invention will be described in detail with reference to the accompanying drawings.
도 2는 본 발명에 따른 트랜스코더의 바람직한 실시예의 상세한 구성을 도시한 블록도이다.2 is a block diagram showing the detailed configuration of a preferred embodiment of a transcoder according to the present invention.
도 2를 참조하면, 본 발명에 따른 트랜스코더(200)는 복호화부(210), 정보추출부(230), 에지방향산출부(240), 예측모드결정부(250), 다운샘플러(260), 및 부호화부(270)를 구비한다.2, the
복호화부(210)는 입력 동영상 스트림을 복호한다. 입력 동영상 스트림은 MPEG, H.26x 등의 압축표준에 의해 압축된 프레임 단위의 영상 신호이다. 복호화부(210)는 가변길이디코더(Variable Length Decoder : VLD)(212), 역양자화부(214), 역DCT부(216), 프레임메모리(218), 움직임보상부(220), 및 가산부(222)를 갖는다. 이러한 복호화부(210)는 가변길이디코더(212)의 출력을 정보추출부(230)에 제공하는 구성을 제외하고 기존의 MPEG 동영상을 복호하는 장치의 구성과 동일하므로 상세한 설명은 생략한다.The
부호화부(270)는 예측모드결정부(250)에 의해 결정된 예측모드를 기초로 동영상을 부호화하여 출력한다. 도 2에 도시된 부호화부(270)는 H.264 부호화기(encoder)로서 DCT/양자화부(272), 가변길이코더(274), 역DCT/역양자화부(276), 프레임메모리(278), 움직임추정부(280), 인트라예측부(282), 및 감산기(284)를 구비한다.The
다운샘플러(260)로부터 입력된 영상은 DCT/양자화부(272)로 입력되어 DCT와 양자화가 수행된 후 가변길이코더(274)에서 컨텍스트 기반의 적응 가변길이코딩(Context-based adaptive variable length coding)된다. 가변길이코더(274)로부터 출력되는 동영상 스트림은 MPEG-4 Part 10(H.264)의 압축표준에 의해 압축된 프레임 단위의 영상 신호이다. 이때 입력영상은 역DCT/역양자화부(276)에도 입력되어 (DCT+Q)-1가 수행된다. (DCT+Q)-1 가 수행된 영상은 선택적으로 블록경계를 스무딩처리를 거친 후 프레임메모리(278)에 저장된다. 움직임추정부(280)는 프레임메모리(278)에 저장되어 있는 참조영상과 입력영상을 가지고 움직임 추정을 수행하여 인코딩할 입력영상이 인터 프레임인가 인트라 프레임인가의 여부에 따라 입력영상에서 참조영상을 뺄 것인가의 여부를 결정하고, 결정내용에 기초하여 선택적으로 참조영상을 감산기(284)에 제공한다. 인트라예측부(282)는 움직임추정부(280)로부터 입력받은 추정결과, 예측모드결정부(250)로부터 입력받은 예측결과, 및 다운샘플러(260)로부터 입력받은 입력영상을 기초로 인트라 매크로블록의 부호화를 위한 인트라 예측방향을 설정하여 가산기(260)로 출력한다. The image input from the
본 발명에 따른 트랜스코더(200)는 정보추출부(230), 에지방향산출부(240), 및 예측모드결정부(250)의 효율성에 따라 성능이 결정된다. 따라서 정보추출부(230)가 복호화부(210)로부터 의미있는 정보를 추출하기 위한 알고리즘은 전체 트랜스코더(210) 내의 복호화 과정의 복잡도를 증가시키지 않으면서 정보를 효율적으로 추출하여야 한다. 또한 에지방향산출부(240) 및 예측모드결정부(250)는 추출된 정보를 활용하여 부호화 파라미터를 최적에 가깝도록 산출하여야 한다. 트랜스코더 (200)내의 부호화부(210)에서 전체 부호화 파라미터를 계산하면 화질은 최적이지만 전체 복잡도가 증가하여 실시간 응용에 있어 문제점을 야기하게 된다. 나아가, 부호화 파라미터를 잘못 선정하면 전체적인 화질이 떨어져 실제 동영상 서비스의 품질을 떨어뜨리게 된다.The performance of the
정보추출부(230)는 복호화부(210)에 의해 복호된 8×8 블록에 대한 DCT 계수 AC 계수를 추출한다. 이 때 정보추출부(230)는 AC 계수를 지그재그 스캔순서로 추출한다. 도 3에는 가변길이디코더(212)에 의해 복호된 4개의 8×8 블록을 1개의 8×8 블록으로 다운샘플링하는 경우에 복호된 블록의 AC 계수와 추출방향이 도시되어 있다. 도 3을 참조하면, 정보추출부(230)는 복호된 블록 중에서 왼쪽 상단에 도시된 8×8 블록으로부터 순차적으로 AC01, AC10, AC02, 및 AC20
을 추출한다. 도 3에 도시된 8Х8 블록은 트랜스코더(200)의 부호화부(270)의 4Х4 블록에만 영향을 주게 된다. 비록 도 3에는 입력영상에 비해 출력영상의 해상도가 감소되는 경우가 도시되어 있으나, 본 발명서 제시하는 인트라 예측 모드 결정 알고리즘은 해상도감소가 이루어지지 않은 경우에도 적용될 수 있다.The information extracting unit 230 extracts the DCT coefficient AC coefficient for the 8x8 block decoded by the
에지방향산출부(240)는 정보추출부(230)에 의해 추출된 AC 계수를 기초로 복호된 8×8 블록내에 존재하는 에지의 방향을 산출한다. 이 때 에지방향산출부(240)는 다음의 수학식에 의해 블록내에 존재하는 일정한 방향의 에지 성분의 존재 유무를 파악한다. 도 3에 도시된 바와 같은 블록에서 추출된 DCT 계수의 특성을 알아보기 위해 AC 계수들을 계산하는 변환식은 수학식 1과 같이 정의된다. The edge
수학식 1에서 AC01, AC10의 식을 변형하여 나타내면 각각 수학식 2와 수학식 3으로 표현할 수 있다. In
수학식 2의 AC01은 가로 방향의 픽셀 정보의 차이를 DCT의 합으로 표현한 것 과 같으므로 블록 내의 세로 방향 에지의 존재 유무를 판단할 수 있는 정보로 제공된다. 수학식 3의 AC10은 세로 방향의 픽셀 정보의 차이를 DCT의 합으로 표현한 것과 같으므로 블록 내의 가로 방향 에지의 존재 유무를 판단할 수 있는 정보로 제공된다. 따라서 AC01이 "0"이면 세로 방향 에지가 존재하지 않는 것을 의미하며, AC
10이 "0"이면 가로 방향 에지가 존재하지 않는 것을 의미한다. 결론적으로, AC01
, AC10, AC02, 및 AC20의 값의 조합을 통해 0°, 90°, 45°, 135°, 67.5°, 112.5°방향의 에지 성분의 존재 유무를 파악할 수 있다.Since AC 01 of
예측모드결정부(250)는 산출된 에지방향에 대응하는 예측모드를 결정한다. 도 4에는 에지의 방향과 AC01, AC10, AC02, 및 AC20의 값의 조합과의 관계가 도시되어 있다. 예측모드결정부(250)는 도 3에 도시된 4개의 8Х8 블록이 모두 같은 방향의 에지를 가지면 그 에지 방향에 일치하는 모드로 선언하여 4Х4 예측 모드와 8Х8 예측 모드를 비교하여 선택하게 된다. 예를 들어, 도 3에 도시된 블록 중에서 왼쪽 상단의 블록에서 AC10>0, AC01>0, 그리고, AC02=0이면, 예측모드결정부(250)는 출력되는 4Х4 블록의 예측 모드를 도 4에 도시된 4Х4 예측 모드 중에서 "7"로 결정하게 된다. 또한, 도 3에 도시된 모든 블록이 4Х4 예측 모드 중에서 "0"으로 결정되면 예측모드결정부(250)는 4개의 블록의 4Х4 예측 모드 "7"로 예측한 결과와 4개의 블록을 하나의 8Х8로 묶어 8Х8 예측모드 "0"으로 예측한 결과와 비교하여 더 나은 성능을 가지는 것으로 예측 모드를 결정한다. 도 3에 도시된 모든 블록이 4Х4 예측 모드 중 "0", "1", "2", "3"으로 결정되는 경우도 동일하다. The prediction mode determiner 250 determines a prediction mode corresponding to the calculated edge direction. 4 shows the relationship between the direction of the edge and the combination of the values of AC 01 , AC 10 , AC 02 , and AC 20 . When all four 8Х8 blocks shown in FIG. 3 have edges in the same direction, the prediction mode determiner 250 declares a mode corresponding to the edge direction and compares the 4Х4 prediction mode with the 8Х8 prediction mode. For example, if AC 10 > 0, AC 01 > 0, and AC 02 = 0 in the block in the upper left corner of the block shown in FIG. 3, the prediction mode determiner 250 determines the prediction mode of the output 4Х4 block. It is determined as "7" from the 4Х4 prediction mode shown in FIG. In addition, when all of the blocks shown in FIG. 3 are determined to be "0" in the 4Х4 prediction mode, the prediction mode determiner 250 predicts the 4Х4 prediction mode "7" of four blocks and four blocks one 8Х8. The prediction mode is determined to have better performance compared to the result predicted by 8Х8 prediction mode "0". The same applies when all blocks shown in FIG. 3 are determined to be "0", "1", "2", and "3" in the 4Х4 prediction mode.
상술한 바와 같은 방법에 의해 에지의 방향과 일치되는 방향으로 예측 모드를 결정하면, 인트라 예측에 의해서 차이 값이 크게 존재하는 픽셀 값이 존재할 확률이 낮아지므로 실제 모든 인트라 예측을 해보지 않고도 최적에 가까운 인트라 예측 모드를 설정해 줄 수 있다. 인트라 예측 모드는 예측에 의한 차이 값이 적으면 적을수록 양호한 출력영상을 산출할 수 있다. When the prediction mode is determined in a direction coinciding with the direction of the edge by the method as described above, the probability of existence of pixel values having a large difference value is reduced by intra prediction, so that the intra that is closest to the optimum without having to actually perform all intra predictions is determined. You can set the prediction mode. In the intra prediction mode, the smaller the difference value according to the prediction, the better the output image can be calculated.
도 5는 본 발명에 따른 트랜스코딩 방법의 바람직한 실시예의 수행과정을 도시한 흐름도이다.5 is a flowchart illustrating the implementation of a preferred embodiment of a transcoding method according to the present invention.
도 5를 참조하면, 가변길이디코더(212)는 입력 동영상 스트림을 복호하여 출력한다(S500). 정보추출부(230)는 복호된 블록으로부터 에지 방향을 산출하기 위한 DCT 계수를 추출한다(S510). 이 때, 정보추출부(230)는 DCT 계수 중에서 지그재그 스캔순서로 AC 계수인 AC01, AC10, AC02, 및 AC20만을 추출한다. 에지방향산출부(240)는 추출된 AC 계수의 특성을 이용하여 블록 내의 에지의 방향을 산출한다(S520). 에지는 블록 내에서 존재하는 에지를 의미하며, 에지의 방향은 0°, 90°, 45°, 135°, 67.5°, 112.5° 방향 중 하나로만 선택된다. 예측모드결정부(250)는 산출된 에지의 방향성에 따라서 인트라 예측 모드를 결정한다(S530). 인트라 예측 모드의 효율은 예측에 사용되는 값(Predictor)이 현재 블록의 픽셀 값과 비슷하면 효율이 높게 되므로 예측 모드에 의한 방향이 에지 방향과 일치하게 되면 실제 예측에 사용되는 값과 예측되는 현재 블록의 픽셀 값의 차이가 줄어들므로 효율이 높아진 다. 이러한 성질에 의해 실제 부호화 알고리즘과는 달리 전체 예측 모드에 의한 비트율-왜곡을 구하지 않고 간단한 계산에 의해서 예측 모드를 결정하므로, 트랜스코더(200) 내의 예측모드결정부(250)에서 수행되는 계산의 복잡도를 감소시키는 장점이 있다. 부호화부(270)는 결정된 인트라 예측 모드를 기초로 다운샘플링된 영상을 부호화하여 출력한다(S540).Referring to FIG. 5, the
이상에서 출력이 MPEG-4 Part 10(H.264)이며 가로와 세로 1/2로 다운 샘플링하는 트랜스코더에서 MPEG-4 Part 10(H.264)의 인트라 매크로블록의 부호화 파라미터인 인트라 예측 모드를 결정하는 경우에 대해 설명하였으나, 본 발명서 제시하는 인트라 예측 모드 결정 알고리즘은 해상도감소가 이루어지지 않은 경우에도 적용될 수 있다.In the above, the output is MPEG-4 Part 10 (H.264) and the transcoder down-sampling the horizontal and the vertical half is used for intra prediction mode, which is an encoding parameter of the intra macroblock of MPEG-4 Part 10 (H.264). Although the case of the determination has been described, the intra prediction mode determination algorithm proposed in the present invention can be applied even when the resolution is not reduced.
본 발명에 따른 DCT 계수의 특성에 따른 인트라 예측 모드를 결정하는 트랜스코더 및 트랜스코딩 방법은 컴퓨터 프로그램으로 작성 가능하며 칩으로 구현 가능하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보 저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 트랜스코딩 방법을 구현한다. 정보 저장매체는 자기 기록매체, 광 기록매체, 및 캐리어 웨이브 매체를 포함한다. 또한 컴퓨터가 읽을 수 있는 저장매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.The transcoder and the transcoding method for determining the intra prediction mode according to the characteristics of the DCT coefficients according to the present invention can be written in a computer program and implemented in a chip. Codes and code segments constituting the program can be easily inferred by a computer programmer in the art. The program is also stored in a computer readable media, which is read and executed by a computer to implement a transcoding method. The information storage medium includes a magnetic recording medium, an optical recording medium, and a carrier wave medium. The computer readable storage medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발 명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.Although the preferred embodiments of the present invention have been shown and described above, the present invention is not limited to the above-described specific preferred embodiments, and the present invention belongs to the present invention without departing from the gist of the present invention as claimed in the claims. Various modifications can be made by those skilled in the art, and such changes are within the scope of the claims.
본 발명에 따른 트랜스코더 및 트랜스코딩 방법에 의하면, 동영상 스트림을 저장매체에 알맞은 매체로 저장하기 위해 포맷을 변환하거나 디지털 TV 서비스를 무선 인터넷 방송이나 DMB(Digital Multimedia Broadcasting)서비스로 변환하거나 네트워크의 대역폭에 맞도록 비트율을 조정하기 위해 MPEG-4 Part 10(H.264)으로 트랜스코딩을 수행할 때, 입력 동영상 스트림의 복호화 시 추출된 정보를 기초로 에지의 방향을 선택하고, 선택한 에지 방향에 따라 인트라 예측 모드를 결정함으로써 트랜스코더의 복잡도를 최소화하고 화질을 유지할 수 있다. 또한, 네트워크 게이트웨이 등에서 비트율의 조정이나 포맷변환을 하여 네트워크의 대역에 맞는 서비스를 가능하게 하며, 기존의 MPEG-1,2,4로 부호화된 동영상 컨텐츠를 MPEG-4 Part 10(H.264) 동영상 컨텐츠로 효율적으로 변형할 수 있다.According to the transcoder and the transcoding method according to the present invention, in order to store a video stream in a medium suitable for a storage medium, a format is converted, a digital TV service is converted into a wireless Internet broadcast or a digital multimedia broadcasting (DMB) service, or a bandwidth of a network. When transcoding with MPEG-4 Part 10 (H.264) to adjust the bit rate to fit the, the edge direction is selected based on the extracted information when decoding the input video stream, and according to the selected edge direction. By determining the intra prediction mode, the complexity of the transcoder can be minimized and the image quality can be maintained. In addition, by adjusting the bit rate or converting the format at the network gateway, it is possible to provide a service suitable for the network band, and the MPEG-4 Part 10 (H.264) moving image can be converted to MPEG-1, 2, 4 encoded video contents. It can be transformed into content efficiently.
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040056821A KR100643126B1 (en) | 2004-07-21 | 2004-07-21 | Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040056821A KR100643126B1 (en) | 2004-07-21 | 2004-07-21 | Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060008527A KR20060008527A (en) | 2006-01-27 |
KR100643126B1 true KR100643126B1 (en) | 2006-11-10 |
Family
ID=37119541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040056821A KR100643126B1 (en) | 2004-07-21 | 2004-07-21 | Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100643126B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010087589A3 (en) * | 2009-01-29 | 2010-09-23 | 엘지전자 주식회사 | Method and apparatus for processing video signals using boundary intra coding |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100750145B1 (en) * | 2005-12-12 | 2007-08-21 | 삼성전자주식회사 | Method and apparatus for intra prediction of image |
KR100739790B1 (en) * | 2006-02-02 | 2007-07-13 | 삼성전자주식회사 | Method and apparatus for deciding intra prediction mode |
US8929657B2 (en) * | 2008-08-22 | 2015-01-06 | KyongHee Yi | System and method for indexing object in image |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020008335A (en) * | 2000-07-22 | 2002-01-30 | 김형수 | Apparatus and method for high compression to consider edge direction of motion compensated prediction |
KR20040027047A (en) * | 2002-09-27 | 2004-04-01 | 삼성전자주식회사 | Encoding/decoding apparatus and method for image using predictive scanning |
KR20040110755A (en) * | 2003-06-20 | 2004-12-31 | 서종수 | Method of and apparatus for selecting prediction modes and method of compressing moving pictures by using the method and moving pictures encoder containing the apparatus and computer-readable medium in which a program for executing the methods is recorded |
-
2004
- 2004-07-21 KR KR1020040056821A patent/KR100643126B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020008335A (en) * | 2000-07-22 | 2002-01-30 | 김형수 | Apparatus and method for high compression to consider edge direction of motion compensated prediction |
KR20040027047A (en) * | 2002-09-27 | 2004-04-01 | 삼성전자주식회사 | Encoding/decoding apparatus and method for image using predictive scanning |
KR20040110755A (en) * | 2003-06-20 | 2004-12-31 | 서종수 | Method of and apparatus for selecting prediction modes and method of compressing moving pictures by using the method and moving pictures encoder containing the apparatus and computer-readable medium in which a program for executing the methods is recorded |
Non-Patent Citations (1)
Title |
---|
1020040056821 - 639803 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010087589A3 (en) * | 2009-01-29 | 2010-09-23 | 엘지전자 주식회사 | Method and apparatus for processing video signals using boundary intra coding |
US9196059B2 (en) | 2009-01-29 | 2015-11-24 | Lg Electronics Inc. | Method and apparatus for processing video signals using boundary intra coding |
Also Published As
Publication number | Publication date |
---|---|
KR20060008527A (en) | 2006-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101471831B1 (en) | Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program | |
KR100750136B1 (en) | Method and apparatus for encoding and decoding of video | |
US7933334B2 (en) | Image encoder and method thereof, computer program of image encoder, and mobile terminal | |
KR101246294B1 (en) | Method of and apparatus for video intraprediction encoding/decoding | |
KR100850706B1 (en) | Method for adaptive encoding and decoding motion image and apparatus thereof | |
KR100850705B1 (en) | Method for adaptive encoding motion image based on the temperal and spatial complexity and apparatus thereof | |
US8311095B2 (en) | Method and apparatus for transcoding between hybrid video codec bitstreams | |
KR20190009408A (en) | Method and Apparatus for Video Encoding/Decoding | |
KR20110047697A (en) | Method and apparatus for encoding and decoding coding unit of picture boundary | |
KR20110017302A (en) | Method and apparatus for encoding/decoding image by using motion vector accuracy control | |
KR20030058873A (en) | Apparatus for motion estimation and mode decision and method thereof | |
US8155203B2 (en) | Method for transcoding a data stream comprising one or more coded, digitised images | |
KR100809603B1 (en) | Method and Apparatus for video coding on pixel-wise prediction | |
JP5004180B2 (en) | Video encoding apparatus and decoding apparatus | |
JP2004215275A (en) | Motion compensation based improved noise prediction method and apparatus, and moving image encoding method and apparatus using the same | |
JP2008004984A (en) | Image processor and method, program, and recording medium | |
KR100643126B1 (en) | Transcoder for determining intra prediction direction based on DCT coefficients and transcoding method of the same | |
KR20040079084A (en) | Method for adaptively encoding motion image based on the temperal complexity and apparatus thereof | |
KR100508975B1 (en) | Motion estimation method using multilevel successive elimination altorithm | |
KR100672958B1 (en) | Transcoding system and method capable of optimizing resolution converting module and motion estimating module commonly | |
KR20110024574A (en) | Integrated video encoding method and apparatus | |
JP2914607B2 (en) | Image signal decoding device | |
KR100924779B1 (en) | Method for adaptive encoding and decoding motion image and apparatus thereof | |
CN116980609A (en) | Video data processing method, device, storage medium and equipment | |
Matsuda et al. | A lossless re-encoding scheme for MPEG-1 video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120903 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131015 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20160105 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20171023 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20200107 Year of fee payment: 14 |