KR20010041441A - Method and device for encoding a video signal - Google Patents

Method and device for encoding a video signal Download PDF

Info

Publication number
KR20010041441A
KR20010041441A KR1020007009588A KR20007009588A KR20010041441A KR 20010041441 A KR20010041441 A KR 20010041441A KR 1020007009588 A KR1020007009588 A KR 1020007009588A KR 20007009588 A KR20007009588 A KR 20007009588A KR 20010041441 A KR20010041441 A KR 20010041441A
Authority
KR
South Korea
Prior art keywords
picture
pictures
sub
bits
coefficients
Prior art date
Application number
KR1020007009588A
Other languages
Korean (ko)
Inventor
그롤리에르프랑소와즈
바라우에릭
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Publication of KR20010041441A publication Critical patent/KR20010041441A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/46Conversion to or from run-length codes, i.e. by representing the number of consecutive digits, or groups of digits, of the same kind by a code word and a digit indicative of that kind
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

비디오 통신에서, 전송의 품질과 지연은 부호기의 주어진 세팅에 대해 발생된 비트들의 숫자에 대역폭을 공급하게 하는 비트율 제어 전략에 의존한다. 상기 부호기에 적절한 가이드라인을 주기 위해 근사적 예측에 기초한(동작 정보에 대한 경험 법칙과, 화상의 내용에 대한 통계의 사용에 의해) 전분석 단계는 결과적으로 상기 발생된 숫자의 비트들을 예측하기 위해 수행되고, 양자화 단계 크기와 연속된 화상들의 속도를 조절하기 위해 제공된 결정 단계가 뒤따른다.In video communications, the quality and delay of transmission rely on a bit rate control strategy that allows the bandwidth of the number of bits generated for a given setting of the encoder. A pre-analysis step based on the approximate prediction (by the use of empirical rules for motion information and statistics on the content of the picture) to give the encoder appropriate guidelines to consequently predict the generated bits of the number. A determination step is provided, followed by a decision step provided to adjust the quantization step size and the speed of successive pictures.

Description

비디오 신호를 인코딩하기 위한 방법 및 장치{Method and device for encoding a video signal}Method and device for encoding a video signal

낮은 비트 속도 응용(텔레비젼 전화, 텔레비젼 회의)에서 상기 H.263 표준에서 제안된 것과 같은 영상 압축을 위한 시스템이 권장된다. 상기 표준에 따른 비디오 인코더는 예를들어 B.Furht등의 책, 클루웨르 아카데믹 출판사 1997년판 "비디오 압축을 위한 동작 판단 알고리즘" 2장 30-35 페이지에 기술되어 있다. 도 1에 도시된 바와 같은 H.263 비디오 인코더는 이전 영상으로부터 현재 영상까지 동작 보상 예측에 기초하며, 직각 변환(DCT와 같은)이 뒤따르는데, 이것은 상기 화상 요소들을 연관시키지 않고, 변환되고 양자화된 상기 예측 오류를 인코딩하기 위한 몇몇 저 차수 계수들과 양자화와 인코딩 동작으로 상기 에너지를 집중하여 상기 화상들의 공간적 여분을 감소시킨다. 적어도 상기 제 1 화상은 참조용이고 일시적 예측없이(즉, "내부 모드"나 I 모드에 따라) 인코딩되며, 때때로 모든 n 화상들에서 하나 이상의 화상은 또한 상기 내부 모드에 따라 코딩된다. 화상의 다른 형태, P는 P화상들, 즉, 이전 화상들로부터 일시적으로 예측되는 화상들에 대응한다.In low bit rate applications (television telephony, television conferencing), a system for video compression as suggested in the H.263 standard is recommended. Video encoders according to this standard are described, for example, in B.Furht et al., Kluwer Academic Publishers, 1997 edition, "Operation Decision Algorithms for Video Compression," chapters 2-30-35. The H.263 video encoder as shown in FIG. 1 is based on motion compensated prediction from the previous picture to the current picture, followed by an orthogonal transform (such as DCT), which does not associate the picture elements, transforms and quantizes them. Some low order coefficients for encoding the predicted error and the quantization and encoding operations concentrate the energy to reduce the spatial redundancy of the pictures. At least the first picture is for reference and is encoded without temporal prediction (ie according to "internal mode" or I mode), and sometimes at least one picture in every n pictures is also coded according to the internal mode. Another form of picture, P, corresponds to P pictures, ie pictures that are temporarily predicted from previous pictures.

본 발명은 비디오 신호의 연속된 화상들을 인코딩하기 위한 방법에 관한 것으로서, 각각의 연속된 화상을 다수의 부(sub)-화상들로 분할하는 단계와, 각각의 부-화상을 계수들로 변환하는 단계와, 상기 계수들을 적용된 단계 크기로 양자화하는 단계와, 상기 양자화된 계수들을 코딩하는 단계와, 각각의 연속된 화상을 인코딩하기 위한 비트수들에 대한 목표치에 따라 상기 단계 크기를 제어하는 단계를 포함한다. 본 발명은 또한 대응하는 장치에 관한것이다. 본 발명은 특히, 소위 H.263 권장사항에 따라 낮은 비트율로 실시간 통신에 적응된다.The present invention relates to a method for encoding successive pictures of a video signal, comprising dividing each successive picture into a plurality of sub-pictures, and converting each sub-picture into coefficients. Quantizing the coefficients to an applied step size, coding the quantized coefficients, and controlling the step size according to a target value for the number of bits for encoding each successive picture. Include. The invention also relates to a corresponding device. The invention is particularly adapted to real time communication at low bit rates in accordance with so-called H.263 recommendations.

도 1은 상기 H.263 표준에 따른 기본적 비디오 압축 개략도.1 is a basic video compression schematic in accordance with the H.263 standard.

도 2는 본 발명에 따른 인코더의 일반적 구조.2 is a general structure of an encoder according to the invention.

도 3은 도 2의 개략도가 어떻게 작용하는가를 도시한 도면.3 shows how the schematic diagram of FIG. 2 works.

도 1에 도시된 바와 같이, 상기 연속된 화상들 P는 규칙적으로 상기 인코딩 장치(입력 비디오)의 입력에 도달한다. 이산 코사인 변환 회로(12)와 양자화 회로 (13)와 가변 길이 인코더(14)(각각, DCT, Q, VLC)를 포함하는 코딩 브랜치(branch)는 상기 화상들을 처리하고(상기 회로(12)는 사실상 뺄셈기 (subtra -ctor)(25)의 출력에서 이용가능한 상기 입력 화상들과 예측된 것들 사이의 차이를 수신한다), 상기 얻어진 코딩된 가변 비트율 비트스트림을 버퍼(15)로 보내는데, 그 출력은 상기 H.263 비디오 인코더의 상기 출력된 일정한 비트율 비트스트림이다. 상기 출력 비트스트림은 버퍼 조절을 위해 비트율 제어회로(30)로도 보내진다. 예측 브랜치 (branch)가 제공되며, 역 양자화 회로(21)(Q-1)와 역 DCT 변환 회로 (22)(DCT-1)와, 가산기(23)(상기 재구성된 이전 화상 RPP를 전달한다)와, 일시적 예측 회로(24)(상기 뺄셈기(15)로 보내진 예측된 화상 PP와 상기 가변 길이 인코더(14)에 보내진 동작 벡터들 MV를 전달하고, 상기 예측은 화상 스킵핑(skipping) 회로(26)의 출력에서 이용가능한 상기 현재 화상 CP와, 상기 가산기의 출력에서 이용가능한 상기 재구성된 하나의 RPP사이에서 수행된 블록-맷칭(matching) 탐색에 기초하고 있다)와, 상기 뺄셈기(25)를 연속하여 포함한다. 상기 일시적 예측 회로(24)의 출력은 또한 상기 일시적 예측에 사용된 상기 이전 화상 RPP의 재구성의 관점에서 상기 가산기(23)의 다른 입력을 향하여 되돌려진다.As shown in Fig. 1, the consecutive pictures P arrive at the input of the encoding device (input video) regularly. A coding branch comprising a discrete cosine transform circuit 12, a quantization circuit 13 and a variable length encoder 14 (DCT, Q, VLC, respectively) processes the images (the circuit 12 In effect receives the difference between the input pictures available at the output of a sub-ctor 25 and the predicted ones, and sends the obtained coded variable bit rate bitstream to a buffer 15, the output of which is Is the output constant bit rate bitstream of the H.263 video encoder. The output bitstream is also sent to the bit rate control circuit 30 for buffer adjustment. A prediction branch is provided, an inverse quantization circuit 21 (Q- 1 ), an inverse DCT transform circuit 22 (DCT- 1 ), and an adder 23 (which carries the reconstructed previous picture RPP). And a temporal prediction circuit 24 (transfers the predicted picture PP sent to the subtractor 15 and the motion vectors MV sent to the variable length encoder 14, wherein the prediction is carried out with a picture skipping circuit). Based on a block-matching search performed between the current picture CP available at the output of 26) and the reconstructed one RPP available at the output of the adder), and the subtractor 25 It includes continuously. The output of the temporal prediction circuit 24 is also returned to another input of the adder 23 in view of the reconstruction of the previous picture RPP used for the temporal prediction.

상기 H.263 표준은 상기 계층의 4개의 층으로 계층적 비트 스트림 문장구조를 정의하는데, 화상 레벨과 블록들의 그룹 레벨(GOB)과 매크로블록 레벨(MB)과 블록 레벨(8×8 화상요소들, 또는 화소들)이 있으며 상기 블록은 DCT가 동작하는 기본적인 유닛이다. 매크로 블록은 4개의 휘도(luminance) 블록들(화상에서 16×16 영역을 커버)과 2개의 크로미넌스 블록들을 포함한다. 상기 예측 브랜치의 회로(24)내의 상기 재구성된 이전 화상 RPP에서 수행된 상기 동작 판단과 보상은 매크로 블록들에서 동작한다. 상기 버퍼(15)와 상기 양자화 회로(13)사이의 피드백 접속(31)은 더 미세하거나(finer) 더 성긴(coarser) 양자화를 얻는 것을 허용한다. 상기 양자화의 조잡함은 상기 제 1의 3개의 층들(블록들, 매크로 블록들, GOB들)에 관한 양자화 매개변수와 각각의 DCT 계수에 대한 양자화의 상대적 조잡함을 설정하는 고정된 양자화 행렬에 의해 정의된다. 상기 인코더의 입력에서 제공된 상기 화상 스킵핑 회로(26)는 상기 비트율을 줄이는(수신가능한 화상품질을 유지하면서) 가능한 방법으로도 사용된다. 스킵된 화상들의 숫자는 가변이며 상기 출력 버퍼 충만도에 의존하고, 버퍼 조절에 대해 제공된 상기 피드백 접속(31)은 그러므로 양자화 단계 크기 변화들뿐 아니라 화상 스킵핑에도(그리고 인트라/인터 선택에도 관련되어 있으며, 이것은 제 1 스위치 (42)와 제 2 스위치(43)를 발동시키는 회로(41)에 의해 제어된다) 관련되어 있다.The H.263 standard defines a hierarchical bit stream sentence structure with four layers of the hierarchy, the picture level and group level of blocks (GOB), macroblock level (MB) and block level (8x8 picture elements). Or pixels) and the block is the basic unit on which the DCT operates. The macro block includes four luminance blocks (covering 16 × 16 areas in the image) and two chrominance blocks. The operation determination and compensation performed at the reconstructed previous picture RPP in the circuitry 24 of the prediction branch operate on macro blocks. The feedback connection 31 between the buffer 15 and the quantization circuit 13 allows for obtaining finer or coarser quantization. The coarseness of the quantization is defined by a fixed quantization matrix that sets the quantization parameter for the first three layers (blocks, macroblocks, GOBs) and the relative coarseness of the quantization for each DCT coefficient. . The picture skipping circuit 26 provided at the input of the encoder is also used in a possible way to reduce the bit rate (while maintaining a receivable picture quality). The number of skipped pictures is variable and depends on the output buffer fullness, and the feedback connection 31 provided for buffer adjustment is therefore related to image skipping (and intra / inter selection as well as quantization step size changes). Which is controlled by the circuit 41 which activates the first switch 42 and the second switch 43).

상기 피드백 접속은 상기 인코더에 가이드라인을 주는 것을 허용하는데, 비트율 제어의 문제는 실제로, 소정 비트율과 입력 화상이 주어지면, 어떤 인코더 세팅이 선택되어야 하는지를 결정하는 방법은? 으로 공식화될 수 있다. 상기 화상들이 상수 화상속도 접근을 갖고 그에따라 주기적으로 잡혀지고 상기 품질은 각각의 연속된 화상의 복잡성에 적응되며(상기 목표된 비트율을 유지하기 위해) 그리하여 한 화상에서 다른 화상까지 가변성이 크게 되거나, 상수 품질 접근을 갖고 그에따라 상기 인코더가 상기 이전 화상의 처리를 끝냈을 때만, 즉, 상기 화상들의 복잡성들에 적응된 높은 가변 화상속도로 상기 화상들이 고정된 양자화 단계로 처리되는 것이 가능하게 될 것이다.The feedback connection allows to give guidelines to the encoder. The problem of bit rate control is actually how to determine which encoder setting should be selected, given a given bit rate and an input picture? It can be formulated as The pictures have a constant picture rate approach and are periodically taken accordingly and the quality is adapted to the complexity of each successive picture (to maintain the target bit rate) and so the variability from one picture to another becomes large, Only when the constant quality approach and therefore the encoder has finished processing the previous picture, ie at high variable picture rates adapted to the complexity of the pictures, it will be possible for the pictures to be processed in a fixed quantization step.

그러므로 화상 속도와 품질 사이의 타협이 조사되는 향상된 인코딩 방법을 제시하는 것이 본 발명의 목적인데, 상기 입력 화상들과 상기 디스플레이된 것들 사이의 지연이 어떤 장면의 회복을 가능한 규칙적인 것으로 보장하기 위해 잘 제어되어야 한다는(가능한 일정하게) 사실도 고려한다.It is therefore an object of the present invention to present an improved encoding method in which a compromise between picture speed and quality is investigated, in order to ensure that the delay between the input pictures and the displayed ones is as regular as possible to recover the scene. Consider the fact that it should be controlled (as constant as possible).

상기 목적을 위해 본 발명은 상기 설명의 서문에 기술되어 있는 것과 같은 방법에 관한 것이고, 여기서 상기 제어 단계는 전(pre)-분석 부-단계를 포함하는데, 이전과 현재 화상들 사이의 동작 정보를 코딩하고 상기 계수들을 코딩하는데 각각 사용된 비트들의 숫자의 판단과, 상기 양자화 단계 크기와 상기 연속된 화상들의 속도를 조절하기 위해 제공된 결정 부-단계에 기초하고 있다.For this purpose the present invention relates to a method as described in the preamble of the above description, wherein the control step comprises a pre-analysis sub-step, wherein the operation information between the previous and current pictures is displayed. Is based on the determination of the number of bits each used to code and to code the coefficients, and the decision sub-step provided to adjust the quantization step size and the speed of the successive pictures.

본 발명의 특정 측면들이 이후에 기술된 실시예를 참조하여 지금 설명될 것이며, 첨부된 도면들과 관련하여 고려될 것이다.Certain aspects of the invention will now be described with reference to the embodiments described below and will be considered in connection with the accompanying drawings.

도 1에 도시된 바와 같은 코딩 체인에서, 상기 출력 버퍼(15)로 인해 수행된 피드백 제어의 시작점은 각각의 연속하는 현재 화상을 상기 전송 채널에서 이용가능한 비트수로로 코딩하는데 사용될 비트들 수를 맞추는 것이다. 각각의 화상의 코딩 동작동안 상기 비트발생을 연구할 때, 전송될 비트들의 가장 큰 양이 상기 화상의 내용에 관한 것이라는 것이 나타난다. 사실상, 비트들은 상기 화상 레벨과 GOB 레벨과 매크로블록 레벨과 블록 레벨들에서 정보를 코딩하기 위해 사용되지만 발생되는 비트들의 수에 의하여 가장 비싼 부분은 매크로 블록과 블록 레벨들인데, 이것은 동작 판단과 DCT 계수 코딩에 관계되어 있으며, 전적으로 상기 현재 화상의 복잡성에 의존한다.In the coding chain as shown in FIG. 1, the starting point of the feedback control performed by the output buffer 15 is to match the number of bits to be used to code each successive current picture with the number of bits available in the transmission channel. will be. When studying the bit generation during the coding operation of each picture, it appears that the largest amount of bits to be transmitted relates to the content of the picture. In fact, bits are used to code information at the picture level, GOB level, macroblock level and block levels, but the most expensive part by the number of bits generated is the macroblock and block levels, which is the operation decision and DCT It is related to coefficient coding and depends entirely on the complexity of the current picture.

그와같은 코딩 체인에서 통신의 품질은 상기 발생된 비트들의 가변이며, 정량자(quantifier)에 의존하는 부분에 의존한다. 본 발명에 따라, 얼마나 많은 비트들이 상기 인코더의 세팅에 따라 발생될 것인지를 대충 예측하는 현재 영상의 전 (pre)-분석이 제공된다. 이하에 더 자세한 방식으로 기술된 상기 전-분석은 상기 인코더의 각각의 가능한 양자화 단계(전분석 단계)에 대해 발생된 비트들 수를 예측하는 것을 허용한다. 결정단계가 뒤따르는데, 여기서 상기 숫자의 비트들을 상기 요구되는 것과 비교한 후에 상기 인코더에 대한 세팅이 발견된다. 상기 대응하는 양자화 단계가 이전에 설정된 품질 영역에 따른 것이라면, 상기 화상은 그것과 함께 코딩된다(이것은 상기 품질이 너무 나쁠 때는 전송이 허가되지 않는다는 것을 의미하며, 너무 큰 정량자 단계 크기에 대응한다). 그렇지 않으면, 대역폭 (bandwidth) 요구들을 맞추기 위해, 가장 나쁜 허가된 양자화 단계가 제 1 로 선택되고 감소된 화상속도가 계산된다(그리고 상기 화상 스킵핑 회로(26)에 따라 선택된다). 그다음에 상기 계산된 세팅은 상기 화상의 인코딩 프로세스에 사용된다. 각각의 GOB의 인코딩 동작후에, 버퍼 조절을 위한 상기 피드백 접속에 의해 허용된 상기 비트 속도 제어는 비트들의 예측되고 요구된 숫자들 사이의 편차가 상기 인코딩 동작동안 나타났다면 체크를 하고, 필요하다면, 상기 인코더의 세팅은 2개의 연속적인 GOB들사이의 상기 양자화 단계를 수정하여(허가된 변화들을 프러스나 마이너스 1 뿐이다) 수정된다.The quality of communication in such a coding chain is variable of the generated bits and depends on the part that depends on the quantifier. According to the invention, a pre-analysis of the current image is provided which roughly predicts how many bits will be generated according to the settings of the encoder. The pre-analysis described in more detail below allows for predicting the number of bits generated for each possible quantization step (pre-analysis step) of the encoder. A decision step follows, where a setting for the encoder is found after comparing the bits of the number with the required one. If the corresponding quantization step is according to a previously set quality region, the picture is coded with it (this means that transmission is not allowed when the quality is too bad, corresponding to too large quantifier step sizes). . Otherwise, in order to meet the bandwidth requirements, the worst allowed quantization step is selected first and the reduced picture rate is calculated (and selected according to the picture skipping circuit 26). The calculated settings are then used for the encoding process of the picture. After the encoding operation of each GOB, the bit rate control allowed by the feedback connection for buffer adjustment checks if a deviation between the predicted and required numbers of bits appeared during the encoding operation, and if necessary The setting of the encoder is modified by modifying the quantization step between two consecutive GOBs (permitted changes are only prus or minus one).

상기 발생된 비트들은 2개의 부분들로 분할될 수 있는데, 제 1 의 것은 헤더들에 대응하고 제 2 의 것은 상기 현재 화상의 실제 내용에 대응한다. 상기 제 1 부분의 계산은 쉽지만, 상기 제 2 부분의 계산은 더 복잡하다.The generated bits can be divided into two parts, the first one corresponding to the headers and the second one corresponding to the actual content of the current picture. The calculation of the first part is easy, but the calculation of the second part is more complicated.

화상의 내용을 전송하기 위해서, 2가지 종류의 정보가 확실히 필요하다.: (a) 상기 현재 화상과 상기 이전 화상사이의 동작의 정보와 (b) 현재의 매크로 블록과 상기 이전 화상의 대응하는 부분사이이 크로미넌스와 휘도 변화들이다.In order to transfer the contents of the picture, two kinds of information are certainly needed: (a) information of the operation between the current picture and the previous picture and (b) the current macro block and the corresponding part of the previous picture. Are chrominance and luminance changes.

상기 동작 정보에 관련된 제 1 전-분석 부-단계는 상기 동작 벡터들을 코딩하는데 필요한 비트들의 숫자의 근사적 예측에 기초하고 있다. 더 자세히 기술하면, 상기 완전한 화상의 평균 동작과, 모든 동작 데이터를 코딩하는데 필요한 비트들의 숫자를 연결하는 경험 법칙이 성립될 수 있다는 것이 발견되었다. 상기 법칙은 다음 공식(1)의 형태로 표현될 수 있다.The first pre-analysis sub-step related to the motion information is based on an approximate prediction of the number of bits needed to code the motion vectors. In more detail, it has been found that a rule of thumb can be established that connects the average operation of the complete picture with the number of bits required to code all the motion data. The law may be expressed in the form of the following formula (1).

PNB = 4.N.log(1000.Mean_mv/N) (1)PNB = 4.N.log (1000.Mean_mv / N) (1)

여기서:here:

N = 영이 아닌 동작 벡터를 갖는 매크로 블록들의 숫자이고,N = number of macroblocks with nonzero motion vectors,

Mean_mv = (동작 벡터들의 합)/(화상당 매크로 블록들의 숫자)이고,Mean_mv = (sum of motion vectors) / (number of macro blocks per image),

PNB = 화상의 동작 정보를 코딩하는데 사용되는 비트들의 판단된 숫자(전체 화상의 평균 동작에 관련한)이다.PNB = a determined number of bits (relative to the average operation of the entire picture) used to code the motion information of the picture.

상기 법칙은 간단하고 빠르다는 장점이 있다.The law has the advantage of being simple and fast.

DCT 계수들을 코딩하기 위해 비트들의 숫자에 관련된 제 2 전-분석 부-단계는 상기 매크로 블록 레벨에서 행해진 예측에 기초하고 있다. 각각의 양자화 단계에 대해, 전류의 휘도 데이터와 참조 매크로 블록들사이의 절대 차이들의 합(=SAD, 이것은 상기 현재 화상의 본래의 매크로 블록과 상기 이전의 재구성된 화상의 변위된 매크로 블록사이의 상관관계 측정이고, 식 (2)에 따르면,The second pre-analysis sub-step related to the number of bits for coding the DCT coefficients is based on the prediction made at the macro block level. For each quantization step, the sum of the absolute differences between the luminance data of the current and the reference macro blocks (= SAD, which is the correlation between the original macro block of the current picture and the displaced macro block of the previous reconstructed picture). Is a relationship measure, and according to equation (2),

(2) (2)

x,y=변위 좌표들이고 N=상기 블록의 크기이며 일반적으로 8이나 16이다)과 대비하여 사용된 비트숫자의 통계가 행해졌고, 비트들의 숫자가 상기 SAD에 대해 선형변화를 갖지 않는 것이 나타난다. H.263 표준에서의 상기 DCT 계수들의 코딩 모드때문에 그렇게 될수 있는데, 이것은 더 빈번한 계수들에 대한 가변길이 코딩모드이며, 다른 것들에 대한 고정길이 코딩모드이다.: 이로인해 왜 각각의 양자화단계에 대해 3개의 서로다른 영역들, 작은 SAD에 대한 것과 매체에 대한 것과 큰 SAD에 대한 다른 것이 관찰되는지가 설명될 수 있다.Statistics of the number of bits used were made against x, y = displacement coordinates and N = size of the block, generally 8 or 16), indicating that the number of bits does not have a linear change with respect to the SAD. This can be because of the coding mode of the DCT coefficients in the H.263 standard, which is a variable length coding mode for more frequent coefficients and a fixed length coding mode for others: This is why for each quantization step It can be explained whether three different areas, one for small SAD and another for medium and large SAD, are observed.

이것은 상기 SAD 영역에 의존하여 서로 다른 예측들을 하게 된다,: 상기 양자화 단계의 전 범위(1에서 31)에서 작용하는 3개의 영역에 대해 절충이 이루어졌다. 3 차수 다항 근사 법칙들이 SAD 〈 500, 500 〈 SAD 〈 1000, 1000 〈 SAD 〈 1500에 대한 각각의 양자화 단계에 대해 계산되었고, 고정된 값이 SAD 〉 1500에 대해 선택되었다. 정확도와 계산 복잡도사이의 상기 절충은 오히려 좋은 것으로 보인다.This results in different predictions depending on the SAD region: A tradeoff was made for the three regions working in the full range (1 to 31) of the quantization step. Third order polynomial approximation laws were calculated for each quantization step for SAD <500, 500 <SAD <1000, 1000 <SAD <1500, and a fixed value was chosen for SAD> 1500. The tradeoff between accuracy and computational complexity seems rather good.

실제로, 상기 코딩의 시작에서, 전체 화상의 동작 판단이 행해진다. 각각의 매크로 블록의 SAD가 공지되고, 비트들의 예측된 숫자가 그다음에, 어떤 양자화 단계가 비트들의 목표된 숫자에 가장 가까운 예측치를 주는지를 결정하기 위해, 각각의 양자화 단계에 대해 계산된다. 상기 계산된 양자화 단계가 최소 품질의 관점에서 너무 높다면, 상기 양자화 단계는 허용된 최대값으로 설정된다. 상기 라인상에서 보내진 비트들의 숫자를 알고, 다음 화상을 붙잡을 시간이 그다음에 계산된다.In practice, at the beginning of the coding, operation determination of the entire image is made. The SAD of each macro block is known and the predicted number of bits is then calculated for each quantization step to determine which quantization step gives the closest prediction to the desired number of bits. If the calculated quantization step is too high in terms of minimum quality, the quantization step is set to the maximum value allowed. Knowing the number of bits sent on the line, the time to capture the next picture is then calculated.

도 2에 도시된 본 발명에 따른 인코더에서, 단일 참조(201)로 참조된 상기 전-분석 부-단계들에는 결정 부-단계(202)가 뒤따른다. 상기 참조 "코더(203)"은 상기 버퍼(15)와 상기 비트율 제어회로(30)를 제외하고, 도 1의 모든 요소들의 연관을 지정한다.In the encoder according to the invention shown in FIG. 2, the pre-analysis sub-steps referred to as a single reference 201 are followed by a decision sub-step 202. The reference " coder 203 " designates the association of all elements of FIG. 1, except for the buffer 15 and the bit rate control circuit 30.

도 1의 기본 개략도에 대해, 도 2는 어떤 레벨에서 상기 전분석이 상기 코딩 체인에서 작용하는지를 예시하고, 도 3은 어떻게 도 2의 개략도(즉, 본 발명에 따른 비트율 제어)가 작용하는지를 도시한다. 상기 조절이 지금 기술된 바와 같은 계산 단계들과 테스트 단계들 또는 비슷한 단계들을 제어하는, 한 세트의 소프트웨어 명령들을 실행하여 여기서 수행된다.For the basic schematic of FIG. 1, FIG. 2 illustrates at what level the preanalysis works in the coding chain, and FIG. 3 shows how the schematic of FIG. 2 (ie, bit rate control according to the present invention) works. . The adjustment is performed here by executing a set of software instructions that control the calculation steps and the test steps or similar steps as now described.

상기 제 1 단계(31)는 다음 형식의 관계식 (3)에 따라 상기 입력 화상과, 상기 대역폭 BW를 고려하는 것과, 상기 출력 버퍼 FOB의 충만도와 상기 목표 프레임 속도 TFR에 대한 비트들의 허가된 목표 숫자 Tb를 계산하기 위해 제공된다.The first step 31 takes into account the input picture and the bandwidth BW according to relation (3) of the following format, the fullness of the output buffer FOB and the allowed target number of bits for the target frame rate TFR. It is provided to calculate T b .

(3) (3)

상기 제 2 단계는 상기 대역폭과 상기 품질과 상기 프레임 속도와 조화되는 것으로 보이는 더 작은 양자화장치(quantizer)(또는 양자화(quantization))단계로 상기 실제 화상을 코딩하는데 유용한 비트들의 예측된 숫자 Pn을 계산하기 위해 제공된 계산 동작(321)을 포함한다. 상기 숫자들 Tb와 Pn는 그다음에 비교된다.(테스트 동작 (322)): Pn이 Tb(출력 Y)보다 크다면, 도 2의 코딩 단계가 상기 양자화 단계와 함께 수행될 것이지만, 반면에, Pn이 Tb(출력 N)보다 작다면, 1이 상기 양자화 단계에 부가되고 상기 동작(321)이 반복되며, 상기 테스트 동작(322)이 Pn의 수정된 값과 함께 반복된다.The second step comprises a predicted number of bits P n useful for coding the actual picture with a smaller quantizer (or quantization) step that appears to match the bandwidth, the quality and the frame rate. A calculation operation 321 provided for calculation. The numbers T b and P n are then compared. (Test operation 322): If P n is greater than T b (output Y), the coding step of FIG. 2 will be performed in conjunction with the quantization step. On the other hand, if P n is less than T b (output N), 1 is added to the quantization step and the operation 321 is repeated, and the test operation 322 is repeated with the modified value of P n . .

Pn이 Tb보다 클때, 품질 테스트(33)가 수행된다.: 상기 양자화 장치가 소정 품질 문턱값(Qn-1〈 Qmax)아래에 있다면, 상기 프레임 속도 FR은 상기 목표 프레임 속도(접속(331))와 동등하며, 반면에 상기의 경우가 아니라면, 새로운 더 작은 프레임 속도가 상기 최소의 허가된 품질에 대한 예측된 숫자의 비트들에 따라 계산된다.(접속(332)) 두 경우에서 코딩단계(341)가 그다음에 각각의 그룹의 블록들(GOB)을 코딩하기위해 수행된다.When P n is greater than T b , a quality test 33 is performed. If the quantization device is below a predetermined quality threshold Q n-1 &lt; Q max , the frame rate FR is determined by the target frame rate (connection). (331)), on the other hand, if not the case, a new smaller frame rate is calculated according to the predicted number of bits for the minimum permitted quality (connection 332). A coding step 341 is then performed to code each group of blocks GOB.

상기 코딩 예측이 상기 실제의 코딩(부-단계(343))에 따른것이라면(예측 OK?를 테스트한다), 상기 마지막 단계가 각각의 새로운 GOB(새로운 GOB인가?(342)를 테스트한다)에 대해 체크하기위해 제공된다. YES라면 다음 코딩 단계가 같은 양자화장치(접속(344))와 함께 계속될 것이고, 그렇지 않다면 상기 흐름(drift)를 감소시키는 관점에서 상기 계산된 양자화장치에 1을 더하거나 뺀다(부-단계(345), 새로운 양 = +/-1).If the coding prediction is according to the actual coding (sub-step 343) (test prediction OK?), Then the last step is for each new GOB (test new GOB? 342). It is provided for checking. If YES, the next coding step will continue with the same quantizer (connection 344), otherwise add or subtract 1 from the computed quantizer in terms of reducing the drift (sub-step 345). , New amount = +/- 1).

Claims (2)

연속된 화상들의 비디오 신호를 코딩하는 방법에 있어서,In a method of coding a video signal of successive pictures, 다수의 부-화상들로 각각의 연속된 화상을 분할하는 단계와,Dividing each successive picture into a plurality of sub-pictures, 각각의 부-화상을 계수들로 변환하는 단계와,Converting each sub-picture into coefficients, 상기 계수들을 적용된 단계 크기로 양자화하는 단계와,Quantizing the coefficients to an applied step size; 상기 양자화된 계수들을 코딩하는 단계와,Coding the quantized coefficients; 각각의 연속된 화상을 인코딩하기위한 비트수에 대한 목표값에 따라 상기 단계 크기를 제어하는 단계로서, 이전과 현재 화상들사이의 동작 정보를 코딩하고 상기 계수들을 코딩하는데 각각 사용된 비트 수의 판단에 기초한 전-분석 부-단계와, 상기 양자화하는 단계 크기와 상기 연속된 화상들의 속도를 조절하기 위해 제공된 결정 부-단계를 포함하는, 상기 제어 단계를 구비하는 비디오 신호 코딩 방법.Controlling said step size in accordance with a target value for the number of bits for encoding each successive picture, said step of determining the number of bits each used to code motion information between previous and current pictures and to code said coefficients And a determining sub-step based on the pre-analysis sub-step and a decision sub-step provided for adjusting the quantizing step size and the speed of the successive pictures. 연속된 화상들의 비디오 신호를 인코딩하는 장치에 있어서,An apparatus for encoding a video signal of successive pictures, 각각의 연속된 화상을 다수의 부-화상들로 분할하는 수단과,Means for dividing each successive picture into a plurality of sub-pictures, 상기 부-화상들 또는 부-화상들의 그룹을 연속적으로 인코딩하기 위한 인코더로서, 각각의 부-화상을 계수들로 변환하기 위한 화상 변환기와 상기 계수들을 적용된 단계 크기로 양자화하기 위한 양자화장치를 포함하는, 상기 인코더와,An encoder for continuously encoding the sub-pictures or a group of sub-pictures, comprising: an image converter for converting each sub-picture into coefficients and a quantizer for quantizing the coefficients to an applied step size With the encoder, 상기 적용된 화상을 인코딩하기 위한 비트수에 대한 목표값에 따라 상기 양자화 단계 크기를 제어하기 위한 제어수단을 포함하며,Control means for controlling the quantization step size according to a target value for the number of bits for encoding the applied picture, 상기 장치는 이전과 현재 화상들 사이의 동작 정보를 코딩하고 상기 계수들을 코딩하는데 각각 사용되는 비트수를 판단하기 위해 제공된 전-분석 스테이지와, 상기 양자화 단계 크기와 연속된 화상들의 속도를 조절하기 위해 제공된 결정스테이지를 더 포함하는, 비디오 신호 인코딩 장치.The apparatus comprises a pre-analysis stage provided for coding motion information between previous and current pictures and for determining the number of bits each used to code the coefficients, and for adjusting the quantization step size and the speed of successive pictures. And a provided decision stage.
KR1020007009588A 1998-12-29 1999-12-17 Method and device for encoding a video signal KR20010041441A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP98403322.5 1998-12-29
EP98403322 1998-12-29
PCT/EP1999/010199 WO2000040031A1 (en) 1998-12-29 1999-12-17 Method and device for encoding a video signal

Publications (1)

Publication Number Publication Date
KR20010041441A true KR20010041441A (en) 2001-05-25

Family

ID=8235609

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007009588A KR20010041441A (en) 1998-12-29 1999-12-17 Method and device for encoding a video signal

Country Status (4)

Country Link
EP (1) EP1057343A1 (en)
JP (1) JP2002534863A (en)
KR (1) KR20010041441A (en)
WO (1) WO2000040031A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826529B2 (en) 2003-09-01 2010-11-02 Samsung Electronics Co., Ltd. H.263/MPEG video encoder for efficiently controlling bit rates and method of controlling the same

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4190157B2 (en) * 2001-02-26 2008-12-03 三洋電機株式会社 Image data transmitting apparatus and image data receiving apparatus
CN106791860B (en) * 2016-12-28 2019-07-30 重庆邮电大学 A kind of adaptive video coding control system and method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05167998A (en) * 1991-12-16 1993-07-02 Nippon Telegr & Teleph Corp <Ntt> Image-encoding controlling method
EP0757490A3 (en) * 1995-08-02 1999-01-13 Matsushita Electric Industrial Co., Ltd. Video coding device and video transmission system using the same, quantization control method and average throughput calculation method used therein
GB9519923D0 (en) * 1995-09-29 1995-11-29 Philips Electronics Nv Motion estimation for predictive image coding
JP4532607B2 (en) * 1995-10-26 2010-08-25 メディアテック インコーポレイション Apparatus and method for selecting a coding mode in a block-based coding system
US6002802A (en) * 1995-10-27 1999-12-14 Kabushiki Kaisha Toshiba Video encoding and decoding apparatus
FR2753330B1 (en) * 1996-09-06 1998-11-27 Thomson Multimedia Sa QUANTIFICATION METHOD FOR VIDEO CODING

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7826529B2 (en) 2003-09-01 2010-11-02 Samsung Electronics Co., Ltd. H.263/MPEG video encoder for efficiently controlling bit rates and method of controlling the same

Also Published As

Publication number Publication date
JP2002534863A (en) 2002-10-15
WO2000040031A1 (en) 2000-07-06
EP1057343A1 (en) 2000-12-06

Similar Documents

Publication Publication Date Title
KR100471956B1 (en) Moving picture encoding apparatus and method
JP3748717B2 (en) Video encoding device
US5461422A (en) Quantizer with automatic pre-threshold
US5241401A (en) Image signal encoding apparatus and method for controlling quantization step size in accordance with frame skip numbers
US5844607A (en) Method and apparatus for scene change detection in digital video compression
KR100227298B1 (en) Code amount controlling method for coded pictures
JP2001086512A (en) Variable bit rate encoder
EP1978743B1 (en) A method and apparatus for transcoding a video signal
KR20060103424A (en) Method and apparatus for selection of bit budget adjustment in dual pass encoding
JP3426668B2 (en) Video coding method
JP3173369B2 (en) Image compression coding device
US6480544B1 (en) Encoding apparatus and encoding method
JP2002010261A (en) Image coding transform apparatus
EP0639924B1 (en) Coding mode control device for digital video signal coding system
KR20010041441A (en) Method and device for encoding a video signal
US5940131A (en) Method and apparatus for coding moving pictures
KR0123243B1 (en) Bit rate control method in a scene conversion
JPH10126792A (en) Image encoding method and device
KR100240620B1 (en) Method and apparatus to form symmetric search windows for bidirectional half pel motion estimation
KR100778473B1 (en) Bit rate control method
KR20010104058A (en) Adaptive quantizer according to DCT mode in MPEG2 encoder
KR0128861B1 (en) Method for changing quantizer step size
KR100335436B1 (en) Quantization Step Size Determination Method_
KR0185847B1 (en) The quantization step control system in video encoder
JPH09107293A (en) Method and device for controlling code volume

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application