KR100203625B1 - An improved image coding system having functions for controlling generated amount of coded bit stream - Google Patents
An improved image coding system having functions for controlling generated amount of coded bit stream Download PDFInfo
- Publication number
- KR100203625B1 KR100203625B1 KR1019960013775A KR19960013775A KR100203625B1 KR 100203625 B1 KR100203625 B1 KR 100203625B1 KR 1019960013775 A KR1019960013775 A KR 1019960013775A KR 19960013775 A KR19960013775 A KR 19960013775A KR 100203625 B1 KR100203625 B1 KR 100203625B1
- Authority
- KR
- South Korea
- Prior art keywords
- encoding
- signal
- frame
- bit
- bandwidth
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Discrete Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은, 매 프레임마다 발생되는 부호화된 비트 발생량 정보에 근거하여 부호화하고자 하는 영상의 복잡도를 산출하고, 그 산출결과에 따라 이산푸리에 변환을 이용하여 입력 영상신호의 고주파 성분을 선택적으로 제거함으로써, 부호화후의 비트 발생량을 적응적으로 조절할 수 있도록 한 비트 발생량 조절기능을 갖는 영상 부호화 시스템에 관한 것으로, 움직임 추정, 보상기법, DCT 및 양자화 기법을 갖는 부호화 수단으로부터 발생되는 부화화된 비트 스트림을 가산하여 매 프레임 단위로 각각의 비트 발생량을 산출하는 비트량 계산 수단 ; 산출된 각 프레임의 비트 발생량에 대한 액티비티값을 산출하고, 이 산출된 액티비티값을 현재 부호화하고자 하는 프레임의 복잡도로서 참조하며, 부호화를 위해 입력되는 상기 현재 프레임의 주파수 통과 대역폭을 적응적으로 제한하기 위한 기설정된 복수의 대역폭 결정신호들중 산출된 액티비티값에 대응하는 대역폭 결정신호를 발생하는 제어수단 ; 및 입력 현재 프레임 신호에 대한 공간영역의 영상신호를 2차원 이산 푸리에 변환을 이용하여 M×N 블록 단위의 주파수 영역의 2차원 DFT 변환계수들로 변환하고, 제어수단으로부터 제공되는 발생된 대역폭 결정신호에 의거하여 변환된 2차원 DFT 변환계수 블록들에 대한 고주파 통과 대역을 결정하며, 변환된 각 2차원 DFT 변환계수 블록의 고주파 통과 대역을 결정된 대역폭으로 제한하고, 대역폭이 제한된 양자화된 각 DFT 블록들 각각에 대해 역이산 푸리에 변환을 수행하여 부호화전의 원신호로 복원하며, 원신호로 복원된 대역폭 제한 프레임 신호를 움직임 추정, 보상을 위한 현재 프레임신호로써 부호화 수단에 제공하는 주파수 선택 수단을 포함함으로써, 부호화 수단에서의 양자화시 과도한 스텝 사이즈의 증가 없이 부호화후 발생되는 비트량을 효과적으로 조절할 수 있는 것이다.The present invention calculates the complexity of an image to be encoded based on the encoded bit generation amount information generated every frame, and selectively removes high frequency components of an input video signal using discrete Fourier transform according to the calculation result. A video encoding system having a bit generation amount adjustment function for adaptively adjusting a bit generation amount after encoding, comprising adding a hatched bit stream generated from an encoding means having a motion estimation, a compensation method, a DCT, and a quantization method. Bit amount calculation means for calculating each bit generation amount in every frame unit; Calculate an activity value for the calculated bit generation amount of each frame, refer to the calculated activity value as the complexity of the frame to be currently encoded, and adaptively limit the frequency passband of the current frame input for encoding. Control means for generating a bandwidth determination signal corresponding to the calculated activity value among a plurality of preset bandwidth determination signals for the mobile terminal; And converting the video signal in the spatial domain with respect to the input current frame signal into two-dimensional DFT transform coefficients in the frequency domain in M × N block units using a two-dimensional discrete Fourier transform, and generating the generated bandwidth determination signal provided from the control means. Determine a high frequency pass band for the transformed 2D DFT transform coefficient blocks, limit the high pass band of each transformed 2D DFT transform coefficient block to the determined bandwidth, and limit the bandwidth of each quantized DFT block. And performing frequency inverse discrete Fourier transform on each to restore the original signal before encoding, and providing the encoding means as a current frame signal for motion estimation and compensation to the encoding means. Effect of bit amount generated after encoding without excessive step size increase in quantization by encoding means Can be adjusted by
Description
제1도는 본 발명의 바람직한 실시예에 따른 비트 발생량 조절기능을 갖는 영상 부호화 시스템의 블록구성도.1 is a block diagram of a video encoding system having a bit generation amount adjusting function according to a preferred embodiment of the present invention.
제2도는 본 발명에 따라 일예로서 8×8 픽셀 블록에 대하여 그 복잡도에 의거하여 결정되는 고주파 성분 제한을 위한 결정 영역을 도시한 도면.2 is a view showing a crystal region for high frequency component limitation determined as an example, based on its complexity, for an 8x8 pixel block according to the present invention;
* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings
100, 170 : 프레임 메모리 110 : 감산기100, 170: frame memory 110: subtractor
120 : 영상 부호화 블록 130 : 엔트로피 부호화 블록120: image coding block 130: entropy coding block
140 : 전송 버퍼 150 : 영상 복호화 블록140: transmission buffer 150: video decoding block
160 : 가산기 180 현재 프레임 예측 블록160: Adder 180 current frame prediction block
210 : 비트량 계산 블록 220 : 제어 블록210: bit amount calculation block 220: control block
230 : 주파수 선택 블록230: frequency selection block
본 발명은 영상신호를 압축 부호화하는 영상 부호화 시스템에 관한 것으로, 더욱 상세하게는 영상신호를 압축 부호화하는 영상 부호화기에서 영상을 부호화할 때, 출력측의 부호화된 비트 발생량에 근거하여 예측되는 입력 영상신호의 복잡도(Variance)를 참조하여 부호화후의 발생 비트량을 적응적으로 조절하는 데 적합한 비트 발생량 조절기능을 갖는 영상 부호화 시스템에 관한 것이다.The present invention relates to a video encoding system for compressing and encoding a video signal. More particularly, the present invention relates to a video encoding system for encoding an image signal. The present invention relates to a video encoding system having a bit generation amount adjustment function suitable for adaptively adjusting the amount of generated bits after encoding with reference to complexity.
이 기술분야에 잘 알려진 바와 같이 이산된 영상신호의 전송은 아날로그 신호보다 좋은 화질을 유지할 수 있다. 일련의 이미지 프레임으로 구성된 비디오 신호가 디지털 형태로 표현될 때, 특히 고품질 텔레비젼(일명 HDTV 라함)의 경우 상당한 양의 데이터가 전송되어야 한다. 그러나 종래의 전송 채널의 사용 가능한 주파수 영역은 제한되어 있으므로, 많은 양의 디지털 데이터를 전송하기 위해서는 전송되는 데이터를 압축하여 그 양을 줄일 필요가 있다. 이와 같이 데이터를 압축하는 다양한 압축 기법 중에서, 확률적 부호화 기법과 시간적, 공간적 압축기법을 결합한 하이브리드 부호화 기법이 가장 효율적인 것으로 알려져 있으며, 이러한 기법들은, 예를 들면 세계 표준화 기구에 의해 그 표준안이 이미 제정된 MPEG-1 및 MPEG-2 등의 권고안에 광범위하게 개시되어 있다.As is well known in the art, the transmission of discrete video signals can maintain better image quality than analog signals. When a video signal consisting of a series of image frames is represented in digital form, a significant amount of data must be transmitted, especially for high quality televisions (aka HDTVs). However, since the usable frequency range of the conventional transmission channel is limited, in order to transmit a large amount of digital data, it is necessary to compress the transmitted data and reduce the amount thereof. Among the various compression techniques for compressing data, hybrid coding techniques combining probabilistic coding techniques with temporal and spatial compression techniques are known to be the most efficient, and these techniques have already been enacted by the standards standard, for example, by the World Organization for Standardization. It is widely disclosed in the recommendations of MPEG-1 and MPEG-2.
대부분의 하이브리드 부호화 기법은 움직임 보다 DCPM(차분펄스 부호 변조), 2차원 DCT(이산 코사인 변환), DCT 계수의 양자화, VLC(가변장 부호화)등을 이용한다. 움직임 보상 DPCM은 현재 프레임과 이전 프레임간의 물체의 움직임을 결정하고, 물체의 움직임에 따라 현재 프레임을 예측하여 현재 프레임과 예측치간의 차이를 나타내는 차분신호를 만들어내는 방법이다. 이 방법은 예를 들어 Staffan Ericsson의 Fixed and Adaptive Predictors for Hybrid Predictive/Transform Coding, IEEE Transactions on Communication, COM-33, NO.12(1985년, 12월), 또는 Ninomiy와 Ohtsuka의 A motion Compensated Interframe Coding Scheme for Television Pictures, IEEE Transactions on Communication, COM-30, NO.1(1982년, 1월)에 기재되어 있다.Most hybrid coding techniques use DCPM (Differential Pulse Code Modulation), 2-D Discrete Cosine Transform (DCT), Quantization of DCT Coefficients, VLC (Variable Coding) rather than motion. The motion compensation DPCM determines a motion of an object between a current frame and a previous frame, and predicts a current frame according to the motion of the object to generate a difference signal representing a difference between the current frame and a predicted value. This can be done, for example, by Staffan Ericsson's Fixed and Adaptive Predictors for Hybrid Predictive / Transform Coding, IEEE Transactions on Communication, COM-33, NO.12 (1985, December), or A motion Compensated Interframe Coding by Ninomiy and Ohtsuka. Scheme for Television Pictures, IEEE Transactions on Communication, COM-30, NO.1 (1982, January).
일반적으로, 이차원 DCT는 영상 데이터간의 공간적 리던던시를 이용하거나 제거하는 것으로써, 디지털 영상 데이터 블록, 예를 들면 8 × 8 블록을 DCT 변환계수로 변환한다. 이 기법은 Chen과 Pratt의 Scenc Adaptive Coder, IEEE Transactions on Communication, COM-32, NO.3(1984년, 3월)에 개시되어 있다. 이러한 DCT 변환계수는 양자화기, 지그재그 주사, VLC 등을 통해 처리됨으로써 전송할 데이터의 양을 효과적으로 감축(또는 압축)할 수 있다.In general, two-dimensional DCT converts digital image data blocks, for example, 8x8 blocks, into DCT conversion coefficients by using or removing spatial redundancy between image data. This technique is described in Chen and Pratt's Scenc Adaptive Coder, IEEE Transactions on Communication, COM-32, NO.3 (1984, March). The DCT conversion coefficient may be processed through a quantizer, a zigzag scan, a VLC, or the like to effectively reduce (or compress) the amount of data to be transmitted.
보다 상세하게, 움직임 보상 DPCM에서는 현재 프레임과 이전 프레임간에 추정된 물체의 움직임에 따라, 현재 프레임을 이전 프레임으로부터 예측한다. 이와 같이 추정된 움직임은 이전 프레임과 현재 프레임간의 변위를 나타내는 2차원 움직임 벡터로 나타낼 수 있다.More specifically, the motion compensation DPCM predicts the current frame from the previous frame according to the motion of the object estimated between the current frame and the previous frame. The estimated motion may be represented by a two-dimensional motion vector representing the displacement between the previous frame and the current frame.
통상적으로, 물체의 변위를 추정하는 데에는 여러 가지 접근방법이 있다. 이들은 일반적으로 두 개의 타입으로 분류되는데, 그중 하나는 블록 매칭 알고리즘을 이용하는 블록단위 움직임 추정방법이고, 다른 하나는 화소순환 알고리즘을 이용하는 화소단위 움직임 추정방법이다.Typically, there are several approaches to estimating the displacement of an object. These are generally classified into two types, one of which is a block-based motion estimation method using a block matching algorithm, and the other is a pixel-based motion estimation method using a pixel circulation algorithm.
상기와 같이 물체의 변위를 추정하는 움직임 추정방법중, 화소단위 움직임 추정방법을 이용하면 변위는 각각의 화소전부에 대해 구해진다. 이러한 방법은 화소값을 더 정확히 추정할 수 있고 스케일변화(예를 들어, 영상면에 수직한 움직임인 주밍(zooming))도 쉽게 다룰 수 있다는 장점을 갖는 반면에, 움직임 벡터가 모든 화소 각각에 대해 결정되기 때문에, 다량의 움직임 벡터들이 발생하는 데 실질적으로 모든 움직임 벡터를 수신기로 전송하다는 것은 불가능하다.Among the motion estimation methods for estimating the displacement of an object as described above, when the pixel-based motion estimation method is used, the displacement is calculated for each pixel. This method has the advantage of being able to estimate pixel values more accurately and easily handle scale changes (e.g., zooming, which is a movement perpendicular to the image plane), while the motion vectors for each pixel Since it is determined, it is impossible to transmit substantially all the motion vectors to the receiver as large amounts of motion vectors occur.
또한, 블록단위 움직임 추정에서는, 현재 프레임의 소정 크기의 블록을 이전 프레임의 소정 범위의 탐색영역내에서 한 화소씩 이동하면서 대응 블록들과 비교하여 그 오차값이 최소인 최적 정합블럭을 결정하며, 이것으로부터, 전송되는 현재 프레임에 대해 블록 전체에 대한 프레임간 변위 벡터(프레임간에 블록이 이동한 정도)가 추정된다. 여기에서, 현재 프레임과 이전 프레임간의 대응하는 두 블록간의 유사성 판단은, 이 기술분야에 잘 알려진 바와 같은, 평균 절대차와 평균 제곱차 등이 주로 사용된다.In addition, in block-by-block motion estimation, a block having a predetermined size of the current frame is moved by one pixel in a search range of a previous frame and compared with the corresponding blocks to determine an optimal matching block having a minimum error value. From this, the interframe displacement vector (the extent to which the block has moved between frames) for the entire block is estimated for the current frame to be transmitted. Here, in determining the similarity between two corresponding blocks between the current frame and the previous frame, the average absolute difference, the mean square difference, etc. are mainly used, as is well known in the art.
한편, 상술한 바와 같은 부호와 기법, 즉 움직임 보상 DCPM, 2차원 DCT, DCT 계수의 양자화 및 VLC(또는 엔트로피 부호화) 등의 부호화 기법을 통해 부호화된 영상 비트 스트림은 영상 부호화 시스템의 출력측에 구비되는 전송 버퍼에 저장된 다음 전송시점이 되면 원격지 수신측으로의 송신을 위해 전송기로 보내진다. 이때, 여기에서의 전송시점은 전송 버퍼의 크기(즉, 용량)와 전송율에 관계되며, 전송 버퍼에서의 오동작(데이터 오버플로우(overflow) 또는 데이터 언더플로우(underflow)이 발생하지 않도록 제어된다.On the other hand, the image bit stream encoded by the coding scheme as described above, that is, coding techniques such as motion compensation DCPM, two-dimensional DCT, DCT coefficient quantization, and VLC (or entropy encoding) is provided on the output side of the video encoding system. The next transmission point stored in the transmission buffer is sent to the transmitter for transmission to the remote receiver. At this time, the time of transmission here is related to the size (that is, capacity) and the transmission rate of the transmission buffer, and is controlled so that no malfunction (data overflow or data underflow) occurs in the transmission buffer.
보다 상세하게, 여러 가지 요인(예를 들면, 영상의 복잡도)으로 인해 부호화시에 각 프레임마다 발생되는 비트량이 달라지게 되는데, 이러한 점을 고려하여 영상 부호화 시스템에서는, 평균 전송율이 일정하게 유지될 수 있도록 출력측 전송 버퍼의 제어를 수행한다. 즉, 영상 부호화 시스템에서는 출력측 전송 버퍼의 데이터 충만상태 정보에 근거하여 현재 부호화하고 있는 프레임 이전까지의 비트 발생량을 조사하고 있다고 현재 프레임에서 할당해야 하는 비트량을 조절한다. 다시말해, 종래의 전형적인 영상 부호화 시스템에서는 출력측 전송 버퍼의 데이터 충만상태 정보에 의거하여 실질적으로 양자화 스텝 사이즈(QP)를 제어함으로써 부호화 시스템에서의 발생 비트량을 조절, 즉 이전까지 비트 발생량이 많으면 양자화 스텝 사이즈를 크게 조절하여 비트 발생량을 줄이고, 이와 반대의 경우에는 양자화 시텝 사이즈를 작게 조절하여 비트 발생량을 늘리는 등의 방법을 통해 비트 발생량을 조절하고 있다.More specifically, the amount of bits generated for each frame at the time of encoding varies due to various factors (for example, the complexity of the image). In view of this, in the image encoding system, the average bit rate may be kept constant. Control of the output buffer. That is, the video encoding system adjusts the amount of bits to be allocated in the current frame, based on the data fullness state information of the output side transmission buffer, to investigate the amount of bits generated before the frame currently encoded. In other words, in the conventional typical video encoding system, the amount of bits generated in the encoding system is adjusted by controlling the quantization step size (QP) substantially based on the data full state information of the output transmission buffer, that is, if the amount of bits generated before has been large, The bit generation amount is controlled by reducing the bit generation amount by adjusting the step size largely, and in the opposite case, by increasing the bit generation amount by adjusting the quantization step size small.
그러나, 상술한 바와 같이 출력측 전송 버퍼의 데이터 충만상태 정보에 의거하여 양자화 스텝 사이즈를 조절함으로써 비트 발생량을 조절하는 종래방법은, 각 프레임에 해당하는 영상 데이터를 동일한 전송율로 부호화하여 전송하고자 하는 경우에 있어서, 부호화 하고자 하는 영상이 복잡한 경우(고주파 성분이 다량 발생)에는 비트 발생량이 많아지게 되는데 이로 인해 양자화 스텝 사이즈가 커져 결과적으로 재생 영상에서의 심각한 화질열화가 야기된다는 문제를 갖는다. 여기에서 발생하는 고주파 성분은 실질적으로 인간의 시각에 매우 둔감한 성분(재생 영상의 화질에 거의 영향을 미치지 않는 성분)이다.However, as described above, the conventional method of adjusting the bit generation amount by adjusting the quantization step size based on the data fullness state information of the output side transmission buffer is performed when encoding and transmitting video data corresponding to each frame at the same data rate. In the case where the image to be encoded is complex (a large amount of high frequency components are generated), a large amount of bits is generated, resulting in a large quantization step size, resulting in serious image quality degradation in the reproduced image. The high frequency component generated here is a component that is substantially insensitive to human vision (a component that hardly affects the image quality of a reproduced video).
따라서, 본 발명은 상술한 종래기술의 문제점을 해결하기 위한 것으로, 매 프레임마다 발생되는 부호화된 비트 발생량 정보에 근거하여 부호화하고자 하는 영상의 복잡도를 산출하고, 그 산출결과에 따라 2차원 이산푸리에 변환을 이용하여 입력 영상신호의 고주파 성분을 선택적으로 제거함으로써, 부호화후의 비트 발생량을 적응적으로 조절할 수 있는 비트 발생량 조절기능을 갖는 영상 부호화 시스템을 제공하는 데 목적이 있다.Accordingly, the present invention solves the problems of the prior art described above, and calculates the complexity of an image to be encoded based on the coded bit generation amount information generated every frame, and according to the calculation result, two-dimensional discrete Fourier transform It is an object of the present invention to provide a video encoding system having a bit generation amount adjusting function capable of adaptively adjusting a bit generation amount after encoding by selectively removing a high frequency component of an input video signal by using a?
상기 목적을 달성하기 위하여 본 발명은, 입력되는 현재 프레임과, 이 현재 프레임 및 재구성된 이전 프레임을 이용하는 움직임 추정, 보상을 통해 얻어지는 예측 프레임간의 차분신호에 대해 이산 코사인 변환, 양자화 및 엔트로피 부호화를 포함하는 부호화 수단을 통해 압축 부호화하여 부호화된 비트 스트림을 발생하며, 상기 양자화는 출력측 버퍼에 저장되는 상기 비트스트림의 충만상태 정보에 의거하여 그 스텝 사이즈가 조절되는 비트 발생량 조절기능을 갖는 영상 부호화 시스템에 있어서, 상기 부호화 수단으로부터 발생되는 상기 부호화된 비트 스트림을 가산하여 매 프레임 단위로 각각의 비트 발생량을 산출하는 비트량 계산 수단 : 상기 산출된 각 프레임의 비트 발생량에 대한 액티비티값을 산출하고, 이 산출된 액티비티값을 현재 부호화하고자 하는 프레임의 복잡도로서 참조하며, 부호화를 위해 입력되는 상기 현재 프레임의 주파수 통과 대역폭을 적응적으로 제한하기 위한 기설정된 복수의 대역폭 결정신호들중 상기 산출된 액티비티값에 대응하는 대역폭 결정신호를 발생하는 제어수단 : 및 상기 입력 현재 프레임 신호에 대한 공간영역의 영상신호를 2차원 이산 푸리에 변환을 이용하여 M×N 블록 단위의 주파수 영역의 2차원 DFT 변환계수들로 변환하고, 상기 제어수단으로부터 제공되는 발생된 대역폭 결정신호에 의거하여 상기 변환된 2차원 DFT 변환계수 블록들에 대한 고주파 통과 대역을 결정하며, 상기 변환된 각 2차원 DFT 변환계수 블록의 고주파 통과 대역을 상기 변환된 대역폭으로 제한하고, 상기 대역폭이 제한된 양자화된 각 DET 블록들 각각에 대해 역이산 푸리에 변환을 수행하여 부호화전의 원신호로 복원하며, 원신호로 복원된 상기 대역폭 제한 프레임 신호를 상기 움직임 추정, 보상을 위한 현재 프레임 신호로써 제공하는 주파수 선택 수단을 더 포함하는 것을 특징으로 하는 비트 발생량 조절기능을 갖는 영상 부호화 시스템을 제공한다.In order to achieve the above object, the present invention includes a discrete cosine transform, quantization and entropy encoding on the difference signal between the input current frame and the prediction frame obtained through motion estimation and compensation using the current frame and the reconstructed previous frame. To a video encoding system having a bit generation amount adjustment function of which a step size is adjusted based on the full state information of the bit stream stored in an output buffer. A bit amount calculating means for calculating each bit generation amount in every frame unit by adding the encoded bit stream generated from the encoding means: calculating an activity value for the calculated bit generation amount of each frame, and calculating The current activity value Refers to the complexity of the frame to be generated, and generates a bandwidth determination signal corresponding to the calculated activity value among a plurality of preset bandwidth determination signals for adaptively limiting the frequency passband bandwidth of the current frame input for encoding. And control means for converting an image signal in a spatial domain with respect to the input current frame signal into two-dimensional DFT transform coefficients in a frequency domain in units of M × N blocks using a two-dimensional discrete Fourier transform, and providing from the control means. Determine a high frequency pass band for the converted 2D DFT transform coefficient blocks based on the generated bandwidth determination signal, and limit the high pass band of each of the converted 2D DFT transform coefficient blocks to the converted bandwidth; And an inverse discrete Fourier transform for each of the bandwidth-limited quantized DET blocks. And a frequency selecting means for restoring the original signal before encoding and providing the bandwidth limited frame signal restored to the original signal as the current frame signal for motion estimation and compensation. Provided is an image encoding system.
본 발명의 상기 및 기타 목적과 여러 가지 장점 이 기술분야에 숙련된 사람들에 의해 첨부된 도면을 참조하여 하기에 기술되는 본 발명의 바람직한 실시예로부터 더욱 명확하게 될 것이다.The above and other objects and various advantages of the present invention will become more apparent from the preferred embodiments of the present invention described below with reference to the accompanying drawings by those skilled in the art.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
제1도는 본 발명의 바람직한 실시예에 따른 비트 발생량 조절기능을 갖는 영상 부호화 시스템에 대한 블록구성도를 나타낸다.1 is a block diagram of a video encoding system having a bit generation amount adjusting function according to a preferred embodiment of the present invention.
동도면에 도시된 바와 같이, 본 발명의 영상 부호화 시스템은 제1프레임 메모리(100), 감산기(110), 영상 부호화 블록(120), 엔트로피 부호화 블록(130), 전송 버퍼(140), 영상 복호화 블록(150), 가산기(160), 제2프레임 메모리(170), 현재 프레임 예측 블록(180), 비트량 계산 블록(210), 제어블록(220) 및 주파수 선택 블록 (230)을 포함한다.As shown in the figure, the image encoding system of the present invention includes a first frame memory 100, a subtractor 110, an image encoding block 120, an entropy encoding block 130, a transmission buffer 140, and image decoding. A block 150, an adder 160, a second frame memory 170, a current frame prediction block 180, a bit amount calculation block 210, a control block 220, and a frequency selection block 230 are included.
제1도를 참조하면, 입력되는 현재 프레임 신호는 제1프레임 메모리(100)에 저장된 다음 주파수 선택 블록(230)으로 입력되며, 주파수 선택 블록(230)에서는 후술되는 제어 블록(220)으로부터 제공되는 부호화후 영상의 복잡도에 의거해 산출되는 제어신호(주파수 영역 구분을 위한 대역폭 결정신호)에 따라 입력 프레임 신호의 주파수를 적응적으로 제한, 즉 2차원 이산 푸리에 변환(Discrete Fourier Transform : DFT)을 이용하여 입력 영상의 고주파 성분(비교적 인간의 시각에 둔감한 부분임)을 제거하는데, 이러한 주파수 선택 블록(230)에 대한 NCP적인 동작과정에 대해서는 후에 상세하게 기술될 것이다. 그런 다음, 이와 같이 고주파 성분이 적응적으로 제거되는 현재 프레임 신호는 라인 L11을 통해 감산기(110)와 현재 프레임 예측 블록(180)에 각각 제공된다.Referring to FIG. 1, the input current frame signal is input to the next frequency selection block 230 stored in the first frame memory 100, and the frequency selection block 230 is provided from a control block 220 to be described later. Adaptively restricts the frequency of the input frame signal according to a control signal (bandwidth determination signal for frequency domain classification) calculated based on the complexity of the image after encoding, that is, using a two-dimensional discrete Fourier transform (DFT). By removing the high frequency components (which are insensitive to the comparative human vision) of the input image, the NCP operation process for this frequency selection block 230 will be described in detail later. Then, the current frame signal from which the high frequency component is adaptively removed is provided to the subtractor 110 and the current frame prediction block 180 through line L11, respectively.
먼저, 감산기(110)에서는 라인 L11을 통해 주파수 선택블록(230)으로부터 제공되는 고주파 성분이 선택적으로 제거된 현재 프레임 신호로부터 라인 L19를 통해 후술되는 현재 프레임 예측 블럭(180)으로부터 제공되는 이동 물체에 대하여 움직임 보상된 예측된 현재 프레임 신호를 감산하며, 그 결과 데이터, 즉 차분화소값을 나타내는 에러신호는 영상 부호화 블록(120)을 통해 이산 코사인 변환(DCT)과 이 기술분야에서 잘 알려진 양자화 방법들 중의 어느 하나를 이용함으로써, 일련의 양자화된 DCT 변환계수들로 부호화 된다. 이때, 영상 부호화 블록(120)에서의 에러신호에 대한 양자화는 라인 L21을 통해 후술되는 출력측 전송 버퍼(140)로부터 제공되는 데이터 충만상태 정보에 따라 결정되는 양자화 파라메터(QP)에 의거하여 그 스텝사이즈가 조절된다.First, in the subtractor 110, a moving object provided from the current frame prediction block 180 described later through the line L19 from the current frame signal from which the high frequency component provided from the frequency selection block 230 is selectively removed through the line L11. Subtract the motion-compensated predicted current frame signal, and as a result, the data, i.e., the error signal representing the differential pixel value, is subjected to discrete cosine transform (DCT) and quantization methods well known in the art through the image coding block 120. By using either one, it is encoded into a series of quantized DCT transform coefficients. In this case, the quantization of the error signal in the image encoding block 120 is based on the quantization parameter QP determined according to the data fullness state information provided from the output side transmission buffer 140 described later through the line L21. Is adjusted.
다음에, 라인 L13 상의 양자화된 DCT 변환계수들은 엔트로피부호화 블록(130)과 영상 복호화 블록(150)으로 각각 보내진다.Next, the quantized DCT transform coefficients on line L13 are sent to entropy encoding block 130 and image decoding block 150, respectively.
여기에서, 엔트로피 부호화 블록(130)에 제공된 양자화된 DCT 변환계수들은, 예를 들면 가변길이 부호화 기법등을 통해 부호화되어 출력측의 전송 버퍼(140)에 제공되며, 이와 같이 부호화된 영상신호는 수신측으로의 전송을 위해 도시 생략된 전송기로 전달된다.Here, the quantized DCT transform coefficients provided to the entropy coding block 130 are encoded, for example, through a variable length coding scheme, and are provided to the transmission buffer 140 on the output side. It is delivered to the transmitter not shown for the transmission of.
한편, 영상 부호화 블록(120)으로부터 영상 복호화 블록(150)에 제공되는 라인 L13 상의 양자화된 DCT 변환계수들은 역양자화 및 역이산 코사인 변환을 통해 다시 복원된 프레임 신호로 변환된 다음, 가산기(160)에 제공되며, 가산기(160)에서는 영상 복호화 블록(150)으로 부터의 복원된 프레임 신호와 라인 L19를 통해 후술되는 현재 프레임 예측 블록(180)으로부터 제공되는 예측된 현재 프레임신호를 가산하여 재구성된 이전 프레임 신호를 생성하여, 이와 같이 재구성된 이전 프레임 신호는 제2프레임 메모리(170)에 저장된다. 따라서, 이러한 경로를 통해 부호화 처리되는 매 프레임에 대한 바로 이전 프레임 신호가 계속적으로 갱신되며, 이와 같이 갱신되는 재구성된 이전 프레임 신호는 움직임 추정, 보상을 위해 후술되는 현재 프레임 예측 블록(180)으로 제공된다.Meanwhile, the quantized DCT transform coefficients on the line L13 provided from the image coding block 120 to the image decoding block 150 are converted into a frame signal reconstructed again through inverse quantization and inverse discrete cosine transform, and then adder 160. The adder 160 adds the reconstructed frame signal from the image decoding block 150 and the predicted current frame signal provided from the current frame prediction block 180 described later through line L19 to reconstruct the previous image. By generating the frame signal, the reconstructed previous frame signal is stored in the second frame memory 170. Accordingly, the immediately previous frame signal for every frame encoded through such a path is continuously updated, and the reconstructed previous frame signal thus updated is provided to the current frame prediction block 180 described later for motion estimation and compensation. do.
다른 한편, 현재 프레임 예측 블록 (180)에서는, 본 발명에 따른 주파수 선택 블록(230)으로부터 제공되는 라인 L11 상의 고주파 성분이 선택적으로 제거되거나 또는 고주파 성분이 제거되지 않은 현재 프레임 신호와 상기한 제2프레임 메모리(170)로부터 제공되는 라인 L15 상의 재구성된 이전 프레임 신호에 기초하여 블록 매칭 알고리즘을 이용해 재구성된 이전 프레임의 기설정 탐색범위(예를 들면, 16×16 탐색범위)에서 소정의 블록(예를 들면, 8×8 DCT 블록)단위로 현재 프레임을 예측한 다음 라인 L19 상에 예측된 현재 프레임 신호를 발생하여 상술한 감산기(110)와 가산기(160)에 각각 제공한다. 이때, 라인 L19상의 스위치(SW)는 도시 생략된 시스템 제어기로부터의 제어신호(CS)에 따라 그 접점이 온/오프되는 것으로, 스위치(SW)가 온 일때는 현재의 부호화 모드가 인터모드임을 의미하고 반대로 오프 일때는 현재의 부호화 모드가 인트라 모드임을 의미한다. 따라서, 감산기(110)에서는 인터모드 부호화시에 현재 프레임 신호와 예측 프레임 신호간의 에러신호를 영상 부호화 블록(120)에 제공하고, 인트라 모드 부호화시에 현재 프레임 신호 자체를 영상 부호화 블록(120)에 제공한다.On the other hand, in the current frame prediction block 180, the current frame signal in which the high frequency component on the line L11 provided from the frequency selection block 230 according to the present invention is selectively removed or the high frequency component is not removed and the above-described second frame is removed. Based on the reconstructed previous frame signal on the line L15 provided from the frame memory 170, a predetermined block (eg, a predetermined search range (eg, 16 × 16 search range) of the previous frame reconstructed using the block matching algorithm For example, the current frame is predicted in units of 8 × 8 DCT blocks, and the predicted current frame signal is generated on the line L19 and provided to the subtractor 110 and the adder 160, respectively. At this time, the switch SW on the line L19 is turned on / off according to the control signal CS from the system controller (not shown). When the switch SW is on, the switch SW on the line L19 indicates that the current encoding mode is inter mode. On the contrary, when off, the current encoding mode is an intra mode. Accordingly, the subtractor 110 provides an error signal between the current frame signal and the predicted frame signal to the image encoding block 120 during inter-mode encoding, and transmits the current frame signal itself to the image encoding block 120 during intra-mode encoding. to provide.
또한, 현재 프레임 예측 블록(180)은 선택되는 각 블록(8×8 블록)들에 대한 움직임 벡터들의 세트를 라인 L17 상에 발생하여 전술한 엔트로피 부호화 블록(130)에 제공한다. 여기에서, 검출되는 움직임 벡터들의 세트들은 현재 프레임의 블록(8×8 블록)과 이전 프레임내의 기설정 탐색영역(예를 들면, 16×16 탐색범위)에서 예측된 가장 유사한 블록간의 변위이다. 따라서, 전술한 엔트로피 부호화 블록(130)에서는 라인 L17 상의 움직임 벡터들의 세트들과 더불어 라인 L13 상의 양자화된 DCT 변환계수들은, 예를 들면 가변길이 부호화 기법 등을 통해 부호화하여 부호화된 비트 스트림을 발생한다.In addition, the current frame prediction block 180 generates a set of motion vectors for each of the selected blocks (8 × 8 blocks) on the line L17 and provides the entropy coding block 130 described above. Here, the sets of motion vectors detected are the displacements between the most similar block predicted in the block of the current frame (8x8 block) and the preset search area (e.g., 16x16 search range) in the previous frame. Accordingly, in the entropy coding block 130 described above, the quantized DCT transform coefficients on the line L13 together with the sets of the motion vectors on the line L17 generate a coded bit stream by, for example, a variable length coding technique. .
한편, 본 발명에 따라 전술한 엔트로피 부호화 블록(130)에서 출력되는 부호화된 비트 스트림은 출력측의 전송 버퍼(140)로 제공됨과 동시에 본 발명에 따른 부호화 비트 발생량 조절을 위해 라인 L23을 통해 비트량 계산블록(210)으로 제공된다.Meanwhile, the encoded bit stream output from the entropy encoding block 130 according to the present invention is provided to the transmission buffer 140 on the output side, and at the same time, the bit amount is calculated through the line L23 to adjust the amount of encoding bit generation according to the present invention. Provided to block 210.
다음에, 본 발명의 비트량 계산 블록(210)에서는 라인 L23을 통해 입력되는 부호화된 비트 스트림, 즉 DCT, 양자화 및 가변길이 부호화 등과 같은 엔트로피 부호화되어 최종적으로 발생되는 비트 스트림을 모두 가산함으로써 그 비트 발생량을 산출한다. 이때, 발생되는 비트량은 곧 영상신호의 정보량에 관련된다고 볼 수 있는데, 만일 현재 입력되는 영상이 복잡한 경우에는 부호화 후에 발생되는 비트량이 많아질 것이고, 그 반대의 경우에는 부호화 후에 발생되는 비트량이 적어지게 될 것이다.Next, in the bit amount calculation block 210 of the present invention, all of the encoded bit streams input through the line L23, that is, bit streams that are entropy coded and finally generated such as DCT, quantization, variable length coding, and the like, are added together. Calculate the amount of generation. In this case, the amount of bits generated may be related to the amount of information of a video signal. If the current input image is complex, the amount of bits generated after encoding will increase, and vice versa. You will lose.
통상, 한 프레임에서 발생되는 평균 비트량(AF)은, 전송율이 R(bit/sec)이고 프레임율(frame rate)이 F 인 경우, 초당 F 개의 프레임이 전송되므로, 평균 비트량(AF) 는 R/F가 된다. 따라서, 현재 프레임에서 발생된 비트량을 R/F와 비교함으로써, 현재 입력되어 부호화되는 영상의 복잡도를 상대적으로 구할 수 있다. 즉, 현재 프레임에서 발생된 비트량이 평균 비트량(AF)보다 크면 상대적으로 복잡한 영상이다. 이와 같은 복잡성은 영상신호가 매 프레임마다 급격하게 변하지 않으므로 현재의 프레임에서 발생된 비트량과 평균 비트량(AF)을 비교하여 다음에 입력되는 영상의 복잡도로서 이용할 수 있다.In general, if the average bit rate AF generated in one frame is R (bit / sec) and the frame rate is F, since F frames are transmitted per second, the average bit amount AF is It becomes R / F. Therefore, by comparing the bit amount generated in the current frame with the R / F, it is possible to relatively obtain the complexity of the image that is currently input and encoded. That is, if the bit amount generated in the current frame is larger than the average bit amount AF, the image is relatively complicated. This complexity can be used as the complexity of the next input image by comparing the bit amount generated in the current frame with the average bit amount AF since the video signal does not change rapidly every frame.
즉, 제1도의 엔트로피 부호화 블록(130)으로부터 출력되는 비트 스트림을 모두 가산한 량을 비트량(Bit Amount) BA라고 하고, 이 비트량 BA 값을 평균 비트량 AF와 비교하여 상대적으로 표현된 값을 ACT(Activity)라 하면, ACT값은 다음의 (1) 식과 계산된다.That is, the sum of all the bit streams output from the entropy coding block 130 of FIG. 1 is referred to as bit amount BA, and the value represented by comparing this bit amount BA value with the average bit amount AF is relatively expressed. Is ACT (Activity), the ACT value is calculated by the following equation (1).
ACT = (BA/AF) ---------------------(1)ACT = (BA / AF) --------------------- (1)
따라서, 상기와 같은 연산은 매 프레임마다 수행되며, 새로운 프레임에 대해서는 발생 비트량을 처음부터 계산한 다음 각 프레임의 액티비티(ACT)를 산출한 다음, 산출된 액티비티( ACT)를 이 프레임에 대한 영상신호의 복잡도로써 이용한다. 이때, 산출된 액티비티(ACT)값이 작으면 단순한 영상임을 해당되고, 산출된 액티비티(ACT)값이 크면 복잡한 영상임을 해당된다. 그런 다음, 이와 같은 과정을 통해 산출된 액티비티(ACT) 값은 다음단의 제어 블록(220)으로 제공된다.Therefore, the above operation is performed every frame. For the new frame, the generated bit amount is calculated from the beginning, the activity ACT of each frame is calculated, and the calculated activity ACT is imaged for this frame. It is used as the complexity of the signal. In this case, when the calculated activity ACT value is small, it corresponds to a simple image, and when the calculated activity ACT value is large, it corresponds to a complex image. Then, the activity ACT value calculated through this process is provided to the next control block 220.
한편, 제어 블록(220)은 상기한 비트량 계산 블록(210)으로부터 제공되는 액티비티(ACT)값에 의거하여 입력 영상의 주파수 제한을 위한 주파수 대역폭 결정신호 B를 라인 L25 상에 발생하여 주파수 선택 블록(230)에 제공한다.Meanwhile, the control block 220 generates a frequency bandwidth determination signal B on the line L25 for limiting the frequency of the input image based on the activity ACT value provided from the bit amount calculation block 210. Provided at 230.
여기에서, 발생되어 주파수 선택 블록(230)으로 제공되는 영역 구분을 위한 대역폭 결정신호 B는 입력 프레임 신호의 주파수 대역을 제한한다. 이때, 주파수 영역을 구분하는데 필요한 대역폭 결정신호 B는 아래와 같은 방법으로 계산되며, 이 대역폭 결정신호 B를 이용하여 본 발명에 따라 제한하고자 하는 입력 영상의 주파수 영역을 설정하는 과정에 대해서는 첨부된 제2도를 참조하여 후에 상세하게 기술될 것이다.Here, the bandwidth determination signal B for region division generated and provided to the frequency selection block 230 limits the frequency band of the input frame signal. In this case, the bandwidth determination signal B necessary for classifying the frequency domain is calculated by the following method, and the process of setting the frequency domain of the input image to be restricted according to the present invention using the bandwidth determination signal B is described in the appended second. It will be described later in detail with reference to the drawings.
보다 상세하게, 제어 블록(220)에서 비트량 계산 블록(210)으로부터 출력되는 액티비티(ACT) 값을 이용하여 주파수 영역 구분을 위한 대역폭 결정신호 B를 출력하는 과정은 다음의 (2)식과 같다.In more detail, the process of outputting the bandwidth determination signal B for frequency domain classification using the activity ACT value output from the bit amount calculation block 210 in the control block 220 is as follows.
상기 (2)식에서 MACT와 SACT를 구하는 과정은 다음과 같다. 즉, 영상신호의 프레임 전송율이 30인 경우에는 1초동안 계산되는 액티비티(ACT)값 30개를 평균한 값이 MACT이고, 이 값의 표준편차가 SACT이다. 따라서, 이와 같이 구한 MACT, SACT 값과 매 프레임에 발생되는 액티비티(ACT)값을 비교함으로써 영역 구분을 위한 대역폭 결정신호 B를 구할 수 있다. 즉, 제어 블록(220)에서는 이전의 30 프레임 동안 발생된 액티비티(ACT) 값의 평균과 표준편차를 이용하여 대역폭 결정신호 B를 발생하는 것이다. 그 결과, 이러한 과정을 통해 얻어지는 현재 발생된 액티비티(ACT)값은 다시 30개의 평균값과 표준편차를 구하는데 이용된다. 따라서, 제어 블록(220)에서는 이전에 발생된 30개의 액티비티(ACT)값중에서 처음 구해진 액티비티값(ACT)(시간적으로 가장 오래된 액티비티값)을 버리고 비트량 계산 블록(210)으로부터 새로 입력된 액티비티값(ACT)을 평균과 표준편차를 구하는 것이다.The process of obtaining MACT and SACT in the above formula (2) is as follows. That is, when the frame rate of the video signal is 30, the average of 30 activity (ACT) values calculated for one second is MACT, and the standard deviation of the values is SACT. Accordingly, by comparing the MACT and SACT values thus obtained and the activity (ACT) values generated in each frame, the bandwidth determination signal B for area division can be obtained. That is, the control block 220 generates the bandwidth determination signal B by using the average and the standard deviation of the activity ACT values generated during the previous 30 frames. As a result, the currently generated activity (ACT) values obtained through this process are again used to calculate the 30 mean values and standard deviations. Therefore, the control block 220 discards the activity value ACT (the oldest activity value in time) first obtained from the 30 activity ACT values previously generated, and newly inputs the activity value from the bit amount calculation block 210. (ACT) is to find the mean and standard deviation.
물론, 현재 발생된 액티비티값(ACT)도 31번째 프레임이 지나면 평균과 표준편차를 구하는데 이용되지 않게 된다.Of course, the currently generated activity value ACT is also not used to calculate the mean and standard deviation after the 31st frame.
상기한 (2)식으로부터 명백한 바와 같이, 주파수 영역 구분을 위한 대역폭 결정신호 B는 1부터 4사이의 정수값을 갖는데, 제1도의 프레임 메모리(100)로부터 출력되는 현재 프레임 신호를 감산기(110)로 제공하기 전에 이전 프레임의 액티비티값(ACT)에 따라 그 대역폭을 적응적으로 조절하기 위해서이다.As is apparent from the above equation (2), the bandwidth determination signal B for frequency domain division has an integer value between 1 and 4, and subtracts the current frame signal output from the frame memory 100 of FIG. This is to adaptively adjust the bandwidth according to the activity value (ACT) of the previous frame before providing it with.
한편, 주파수 선택 블록(230)은, 상술한 제어 블록(220)으로부터 제공되는 주파수 영역 구분을 위한 대역폭 결정신호 B에 의거하여 입력 영상에서 시각에 비교적 둔감한 고주파 성분을 제한하는데, 그 과정은 실질적으로 2차원 주파수 변환과정과 주파수 선택과정으로 구분할 수 있으며, 이때 2차원 주파수 변환과정에서는 이산 푸리에 변환(DFT)을 이용하고, 주파수 선택과정에서는 상술한 제어 블록(220)으로부터 제공된 대역폭 결정신호 B에 의거하여 DFT 변환된 영상신호의 통과 대역을 결정한다.On the other hand, the frequency selection block 230, based on the bandwidth determination signal B for frequency domain classification provided from the above-described control block 220 limits the high frequency components relatively insensitive to the time in the input image, the process is substantially It can be divided into a two-dimensional frequency conversion process and a frequency selection process, where a discrete Fourier transform (DFT) is used in the two-dimensional frequency conversion process, and in the frequency selection process to the bandwidth determination signal B provided from the control block 220 described above. Based on this, the passband of the DFT-converted video signal is determined.
다음에, 상기한 바와 같은 주파수 선택 블록(230)에서 입력 영상을 2차원 DFT 변환하고, 또한 주파수 영역 구분을 위한 대역폭 결정신호 B에 의거하여 2차원 DFT 변환된 영상신호의 주파수를 선택하는 과정에 대하여 상세하게 설명한다.Next, in the frequency selection block 230 as described above, the input image is two-dimensional DFT transformed, and the frequency of the two-dimensional DFT-converted video signal is selected based on the bandwidth determination signal B for frequency domain classification. It demonstrates in detail.
먼저, 주파수 선택 블록(230)은 입력 영상신호가 갖는 공간영역의 유사성을 이용하는 것으로, 아래의 (3)식에 의거하여 공간영역의 영상신호(픽셀데이터)를 푸리에함수를 이용하여 M×N 단위, 예를 들면 8×8 단위의 주파수 영역의 2차원 DFT 변환계수들로 변환한다.First, the frequency selection block 230 uses the similarity of the spatial domain of the input image signal. The frequency selection block 230 uses the Fourier function to convert the image signal (pixel data) of the spatial domain using a Fourier function according to Equation 3 below. For example, two-dimensional DFT transform coefficients of a frequency domain of 8 × 8 units are converted.
상기 (3)식에서 f(u,v)는 각 픽셀의 값을, u는 수평 방향의 위치를, v는 수직 방향으로의 픽셀의 위치를 나타낸다. 따라서, N×N 블록의 각 픽셀에 대한 값은 다음과 같은 값을 갖는다. 즉, N=8인 경우 u 및 v는 0과 7사이의 값을 갖는다. 이때, 각 값들은 0에서 255 사이의 정수값을 갖는다. 또한, 상기 (3)식에서 Z(k, 1)은 변환된 신호를 의미하고, k, 1은 각각 수평 및 수직 방향으로의 주파수 성분을 의미한다. 따라서, N=8인 경우에는 8×8 DFT 블록, 즉 공간영역의 신호가 주파수 영역의 신호로 변환된다.In Equation (3), f (u, v) represents the value of each pixel, u represents the position in the horizontal direction, and v represents the position of the pixel in the vertical direction. Therefore, the value for each pixel of the N × N block has the following value. That is, when N = 8 u and v have a value between 0 and 7. At this time, each value has an integer value between 0 and 255. In addition, in Equation (3), Z (k, 1) means a converted signal, and k and 1 mean frequency components in the horizontal and vertical directions, respectively. Therefore, when N = 8, an 8x8 DFT block, that is, a signal in the spatial domain is converted into a signal in the frequency domain.
보다 상세하게, 주파수 선택 블록(230)에서는 상술한 바와 같은 과정을 통해 얻어진 DFT 변환계수들에 대하여, 라인 L25를 통해 제1도의 제어 블록(220)으로부터 제공되는 주파수 영역 구분을 위한 대역폭 결정신호 B에 의거하여 그 통과되는 주파수 대역을 결정한다. 전술한 바와 같이, 주파수 영역 구분을 위한 대역폭 결정신호 B는 1에서 4사이의 정수값이므로 이에 따라 선택되는 주파수는 다음과 같다.More specifically, in the frequency selection block 230, the bandwidth determination signal B for frequency domain division provided from the control block 220 of FIG. 1 through the line L25 for the DFT conversion coefficients obtained through the above-described process. Based on this, the frequency band that is passed is determined. As described above, since the bandwidth determination signal B for frequency domain division is an integer value between 1 and 4, the frequency selected according to this is as follows.
즉, 주파수 선택 블록(230)에서는 변환된 주파수 Z(k,1)에서 특정한 주파수를 선택한다. 여기에서, k, 1은 0에서 N-1 사이의 정수값이다. 따라서, 주파수 선택블록(230)에서 출력되는 값은 특정 주파수 성분(즉, 고주파 성분)이 제거된 신호가 된다. 예를 들어, N=8인 경우에, 일예로서 제2도에 도시된 바와 같이, 그 통과 주파수 대역이 결정될 것이다.That is, the frequency selection block 230 selects a specific frequency from the converted frequency Z (k, 1). Here, k and 1 are integer values between 0 and N-1. Therefore, the value output from the frequency selection block 230 is a signal from which a specific frequency component (ie, a high frequency component) is removed. For example, when N = 8, as shown in FIG. 2 as an example, the pass frequency band will be determined.
제2도에 도시된 바와 같이, 라인 L25를 통해 제1도의 제어블록(220)으로부터 주파수 선택 블록(2330)으로 제공되는 주파수 영역 구분을 위한 대역폭 결정신호 B 값이 1이면 변환 주파수 Z(k,1)는 모두 선택되고, B값이 2,3,4인 경우에는 제2도에서와 같이 각각에 해당하는 점선 이하의 주파수는 모드 0으로 하여 선택하지 않는다. 즉, 제2도에서 B값이 4인 경우에는 Z(1,7), Z(2,6) 등과 같은 점선 이하의 주파수는 모두 0으로 매핑 처리되는 것이다.As shown in FIG. 2, when the bandwidth determination signal B value for frequency domain division provided from the control block 220 of FIG. 1 to the frequency selection block 2330 through the line L25 is 1, the conversion frequency Z (k, 1) are all selected, and when the B value is 2, 3, or 4, as shown in FIG. That is, when the value of B is 4 in FIG. 2, frequencies below the dotted line such as Z (1,7), Z (2,6), etc., are all mapped to 0. FIG.
다음에, 상술한 바와 같이 영상의 복잡도에 기초하여 결정되는 대역폭 결정신호 B값에 따라 특정영역의 주파수(고주파 성분)가 제거된 DFT 변환계수들(주파수 영역의 신호)은 아래에 도시된 (4)식을 통해 원래의 공간영역의 신호로 역변환된다.Next, as described above, the DFT transform coefficients (signals in the frequency domain) from which the frequency (high frequency component) of the specific region is removed in accordance with the bandwidth determination signal B value determined based on the complexity of the image are shown below (4). Is converted back to the original spatial signal.
상기 (4)식에서 f(u,v)는 각 픽셀의 값을 의미하고, u 및 v는 수평 및 수직 방향으로의 픽셀의 위치를 의미하며, Z(k,1)은 변환된 신호를 의미하고, k,1은 각각 수평 및 수직 방향으로의 주파수 성분을 의미한다. 따라서, N=8 인 경우에는 주파수 영역의 8×8 DFT 블록들은 공간영역의 신호로 변환된다.In Equation (4), f (u, v) denotes the value of each pixel, u and v denote the position of the pixel in the horizontal and vertical directions, and Z (k, 1) denotes the converted signal. , k, 1 means frequency components in the horizontal and vertical directions, respectively. Therefore, when N = 8, 8x8 DFT blocks in the frequency domain are converted into signals in the spatial domain.
그 결과, 주파수 선택 블록(230)에서는 라인 L11을 통해 제1도의 감산기(110) 및 현재 프레임 예측 블록(180)으로 영상의 복잡도에 따라 특정영역의 주파수가 제거된 영상신호, 즉 영상의 복잡도에 근거하여 산출되는 대역폭 결정신호 B에 따라 영상의 고주파 성분이 선택적(또는 적응적)으로 제거된 영상신호(특정영역의 고주파 성분이 0 값으로 대체된 영상신호)를 제공하게 된다.As a result, in the frequency selection block 230, the subtractor 110 and the current frame prediction block 180 of FIG. 1 through the line L11 are applied to the image signal from which the frequency of the specific region is removed according to the complexity of the image, that is, the complexity of the image. According to the bandwidth determination signal B calculated based on this, a video signal (video signal in which a high frequency component of a specific region is replaced with a zero value) from which a high frequency component of an image is selectively (or adaptively) removed is provided.
따라서, 제1도의 영상 부호화 블록(120)에서는, 복잡한 영상의 경우, 상술한 바와 같이 인간의 시각에 비교적 둔감한 영상의 고주파 성분을 선택적(또는 적응적)으로 제거한 상태에서 부호화(양자화)를 수행하게 되므로, 시각적으로 중요한 성분인 저주파 신호에 대해 양자화 오차가 적게 생기도록 하면서 부호화할 수 있는 것이다. 만일, 복잡한 영상임에도 불구하고 본 발명에서와 같이 주파수의 저역 통과 대역폭을 제한하지 않게 되면, 결과적으로 부호화후에 발생되는 비트량이 많아져 양자화 스텝 사이즈가 커지게 되므로 모든 주파수 대역(고주파에서 저주파 대역)에 대하여 양자화 오차가 많이 발생되고, 그 결과 수신측의 재생 영상에서 양자화로 인한 화질열화가 야기될 것이다.Accordingly, in the image encoding block 120 of FIG. 1, in the case of a complex image, encoding (quantization) is performed in a state in which a high frequency component of an image relatively insensitive to human vision is selectively (or adaptively) removed as described above. Therefore, the low frequency signal, which is a visually important component, can be encoded with less quantization error. If the low pass bandwidth of the frequency is not limited as in the present invention even though it is a complicated image, as a result, the amount of bits generated after encoding increases and the quantization step size becomes large. A large number of quantization errors are generated, and as a result, image quality deterioration due to quantization will be caused in the playback image of the receiver.
이상 설명한 바와 같이 본 발명에 따르면, 바로 이전 프레임의 부호화후에 발생되는 비트량을 이용하여 현재 부호화하고자 하는 영상의 복잡도를 계산하고, 그 계산결과에 따라 현재 입력 영상이 복잡한 영상인 경우, 그에 상응하는 가중치를 주어 인간의 시각에 둔감한 영상의 고주파 성분을 일차적으로 제거한 다음 MC-DCT, 양자화 등의 부호화를 수행하도록 함으로써, 양자화 단계에서의 과도한 스텝 사이즈의 증가 없이 부호화후 발생되는 비트량을 효과적으로 조절할 수 있다. 따라서, 본 발명에 의하면, 부호화된 영상을 복원하여 디스플레이할 때, 재생 영상에서 필연적으로 나타나는 양자화 오차로 인한 화질열화를 효과적으로 감소시킬 수 있다.As described above, according to the present invention, the complexity of the image to be currently encoded is calculated by using the bit amount generated after the encoding of the immediately preceding frame, and according to the calculation result, if the current input image is a complex image, By giving weights, the high frequency components of the image insensitive to human vision are first removed, and then coding such as MC-DCT and quantization is performed to effectively control the amount of bits generated after encoding without increasing an excessive step size in the quantization step. Can be. Therefore, according to the present invention, it is possible to effectively reduce image quality deterioration due to quantization error inevitably present in a reproduced image when reconstructing and displaying an encoded image.
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960013775A KR100203625B1 (en) | 1996-04-30 | 1996-04-30 | An improved image coding system having functions for controlling generated amount of coded bit stream |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960013775A KR100203625B1 (en) | 1996-04-30 | 1996-04-30 | An improved image coding system having functions for controlling generated amount of coded bit stream |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970073128A KR970073128A (en) | 1997-11-07 |
KR100203625B1 true KR100203625B1 (en) | 1999-06-15 |
Family
ID=19457277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960013775A KR100203625B1 (en) | 1996-04-30 | 1996-04-30 | An improved image coding system having functions for controlling generated amount of coded bit stream |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100203625B1 (en) |
-
1996
- 1996-04-30 KR KR1019960013775A patent/KR100203625B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR970073128A (en) | 1997-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100203710B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
JPH0723422A (en) | Video signal band compression equipment of digital vtr | |
KR20000053028A (en) | Prediction method and device with motion compensation | |
KR100229796B1 (en) | Image decoding system including compensation at detoriorate image | |
KR100203682B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203714B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203709B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203625B1 (en) | An improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203627B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203676B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203659B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203703B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203675B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203685B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203663B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203684B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203628B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203674B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203630B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100229791B1 (en) | Adaptive image coding system having functions for controlling bandpath of video signals | |
KR100203660B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203677B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203629B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203699B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream | |
KR100203678B1 (en) | Improved image coding system having functions for controlling generated amount of coded bit stream |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110302 Year of fee payment: 13 |
|
LAPS | Lapse due to unpaid annual fee |