KR100214378B1 - Adaptive quantizing method needless of transmitting additional information - Google Patents
Adaptive quantizing method needless of transmitting additional information Download PDFInfo
- Publication number
- KR100214378B1 KR100214378B1 KR1019950035995A KR19950035995A KR100214378B1 KR 100214378 B1 KR100214378 B1 KR 100214378B1 KR 1019950035995 A KR1019950035995 A KR 1019950035995A KR 19950035995 A KR19950035995 A KR 19950035995A KR 100214378 B1 KR100214378 B1 KR 100214378B1
- Authority
- KR
- South Korea
- Prior art keywords
- vector
- representative
- representative vector
- label
- vectors
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 유한개의 대표 벡터를 가지고서 무한개의 대표 벡터를 갖는 효과를 얻고, 부가 정보(Overhead)를 수신단에 전송할 필요가 없는 적응적 양자화 방법에 관한 것이다.The present invention relates to an adaptive quantization method that achieves the effect of having an infinite number of representative vectors with a finite number of representative vectors, and does not need to transmit overhead information to a receiver.
발생 가능한 모든 종류의 영상 데이터를 모아서 P×Q크기의 벡터로 세분화한 후 분류화 과정을 통하여 세포 대표 벡터 군을 설정하는 단계와, 구해진 세포 벡터 군을 이용하여, 전송 비트율에 맞는 라벨의 갯수 만큼 세포 벡터를 분류화하여 광역 대표 벡터를 구하는 단계와, 광역 대표 벡터를 구한 후, 각각의 광역 대표 벡터에 가장 가까운(Euclidean Distance로써) 세포 대표 벡터를 이용하여 사전에 지정된 수만큼 지역 대표 벡터를 지정하는 단계로 구성된다.Collecting all kinds of image data that can be generated and subdividing them into P × Q-sized vectors and classifying them into cell representative vector groups, and using the obtained cell vector groups, as many as the number of labels corresponding to the transmission bit rate Classifying the cell vectors to obtain a wide representative vector, and after obtaining the wide representative vector, assigning a local representative vector by a predetermined number using the cell representative vector that is closest to each wide representative vector (as the Eulidean Distance). It consists of steps.
이것에 의해 유한개의 대표 벡터를 가지고 무한개의 대표 벡터를 갖는 효과를 얻을 뿐만 아니라 부가 정보(Overhead)는 수신단에 전송하지 않는 효과가 있다.As a result, not only the finite number of representative vectors and the infinite number of representative vectors are obtained, but the additional information is not transmitted to the receiver.
Description
제1도는 동 영상 처리에서 프레임간 블록의 전파 방향을 도시한 설명도.1 is an explanatory diagram showing a propagation direction of an inter-frame block in moving image processing.
제2도는 광역, 지역 및 세포 대표 벡터군을 도시한 구성도.2 is a block diagram showing a wide area, a region, and a cell representative vector group.
제3도는 학습용 벡터, 세포, 지역, 그리고 광역 대표 벡터의 생성 과정을 도시한 도면.3 is a diagram illustrating a process of generating a learning vector, a cell, a region, and a broad representative vector.
제4도는 동 영상 압축 처리에서 엔코더와 디코더에서의 광역 대표 벡터 라벨 맵 동기화 과정을 도시한 도면.4 is a diagram illustrating a process of synchronizing a global representative vector label map at an encoder and a decoder in a video compression process.
제 5도는 광역 대표 벡터 라벨과 지역 대표 벡터 라벨의 전송 비트 설정을 위한 방법을 도시한 것으로서, 전송률에 의해 N 비트로 지정되었을 때, 1비트의 탐색 모드 비트와 N-1 비트의 전송 코드 비트로 나눈 형태를 도시한 도면.5 is a diagram illustrating a method for setting transmission bits of a wide representative vector label and a local representative vector label, and is divided into one bit of a search mode bit and an N-1 bit of transmission code bits when N bits are designated by the bit rate. Figure.
제6도는 광역 대표 벡터의 업데이트를 도시한 도면.6 shows an update of a global representative vector.
제7도는 동 영상 압축 처리에서 적응성을 향상시키기 위해 첫 번째 영상에서 가장 가까운 광역 대표 벡터를 선정하여 그 라벨을 첫 번째 프레임을 전송하기 전에 디코더 단에 전송하는 블록도.FIG. 7 is a block diagram of selecting a nearest wide representative vector from the first image and transmitting the label to the decoder before transmitting the first frame to improve adaptability in the video compression process.
제8도는 포스트와 세포 벡터, 그리고 포스트와 업데이트되는 광역 벡터간의 상대적인 관계.8 shows the relative relationship between post and cell vectors and the post and updated global vectors.
제9도는 사전에 결정되는 포스트와 세포 대표 벡터간의 간격맵과 실행중에 갱신되는 포스트와 광역대표벡터간의 간격맵.9 is a predetermined distance map between a post and cell representative vector and a distance map between a post and a wide representative vector updated during execution.
본 발명은 부가 정보 전송이 필요없는 적응적 양자화 방법에 관한 것으로서, 유한개의 대표 벡터를 가지고서 무한개의 대표 벡터를 갖는 효과를 얻고, 부가 정보(Overhead)를 수신단에 전송할 필요가 없는 적응적 양자화 방법에 관한 것이다.The present invention relates to an adaptive quantization method that does not require additional information transmission. The present invention relates to an adaptive quantization method that obtains an effect of having an infinite number of representative vectors with a finite number of representative vectors, and does not require transmission of additional information to a receiver. It is about.
특히, 본 발명은 영상 전화, 영상 회의 시스템, 음성 사서함 및 데이터 압축 처리가 필요한 모든 시스템에서, 또한 MPEG-4와 같은 초 저속용 데이터 압축 처리에서 필수적인 적응형 코딩 기법이다.In particular, the present invention is an adaptive coding technique essential in video telephony, video conferencing systems, voice mailboxes and all systems requiring data compression processing, and also in ultra-low speed data compression processing such as MPEG-4.
영상이나 음성등의 전송시 보내야할 데이터의 양알아쓰 최소화하도록 압축 처리하는 것은 매우 중요하다. 특히 화상 전화나 영상 회의 시스템의 경우와 같이 초 저속 전송 방법에 필수적이다. 현재까지, DCT를 이용한 일반적인 변환 코딩 기법(transform coding using Discrete Cosine Transform)이 널리 이용되어 왔지만 (예를들어 MPEG-1, MPEG-2, International Standards), 초 저속용 압축 처리 기법으로서는 변환 코딩 기법이 스칼라 (Scalar) 단위로 데이터를 처리하기 때문에 비트율 감소에 한계가 따른다.It is very important to compress the data to minimize the amount of data to be sent when transmitting video or audio. In particular, such as in the case of video telephony or video conferencing system, it is essential for ultra-low speed transmission method. Until now, transform coding using Discrete Cosine Transform has been widely used (eg MPEG-1, MPEG-2, International Standards). Since data is processed in scalar units, there is a limit to bit rate reduction.
따라서 고 압축율(high compression ratio)을 얻기위해 벡터 단위로 데이터를 처리하여 그 라벨(일종의 처리한 데이터의 주소)만을 전송하는 벡터 양자화(vector quantization)기법이 있으며 초 저속 전송용 데이터 처리에 알맞는 기법으로 알려져 왔다.Therefore, there is a vector quantization technique that processes data in vector units to obtain a high compression ratio, and transmits only the label (address of the processed data), and is suitable for data processing for ultra-low speed transmission. It has been known as.
일반적인 벡터 양자화 방법은 학습 단계와 실행 단계로 구성 되어 있다. 우선 학습 단계에서 여러 가지 발생 가능한 데이터를 분류하고 (이하 데이터 군(data group)이라 한다), 분류된 학습용 데이터를 사용자가 지정한 P×Q크기의 벡터의 집합으로 분리해 낸다.The general vector quantization method consists of a learning phase and an execution phase. First, in the learning stage, various kinds of possible data are classified (hereinafter referred to as a data group), and the classified training data are separated into a set of P × Q size vectors designated by the user.
그 벡터의 집합으로부터 유한개의 Nr개 대표 벡터(representative vector)를 반복적인 분류 방법(iterative clustering algorithm)을 사용하여 (예를 들어 K-means algorithm) 추출해 내고, 그 대표 벡터들을 소속 데이터 군의 코드북(codebook)으로 정한다.From the set of vectors, the finite Nr representative vectors are extracted using an iterative clustering algorithm (e.g., K-means algorithm), and the representative vectors are codebooks of the data group. codebook).
실행 단계에서는 입력 데이터를 P×Q 크기의 벡터 집합으로 분리해내고 각각의 벡터와 가장 가까운 대표 벡터를 선정하여 그것의 라벨만을 디코더(decoder)단에 전송한다.In the execution step, the input data is separated into a set of vectors of size P × Q, a representative vector closest to each vector is selected, and only its label is transmitted to the decoder.
디코더 단에서는 전송받은 라벨을 미리 소유하고 있는 코드북내의(학습시 발생한 코드북을 엔코더와 디코더가 똑같이 소유한다; 일종의 약속된 코드)대표 벡터로 교체하여 해당 입력 데이터를 재생한다.In the decoder stage, the corresponding input data is reproduced by replacing the representative vector in the codebook (the encoder and the decoder owns the same code; a kind of promised code) in the codebook that owns the received label in advance.
벡터 양자화 방법은 데이터를 벡터 단위로 나누어 처리하므로 데이터 압축 효율면에서 스칼라 양자화 방법보다 유리하지만 알고리즘의 성격상 다음과 같은 단점을 내포하고 있다.The vector quantization method divides the data into vector units and thus has an advantage over the scalar quantization method in terms of data compression efficiency. However, the vector quantization method has the following disadvantages.
1. 학습시 고정된 코드북내에서 입력 데이터와 가장 가까운 대표 벡터를 입력 데이터로 대체하여 처리하므로 실제 보내야 할 데이터와 전송된 데이터와의 왜곡(distortion)이 발생한다.1. During learning, the representative vector closest to the input data is replaced with the input data in the fixed codebook, so distortion of the data to be sent and the transmitted data occurs.
데이터의 정확한 복원(reconstruction)은 왜곡 현상을 최소화 하는데 있으며 이론적으로 무한개의 대표 벡터가 존재하면 왜곡은 없앨 수 있지만 무한개에 가까운 대표 벡터의 라벨링(labeling)에 많은 수의 비트(bit)가 필요하여 (예를 들어 8비트는 256개의 라벨을 표현할 수 있다) 데이터 압축이란 면에서 상반된다.Accurate reconstruction of data minimizes distortion, and theoretically, if infinite representative vectors exist, distortion can be eliminated, but a large number of bits are required for labeling of nearly infinite representative vectors. (For example, 8 bits can represent 256 labels.) Contrary to data compression.
실제로 무한에 가까운 대표 벡터가 존재한다고 해도 각각의 입력 데이터를 처리하는데 소수의 대표 벡터만 해당되어 나머지 대다수의 대표 벡터는 쓰이지 않는다. (영상의 특성이 모두 다른 것들을 처리하기 위해 많은 종류의 대표 벡터가 있지만 특정 영상이 입력되었을 때 다른 특성을 표현하기 위한 대표 벡터는 쓰이지 않는다. 예를 들어 에지(Edge)가 적은 단순한 영상을 처리할 때 복잡한 영상을 처리할 수 있는 대표 벡터는 전혀 쓰이지 않는다). 데이터 압축 효율을 얻기 위하여, 유한개의 ,즉 Nr개의 대표 벡터의 수를 유지해야 하며 큰 차원 (large dimension)을 갖는 벡터를 사용하여야 한다. 여기서 Nr ∞이다.In fact, even if there is a representative vector close to infinity, only a few representative vectors are used to process each input data, and the majority of the representative vectors are not used. (There are many types of representative vectors to process all the different characteristics of the image, but when a specific image is input, the representative vector is not used to express other characteristics. For example, a simple image with few edges can be processed. Representative vectors that can process complex images are not used at all). In order to obtain the data compression efficiency, the number of finite or Nr representative vectors must be maintained and a vector having a large dimension must be used. Where Nr ∞.
2. 대표 벡터는 유한개의 학습용 데이터 군에서 반복적인 분류 방법으로 추출되기 때문에 모든 입력 데이터(every input data)에 적합한 코드북을 생성하지 못한다.2. Since the representative vector is extracted by an iterative classification method from a finite group of training data, it cannot generate a codebook suitable for all input data.
그리고 일단 학습 단계에서 결정된 코드북은 임의로 변경할 수 없으므로 (약속된 코드북이 동시에 엔코더부와 디코더부에 존재하여야 하므로)임의의 입력 데이터(any input data)에 적응적(adaptive)으로 대응하지 못한다. 전송하여야 할 데이터에 적응적으로 대처하기 위해서는, 각각의 데이터를 처리할 때 , 반드시 알맞는 대표 벡터를 재설정하고 그 코드북을 수신단에 전송한 후에, 전송하여야 할 데이터와 가장 가까운 대표 벡터의 라벨을 전송하는 방법이 있다. 이를 이후에 일반적인 적응 벡터 양자화 방법 (Conventional Adaptive Vector Quantization)이라 하자(Goldberg, M.,Boucher, P.R. and Shlien,S.,(1986) Image Compression Adaptive Vector Quantization , Ieee Trans, Commun., vol COM-34, pp. 180-187 참조), 하지만 대표 벡터를 항상 전송해 주어야 하므로 부가 정보(Overhead)의 양이 심각하게 많아진다. 압축 효율을 높이기 위해서는 부가 정보의 양을 줄여야 하며, 이는 대표 벡터의 수를 줄이므로써 이루어진다.Since the codebook determined at the learning stage cannot be arbitrarily changed, it cannot adaptively adapt to any input data (since the promised codebook must exist at the same time as the encoder unit and the decoder unit). In order to adapt adaptively to the data to be transmitted, when processing each data, it is necessary to reset the appropriate representative vector and transmit the codebook to the receiver, and then transmit the label of the representative vector closest to the data to be transmitted. There is a way. Let's call this general Adaptive Vector Quantization (Goldberg, M., Boucher, PR and Shlien, S., (1986) Image Compression Adaptive Vector Quantization, Ieee Trans, Commun., Vol COM-34) , see pp. 180-187), but since the representative vector must always be transmitted, the amount of overhead increases significantly. In order to increase the compression efficiency, the amount of additional information should be reduced by reducing the number of representative vectors.
이 때, 표현해야 할 데이터와의 왜곡이 비례하여 커지므로(대표벡터의 수) 적은 수의 대표 벡터만을 이용하여 정학한 데이터 복원은 이루어지기 어렵다.At this time, the distortion with the data to be expressed increases in proportion (the number of representative vectors). Exact data recovery using only a small number of representative vectors is difficult.
본 발명은 상술한 종래의 문제점을 극복하기 위한 것으로서, 본 발명의 목적은 전술한 두가지 단점을 줄이는 방향의 적응적 벡터 양자화 기법을 제공하는 것으로서, 이상적인 적응적 벡터 양자화 기법의 두가지 조건(Two conditions for the ideal adaptive vector quantization methodology)으로서 다음을 만족시키는데 있다.SUMMARY OF THE INVENTION The present invention has been made to overcome the above-mentioned problems, and an object of the present invention is to provide an adaptive vector quantization technique in a direction that reduces the aforementioned two disadvantages, and provides two conditions for an ideal adaptive vector quantization technique. the ideal adaptive vector quantization methodology, which satisfies
1. 유한개의 대표 벡터를 가지고 무한개의 대표 벡터를 갖는 효과를 얻는다.1. The effect of having infinite representative vectors with finite representative vectors is obtained.
2. 부가 정보(Overhead)는 수신단에 전송하지 않는다.2. No overhead is transmitted to the receiver.
이하, 본 발명의 실시예를 첨부한 도면을 참조하여 상세히 설명하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
본 발명은 이상적인 적응적 벡터 양자화 기법의 두가지 조건(Two conditions for the ideal adaptive vector quantization methodology)으로서 다음을 만족시킨다.The present invention satisfies the following as two conditions for the ideal adaptive vector quantization methodology.
1. 유한개의 대표 벡터를 가지고 무한개의 대표 벡터를 갖는 효과를 얻는다.1. The effect of having infinite representative vectors with finite representative vectors is obtained.
2. 부가 정보(Overhead)는 수신단에 전송하지 않는다.2. No overhead is transmitted to the receiver.
같은 양의 데이터가 연속적으로 존재하고 (일정한 양의 데이터를 데이터 프레임(Data Frame)이라고 하자; 예를 들어 동 영상 프레임, 음성 프레임), 프레임간 상관 관계 (Correlation)가 비교적 높고, 또한 각각의 프레임 내의 정보의 흐름(Information Flow)을 예측할 수 있을 때 위에서 명기된 두가지 조건을 만족하는 적응적 벡터 양자화기를 구현할 수 있다. 예를 들어 제 1도에 도시된 바와 같이 동 영상 프레임 데이터 처리시, 각각의 프레임을 여러개의 고정된 블록(Block)으로 나누어 현재 프레임에서 임의의 블록이 이전 프레임의 어느 블록과 상관 관계가 제일 높은 지를 알 수 있을 때 , 즉 제 1도의 (a)와 같이 프에임내의 블록의 위치를 프레임간에 동일하게 지정한 경우나, 제 1 도의 (b)에서 나타낸 것과 같이 움직임 보상(Motion Compensation: MC)을 통하여 현재 프레임의 위치가 이전 프레임의 어디 부분에서 전파(Propagation)되었는지 예측 할 수 있는 경우에, 위의 조건을 만족하는 적응적 벡터 양자화기를 구현할 수 있다.The same amount of data is present continuously (a certain amount of data is called a data frame; for example, a video frame, an audio frame), the correlation between frames is relatively high, and each frame When it is possible to predict the information flow in the information (Information Flow) it is possible to implement an adaptive vector quantizer that satisfies the two conditions specified above. For example, as shown in FIG. 1, when processing video frame data, each frame is divided into several fixed blocks, and any block in the current frame has the highest correlation with any block in the previous frame. In this case, when the position of the block in the frame is the same between frames as shown in (a) of FIG. 1 or motion compensation (MC) as shown in (b) of FIG. If it is possible to predict where the position of the current frame is propagated in the previous frame, an adaptive vector quantizer that satisfies the above condition can be implemented.
이상적인 적응적 벡터 양자화 방법의 첫 번째 조건 (유한개의 대표 벡터를 가지고 무한개의 대표 벡터를 갖는 효과를 얻는다)을 만족하기 위하여 대표 벡터를 광역 대표 벡터 군(Global Representative Vector: GRV), 지역 대표 벡터 군(Local Representative Vector : LRV) 그리고 세포 대표 벡터군(Cell Representative Vector: CRV)으로 제 2도에 도시된 것과 같이 나눈다.In order to satisfy the first condition of the ideal adaptive vector quantization method (the effect of having infinite representative vectors with infinite representative vectors), the representative vectors are represented by a global representative vector group (GRV) and a local representative vector group. (Local Representative Vector: LRV) and Cell Representative Vector (CRV) are divided as shown in FIG.
세포 대표 벡터 군은 발생 가능한 모든 종류의 영상 데이터를 모아서 학습용 데이터로 지정한 후 그것을 P SQ 크기의 벡터로 세분화한 후 분류화(Classification) 과정을 통하여 설정한다.The cell representative vector group collects all kinds of image data that can be generated, designates it as learning data, divides it into a P SQ size vector, and sets it through a classification process.
분류화 방법에는 종래의 기술로써 상술한 일반적으로 쓰이는 벡터 양자화 방법 등을 이용한다. 즉, 본 발명에서는 상기 세포 대표 벡터 군을 만들기 위한 학습 방법으로써, 상술한 바와 같이 학습 단계와 실행 단계로 구성되는 일반적인 벡터 양자화 방법을 이용한다.As the classification method, the conventionally used vector quantization method and the like described above are used. That is, in the present invention, as a learning method for creating the cell representative vector group, a general vector quantization method consisting of a learning step and an execution step as described above is used.
구해진 세포 벡터 군을 이용하여 광역 대표 벡터를 전송 비트율에 맞는 라벨의 개수만큼 (전송 비트율과 라벨의 개수는 정비례한다; 유한개의 고정된 벡터수) 세포 벡터를 분류화하여 구한다.Using the obtained cell vector group, a wide-area representative vector is obtained by classifying cell vectors by the number of labels corresponding to the transmission bit rate (the transmission bit rate and the number of labels are directly proportional to the number of fixed vectors).
광역 대표 벡터를 구한후 지역 대표 벡터를 각각의 광역 대표 벡터에 가장 가까운(Euclidean Distance로써)세포 대표 벡터를 이용하여 사전에 지정된 수만큼 지정한다. (여기서는 광역 대표 벡터수와 같다). 세포 벡터의 수는 시스템이 처리할 수 있는 한계(처리 속도나 저장 공간의 한계)까지 만들 수 있다.After obtaining the global representative vector, the local representative vector is designated by a predetermined number using the cell representative vector closest to each of the global representative vectors (as the Eulidean Distance). (Here it is equal to the number of representative vector vectors). The number of cell vectors can create limits to the system's ability to process (speed of processing or storage space).
그러므로 무한에 가까운 대표 벡터의 수를 갖는 공간에서 유한개의 광역 대표 벡터와 지역 대표 벡터를 조정하게 되므로써 조건 1을 만족할 수 있다. 이는 제 3도에 도시되어 있다.Therefore, Condition 1 can be satisfied by adjusting the finite wide-area vector and the local-representative vector in a space having a nearly infinite number of representative vectors. This is shown in FIG.
상기와 같은 세포, 지역 광역 대표 벡터의 초기 설정에서는 동영상 프레임의 영상 정보를 모두 모아서 초기화한다. 즉, 수집된 영상 정보 데이터들을 대표 벡터를 추출하기 위한 학습 과정의 학습 데이터로 사용하여 대표 벡터들을 초기화한다. 또한, 상기 대표 벡터들의 초기 설정시에 벡터 양자화는 인트라(INTRA)프레임 모드에서 사용하며, 인터(INTER)모드의 경우에는 움직임 보상을 이용한다. 만약, 움직임 보상이 실패하면 인트라 프레임 모드에서와 같은 벡터 양자화 방법을 사용한다. 이상적인 적응적 벡터 양자화기의 두 번째 조건, 즉 부가 정보는 보내지 않는다.는 조건을 만족하기 위해서 엔코더와 디코더에 똑같은 광역 대표 벡터 라벨 맵(GRV Label Map: GRVLM)을 만들어 동기화(Synchronization)를 한다. 동 영상 데이터 압축 처리에서 광역 대표 벡터 라벨 맵을 제 4 도에 도시하였다.In the initial setting of the cell and the regional wide area representative vector, all the video information of the video frame is collected and initialized. That is, the representative vectors are initialized using the collected image information data as learning data of a learning process for extracting the representative vector. In the initial setting of the representative vectors, vector quantization is used in an INTRA frame mode, and motion compensation is used in an INTER mode. If motion compensation fails, the same vector quantization method as in the intra frame mode is used. In order to satisfy the second condition of the ideal adaptive vector quantizer, that is, no additional information is sent, the same global representative vector label map (GRVLM) is generated and synchronized to the encoder and the decoder. A wide representative vector label map in the video data compression process is shown in FIG.
라벨맵은 압축 처리 초반에 코딩(Coding)되어 전송되는 매크로 블록(Macro Block)내의 광역 대표 벡터의 라벨을 저장하여 형성되며, 동기화는 움직임 보상 계수 (Motion Compensation Coefficients)를 이용한다.The label map is formed by storing a label of a wide representative vector in a macro block that is coded and transmitted at the beginning of the compression process, and synchronization uses motion compensation coefficients.
즉 엔코더에서 디코더로 필수적으로 전송하는 움직임 보상 계수를 이용하여 매크로 블록 내의 광역 대표 벡터 라벨 맵의 라벨을 옮겨 놓는다.That is, the label of the global representative vector label map in the macro block is replaced using the motion compensation coefficient that is essentially transmitted from the encoder to the decoder.
엔코더에서 디코더로의 랄벱의 전송은 제 5 도에 도시된 라벨 비트 맵에 의한다. 미리 지정된 전송 비트율을 유지하기 위해 한개의 라벨을 표시하는데 N 비트(bits)가 필요하다고 가정하면, 광역과 지역의 두가지 대표 벡터를 표현하기 위해 1 비트의 탐색 모드 비트(Search Mode Bit: SMB)를 두고 라벨 표현에 각각 N-1 비트를 할당한다.The transmission of the signal from the encoder to the decoder is by the label bitmap shown in FIG. Assuming that N bits are required to display one label to maintain a predetermined transmission bit rate, a search mode bit (SMB) of one bit is used to represent two representative vectors of a wide area and a region. Assign N-1 bits to the label representation.
즉 2(N-1)개의 광역 대표 벡터는 각각 2(N-1)개의 지역 대표 벡터를 갖는다.That is, 2 (N-1) wide representative vectors each have 2 (N-1) local representative vectors.
광역 대표 벡터의 라벨을 전송하기 위해서는 SMB를 지정하고, 지역 대표 벡터의 라벨을 전송하는데는 SMB를 1로 지정하고, N-1비트의 해당 라벨을 전송한다.SMB is designated to transmit the label of the wide representative vector, SMB is designated as 1 to transmit the label of the local representative vector, and the corresponding label of N-1 bits is transmitted.
동 영상 압축 처리에서 벡터 양자화기의 적응화(Adaptation)는 제 4 도에 도시된 광역 대표 벡터 라벨 맵과 제 5 도에 도시된 라벨의 전송 비트 설정 방법 그리고 제6도에 도시된 광역 대표 벡터의 갱신(Update)방법을 반복 실행함으로써 얻어진다.The adaptation of the vector quantizer in the moving picture compression process is performed by the wide representative vector label map shown in FIG. 4 and the transmission bit setting method of the label shown in FIG. 5, and the update of the wide representative vector shown in FIG. It is obtained by repeating the (Update) method.
즉, 동 영상 데이터 압축 처리에서 벡터 양자화 방법의 적응화 방법을 단계적으로 설명하면 다음과 같다.In other words, the adaptive method of the vector quantization method in the moving picture data compression process will be described as follows.
1. 광역 대표 벡터 라벨 맵의 동기화1. Synchronization of Wide Representative Vector Label Map
엔코더에서 현재 입력된 이전에 입력되어 코딩되어서 전송된 후 다시 재생된 영상 (Reconstructed Image)과 비교하여 움직임 보상 계수 (MC Coefficients)를 구하고, 그 움직임 보상 계수를 이용하여 광역 대표 벡터 라벨 맵 중에서 해당되는 부분(움직임 부분)의 라벨 맵을 변경한다.The motion compensation coefficients (MC Coefficients) are obtained by comparing the previously input, coded, transmitted, and reproduced images that are currently input from the encoder, and using the motion compensation coefficients, Change the label map for the part (the moving part).
즉, 처음 전송하는 동영상 프레임의 첫 번째 영상은 움직임 정보를 사용하지 않는 인트라(INTRA) 모드로 부호화한다. 따라서, 세포 벡터로부터 영상을 가장 잘 표현하는 광역 대표 벡터들을 구하여 첫 번째 영상을 부호화하여 이때의 벡터들에 대한 라벨을 전송한다.That is, the first image of the first video frame to be transmitted is encoded in an intra mode that does not use motion information. Therefore, the global representative vectors that best represent the image are obtained from the cell vectors, and the first image is encoded to transmit the labels for the vectors.
상기 인트라 모드에서는 일반적인 벡터 양자화 방법을 적용하며, 이때 제 4도에 도시된 매크로 블록의 벡터 크기는 P×Q의 크기(또는 길이)를 나타낸다. 여기서, 상기 라벨을 매크로 블록의 위치 관계에 따라서 2차원 평면으로 구성한 것을 라벨 맵이하고 하며, 상기 라멜 맵은 영상 정보 대신 광역 벡터의 라벨 값을 가진다.In the intra mode, a general vector quantization method is applied, wherein the vector size of the macro block illustrated in FIG. 4 represents the size (or length) of P × Q. Here, the label map consists of a 2D plane according to the positional relationship of the macro blocks, and the lammel map has a label value of a wide vector instead of image information.
또한 , 첫 영상이 전송된 후 두 번째 영상부터는 복원된 이전 영상으로부터 움직임을 추정하는(INTER)모드로 부호화된다. 즉, 전송되는 움직임 정보를 이용하여 복원된 이전 영상 정보를 가져다가 현재 매크로 블록을 복원한다. 이때 움직임 보상으로 복원한 영상의 화질이 떨어질 경우 움직임 정보 대신 광역 또는 지역 대표 벡터를 선택하여 전송한다.In addition, after the first image is transmitted, the second image is encoded in an INTER mode in which motion is estimated from the reconstructed previous image. That is, the previous macro information is restored by using the transmitted motion information to restore the current macro block. In this case, when the image quality of the image reconstructed by the motion compensation is deteriorated, a wide area or region representative vector is selected and transmitted instead of the motion information.
따라서, 첫 번째 영상 부호화 과정에서 구성된 라벨 맵에 대해서도 이러한 움직임 정보를 이용하여 라벨 맵의 벡터 라벨 값을 재조정하는 것이다. 디코더에서도 역시 전송된 MC 계수를 이용하여 라벨 맵을 변경하여 엔코더와 동기시킨다. (제 4 도)Therefore, the vector label value of the label map is readjusted using the motion information even for the label map constructed in the first image encoding process. The decoder also uses the transmitted MC coefficients to change the label map to synchronize with the encoder. (4th degree)
2. 대표 벡터 결정 및 전송2. Determining and Sending Representative Vectors
현 입력 영상과 움직임이 보상된 재생 영상을 비교하여 보상이 미흡하여 (혹은 새로운 물체가 전 여상에 추가 되어서) 생기는 불일치를 코딩하여 전송할 필요가 있을 때 ,(단계 2-1) 새롭게 코딩하여야 할 부분과 가장 가까운 광역 대표 벡터의 라벨을 구한다. (단계 2-2) 구해진 광역 대표 벡터의 라벨과 라벨 맵(GRV Label Map)에서 해당 위치의 라벨(이전 프레임의 광역 대표 벡터 라벨)을 서로 비교하여 라벨 값이 다르면 제 5 도의 (b)에서와 같이 SMB를 0으로하여 광역 대표 벡터의 라벨 값을 디코더단에 전송하고; 라벨의 값이 서로 같으면 전송되는 데이터를 더욱 정확히 표현하기 위하여 제 5 도의 (c)와 같이 SMB를 1로 지정하고 라벨 값에 해당하는 광역 대표 벡터의 위치에서 가장 가까운 2(N-1)개의 지역 대표 벡터 중에서 새롭게 코딩해야 할 부분과 가장 가까운 지역 대표 벡터를 선택하여 그 라벨을 전송한다. 이 방법을 이용하여 22(N-1)의 선택권을 가지므로서 (GRV Label 의 수 × LRV Label 의 수) 데이터의 정확한 복원을 이룬다.When it is necessary to code and transmit an inconsistency caused by a lack of compensation (or a new object added to the entire image) by comparing the current input video with the motion-compensated playback video (step 2-1), the part to be newly coded Find the label of the wide-area representative vector nearest to. (Step 2-2) If the label value is different from the label of the corresponding wide area representative vector and the label map (GRV Label Map) of the corresponding position (wide area representative vector label of the previous frame), and the label value is different, as shown in (b) of FIG. As SMB is set to 0, the label value of the wide representative vector is transmitted to the decoder. If the values of the labels are the same, in order to represent the transmitted data more accurately, as shown in (c) of FIG. 5, SMB is designated as 1, and 2 (N-1) regions closest to the position of the wide representative vector corresponding to the label value are shown. The local representative vector is selected among the representative vectors closest to the part to be newly coded and the label is transmitted. By using this method, the data (2) (N-1) has the option of (number of GRV Labels × number of LRV Labels) to achieve accurate restoration of data.
3. 광역 대표 벡터 업데이트(Update)3. Global Representative Vector Update
업데이트 인터발은 각각의 영상 프레임당이나 일정 개수의 광역 대표 벡터의 변화가 있을 때 행한다.The update interval is performed for each image frame or when there is a change in a certain number of global representative vectors.
(단계 3-1) 엔코더와 디코더에서 제 6 도에 도시된 것과 같이 특정한 광역 대표 벡터에 소속된 지역 대표 벡터가 여러번 지정되어 전송되었을 때 (단계 3-2), 코딩된 지역 대표 벡터를 모두 모아서 그 중심 (Centroid)을 구하고 이를 새로운 광역 대표 벡터로 지정한다. (단계 3-3) 새로운 광역 대표 벡터를 중심으로 가장 가까운 N-1개의 세포 대표 벡터를 선정하고 이를 지역 대표 벡터로 지정한다.(Step 3-1) When an area representative vector belonging to a specific wide area representative vector is designated and transmitted many times as shown in FIG. 6 in the encoder and the decoder (step 3-2), all the coded area representative vectors are collected. Find the centroid and designate it as the new global representative vector. (Step 3-3) The closest N-1 cell representative vectors are selected based on the new global representative vectors and designated as local representative vectors.
제 5 도의 (b)에서와 같이 SMB를 0으로 하고 광역 대표 벡터의 라벨 값을 디코더단에 전송할 때 특수 물체(Special Objects)를 정확히 보내기 위해 보내야 할 벡터값과 전송되는 광역 대표 벡터의 값을 뺀 차 (프레임차, Frame Difference)를 코딩해서 전송하는 법도 추가하여 생각할 수 있다.As shown in (b) of FIG. 5, SMB is set to 0 and the value of the wide representative vector is subtracted from the vector value to be sent to correctly send special objects when the label value of the wide representative vector is transmitted to the decoder. You can also think of how to code and transmit the difference (frame difference).
앞서 설명한 것과 같이 벡터 양자화 방법에서 매우 많은 대표 벡터를 가진 코드북을 갖고 있다 하더라도 특정 영상이 입력되었을 때 그것을 코딩하여 전송하는데는 소수의 대표 벡터만을 필요로 한다.(일반적인 벡터 양자화 방법 단점 1: 예를 들어 매우 단순한 영상을 처리할 때는 에너지가 많은 부분을 대표로 하는 대표 벡터는 사용되지 않는다.)As mentioned above, even if the vector quantization method has a codebook with a very large number of representative vectors, only a few representative vectors are required to code and transmit a specific image when it is input. For example, when processing a very simple image, a representative vector representing a high energy portion is not used.)
동 영상 처리와 같이 초기 화면과 상관성이 매우 높고 뒤에 연결된 영상이 대체적으로 초기 화면과 같은 복잡도를 갖는 압축 처리에서 초기 화면을 코딩하여 전송하기 전에 초기 화면과 가장 가까운 광역 대표 벡터를 세포 대표 벡터 군으로부터 구하여 설정한 후, 그 라벨만을 디코더 단에 전송하는 광역 대표 벡터 초기화 방법을 제안한다.In the compression process, which is highly correlated with the initial screen, such as moving image processing, and the image connected later is generally the same complexity as the initial screen, the wide-area representative vector closest to the initial screen is transferred from the cell representative vector group before coding and transmitting the initial screen. After obtaining and setting, a wide-area representative vector initialization method for transmitting only the label to the decoder stage is proposed.
이렇게 처리하므로써 전송해야 할 데이터에 초기부터 적응할수 있게 되며 라벨만을 전송하므로써 전송 비트양은 대단히 적다. 이는 제 7 도에 도시되어 있다.By doing this, it is possible to adapt to the data to be transmitted from the beginning, and by transmitting only a label, the amount of bits transmitted is very small. This is shown in FIG.
본 발명에서는 광역 대표 벡터가 입력 영상에 적응적으로 대처하기 위해서 움직이는 것을 특징으로 하는 벡터 양자화 방법이다. 이 때 새로이 업데이트되는 광역 대표 벡터마다 주변 세포 대표 벡터군으로부터 지역 대표 벡터를 설정 해주어야만 한다.In the present invention, the wide-area representative vector is a vector quantization method characterized by moving in order to cope with the input image adaptively. At this time, a regional representative vector should be set from the neighboring cell representative vector group for each newly updated wide area representative vector.
간단히 모든 세포 벡터와 갱신된 광역 대표 벡터와의 절대적 거리를 구하여 가장 가까운 일정한 수의(본 발명에서는 2(N-1)개) 지역 대표 벡터를 구하게 하는 것이 일반적이지만 ,그에 따른 계산량이 너무 많아서 실시간 처리가 불가능하다. 그래서 본 발명에서는 세포 대표 벡터 군의 공간(세포 벡터가 차지하는 차원과 그 크기를 알면 구할 수 있다. )에 3개 이상의 포스트(Post)를 두어 상대적인 거리 관계로 지역 대표 벡터의 업데이트를 꾀하는 방법을 제안한다.It is common to simply obtain the absolute distance between all cell vectors and the updated global representative vector to obtain the nearest constant number (two (N-1) regions) in the present invention, but the computational amount is so large that the real time Processing is impossible. Therefore, the present invention proposes a method of updating a local representative vector in a relative distance relationship by having three or more posts in the space of the cell representative vector group (which can be obtained by knowing the dimensions and sizes of the cell vectors). do.
제8도와 같이 세포 대표 벡터군이 차지하는 공간에 3개 이상의 포스트를 두고 각각의 세포 대표 벡터와 포스트간의 거리를 제 9 도의 (a)와 같이 간격 맵(Distance Map)을 만들어 학습 단계에서 처리하므로 참조테이블(Looking Table)화 한다. 이는 학습 단계에서 처리하므로 참조 맵(Looking Map)은 엔코더와 디코더 양쪽에서 동시에 소유할 수 있다.As shown in FIG. 8, three or more posts are placed in the space occupied by the cell representative vector group, and the distance between each cell representative vector and the post is processed in the learning stage by creating a distance map as shown in FIG. Make a table. This is handled in the learning phase, so a lookup map can be owned by both the encoder and the decoder at the same time.
동 영상 압축 처리에서와 같이 벡터 양자화 방법의 실시간 실행시, 제 8 도에 도시된 것과 같이 업데이트된 대표 벡터와 포스트 간의 거리를 구하고 그 간격 맵 (Distance Map)을 제 9(b)도와 같이 둔다. 제 9(b)도의 간격 맵과 제 9(a)도의 간격 맵을 이용하여 상대적으로 거리가 갱신된 광역 대표 벡터와 가까운 일정한 수의 (갯수를 K라 하면 K2(N-1)) 세포 대표 벡터를 구한 후, K개의 세포 벡터와 갱신된 광역 벡터와의 거리를 구하여 2(N-1)개의 지역 대표 벡터를 설정한다.In real time execution of the vector quantization method as in the video compression process, the distance between the updated representative vector and the post is obtained as shown in FIG. 8, and the distance map is shown in FIG. 9 (b). Using the interval map of FIG. 9 (b) and the interval map of FIG. 9 (a), a representative number of cell representative vectors ( K 2 (N-1) ), which is relatively close to the wide-area representative vector whose distance is updated Then, the distance between the K cell vectors and the updated wide area vector is obtained, and 2 (N-1) local representative vectors are set.
위 방법을 사용하여 지역 대표 벡터의 설정시 광역 벡터와 포스트 그리고 각각의 세포 벡터와 포스트간의 상대적 거리를 사용하므로써 상당한 양의 계산량을 줄일 수 있으며 실시간 처리를 가능케 한다.Using the above method, we can reduce the amount of computation and enable real-time processing by using the wide vector and post and the relative distance between each cell vector and post when setting up the local representative vector.
Claims (17)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950035995A KR100214378B1 (en) | 1995-10-18 | 1995-10-18 | Adaptive quantizing method needless of transmitting additional information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950035995A KR100214378B1 (en) | 1995-10-18 | 1995-10-18 | Adaptive quantizing method needless of transmitting additional information |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970025182A KR970025182A (en) | 1997-05-30 |
KR100214378B1 true KR100214378B1 (en) | 1999-08-02 |
Family
ID=19430559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950035995A KR100214378B1 (en) | 1995-10-18 | 1995-10-18 | Adaptive quantizing method needless of transmitting additional information |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100214378B1 (en) |
-
1995
- 1995-10-18 KR KR1019950035995A patent/KR100214378B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR970025182A (en) | 1997-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100539694C (en) | Motion video coding/decoding method and motion video decoding device | |
US6571016B1 (en) | Intra compression of pixel blocks using predicted mean | |
TW297984B (en) | ||
US5251028A (en) | Apparatus for reducing quantization artifacts in an interframe hybrid coding system with motion compensation | |
EP0454927A2 (en) | A coding system for video signals | |
US20020009143A1 (en) | Bandwidth scaling of a compressed video stream | |
US20030185452A1 (en) | Intra compression of pixel blocks using predicted mean | |
EP0759679A2 (en) | Method and apparatus for detecting motion vectors based on hierarchical motion estimation | |
JPH07288474A (en) | Vector quantization coding/decoding device | |
JP3703299B2 (en) | Video coding method, system and computer program product for optimizing picture center image quality | |
JPH10234046A (en) | Contour coding method using error band | |
KR0159370B1 (en) | Method and apparatus for encoding a video signals using a boundary of an object | |
US6804299B2 (en) | Methods and systems for reducing requantization-originated generational error in predictive video streams using motion compensation | |
JPH09331536A (en) | Error correction decoder and error correction decoding method | |
US8879622B2 (en) | Interactive system and method for transmitting key images selected from a video stream over a low bandwidth network | |
KR100212559B1 (en) | The contour coding system and motion prediction method for object | |
US5646867A (en) | Method and system for improved motion compensation | |
JPH07170523A (en) | Moving picture coder and moving picture decoder | |
CN1078795C (en) | Improved motion compensation method for use in image encoding system | |
KR100214378B1 (en) | Adaptive quantizing method needless of transmitting additional information | |
US5861923A (en) | Video signal encoding method and apparatus based on adaptive quantization technique | |
KR0149938B1 (en) | Moving image compressing apparatus and method using fractal and motion compensation | |
JPS63284974A (en) | Picture compression system | |
KR0178223B1 (en) | Improved pattern vector encoding system and codeword renewal method thereof | |
WO2004010708A1 (en) | Advanced method of coding and decoding motion vector and apparatus therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20100423 Year of fee payment: 12 |
|
LAPS | Lapse due to unpaid annual fee |