RU2557449C1 - Video encoding and decoding method based on three-dimensional discrete cosine transform - Google Patents

Video encoding and decoding method based on three-dimensional discrete cosine transform Download PDF

Info

Publication number
RU2557449C1
RU2557449C1 RU2014113585/08A RU2014113585A RU2557449C1 RU 2557449 C1 RU2557449 C1 RU 2557449C1 RU 2014113585/08 A RU2014113585/08 A RU 2014113585/08A RU 2014113585 A RU2014113585 A RU 2014113585A RU 2557449 C1 RU2557449 C1 RU 2557449C1
Authority
RU
Russia
Prior art keywords
dct
dct coefficients
fragments
calculated
coefficients
Prior art date
Application number
RU2014113585/08A
Other languages
Russian (ru)
Inventor
Нина Сергеевна Агеева
Евгений Александрович Беляев
Сергей Викторович Дворников
Игорь Николаевич Оков
Тимофей Михайлович Сухов
Андрей Александрович Устинов
Василий Валерьевич Цветков
Original Assignee
Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства Обороны Российской Федерации (Минобороны России)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства Обороны Российской Федерации (Минобороны России) filed Critical Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства Обороны Российской Федерации (Минобороны России)
Priority to RU2014113585/08A priority Critical patent/RU2557449C1/en
Application granted granted Critical
Publication of RU2557449C1 publication Critical patent/RU2557449C1/en

Links

Images

Abstract

FIELD: physics.
SUBSTANCE: adaptation is performed by rearranging fragments of discrete cosine transform (DCT) coefficients obtained after two-dimensional DCT on the time axis and subsequent one-dimensional DCT such that the total number of non-zero transform coefficients after three-dimensional DCT is less than the number of non-zero DCT coefficients obtained after three-dimensional DCT without rearranging two-dimensional DCT fragments. In the disclosed method, after forming a domain measuring n×n×n pixels, DCT coefficients are calculated on spatial coordinates x and y for each fragment of the domain. The fragments are then rearranged in the form of a rearrangement vector and a time DCT operation is performed. The DCT coefficients are sampled, encoded and transmitted over a communication channel with the rearrangement vector. At reception, said procedures are performed in reverse order and the original video stream is restored.
EFFECT: high degree of compression of video data with a given image reconstruction error at reception owing to adaptation to variation of static properties of images.
3 cl, 9 dwg

Description

Изобретение относится к области кодирования, а именно к способу сжатия подвижных изображений с целью сокращения объема данных, необходимых для их хранения либо передаваемых по каналу связи для последующего восстановления изображений на приеме.The invention relates to the field of coding, and in particular to a method for compressing moving images in order to reduce the amount of data necessary for their storage or transmitted over a communication channel for subsequent restoration of images on reception.

Известен способ кодирования на основе трехмерного дискретного косинусного преобразования (ДКП) [Zaharia R., Aggoun A., McCormick М. Adaptive 3D-DCT compression algorithm for continuous parallax 3D integral imaging. Journal of Signal processing: Image Communication. 17, pp. 231-242, 2002].A known coding method based on three-dimensional discrete cosine transform (DCT) [Zaharia R., Aggoun A., McCormick M. Adaptive 3D-DCT compression algorithm for continuous parallax 3D integral imaging. Journal of Signal processing: Image Communication. 17, pp. 231-242, 2002].

Недостаток способа - отсутствие адаптации в процессе кодирования к степени подвижности кадров подвижного изображения, что приводит к увеличению объема данных на выходе кодера при заданной ошибке кодирования.The disadvantage of this method is the lack of adaptation in the encoding process to the degree of mobility of the frames of the moving image, which leads to an increase in the amount of data at the output of the encoder for a given encoding error.

Известен способ сжатия видеоданных, в котором применяется трехмерное ДКП (ДКП-3) [Bozinovic N., Konrad J. Scan or derandquantization for 3D-DCT coding in Proc. of SPIEV is. Comm. Andlm. Proc. Vol.5150. pp. 1204-1215, 2003].A known method of video compression, which uses three-dimensional DCT (DCT-3) [Bozinovic N., Konrad J. Scan or derandquantization for 3D-DCT coding in Proc. of SPIEV is. Comm. Andlm. Proc. Vol. 5150. pp. 1204-1215, 2003].

В данном способе применяется обработка видеопоследовательности кадров на основе трехмерного ДКП. При этом выполнение операции преобразования начинается с пространственных координат х и у, а полученные спектральные коэффициенты двумерного ДКП (ДКП-2) подвергаются одномерному ДКП (ДКП-1) по временной координате t для сокращения временной избыточности.In this method, processing of a video sequence of frames based on three-dimensional DCT is used. In this case, the conversion operation begins with the spatial coordinates x and y, and the obtained spectral coefficients of the two-dimensional DCT (DCT-2) are subjected to the one-dimensional DCT (DCT-1) along the time coordinate t to reduce time redundancy.

Основным недостатком способа-аналога является отсутствие возможности адаптации операций кодирования к статистике исходных изображений, что приводит к невозможности достижения высоких коэффициентов сжатия.The main disadvantage of the analogue method is the inability to adapt coding operations to the statistics of the original images, which makes it impossible to achieve high compression ratios.

Наиболее близким по технической сущности к заявляемому способу является "Способ кодирования и декодирования видеоинформации на основе трехмерного дискретного косинусного преобразования" патент RU №2375838, опубл. 10.12.2009, бюл. №34. Способ-прототип заключается в следующих действиях: на передаче последовательность телевизионных кадров разбивают пакеты по n кадров, из которых формируют домены размером n×n×n пикселей, затем на первом этапе кодирования в каждом домене размером n×n×n пикселей осуществляют ДКП по времени, определяют наличие движения в каждом фрагменте размером n×n пикселей по признаку наличия ненулевых спектральных коэффициентов, кроме первого фрагмента домена, в случае наличия движения в каждом фрагменте домена для устранения пространственной избыточности вычисляют коэффициенты ДКП (КДКП) по двум пространственным координатам х и у, полученные коэффициенты квантуют, совокупность квантованных коэффициентов кодируют для устранения пространственной избыточности, кодированные коэффициенты передают в канал связи. В случае отсутствия движения вычисляют КДКП по пространственным координатам х и у только для первого фрагмента домена и выполняют операции квантования, кодирования и передачи коэффициентов по каналу связи. На последующих этапах кодирования при поступлении очередных пакетов, если движение имеется, то процесс кодирования повторяют, если в конкретных доменах движения нет, то для них передают сигнал об использовании при декодировании предыдущего фрагмента. На приеме сжатый видеопоток подвергают декодированию, а затем деквантованию. В случае наличия движения в доменах деквантованные коэффициенты подвергают обратному ДКП-3 (ОДКП-3) (последовательное выполнение обратного двумерного ДКП (ОДКП-2D) и обратного одномерного ДКП (ОДКП-1D) и в результате восстанавливают исходный видеопоток. В случае отсутствия движения в конкретных доменах по переданным в предыдущих доменах спектральным коэффициентам (хранятся в буфере фрагментов без движения) восстанавливают фрагменты этих доменов при выполнении только обратного дискретного косинусного преобразования (ОДКП) по времени и в результате восстанавливают исходный видеопоток.The closest in technical essence to the claimed method is the "Method of encoding and decoding video information based on three-dimensional discrete cosine transform" patent RU No. 2375838, publ. 12/10/2009, bull. Number 34. The prototype method consists in the following actions: packets of n frames are divided into transmission sequences of television frames, from which domains of size n × n × n pixels are formed, then at the first stage of coding, each domain of size n × n × n pixels performs DCT in time , determine the presence of motion in each fragment of size n × n pixels based on the presence of non-zero spectral coefficients, except for the first fragment of the domain, in the case of movement in each fragment of the domain to eliminate spatial ti is calculated DCT coefficients (MPC) in two spatial coordinates x and y obtained coefficients are quantized, encoded set of quantized coefficients to eliminate spatial redundancy, the coded coefficients are transmitted to the communication channel. In the absence of movement, the CDQP is calculated by the spatial coordinates x and y only for the first fragment of the domain and the operations of quantization, coding, and transmission of coefficients over the communication channel are performed. At the subsequent stages of coding, when the next packets arrive, if there is movement, then the coding process is repeated, if there is no movement in specific domains, then a signal about the previous fragment is used for them when decoding. At the reception, the compressed video stream is decoded and then dequantized. In the case of movement in the domains, the dequantized coefficients are subjected to reverse DCT-3 (ODKP-3) (sequential execution of the inverse two-dimensional DCT (ODKP-2D) and reverse one-dimensional DCT (ODKP-1D) and, as a result, the original video stream is restored. specific domains using the spectral coefficients transferred in previous domains (stored in the fragment buffer without movement) restore fragments of these domains when performing only the inverse discrete cosine transform (DCCT) in time and in p result of restoring the original video stream.

Недостаток прототипа в том, что при кодировании учет степени подвижности исходных изображений происходит путем их классификации на две группы: с отсутствием движения и с наличием движения. Это делает способ кодирования менее эффективным с позиций достигаемого сжатия при заданной ошибки восстановления на приеме вследствие недостаточной адаптации к степени подвижности кодируемых фрагментов исходного изображения.The disadvantage of the prototype is that when encoding, accounting for the degree of mobility of the source images occurs by classifying them into two groups: with no movement and with the presence of movement. This makes the encoding method less efficient from the standpoint of achieved compression for a given reception recovery error due to insufficient adaptation to the degree of mobility of the encoded fragments of the original image.

Целью изобретения является разработка способа кодирования и декодирования видеоинформации на основе ДКП-3, обеспечивающего увеличение степени сжатия видеоданных при заданной ошибке восстановления изображений на приеме за счет адаптации к изменению статистических свойств входных изображений. Адаптация к изменению статистических свойств входных изображений осуществляется путем перестановки порядка расположения фрагментов КДКП, полученных после выполнения ДКП-2 по оси времени, последующего выполнения ДКП-1 таким образом, что суммарное число ненулевых коэффициентов преобразования после выполнения ДКП-3 становится меньше по сравнению с числом ненулевых коэффициентов преобразования, получаемых после выполнения ДКП-3 без выполнения перестановки фрагментов ДКП-2.The aim of the invention is to develop a method of encoding and decoding video information based on DCT-3, which provides an increase in the degree of compression of video data for a given error of image recovery at the reception due to adaptation to changes in the statistical properties of input images. Adaptation to change the statistical properties of the input images is carried out by rearranging the order of the CDCF fragments obtained after performing DCT-2 along the time axis, subsequent execution of DCT-1 in such a way that the total number of non-zero transformation coefficients after performing DCT-3 becomes less than the number nonzero conversion coefficients obtained after performing DCT-3 without performing permutation of fragments of DCT-2.

В заявленном способе кодирования и декодирования видеоинформации на основе ДКП-3 поставленная цель достигается тем, что в известном способе кодирования и декодирования видеоинформации на основе ДКП-3, заключающемся в том, что сжимают последовательность телевизионных кадров, для чего эту последовательность разбивают на пакеты по n кадров, из которых формируют домены размером n×n×n пикселей, над каждым доменом размером n×n×n пикселей выполняют ДКП-3 для устранения временной и пространственной избыточности, полученные КДКП квантуют, кодируют для устранения статистической избыточности и передают в канал связи, принимают из канала связи сжатый видеопоток, сжатый видеопоток подвергают декодированию, деквантованию, ОДКП-3, в результате по сжатому сигналу восстанавливают исходный видеопоток. При этом после формирования домена размером n×n×n пикселей вычисляют КДКП по пространственным координатам x и y для каждого фрагмента домена. Затем выполняют перестановку фрагментов полученных КДКП по пространственным координатам x и y. Запоминают перестановку в виде вектора перестановки. После этого выполняют операцию ДКП по времени, КДКП квантуют и кодируют. Далее полученные квантованные КДКП и вектор перестановки и передают в канал связи, принимают из канала связи, декодируют КДКП и вектор перестановки, деквантуют КДКП. Над деквантованными КДКП выполняют операцию ОДКП по времени. Выполняют обратную перестановку фрагментов КДКП по пространственным координатам x и y. Восстанавливают домен размером n×n×n пикселей путем вычисления коэффициентов ОДКП по пространственным координатам x и у и в результате восстанавливают исходный видеопоток.In the claimed method of encoding and decoding video information based on DCT-3, the goal is achieved in that in the known method of encoding and decoding video information based on DCT-3, which consists in compressing a sequence of television frames, for which this sequence is divided into packets by n frames from which domains of size n × n × n pixels are formed, DCT-3 is performed over each domain of size n × n × n to eliminate temporal and spatial redundancy, the obtained CDCs are quantized, encoded To eliminate statistical redundancy, a compressed video stream is received from a communication channel, a compressed video stream is subjected to decoding, dequantization, ODKP-3, as a result, the original video stream is restored from the compressed signal. In this case, after the formation of a domain of size n × n × n pixels, the CDQP is calculated by the spatial coordinates x and y for each fragment of the domain. Then perform the rearrangement of the fragments obtained KDKP spatial coordinates x and y. Remember the permutation in the form of a permutation vector. After that, the DCT operation is performed in time, the CDQP is quantized and encoded. Next, the obtained quantized QDKP and permutation vector are transmitted to the communication channel, received from the communication channel, decoded QDKP and vector of permutation, and QDKW are de-coupled. Above the dequantized CDQDs, the DCTCH operation is performed in time. Perform the reverse permutation of the CDCF fragments by the spatial coordinates x and y. A domain of size n × n × n pixels is restored by calculating the DCCT coefficients from the spatial coordinates x and y, and as a result, the original video stream is restored.

Для перестановки фрагментов полученных КДКП по пространственным координатам x и y предварительно над полученными КДКП по пространственным координатам x и y выполняют операцию ДКП по времени. Далее квантуют полученные коКДКП, определяют число NZ ненулевых квантованных КДКП и запоминают его. Затем последовательно каждый фрагмент вычисленных КДКП по пространственным координатам x и y поочередно перемещают на место расположения остальных фрагментов вычисленных КДКП по координатам x и y, а на месте перемещенного фрагмента вычисленных КДКП по координатам x и y располагают фрагмент вычисленных КДКП по координатам x и y, вместо которого расположили перемещенный фрагмент вычисленных КДКП по координатам x и у. Затем для полученных после перемещения КДКП выполняют операцию ДКП по времени, квантуют и определяют число NZt ненулевых квантованных КДКП. Если NZt окажется меньше, чем ранее запомненное NZ, то выполняют переприсвоение NZ=NZt и запоминают порядок расположения фрагментов вычисленных КДКП по пространственным координатам x и y в виде вектора перестановки. В противном случае восстанавливают предыдущее расположение фрагментов вычисленных КДКП по пространственным координатам x и y.To rearrange the fragments of the obtained QDCP in spatial coordinates x and y, the DCT operation in time is preliminarily performed on the obtained QCD in spatial coordinates x and y. Next, the obtained co-QCDCs are quantized, the number NZ of nonzero quantized QCDCs is determined, and stored. Then, in succession, each fragment of the calculated QCDCs at the spatial coordinates x and y is alternately moved to the location of the remaining fragments of the calculated QCDCs at the x and y coordinates, and at the place of the moved fragment of the calculated QCDCs at the x and y coordinates, a fragment of the calculated QCDCs at the x and y coordinates is placed instead which located the displaced fragment of the calculated CDQP at the x and y coordinates. Then, for the obtained QDQDs, the DCT operation is performed in time, the number NZt of nonzero quantized QDQDs is quantized, and determined. If NZt turns out to be less than the previously memorized NZ, then reassignment NZ = NZt is performed and the order of the fragments of the calculated QDQPs in spatial coordinates x and y is stored in the form of a permutation vector. Otherwise, restore the previous location of the fragments of the calculated KDKP by spatial coordinates x and y.

Для запоминания порядка расположения фрагментов КДКП по пространственным координатам x и y формируют вектор перестановки размером 1×n элементов путем присвоения каждому его элементу Pi, где i=1, 2,…, n номера места расположения соответствующего фрагмента вычисленных КДКП по пространственным координатам x и y.To memorize the order of the location of the CDCF fragments by the spatial coordinates x and y, a permutation vector of 1 × n elements is formed by assigning each of its elements P i , where i = 1, 2, ..., n, the location number of the corresponding fragment of the calculated CDCC by the spatial coordinates x and y.

Благодаря новой совокупности существенных признаков в заявленном способе достигается указанный технический результат за счет изменения порядка расположения по оси времени фрагментов вычисленных КДКП по координатам x и y так, что суммарное количество ненулевых квантованных КДКП после выполнения трехмерного преобразования было минимальным.Thanks to the new set of essential features in the claimed method, the indicated technical result is achieved by changing the order of the location along the time axis of the fragments of the calculated QDQS at the x and y coordinates so that the total number of nonzero quantized QDQDs after the three-dimensional transformation was minimal.

Заявленный способ поясняется чертежами, на которых показаны:The claimed method is illustrated by drawings, which show:

на фиг.1 - структурная схема заявленного способа кодирования и декодирования видеоинформации на основе ДКП-3;figure 1 is a structural diagram of the claimed method of encoding and decoding video information based on DCT-3;

на фиг.2 - сущность заявленного способа на основе ДКП-3;figure 2 - the essence of the claimed method based on DCT-3;

на фиг.3 - формирование исходного домена в виде трехмерного массива размером n×n×n пикселей;figure 3 - the formation of the source domain in the form of a three-dimensional array of size n × n × n pixels;

на фиг.4 - вычисление КДКП по пространственным координатам x и y;figure 4 - calculation of the CDQP by the spatial coordinates x and y;

на фиг.5 - пример матрицы ДКП-2 размером 8×8 элементов;figure 5 is an example of a matrix DCT-2 with a size of 8 × 8 elements;

на фиг.6 - пример ДКП-1 над вычисленными КДКП по пространственным координатам x и y без перестановки и с перестановкой фрагментов;in Fig.6 is an example of DCT-1 over the calculated CDQA in spatial coordinates x and y without rearrangement and with rearrangement of fragments;

на фиг.7 - пример квантованных КДКП, после выполнения одномерного ДКП без перестановки фрагментов вычисленных КДКП по пространственным координатам x и y по оси времени;Fig. 7 is an example of quantized QDQDs, after performing a one-dimensional DCT without rearranging fragments of the calculated QDLC in spatial coordinates x and y along the time axis;

на фиг.8 - пример квантованных КДКП, после ДКП-1 с перестановкой фрагментов вычисленных КДКП по пространственным координатам x и y по оси времени;Fig. 8 is an example of quantized CDQPs after DCT-1 with permutation of fragments of the calculated CDQPs along spatial coordinates x and y along the time axis;

на фиг.9 - пример зависимостей количества ненулевых квантованных КДКП от номера фрагмента.Fig.9 is an example of the dependences of the number of nonzero quantized QDQDs on the fragment number.

Возможность реализации заявленного способа кодирования и декодирования видеоинформации на основе ДКП-3 объясняется следующим.The ability to implement the claimed method of encoding and decoding video information based on DCT-3 is explained as follows.

Кадры подвижного изображения характеризуются как внутрикадровой или пространственной избыточностью, так и межкадровой или временной избыточностью. Как правило, в известных стандартах сжатия Н.263, Н.264 для устранения внутрикадровой избыточности используют какое-либо декоррелирующее преобразование, например, ДКП-2. Для устранения межкадровой избыточности используют межкадровое предсказание на основе передачи векторов движения. В способах кодирования на основе ДКП-3 устранение внутрикадровой и межкадровой избыточности осуществляется путем декорреляции пикселей исходного изображения как по пространственным координатам x и y, так и по оси времени. В результате декорреляции большая часть коэффициентов ДКП-3 оказывается нулевой или близкой к нулю, что и обеспечивает уменьшение требуемого количества бит, необходимых для кодирования коэффициентов ДКП-3. Однако, как показывают практические исследования, декоррелирующее преобразование на основе косинусных функций является оптимальным только для заданного класса изображений. Этот класс изображений ограничивается низкочастотными (с малым числом мелких деталей) изображениями и, в случае подвижного видео, изображениями с медленным изменением сцен при переходе от кадра к кадру. На практике неоптимальность используемых преобразований, особенно во временной области, проявляется в сохранении большого числа ненулевых квантованных коэффициентов преобразования, что, в свою очередь, снижает достигаемый коэффициент сжатия. Устранение этого недостатка возможно на основе реализации процедуры адаптации в процессе кодирования двумя путями. Первый состоит в изменении используемого декоррелирующего преобразования, которое бы учитывало динамику изменения межкадровых различий. Второй состоит в изменении свойств входных данных, над которыми выполняется фиксированное декоррелирующее преобразование. При этом преобразование входных данных выполняют так, чтобы привести их к виду, оптимальному для используемого декоррелирующего преобразования.Frames of a moving image are characterized by both intraframe or spatial redundancy, and interframe or temporal redundancy. As a rule, in the well-known compression standards H.263, H.264, some decorrelation transformation, for example, DCT-2, is used to eliminate intraframe redundancy. To eliminate inter-frame redundancy, inter-frame prediction based on the transmission of motion vectors is used. In encoding methods based on DCT-3, elimination of intraframe and interframe redundancy is carried out by decorrelation of pixels of the original image both in spatial coordinates x and y, and along the time axis. As a result of decorrelation, most of the DCT-3 coefficients turn out to be zero or close to zero, which ensures a decrease in the required number of bits required for encoding DCT-3 coefficients. However, as practical studies show, the decorrelation transformation based on cosine functions is optimal only for a given class of images. This class of images is limited to low-frequency (with a small number of small details) images and, in the case of mobile video, images with a slow change in scenes when moving from frame to frame. In practice, the non-optimality of the transforms used, especially in the time domain, is manifested in the preservation of a large number of nonzero quantized transform coefficients, which, in turn, reduces the achieved compression ratio. The elimination of this drawback is possible on the basis of the implementation of the adaptation procedure in the coding process in two ways. The first is to change the decorrelation transform used, which would take into account the dynamics of changes in frame differences. The second consists in changing the properties of the input data, over which a fixed decorrelation transformation is performed. In this case, the conversion of the input data is performed in such a way as to bring them to a form optimal for the decorrelation conversion used.

Использование первого способа проблематично. Это обусловлено не только необходимостью решения сложной задачи вычисления оптимального преобразования, но и необходимостью передачи больших объемов данных, описывающих полученное преобразование, декодирующему устройству по каналу связи с ограниченной пропускной способностью. Поэтому в заявленном способе предложен подход на основе изменений свойств входных данных при сохранении неизменным используемого ДКП в качестве декоррелирующего. Изменять свойства входных данных предлагается на основе изменения порядка следования фрагментов коэффициентов, вычисленных на основе ДКП-2 по оси времени.Using the first method is problematic. This is due not only to the need to solve the complex problem of calculating the optimal conversion, but also to the necessity of transmitting large amounts of data describing the obtained transformation to a decoding device via a communication channel with limited bandwidth. Therefore, in the inventive method, an approach is proposed based on changes in the properties of the input data while maintaining unchanged used DCT as decorrelating. It is proposed to change the properties of the input data based on a change in the sequence of fragments of the coefficients calculated on the basis of DCT-2 along the time axis.

Наглядно основная идея предлагаемого способа показана на фиг.2. В левом верхнем углу представлен пример домена размером 8×8×8 пикселей. При этом 1-й, 2-й, 4-й и 8-й фрагменты домена состоят из одинаковых пикселей, равных 255 (показаны белым цветом), а 3-й, 5-й, 6-й и 7-й фрагменты домена состоят из одинаковых пикселей, равных 127 (показаны серым цветом). После выполнения операции ДКП-2 над каждым фрагментом домена получены 8 фрагментов КДКП по координатам x и y (правый верхний угол фиг.2). Все вычисленные КДКП по координатам x и y каждого фрагмента равны нулю за исключением коэффициентов с координатами x=1 и y=1, равных 2040, 2040, 1016, 2040, 1016, 1016, 1016 2040 для 1, 2, 3, 4, 5, 6, 7 и 8 фрагментов соответственно. После выполнения ДКП-1 над вычисленными КДКП по координатам x и y без перестановки фрагментов получено 8 ненулевых квантованных КДКП: 4321, 525, 669, -384, 724, -76, -277, -786. С другой стороны, если осуществить перестановку фрагментов вычисленных КДКП по координатам x и у, поменяв местами 2-й и 5-й фрагменты, то будет получено 2 ненулевых квантованных КДКП: 4322, 0, 0, 0, 1448, 0, 0, 0. Таким образом, перестановка фрагментов вычисленных КДКП по координатам x и y приводит к уменьшению числа ненулевых КДКП в данном примере в 4 раза, что, в свою очередь, приводит к повышению коэффициента сжатия приблизительно во столько же раз.Clearly, the main idea of the proposed method is shown in figure 2. In the upper left corner is an example of a domain with a size of 8 × 8 × 8 pixels. In this case, the 1st, 2nd, 4th and 8th fragments of the domain consist of the same pixels equal to 255 (shown in white), and the 3rd, 5th, 6th and 7th fragments of the domain consist of identical pixels equal to 127 (shown in gray). After performing the DCT-2 operation on each fragment of the domain, 8 CDQP fragments were obtained at the x and y coordinates (upper right corner of FIG. 2). All the calculated QDECs at the x and y coordinates of each fragment are equal to zero, except for the coefficients with the coordinates x = 1 and y = 1, equal to 2040, 2040, 1016, 2040, 1016, 1016, 1016 2040 for 1, 2, 3, 4, 5 , 6, 7, and 8 fragments, respectively. After performing DKP-1 on the calculated CDKPs at the x and y coordinates without rearranging the fragments, 8 nonzero quantized CDKPs were obtained: 4321, 525, 669, -384, 724, -76, -277, -786. On the other hand, if we rearrange the fragments of the calculated QDQPs along the x and y coordinates, interchanging the 2nd and 5th fragments, we will get 2 nonzero quantized QDQDs: 4322, 0, 0, 0, 1448, 0, 0, 0 Thus, the permutation of fragments of the calculated QDQDs along the x and y coordinates leads to a 4-fold decrease in the number of nonzero QDQDs in this example, which, in turn, leads to an increase in the compression coefficient by approximately the same factor.

Реализацию данной идеи можно пояснить на схеме, показанной на фиг.1. На вход кодера поступают домены в виде трехмерных массивов пикселей размером n×n×n. Формирование доменов размером n×n×n пикселей из пакета, состоящего из n кадров подвижного изображения, показано на фиг.3. Затем над каждым из n фрагментов домена вычисляют КДКП по координатам x и y, т.е. выполняют операцию ДКП-2, как показано на фиг.4. Данную операцию выполняют в блоке 11 (ДКП-2D фиг.1). Выполнение ДКП-2 осуществляется, например, как описано в кн.: Ахмед Н., Рао К. Ортогональные преобразования при обработке цифровых сигналов / Под ред. И.Б. Фоменко; Пер. с англ. - М.: Связь, 1980. Матричная запись ДКП-2 i-го фрагмента исходного домена, представленного матрицей [А]i, имеет вид:The implementation of this idea can be explained in the diagram shown in figure 1. The encoder receives domains in the form of three-dimensional arrays of pixels of size n × n × n. The formation of n × n × n pixel domains from a packet consisting of n frames of a moving image is shown in FIG. 3. Then, above each of the n fragments of the domain, the CDQP is calculated at the x and y coordinates, i.e. perform the operation DCT-2, as shown in figure 4. This operation is performed in block 11 (DCT-2D figure 1). Implementation of DCT-2 is carried out, for example, as described in the book: Ahmed N., Rao K. Orthogonal transformations in the processing of digital signals / Ed. I.B. Fomenko; Per. from English - M .: Svyaz, 1980. The matrix record DKP-2 of the i-th fragment of the source domain, represented by the matrix [A] i , has the form:

Figure 00000001
Figure 00000001

где [S]i - вычисленные КДКП по пространственным координатам x и y i-го фрагмента; [Г] и [Г]T - прямая и транспонированная (обратная) матрицы ДКП-2, определяемые массивом векторов { 1 n , 2 n cos ( 2 m 1 ) ( k 1 ) π 2 n } ,

Figure 00000002
m=1, 2,…, n; k=2,3,…,n. На фиг.5 показан пример матрицы ДКП-2 размером 8×8 элементов.where [S] i - calculated KDKP on spatial coordinates x and y of the i-th fragment; [Г] and [Г] T - direct and transposed (inverse) DKP-2 matrices defined by an array of vectors { one n , 2 n cos ( 2 m - one ) ( k - one ) π 2 n } ,
Figure 00000002
m = 1, 2, ..., n; k = 2,3, ..., n. Figure 5 shows an example of a matrix DKP-2 with a size of 8 × 8 elements.

Далее фрагменты вычисленных КДКП по координатам x и y поступают на блок перестановки. Перестановка фрагментов выполняется так, чтобы число ненулевых КДКП, полученных после выполнения ДКП-1 по оси времени, было минимальным. Данную операцию выполняют в блоке 12 (перестановка фиг.1). Перестановка фрагментов выполняется на основе вектора перестановки, который вычисляется в боке 16 (Блок управления перестановкой фиг.1) в зависимости от параметров NZ и NZt, получаемых с выхода блока квантования. После этого выполняют операцию ДКП по времени в блоке 13 (ДКП-1D фиг.1). Полученные КДКП квантуют в блоке 14 (квантование фиг.1) и кодируют в блоке 15 (кодирование фиг.1). Далее полученные квантованные КДКП и вектор перестановки и передают в канал связи (блок канал связи фиг.1), принимают из канала связи. Декодируют КДКП и вектор перестановки. Данную операцию выполняют в блоке 21 (декодирование фиг.1). Затем деквантуют КДКП в блоке 22 (деквантование фиг.1). Над деквантованными КДКП выполняют операцию ОДКП по времени в блоке 23 (ОДКП-1D фиг.1). После этого выполняют обратную перестановку фрагментов КДКП по пространственным координатам x и y в блоке 24 (перестановка фиг.1). Далее восстанавливают домен размером n×n×n пикселей путем вычисления коэффициентов ОДКП по пространственным координатам x и y в блоке 25 (ОДКП-2D фиг.1) и в результате восстанавливают исходный видеопоток.Further, fragments of the calculated CDQP along the x and y coordinates go to the permutation block. The permutation of the fragments is performed so that the number of nonzero QCDs obtained after performing DCT-1 along the time axis is minimal. This operation is performed in block 12 (permutation of figure 1). The permutation of the fragments is performed on the basis of the permutation vector, which is calculated in side 16 (Permutation control block of FIG. 1) depending on the parameters NZ and NZt obtained from the output of the quantization block. After that, the DCT operation is performed in time in block 13 (DCT-1D of FIG. 1). The obtained CDQPs are quantized in block 14 (quantization of FIG. 1) and encoded in block 15 (encoding of FIG. 1). Next, the obtained quantized QWCD and the permutation vector are transmitted to the communication channel (block communication channel of FIG. 1), received from the communication channel. Decode CDKP and permutation vector. This operation is performed in block 21 (decoding of FIG. 1). Then, the CDC is de-quantized in block 22 (de-quantization of FIG. 1). Above the dequantized CDC, the DCCT operation is performed in time in block 23 (DCC-1D of FIG. 1). After this, the reverse permutation of the CDCF fragments is performed by the spatial coordinates x and y in block 24 (permutation of FIG. 1). Next, a domain of size n × n × n pixels is restored by calculating the DCCT coefficients from the spatial coordinates x and y in block 25 (DCCT-2D of FIG. 1) and, as a result, the original video stream is restored.

Для наглядности на фиг.6 в левой части показан результат выполнения ДКП-1 над вычисленными КДКП по пространственным координатам x и y без перестановки, т.е. 1 фрагмент КДКП расположен на первом месте, второй - на втором и т.д. Вектор перестановки в этом случае имеет вид P=[1 2 3 4 5 6 7 8]. Число ненулевых квантованных КДКП в данном примере составило 107. В правой части фиг.6 показан результат выполнения ДКП-1 над вычисленными КДКП по пространственным координатам x и y после их перестановки. Найденный вектор перестановки в данном примере имеет вид P=[7 5 4 3 1 6 2 8], т.е. 7 фрагмент КДКП расположен на первом месте, 5 - на втором и т.д. в соответствии с вектором перестановки. Число ненулевых квантованных КДКП в данном случае составило 88, что меньше, чем в первом случае. Примеры квантованных КДКП, после выполнения ДКП-1 без перестановки фрагментов вычисленных КДКП по пространственным координатам x и y по оси времени и сперестановкой показаны на фиг.7 и 8 соответственно.For clarity, Fig. 6 on the left side shows the result of performing DCT-1 on the calculated CDQDs along spatial coordinates x and y without rearrangement, i.e. 1 fragment of the CDAC is in the first place, the second - in the second, etc. The permutation vector in this case has the form P = [1 2 3 4 5 6 7 8]. The number of nonzero quantized QDQDs in this example was 107. The right-hand side of Fig. 6 shows the result of performing DCT-1 on the calculated QDQDs according to the spatial coordinates x and y after their rearrangement. The found permutation vector in this example has the form P = [7 5 4 3 1 6 2 8], i.e. 7 fragment KDKP is located in the first place, 5 - in the second, etc. in accordance with the permutation vector. The number of nonzero quantized QDQDs in this case was 88, which is less than in the first case. Examples of quantized QDQDs, after performing DKP-1 without rearranging fragments of the calculated QDLCs in spatial coordinates x and y along the time axis and permutation are shown in Figs. 7 and 8, respectively.

Для оценки эффективности предлагаемого способа кодирования и декодирования на основе ДКП-3 проведено имитационное моделирование на ПЭВМ. В качестве показателя эффективности использовался коэффициент снижения количества ненулевых квантованных КДКП при перестановке фрагментов вычисленных КДКП по пространственным координатам x и y относительно количества ненулевых квантованных КДКП, полученных без перестановки.To assess the effectiveness of the proposed method of encoding and decoding based on DCT-3, simulation was carried out on a PC. As a performance indicator, we used the coefficient of decreasing the number of nonzero quantized QDQDs when rearranging fragments of the calculated QDQPs in spatial coordinates x and y relative to the number of nonzero quantized QDQPs obtained without permutation.

В качестве исходных подвижных изображений использовался набор тестовых изображений размером 576×720 пикселей в формате YUV 4:4:4 и кадровой скоростью 25 кадров/с. Размер исходного домена составил 8×8×16 пикселей.A set of test images of 576 × 720 pixels in YUV 4: 4: 4 format and a frame rate of 25 frames / s were used as initial moving images. The size of the source domain was 8 × 8 × 16 pixels.

На фиг.9 показаны характерные зависимости количества ненулевых квантованных КДКП от номера фрагмента:Figure 9 shows the characteristic dependences of the number of nonzero quantized QDQDs on the fragment number:

а) без перестановки фрагментов;a) without rearrangement of fragments;

б) с перестановкой фрагментов;b) with rearrangement of fragments;

с) величина разности между количеством КДКП, полученных с перестановкой и без перестановки.c) the magnitude of the difference between the number of KDKP obtained with permutation and without permutation.

Определим коэффициент эффективности как K э ф = ( N б п N п N б п ) 100 % ,

Figure 00000003
We define the efficiency coefficient as K uh f = ( N b P - N P N b P ) one hundred % ,
Figure 00000003

Nбп - суммарное количество ненулевых квантованных КДКП, полученных без перестановки фрагментов; Nп - суммарное количество ненулевых квантованных КДКП, полученных с перестановкой фрагментов.N bp - the total number of nonzero quantized QCDP obtained without rearrangement of fragments; N p - the total number of nonzero quantized QCDC obtained with the permutation of fragments.

Результаты имитационного моделирования разработанного способа показали, что выигрыш составил 15÷20% по сравнению с прототипом. Как показали исследования, уменьшение количества ненулевых квантованных КДКП на 15÷20% приводит к такой же величине увеличения коэффициента сжатия при сохранении прежнего качества восстановленных изображений, что подтверждает достижения цели изобретения.The results of simulation of the developed method showed that the gain was 15 ÷ 20% compared with the prototype. Studies have shown that a decrease in the number of nonzero quantized QDQDs by 15–20% leads to the same increase in the compression ratio while maintaining the previous quality of the reconstructed images, which confirms the achievement of the purpose of the invention.

Claims (3)

1. Способ кодирования и декодирования видеоинформации на основе трехмерного дискретного косинусного преобразования (ДКП), заключающийся в том, что сжимают последовательность телевизионных кадров, для чего эту последовательность разбивают на пакеты по n кадров, из которых формируют домены размером n×n×n пикселей, над каждым доменом размером n×n×n пикселей выполняют трехмерное ДКП для устранения временной и пространственной избыточности, полученные коэффициенты ДКП квантуют, кодируют для устранения статистической избыточности и передают в канал связи, принимают из канала связи сжатый видеопоток, сжатый видеопоток подвергают декодированию, деквантованию, обратному трехмерному ДКП, в результате по сжатому сигналу восстанавливают исходный видеопоток, отличающийся тем, что после формирования домена размером n×n×n пикселей вычисляют коэффициенты ДКП по пространственным координатам x и y для каждого фрагмента домена, затем выполняют перестановку фрагментов полученных коэффициентов ДКП по пространственным координатам x и y, запоминают перестановку в виде вектора перестановки, выполняют операцию ДКП по времени, коэффициенты ДКП квантуют, кодируют полученные квантованные коэффициенты ДКП и вектор перестановки и передают в канал связи, принимают из канала связи, декодируют коэффициенты ДКП и вектор перестановки, деквантуют коэффициенты ДКП, над деквантованными коэффициентами ДКП выполняют операцию обратного ДКП по времени, выполняют обратную перестановку фрагментов коэффициентов ДКП по пространственным координатам x и y, восстанавливают домен размером n×n×n пикселей путем вычисления коэффициентов обратного ДКП по пространственным координатам x и y и в результате восстанавливают исходный видеопоток.1. A method of encoding and decoding video information based on three-dimensional discrete cosine transform (DCT), which consists in compressing a sequence of television frames, for which this sequence is divided into packets of n frames, from which domains of n × n × n pixels are formed, over each domain of size n × n × n pixels, three-dimensional DCT is performed to eliminate temporal and spatial redundancy, the obtained DCT coefficients are quantized, encoded to eliminate statistical redundancy, and transmitted the compressed video stream is received from the communication channel, the compressed video stream is decoded, dequantized, the inverse of the three-dimensional DCT, as a result, the original video stream is restored from the compressed signal, characterized in that, after the formation of a domain of n × n × n pixels, DCT coefficients are calculated by spatial the x and y coordinates for each domain fragment, then they rearrange the fragments of the obtained DCT coefficients by the spatial coordinates x and y, remember the permutation in the form of a permutation vector , perform the DCT operation in time, DCT coefficients are quantized, encode the obtained quantized DCT coefficients and a permutation vector and transmit to the communication channel, receive from the communication channel, decode DCT coefficients and a permutation vector, deduct DCT coefficients, perform reverse DCT operation on dequantized DCT coefficients time, perform reverse permutation of fragments of DCT coefficients by spatial coordinates x and y, restore a domain of size n × n × n pixels by calculating the coefficients of the inverse DCT on spatial coordinates x and y and as a result restore the original video stream. 2. Способ по п.1, отличающийся тем, что для перестановки фрагментов полученных коэффициентов ДКП по пространственным координатам x и у предварительно над полученными коэффициентами ДКП по пространственным координатам x и y выполняют операцию ДКП по времени, квантуют полученные коэффициенты ДКП, определяют число NZ ненулевых квантованных коэффициентов ДКП и запоминают его, затем последовательно каждый фрагмент вычисленных коэффициентов ДКП по пространственным координатам x и у поочередно перемещают на место расположения остальных фрагментов вычисленных коэффициентов ДКП по координатам x и у, а на месте перемещенного фрагмента вычисленных коэффициентов ДКП по координатам x и у располагают фрагмент вычисленных коэффициентов ДКП по координатам x и y, вместо которого расположили перемещенный фрагмент вычисленных коэффициентов ДКП по координатам x и y, для полученных после перемещения коэффициентов ДКП выполняют операцию ДКП по времени, квантуют и определяют число NZt ненулевых квантованных коэффициентов ДКП и, если NZt окажется меньше, чем ранее запомненное NZ, то выполняют переприсвоение NZ=NZt и запоминают порядок расположения фрагментов вычисленных коэффициентов ДКП по пространственным координатам x и y в виде вектора перестановки, в противном случае восстанавливают предыдущее расположение фрагментов вычисленных коэффициентов ДКП по пространственным координатам x и y.2. The method according to claim 1, characterized in that to rearrange the fragments of the obtained DCT coefficients in the spatial coordinates x and y, the DCT operation in time is performed on the obtained DCT coefficients in the spatial coordinates x and y, the obtained DCT coefficients are quantized, the number NZ is determined quantized DCT coefficients and remember it, then each fragment of the calculated DCT coefficients in spatial coordinates x and y is successively moved to the location of the remaining fragments of the calculated DCT coefficients at the x and y coordinates, and at the place of the moved fragment of the calculated DCT coefficients at the x and y coordinates, there is a fragment of the calculated DCT coefficients at the x and y coordinates, instead of which there is a displaced fragment of the calculated DCT coefficients at the x and y coordinates, for the obtained after moving the DCT coefficients, perform the DCT operation in time, quantize and determine the number NZt of nonzero quantized DCT coefficients and, if NZt is less than the previously stored NZ, then perform assignment NZ = NZt and remember the order of fragments of the calculated DCT coefficients in the spatial coordinates x and y in the form of a permutation vector; otherwise, the previous arrangement of fragments of the calculated DCT coefficients in the spatial coordinates of x and y is restored. 3. Способ по п.1, отличающийся тем, что для запоминания порядка расположения фрагментов вычисленных коэффициентов ДКП по пространственным координатам x и y формируют вектор перестановки размером 1×n элементов путем присвоения каждому его элементу Pi, где i=1, 2,…, n номера места расположения соответствующего фрагмента вычисленных коэффициентов ДКП по пространственным координатам x и y. 3. The method according to claim 1, characterized in that for storing the order of the fragments of the calculated DCT coefficients by the spatial coordinates x and y form a permutation vector of 1 × n elements by assigning each of its elements P i , where i = 1, 2, ... , n are the numbers of the location of the corresponding fragment of the calculated DCT coefficients with respect to the spatial coordinates x and y.
RU2014113585/08A 2014-04-07 2014-04-07 Video encoding and decoding method based on three-dimensional discrete cosine transform RU2557449C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2014113585/08A RU2557449C1 (en) 2014-04-07 2014-04-07 Video encoding and decoding method based on three-dimensional discrete cosine transform

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014113585/08A RU2557449C1 (en) 2014-04-07 2014-04-07 Video encoding and decoding method based on three-dimensional discrete cosine transform

Publications (1)

Publication Number Publication Date
RU2557449C1 true RU2557449C1 (en) 2015-07-20

Family

ID=53611839

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014113585/08A RU2557449C1 (en) 2014-04-07 2014-04-07 Video encoding and decoding method based on three-dimensional discrete cosine transform

Country Status (1)

Country Link
RU (1) RU2557449C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2799099C1 (en) * 2023-03-27 2023-07-04 Общество с ограниченной ответственностью "МИНИТЕХ" Method for processing video information based on three-dimensional discrete cosine transformation with motion compensation

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933193A (en) * 1996-03-25 1999-08-03 Trw Inc. Method and system for three-dimensional compression of digital video signals
RU2209527C2 (en) * 1996-11-28 2003-07-27 Томсон Мюльтимедиа Method and device for video data compression
RU2261532C1 (en) * 2004-05-17 2005-09-27 Военный университет связи Method for compressing and restoring messages
RU2375838C1 (en) * 2008-11-19 2009-12-10 Федеральное государственное унитарное предприятие "Научно-исследовательский институт телевидения" Method of coding and decoding video information based on three-dimensional discrete cosine transformation
RU2417518C2 (en) * 2005-08-12 2011-04-27 Майкрософт Корпорейшн Efficient coding and decoding conversion units
RU2420912C1 (en) * 2009-11-24 2011-06-10 Федеральное государственное унитарное предприятие "Научно-исследовательский институт телевидения" Method of distributing and transcoding video content
US8483269B2 (en) * 2005-12-09 2013-07-09 Electronics And Telecommunications Research Institute System and method for transmitting/receiving three dimensional video based on digital broadcasting

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933193A (en) * 1996-03-25 1999-08-03 Trw Inc. Method and system for three-dimensional compression of digital video signals
US5936669A (en) * 1996-03-25 1999-08-10 Trw Inc. Method and system for three-dimensional compression of digital video signals
RU2209527C2 (en) * 1996-11-28 2003-07-27 Томсон Мюльтимедиа Method and device for video data compression
RU2261532C1 (en) * 2004-05-17 2005-09-27 Военный университет связи Method for compressing and restoring messages
RU2417518C2 (en) * 2005-08-12 2011-04-27 Майкрософт Корпорейшн Efficient coding and decoding conversion units
US8483269B2 (en) * 2005-12-09 2013-07-09 Electronics And Telecommunications Research Institute System and method for transmitting/receiving three dimensional video based on digital broadcasting
RU2375838C1 (en) * 2008-11-19 2009-12-10 Федеральное государственное унитарное предприятие "Научно-исследовательский институт телевидения" Method of coding and decoding video information based on three-dimensional discrete cosine transformation
RU2420912C1 (en) * 2009-11-24 2011-06-10 Федеральное государственное унитарное предприятие "Научно-исследовательский институт телевидения" Method of distributing and transcoding video content

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2799099C1 (en) * 2023-03-27 2023-07-04 Общество с ограниченной ответственностью "МИНИТЕХ" Method for processing video information based on three-dimensional discrete cosine transformation with motion compensation

Similar Documents

Publication Publication Date Title
KR102548737B1 (en) Apparatus and method for image coding and decoding
Kang et al. Distributed compressive video sensing
KR100788220B1 (en) Quality based image compression
Chen et al. Dynamic measurement rate allocation for distributed compressive video sensing
JP6858277B2 (en) Directional intra-predictive coding
US7702170B2 (en) Method of block coding of image
JP5838258B2 (en) Method and apparatus for lossy compression encoding data and corresponding method and apparatus for reconstructing data
RU2412473C2 (en) Reversible two-dimensional pre- and post-filtration for overlapping biorthogonal transformation
CN108028931A (en) Method and device for the adaptive inter prediction of coding and decoding video
KR20150129715A (en) Method and apparatus for applying secondary transforms on enhancement-layer residuals
Sathiyanathan Medical image compression using view compensated wavelet transform
US10091531B2 (en) Image coding and decoding methods and apparatuses
CN109196861B (en) Method for decoding digital image, encoding method and device
JP2018509070A (en) Digital image coding method, decoding method, apparatus, and accompanying computer program
WO2014071096A1 (en) Preserving rounding errors in video coding
Deshlahra et al. A comparative study of DCT, DWT & hybrid (DCT-DWT) transform
RU2557449C1 (en) Video encoding and decoding method based on three-dimensional discrete cosine transform
CN107948644B (en) Underwater image compression method and transmission method
Zhao et al. Compressive-sensed image coding via stripe-based DPCM
KR20170058335A (en) Method and apparatus for encoding and decoding video signal adaptively on basis of separable transformation
Naidu et al. A novel framework for JPEG image compression using baseline coding with parallel process
RU2375838C1 (en) Method of coding and decoding video information based on three-dimensional discrete cosine transformation
US10750206B2 (en) Method for encoding and decoding images, device for encoding and decoding images, and corresponding computer programs
CN100477789C (en) A method of inter-frame reinforcement based on Moving Joint Picture Experts Group 2000
RU2434358C1 (en) Method of compressing and reconstructing moving colour video images

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20160408