RU2616176C1 - Method for encoding-decoding of digital video images - Google Patents

Method for encoding-decoding of digital video images Download PDF

Info

Publication number
RU2616176C1
RU2616176C1 RU2016111518A RU2016111518A RU2616176C1 RU 2616176 C1 RU2616176 C1 RU 2616176C1 RU 2016111518 A RU2016111518 A RU 2016111518A RU 2016111518 A RU2016111518 A RU 2016111518A RU 2616176 C1 RU2616176 C1 RU 2616176C1
Authority
RU
Russia
Prior art keywords
decoding
matrix
encoding
image
function
Prior art date
Application number
RU2016111518A
Other languages
Russian (ru)
Inventor
Дмитрий Сергеевич Калистратов
Евгений Иванович Минаков
Original Assignee
Федеральное государственное бюджетное образовательное учреждение высшего образования "Тульский государственный университет" (ТулГУ)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное бюджетное образовательное учреждение высшего образования "Тульский государственный университет" (ТулГУ) filed Critical Федеральное государственное бюджетное образовательное учреждение высшего образования "Тульский государственный университет" (ТулГУ)
Priority to RU2016111518A priority Critical patent/RU2616176C1/en
Application granted granted Critical
Publication of RU2616176C1 publication Critical patent/RU2616176C1/en

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

FIELD: information technology.
SUBSTANCE: method for encoding-decoding of digital video images. According to the metod, in the process of encoding of the wavelet transform to the low frequency component for smoothing the initial function an additional high frequency component is added rowwise and used for encoding, but suppressed on the decoding side by using a lowpass filter. And encoding is implemented using a composite function with two goals of increasing data compression ratio and maintaining the quality of the decoded image, and the decoder filter characteristics are considered as a restriction at the encoding stage.
EFFECT: increased ratio of video image compression with a slight decrease of the decoded image quality with respect to the images having a high frequency nature of the signal spectrum.
8 dwg, 3 tbl

Description

Техническое решение относится к области цифровой обработки сигналов, в частности к способам кодирования-декодирования цифровых видеоизображений, и может быть применено в системах хранения и обработки визуальной информации.The technical solution relates to the field of digital signal processing, in particular to methods of encoding-decoding digital video images, and can be applied in storage and processing of visual information.

Известен аналогичный способ кодирования-декодирования цифровых видеоизображений на основе стандарта кодирования MPEG-4, описанный в книге Яна Ричардсона «Видеокодирование Н.264 и MPEG-4 - стандарты нового поколения» Москва: Техносфера, 2005. - 368 с., с. 197 и состоящий в следующем: при кодировании каждого очередного изображения кодером опрашивают датчик цветного изображения, далее полученное изображение представляют тремя исходными цветовыми матрицами, соответствующими красному, зеленому и синему цветовым компонентам изображения, после чего сохраняют исходные цветовые матрицы в памяти кодера, затем к каждой исходной цветовой матрице построчно применяют вейвлет-преобразование, в ходе которого получают низкочастотный и высокочастотный компоненты матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют квантование и кодирование с пространственным прогнозом, затем к высокочастотному компоненту текущей матрицы применяют квантование, сканирование и кодирование по методу нулевых деревьев, а после этого к предварительным кодам обоих частотных компонентов текущей матрицы применяют энтропийное арифметическое кодирование, после кодирования всех исходных матриц набор полученных кодов записывают в запоминающее устройство, декодером в процессе проведения декодирования изображения сначала из запоминающего устройства извлекают набор кодов изображения, далее для каждой декодируемой цветовой матрицы сначала применяют к полученным кодам энтропийное арифметическое декодирование, в результате чего получают раздельные коды низкочастотного и высокочастотного компонентов матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют декодирование с пространственным прогнозом и деквантование, затем к высокочастотному компоненту текущей матрицы применяют декодирование по методу нулевых деревьев, обратное сканирование и деквантование, после чего по декодированным низкочастотным и высокочастотным компонентам посредством обратного вейвлет-преобразования восстанавливают исходную текущую матрицу изображения, а после декодирования всех цветовых матриц восстанавливают исходное изображение.There is a similar method of encoding-decoding digital video images based on the MPEG-4 encoding standard described in the book by Jan Richardson, “H.264 Video Encoding and MPEG-4 - New Generation Standards” Moscow: Technosphere, 2005. - 368 p., P. 197 and consisting of the following: when encoding each successive image, the encoder polls the color image sensor, then the resulting image is represented by three source color matrices corresponding to the red, green and blue color components of the image, after which the original color matrices are stored in the encoder memory, then to each source wavelet transform is applied row by row to the color matrix, during which the low-frequency and high-frequency components of the matrix are obtained, and then to the low-frequency the component of the current matrix is sequentially applied quantization and coding with spatial prediction, then quantization, scanning and coding according to the zero-tree method are applied to the high-frequency component of the current matrix, and then entropy arithmetic coding is applied to the preliminary codes of both frequency components of the current matrix, after encoding all the source matrices the set of received codes is written to the storage device by the decoder in the process of decoding the sn At the beginning, a set of image codes is extracted from the storage device, then for each decoded color matrix, the entropy arithmetic decoding is first applied to the obtained codes, as a result of which separate codes of the low-frequency and high-frequency components of the matrix are obtained, after which spatial prediction decoding is sequentially applied to the low-frequency component of the current matrix, and dequantization, then decoding by the method of zero d is applied to the high-frequency component of the current matrix revev, dequantization and reverse scan, and then decoded by the low-frequency and high-frequency components by the inverse wavelet transform is reduced starting current matrix image, and after decoding all color matrixes restore the original image.

Недостатком указанного аналога является низкое значение коэффициента компрессии видеоизображений, имеющих высокочастотный характер спектра сигнала.The disadvantage of this analogue is the low value of the compression ratio of video images having a high-frequency character of the signal spectrum.

В качестве прототипа выбран способ кодирования-декодирования цифровых видеоизображений на основе стандарта кодирования MPEG-4, описанный в книге Яна Ричардсона «Видеокодирование Н.264 и MPEG-4 - стандарты нового поколения» Москва: Техносфера, 2005. - 368 с., с. 197 и состоящий в следующем: при кодировании каждого очередного изображения кодером опрашивают датчик цветного изображения, далее полученное изображение представляют тремя исходными цветовыми матрицами, соответствующими красному, зеленому и синему цветовым компонентам изображения, после чего сохраняют исходные цветовые матрицы в памяти кодера, затем к каждой исходной цветовой матрице построчно применяют вейвлет-преобразование, в ходе которого получают низкочастотный и высокочастотный компоненты матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют квантование и кодирование с пространственным прогнозом, затем к высокочастотному компоненту текущей матрицы применяют квантование, сканирование и кодирование по методу нулевых деревьев, а после этого к предварительным кодам обоих частотных компонентов текущей матрицы применяют энтропийное арифметическое кодирование, после кодирования всех исходных матриц набор полученных кодов записывают в запоминающее устройство, декодером в процессе проведения декодирования изображения сначала из запоминающего устройства извлекают набор кодов изображения, далее для каждой декодируемой цветовой матрицы сначала применяют к полученным кодам энтропийное арифметическое декодирование, в результате чего получают раздельные коды низкочастотного и высокочастотного компонентов матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют декодирование с пространственным прогнозом и деквантование, затем к высокочастотному компоненту текущей матрицы применяют декодирование по методу нулевых деревьев, обратное сканирование и деквантование, после чего по декодированным низкочастотным и высокочастотным компонентам посредством обратного вейвлет-преобразования восстанавливают исходную текущую матрицу изображения, а после декодирования всех цветовых матриц восстанавливают исходное изображение.As a prototype, a method of encoding-decoding digital video images based on the MPEG-4 encoding standard described in the book by Jan Richardson, “H.264 Video Encoding and MPEG-4 — New Generation Standards,” Moscow: Technosphere, 2005. — 368 p., P. 197 and consisting of the following: when encoding each successive image, the encoder polls the color image sensor, then the resulting image is represented by three source color matrices corresponding to the red, green and blue color components of the image, after which the original color matrices are stored in the encoder memory, then to each source wavelet transform is applied row by row to the color matrix, during which the low-frequency and high-frequency components of the matrix are obtained, and then to the low-frequency the component of the current matrix is sequentially applied quantization and coding with spatial prediction, then quantization, scanning and coding according to the zero-tree method are applied to the high-frequency component of the current matrix, and then entropy arithmetic coding is applied to the preliminary codes of both frequency components of the current matrix, after encoding all the source matrices the set of received codes is written to the storage device by the decoder in the process of decoding the sn At the beginning, a set of image codes is extracted from the storage device, then for each decoded color matrix, the entropy arithmetic decoding is first applied to the obtained codes, as a result of which separate codes of the low-frequency and high-frequency components of the matrix are obtained, after which spatial prediction decoding is sequentially applied to the low-frequency component of the current matrix, and dequantization, then decoding by the method of zero d is applied to the high-frequency component of the current matrix revev, dequantization and reverse scan, and then decoded by the low-frequency and high-frequency components by the inverse wavelet transform is reduced starting current matrix image, and after decoding all color matrixes restore the original image.

Недостатком прототипа является низкое значение коэффициента компрессии видеоизображений, имеющих высокочастотный характер спектра сигнала.The disadvantage of the prototype is the low value of the compression ratio of video images having a high-frequency nature of the signal spectrum.

Задачей технического решения является существенное повышение коэффициента компрессии видеоизображений при незначительном снижении качества декодированного изображения применительно к изображениям, имеющим высокочастотный характер спектра сигнала.The objective of the technical solution is to significantly increase the compression ratio of video images with a slight decrease in the quality of the decoded image as applied to images having a high-frequency character of the signal spectrum.

Поставленная задача решается благодаря тому, что в способе кодирования-декодирования цифровых видеоизображений, содержащем следующую последовательность действий: при кодировании каждого очередного изображения кодером опрашивают датчик цветного изображения, далее полученное изображение представляют тремя исходными цветовыми матрицами, соответствующими красному, зеленому и синему цветовым компонентам изображения, после чего сохраняют исходные цветовые матрицы в памяти кодера, затем к каждой исходной цветовой матрице построчно применяют вейвлет-преобразование, в ходе которого получают низкочастотный и высокочастотный компоненты матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют квантование и кодирование с пространственным прогнозом, затем к высокочастотному компоненту текущей матрицы применяют квантование, сканирование и кодирование по методу нулевых деревьев, а после этого к предварительным кодам обоих частотных компонентов текущей матрицы применяют энтропийное арифметическое кодирование, после кодирования всех исходных матриц набор полученных кодов записывают в запоминающее устройство, декодером в процессе проведения декодирования изображения сначала из запоминающего устройства извлекают набор кодов изображения, далее для каждой декодируемой цветовой матрицы сначала применяют к полученным кодам энтропийное арифметическое декодирование, в результате чего получают раздельные коды низкочастотного и высокочастотного компонентов матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют декодирование с пространственным прогнозом и деквантование, затем к высокочастотному компоненту текущей матрицы применяют декодирование по методу нулевых деревьев, обратное сканирование и деквантование, после чего по декодированным низкочастотным и высокочастотным компонентам посредством обратного вейвлет-преобразования восстанавливают исходную текущую матрицу изображения, а после декодирования всех цветовых матриц восстанавливают исходное изображение; предусмотрены следующие отличия: для каждой строки каждой цветовой матрицы низкочастотного компонента вейвлет-преобразования в кодере после квантования, но перед кодированием с пространственным прогнозом применяют построчную оптимизацию в соответствии с системой уравнений

Figure 00000001
The problem is solved due to the fact that in the method of encoding-decoding digital video images containing the following sequence of actions: when encoding each next image, the encoder polls the color image sensor, then the resulting image is represented by three source color matrices corresponding to the red, green and blue color components of the image, after which the source color matrices are stored in the encoder memory, then line by line at each source color matrix the wavelet transform is changed, during which the low-frequency and high-frequency components of the matrix are obtained, after which quantization and coding with spatial prediction are sequentially applied to the low-frequency component of the current matrix, then quantization, scanning and coding by the zero-tree method are applied to the high-frequency component of the current matrix, and after of this, entropy arithmetic coding is applied to the preliminary codes of both frequency components of the current matrix, after coding of all and similar matrices, the set of received codes is written to the storage device, the decoder, in the process of decoding the image, first extracts the set of image codes from the storage device, then for each decoded color matrix, the entropy arithmetic decoding is first applied to the obtained codes, as a result of which separate codes of the low-frequency and high-frequency components are obtained matrices, after which decoding with transient prediction and dequantization, then zero-tree decoding, inverse scanning and dequantization are applied to the high-frequency component of the current matrix, then the decoded low-frequency and high-frequency components use the inverse wavelet transform to restore the original current image matrix, and after decoding all color matrices, the original picture; the following differences are provided: for each row of each color matrix of the low-frequency component of the wavelet transform in the encoder after quantization, but before coding with spatial prediction, row-wise optimization is applied in accordance with the system of equations
Figure 00000001

w(x) - входная функция вейвлет-преобразования после квантования;w (x) is the input function of the wavelet transform after quantization;

q(x) - добавочная функция;q (x) is an additional function;

f(x) - функция выхода фильтра;f (x) is the filter output function;

λ(х) - множитель Лагранжа;λ (x) is the Lagrange multiplier;

c1, c2 - весовые коэффициенты;c 1 , c 2 - weighting factors;

а - коэффициент фильтра; a is the filter coefficient;

k - коэффициент пропорциональности;k is the coefficient of proportionality;

x – аргумент,x is an argument

с неизвестными q(x),

Figure 00000002
, λ(х), причем для кодирования используют производную суммарной функцииwith unknowns q (x),
Figure 00000002
, λ (x), and for encoding using the derivative of the total function

Figure 00000003
Figure 00000003

s(x) - суммарная функция;s (x) is the total function;

w(x) - входная функция вейвлет-преобразования после квантования;w (x) is the input function of the wavelet transform after quantization;

q(x) - добавочная функция;q (x) is an additional function;

а в декодере после декодирования с пространственным прогнозом, но перед деквантованием применяют фильтрацию по формулеand in the decoder, after decoding with spatial prediction, but before dequantization, filtering according to the formula

Figure 00000004
Figure 00000004

s(x) - суммарная функция;s (x) is the total function;

Figure 00000002
- функция выхода фильтра;
Figure 00000002
- filter output function;

а - коэффициент фильтра; a is the filter coefficient;

k - коэффициент пропорциональности;k is the coefficient of proportionality;

x – аргумент,x is an argument

при неизвестной

Figure 00000002
, при этом значения функции s(x) вычисляют предварительно по ее производной и с учетом краевых условий, причем и в кодере, и в декодере краевые условия выбирают одинаковыми для соответствующих строк и задают предварительно, значения коэффициентов c1, c2 в кодере задают предварительно, значения коэффициентов а, k для кодера и декодера принимают одинаковыми и задают предварительно, а в процессе кодирования-декодирования используют дискретные представления указанных формул, в которых аргумент x принимают в качестве номера элемента текущей строки преобразования.with unknown
Figure 00000002
, while the values of the function s (x) are preliminarily calculated according to its derivative and taking into account the boundary conditions, both in the encoder and in the decoder, the boundary conditions are chosen the same for the corresponding lines and are pre-set, the values of the coefficients c 1 , c 2 in the encoder are pre-set , the values of the coefficients, k for the encoder and the decoder receiving the same and is set in advance, and in the process of encoding-decoding using digital representations of said formulas in which the argument x is taken as the current item numbers element Oka conversion.

Устройство для реализации предложенного способа кодирования-декодирования цифровых видеоизображений состоит из ноутбука «SAMSUNG R530», цифровой web-камеры «hama АС-150», подставки для web-камеры, освещаемого объекта, источника освещения объекта, разветвителя, источника электричества, съемочной площадки. К ноутбуку 1 подключена цифровая web-камера 2, находящаяся на подставке 3, предназначенная для съемки поверхности объекта 4, освещаемого источником освещения 5. К разветвителю 6 подключены ноутбук и источник освещения, а сам разветвитель подключен к источнику электричества 7. Все перечисленные выше элементы расположены на съемочной площадке 8. Ноутбук и источник освещения находятся во включенном состоянии, причем на ноутбуке загружено программное обеспечение для проведения сравнительного анализа прототипного и заявляемого способов кодирования-декодирования цифровых видеоизображений. Ноутбук снабжен программным обеспечением, позволяющим осуществлять заявляемый способ в отдельности, а также осуществлять эксперимент по проведению сравнительного анализа моделей видеокодеков (кодер и декодер) на базах прототипного и заявляемого способов. В эксперименте по сравнению двух моделей видеокодеков обрабатывается один и тот же кадр, получаемый программно с web-камеры и принимаемый в качестве входного изображения. Чувствительность web-камеры, а также расстояние от съемочного объекта до источника освещения подобраны таким образом, чтобы для всех цветовых компонентов всех пикселов входного изображения их относительные значения яркости не превышали бы значения дискретного максимума в 254 отн. ед. яркости при программном представлении каждого цветового компонента 1-им байтом, то есть, чтобы в изображении не было «засветки». Эксперимент устроен следующим образом: сначала изображение записывается и обрабатывается моделью видеокодека на базе прототипного способа, при этом в памяти ноутбука сохраняется обрабатываемое изображение, после чего сохраненное изображение обрабатывается моделью видеокодека на базе заявляемого способа. Все параметры и технические характеристики перечисленных выше конструктивных элементов, а также схемы и параметры сравниваемых моделей видеокодеков при прочих равных условиях представлены в таблицах (Таблица 1) и (Таблица 2) и на фигурах (ФИГ. 1, ФИГ. 2, ФИГ. 3, ФИГ. 4).A device for implementing the proposed method for encoding / decoding digital video images consists of a SAMSUNG R530 laptop, a hama AC-150 digital web camera, a stand for a web camera, an illuminated object, an object light source, a splitter, an electricity source, and a film set. A digital webcam 2 is connected to the laptop 1, located on the stand 3, designed to capture the surface of the object 4 illuminated by the light source 5. A laptop and a light source are connected to the splitter 6, and the splitter is connected to an electricity source 7. All of the above items are located on the set 8. The laptop and the light source are in the on state, and the laptop is loaded with software for comparative analysis of the prototype and the claimed encoding methods digital video decoding. The laptop is equipped with software that allows you to implement the inventive method separately, as well as carry out an experiment to conduct a comparative analysis of video codec models (encoder and decoder) on the basis of the prototype and the inventive methods. In an experiment, by comparing two models of video codecs, the same frame is processed that is obtained programmatically from a web camera and accepted as an input image. The sensitivity of the web-camera, as well as the distance from the shooting object to the light source, are selected so that for all color components of all pixels of the input image, their relative brightness values would not exceed a discrete maximum of 254 rel. units brightness when programmatically presenting each color component with 1 byte, that is, so that there is no “flare” in the image. The experiment is organized as follows: first, the image is recorded and processed by the video codec model based on the prototype method, while the processed image is stored in the laptop’s memory, after which the saved image is processed by the video codec model based on the proposed method. All parameters and technical characteristics of the above structural elements, as well as schemes and parameters of the compared models of video codecs, ceteris paribus, are presented in tables (Table 1) and (Table 2) and in the figures (FIG. 1, FIG. 2, FIG. 3, FIG. 4).

Figure 00000005
Figure 00000005

Figure 00000006
Figure 00000006

Figure 00000007
Figure 00000007

Описанный выше способ кодирования-декодирования цифровых видеоизображений осуществляется следующим образом: на ноутбуке запускают программный вариант по осуществлению заявляемого способа в отдельности или эксперимент по проведению сравнительного анализа моделей видеокодеков на базах прототипного и заявляемого способов нажатием соответствующей кнопки. После этого ожидают окончания обработки изображения и вывода на экран результатов осуществления заявляемого способа в отдельности, либо результатов эксперимента по сравнению моделей видеокодеков, использующих прототипный и заявляемый способы.The method of encoding-decoding digital video images described above is carried out as follows: on a laptop, a software version is launched to implement the inventive method individually or an experiment to conduct a comparative analysis of video codec models based on the prototype and inventive methods by pressing the corresponding button. After that, they expect the end of image processing and display on the screen of the results of the implementation of the proposed method separately, or the results of the experiment compared to models of video codecs using the prototype and the claimed methods.

Наличие причинно-следственной связи между совокупностью существенных признаков заявляемого объекта и достигаемым техническим результатом показано в таблице 3. Табличные данные основаны на результатах экспериментов по сравнительному анализу моделей видеокодеков на базах прототипного и заявляемого способов. Оба критерия подсчитывались программно.

Figure 00000008
The presence of a causal relationship between the set of essential features of the claimed object and the achieved technical result is shown in table 3. The table data is based on the results of experiments on the comparative analysis of video codec models based on the prototype and the claimed methods. Both criteria were calculated programmatically.
Figure 00000008

Согласно результатам экспериментальных данных предложенный способ кодирования декодирования обеспечивает повышение коэффициента компрессии цифровых видеоизображений с высокочастотным характером спектра сигнала в среднем на 8-14% при незначительном снижении качества декодированного изображения в среднем на 1-2%.According to the experimental data, the proposed decoding encoding method provides an increase in the compression ratio of digital video images with a high-frequency character of the signal spectrum by an average of 8-14% with a slight decrease in the quality of the decoded image by an average of 1-2%.

Техническая сущность заявляемого технического решения поясняется следующими дополнительными материалами.The technical nature of the claimed technical solution is illustrated by the following additional materials.

ФИГ. 1. Структурная схема устройства для реализации прототипного и заявляемого способов.FIG. 1. The structural diagram of a device for implementing the prototype and the proposed methods.

ФИГ. 2. Функциональная схема кодера в устройстве для реализации прототипного способа.FIG. 2. Functional diagram of the encoder in the device for implementing the prototype method.

ФИГ. 3. Функциональная схема кодера в устройстве для реализации заявляемого способа.FIG. 3. The functional diagram of the encoder in the device for implementing the proposed method.

ФИГ 4 Принципиальная схема оптимизации кодирования сигнала низкочастотного компонента вейвлет-преобразования.FIG 4 A schematic diagram of the optimization of coding the signal of the low-frequency component of the wavelet transform.

ФИГ. 5. Результаты моделирования предложенного способа для квадратного сектора из низкочастотного компонента вейвлет-преобразования.FIG. 5. The simulation results of the proposed method for the square sector of the low-frequency component of the wavelet transform.

ФИГ. 6. Результаты моделирования предложенного способа для одной строки из низкочастотного компонента вейвлет-преобразования.FIG. 6. The simulation results of the proposed method for one line of the low-frequency component of the wavelet transform.

ФИГ. 7. Схема экспериментальной установки для сравнения эффективностей работы видеоеодеков на базах прототипного и заявляемого способов.FIG. 7. The scheme of the experimental setup for comparing the operating efficiencies of video deck based on the prototype and the proposed methods.

ФИГ. 8.Снимок экспериментальной установки для сравнения эффективностей работы видеоеодеков на базах прототипного и заявляемого способов.FIG. 8. A photograph of an experimental setup for comparing the performance of video deck based on the prototype and the proposed methods.

Объяснение необходимости введения совокупности указанных отличительных признаков состоит в следующем. Известно, что при обработке изображений с высокочастотным характером спектра эффективность вейвлет-преобразования по коэффициенту компрессии снижается вследствие того, что для таких изображений изменение сигнала при переходе от пиксела к пикселу становится велико.An explanation of the need to introduce a combination of these distinctive features is as follows. It is known that when processing images with a high-frequency nature of the spectrum, the efficiency of the wavelet transform with respect to the compression coefficient decreases due to the fact that for such images the signal change during the transition from pixel to pixel becomes large.

Так, например, в рассматриваемом случае даже функция низкочастотного компонента вейвлет-преобразования w имеет большую по абсолютным значениям первую производную, а потому является неудобной для кодирования.So, for example, in the case under consideration, even the function of the low-frequency component of the wavelet transform w has a large first derivative in absolute values, and therefore is inconvenient for encoding.

Суть описываемого способа состоит в том, что в кодере к исходному низкочастотному сигналу вейвлет-преобразования w искусственно подмешивается еще один высокочастотный компонент q так, что с одной стороны суммарная функция s=w+q становится белее гладкой, чем w (вследствие этого первая производная s' становится удобной для компрессии), а с другой стороны добавочная составляющая высокочастотной функции q может быть эффективно подавлена на стороне декодирования с минимальными потерями для качества изображения при использовании фильтра низких частот.The essence of the described method is that in the encoder another high-frequency component q is artificially mixed with the initial low-frequency wavelet transform signal w so that on the one hand the total function s = w + q becomes whiter than w (as a result, the first derivative s 'becomes convenient for compression), and on the other hand, the additional component of the high-frequency function q can be effectively suppressed on the decoding side with minimal loss in image quality when using a low-pass filter frequencies.

Обработка данных ведется построчно. Представленные математические модели и последовательности их выполнения устройствами схемы видеокодирования (ФИГ. 1) являются решением вариационной задачи с целевым функционалом JData processing is carried out line by line. The presented mathematical models and the sequences of their execution by the devices of the video coding scheme (FIG. 1) are a solution to the variational problem with the target functional J

Figure 00000009
Figure 00000009

и ограничением связиand communication restrictions

Figure 00000010
Figure 00000010

где

Figure 00000011
- целевой функционал; x - аргумент; b - верхняя граница области интегрирования; w(x) - входная функция; q(x) - добавочная функция;
Figure 00000012
- функция выхода фильтра; λ(x) - множитель Лагранжа; c1, c2 - весовые коэффициенты; а - постоянный коэффициент, характеризующий частоту среза фильтра; k - коэффициент пропорциональности, учитывающий ослабление сигнала на выходе фильтра.Where
Figure 00000011
- target functionality; x is the argument; b is the upper boundary of the integration region; w (x) is the input function; q (x) is an additional function;
Figure 00000012
- filter output function; λ (x) is the Lagrange multiplier; c 1 , c 2 - weighting factors; a is a constant coefficient characterizing the cutoff frequency of the filter; k is the coefficient of proportionality, taking into account the attenuation of the signal at the output of the filter.

Первое слагаемое функционала характеризует цель повышения степени гладкости производной суммарной функции s=w+q (требование объема кодов). Второе слагаемое характеризует цель сохранения незначительного различия исходного кодируемого w и выходного декодируемого

Figure 00000013
сигналов (требование качества изображения). Приоритеты между указанными целями регулируются весовыми коэффициентами. Ограничение связи представляет собой фильтр низких частот. Оно учитывается при кодировании, а также используется при декодировании.The first term of the functional characterizes the goal of increasing the degree of smoothness of the derivative of the total function s = w + q (requirement for the amount of codes). The second term characterizes the goal of maintaining a slight difference between the original encoded w and the output decoded
Figure 00000013
signals (image quality requirement). Priorities between these goals are regulated by weighting factors. Communication restriction is a low pass filter. It is taken into account during encoding, and is also used in decoding.

Результаты сравнительного анализа прототипного и заявляемого способов, приведенные на фигурах (ФИГ. 5) и (ФИГ. 6), содержат экспериментально полученные характеристики для следующих функций: функция низкочастотного компонента вейвлет-преобразования w, производная этого сигнала w', добавочная функция q, суммарная функция s, равная сумме w+q кодируемой и добавочной функций, ее производная s' (передаваемая декодеру), ошибка r декодированного низкочастотного компонента вейвлет-преобразования, определяемая как разность

Figure 00000014
кодируемого и отфильтрованного (декодируемого) сигналов.The results of a comparative analysis of the prototype and the proposed methods, shown in the figures (FIG. 5) and (FIG. 6), contain experimentally obtained characteristics for the following functions: function of the low-frequency component of the wavelet transform w, derivative of this signal w ', additional function q, total the function s equal to the sum w + q of the encoded and additional functions, its derivative s' (transmitted to the decoder), the error r of the decoded low-frequency component of the wavelet transform, defined as the difference
Figure 00000014
encoded and filtered (decoded) signals.

По результатам сравнительного анализа можно отметить, что поскольку суммарная функция s в процессе кодирования становится гладкой функцией, это снижает абсолютные значения ее первой производной s'. Функцию s' становится удобно кодировать, поскольку она имеет малые абсолютные значения, что приводит к уменьшению разрядной сетки для этих значений. Кроме того, функция s' содержит длинные нулевые серии, которые эффективно кодируются энтропийным кодером. Вследствие этого запоминающему устройству требуется меньший объем памяти для хранения закодированной s', а значит повышается коэффициент компрессии изображения.According to the results of the comparative analysis, it can be noted that since the total function s in the coding process becomes a smooth function, this reduces the absolute values of its first derivative s'. It becomes convenient to code the function s', since it has small absolute values, which leads to a decrease in the bit grid for these values. In addition, the function s' contains long zero sequences that are effectively encoded by an entropy encoder. As a result, the storage device requires less memory to store the encoded s', which means that the compression ratio of the image is increased.

В то же время, по начальным условиям и кодам функции s' декодер может восстановить сначала саму функцию s, а затем посредством фильтрации выделить из нее желаемую функцию w (в декодере ей соответствует функция

Figure 00000013
), подавив добавочный компонент q. Поскольку действие фильтра декодера (ограничение связи) учитывается еще на стороне кодирования, то сигнал декодируемого изображения искажается слабо.At the same time, according to the initial conditions and codes of the function s', the decoder can first restore the function s itself, and then filter out the desired function w from it (in the decoder, it corresponds to the function
Figure 00000013
) by suppressing the additional component q. Since the effect of the decoder filter (communication restriction) is taken into account even on the encoding side, the signal of the decoded image is distorted slightly.

Технико-экономическое обоснование заявляемого способа состоит в том, что при его применении возможно хранение большего количества изображений при тех же объемах памяти, а значит в общем случае можно сэкономить на количестве таких запоминающих устройств при прочих равных условиях. Еще одно экономически-выгодное применение предложенного способа состоит в его использовании в рамках кодирования кадровых видеопотоков (цифровое телевидение, интернет-общение в режиме on-line), поскольку меньший объем кода требует меньших энергетических затрат. Но в этом случае необходимо использовать малые форматы изображений (критично время кодирования), а также иметь канал связи с высокими показателями помехоустойчивости, поскольку из-за использования производных одна ошибка декодирования в строке порождает серию ошибок для оставшихся элементов строки.The feasibility study of the proposed method consists in the fact that when it is used, it is possible to store more images with the same amount of memory, which means that in the general case you can save on the number of such storage devices, all other things being equal. Another cost-effective application of the proposed method is its use in the framework of encoding frame video streams (digital television, online communication on-line), since a smaller amount of code requires less energy. But in this case, it is necessary to use small image formats (coding time is critical), and also have a communication channel with high noise immunity, because due to the use of derivatives, one decoding error per line generates a series of errors for the remaining elements of the line.

Claims (23)

Способ кодирования-декодирования цифровых видеоизображений, состоящий в следующем: при кодировании каждого очередного изображения кодером опрашивают датчик цветного изображения, далее полученное изображение представляют тремя исходными цветовыми матрицами, соответствующими красному, зеленому и синему цветовым компонентам изображения, после чего сохраняют исходные цветовые матрицы в памяти кодера, затем к каждой исходной цветовой матрице построчно применяют вейвлет-преобразование, в ходе которого получают низкочастотный и высокочастотный компоненты матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют квантование и кодирование с пространственным прогнозом, затем к высокочастотному компоненту текущей матрицы применяют квантование, сканирование и кодирование по методу нулевых деревьев, а после этого к предварительным кодам обоих частотных компонентов текущей матрицы применяют энтропийное арифметическое кодирование, после кодирования всех исходных матриц набор полученных кодов записывают в запоминающее устройство, декодером в процессе проведения декодирования изображения сначала из запоминающего устройства извлекают набор кодов изображения, далее для каждой декодируемой цветовой матрицы сначала применяют к полученным кодам энтропийное арифметическое декодирование, в результате чего получают раздельные коды низкочастотного и высокочастотного компонентов матрицы, после чего к низкочастотному компоненту текущей матрицы последовательно применяют декодирование с пространственным прогнозом и деквантование, затем к высокочастотному компоненту текущей матрицы применяют декодирование по методу нулевых деревьев, обратное сканирование и деквантование, после чего по декодированным низкочастотным и высокочастотным компонентам посредством обратного вейвлет-преобразования восстанавливают исходную текущую матрицу изображения, а после декодирования всех цветовых матриц восстанавливают исходное изображение, отличающийся тем, что для каждой строки каждой цветовой матрицы низкочастотного компонента вейвлет-преобразования в кодере после квантования, но перед кодированием с пространственным прогнозом применяют построчную оптимизацию в соответствии с системой уравненийA method of encoding / decoding digital video images, which consists in the following: when encoding each successive image, the encoder polls the color image sensor, then the resulting image is represented by three source color matrices corresponding to the red, green and blue color components of the image, after which the original color matrices are stored in the encoder memory , then a wavelet transform is applied row by row to each source color matrix, during which a low-frequency and high frequency component of the matrix, after which quantization and coding with spatial prediction are successively applied to the low-frequency component of the current matrix, then quantization, scanning, and coding are applied to the high-frequency component of the current matrix according to the zero-tree method, and then the entropy is applied to the preliminary codes of both frequency components of the current matrix arithmetic coding, after coding all the source matrices, the set of received codes is written to the storage device, Dec In the process of decoding the image, first, a set of image codes is extracted from the storage device, then for each decoded color matrix, the entropy arithmetic decoding is first applied to the obtained codes, resulting in separate codes of the low-frequency and high-frequency components of the matrix, and then to the low-frequency component of the current matrix in series apply spatial prediction decoding and dequantization, then to the high-frequency component of those For the matrix matrix, zero-tree decoding, reverse scanning and dequantization are used, after which the original current image matrix is restored using the decoded low-frequency and high-frequency components using the inverse wavelet transform, and after decoding all color matrices, the original image is restored, characterized in that for each row each color matrix of the low-frequency component of the wavelet transform in the encoder after quantization, but before coding with space With a forecast, line-by-line optimization is applied in accordance with the system of equations
Figure 00000015
Figure 00000015
w(x) - входная функция вейвлет-преобразования после квантования;w (x) is the input function of the wavelet transform after quantization; q(x) - добавочная функция;q (x) is an additional function;
Figure 00000016
- функция выхода фильтра;
Figure 00000016
- filter output function;
λ(x) - множитель Лагранжа;λ (x) is the Lagrange multiplier; c1, c2 - весовые коэффициенты;c 1 , c 2 - weighting factors; а - коэффициент фильтра; a is the filter coefficient; k - коэффициент пропорциональности;k is the coefficient of proportionality; x – аргумент,x is an argument с неизвестными q(x),
Figure 00000017
, λ(x), причем для кодирования используют производную суммарной функции
with unknowns q (x),
Figure 00000017
, λ (x), and for encoding using the derivative of the total function
s'(x)=w'(x)+q'(x)s' (x) = w '(x) + q' (x) s(x) - суммарная функция;s (x) is the total function; w(x) - входная функция вейвлет-преобразования после квантования;w (x) is the input function of the wavelet transform after quantization; q(x) - добавочная функция,q (x) is an additional function, а в декодере после декодирования с пространственным прогнозом, но перед деквантованием применяют фильтрацию по формулеand in the decoder, after decoding with spatial prediction, but before dequantization, filtering according to the formula
Figure 00000018
Figure 00000018
s(x) - суммарная функция;s (x) is the total function;
Figure 00000019
- функция выхода фильтра;
Figure 00000019
- filter output function;
а - коэффициент фильтра; a is the filter coefficient; k - коэффициент пропорциональности;k is the coefficient of proportionality; x – аргумент,x is an argument при неизвестной
Figure 00000020
, при этом значения функции s(x) вычисляют предварительно по ее производной и с учетом краевых условий, причем и в кодере, и в декодере краевые условия выбирают одинаковыми для соответствующих строк и задают предварительно, значения коэффициентов c1, c2 в кодере задают предварительно, значения коэффициентов а, k для кодера и декодера принимают одинаковыми и задают предварительно, а в процессе кодирования-декодирования используют дискретные представления указанных формул, в которых аргумент x принимают в качестве номера элемента текущей строки преобразования.
with unknown
Figure 00000020
, while the values of the function s (x) are preliminarily calculated according to its derivative and taking into account the boundary conditions, both in the encoder and in the decoder, the boundary conditions are chosen the same for the corresponding lines and are pre-set, the values of the coefficients c 1 , c 2 in the encoder are pre-set , the values of the coefficients, k for the encoder and the decoder receiving the same and is set in advance, and in the process of encoding-decoding using digital representations of said formulas in which the argument x is taken as the current item numbers element Oka conversion.
RU2016111518A 2016-03-28 2016-03-28 Method for encoding-decoding of digital video images RU2616176C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2016111518A RU2616176C1 (en) 2016-03-28 2016-03-28 Method for encoding-decoding of digital video images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2016111518A RU2616176C1 (en) 2016-03-28 2016-03-28 Method for encoding-decoding of digital video images

Publications (1)

Publication Number Publication Date
RU2616176C1 true RU2616176C1 (en) 2017-04-12

Family

ID=58642850

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016111518A RU2616176C1 (en) 2016-03-28 2016-03-28 Method for encoding-decoding of digital video images

Country Status (1)

Country Link
RU (1) RU2616176C1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298163B1 (en) * 1997-02-12 2001-10-02 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method using band dependent tables
US20040017952A1 (en) * 1999-10-01 2004-01-29 Tinku Acharya Color video coding scheme
RU2502215C2 (en) * 2009-06-09 2013-12-20 Сони Корпорейшн Trees for adaptive coding of images and video using set partitioning in generalised hierarchical trees having directionality
RU2550544C1 (en) * 2013-12-16 2015-05-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Method for motion compensation in digital dynamic stereoscopic video
RU2552139C1 (en) * 2013-12-16 2015-06-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Method for motion compensation in digital dynamic video

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298163B1 (en) * 1997-02-12 2001-10-02 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method using band dependent tables
US20040017952A1 (en) * 1999-10-01 2004-01-29 Tinku Acharya Color video coding scheme
RU2502215C2 (en) * 2009-06-09 2013-12-20 Сони Корпорейшн Trees for adaptive coding of images and video using set partitioning in generalised hierarchical trees having directionality
RU2550544C1 (en) * 2013-12-16 2015-05-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Method for motion compensation in digital dynamic stereoscopic video
RU2552139C1 (en) * 2013-12-16 2015-06-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Method for motion compensation in digital dynamic video

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
авто Калистратов Д.С. "Исследование способов компенсации движения в цифровых динамических видеоизображениях", опубл. 01.04.2015. *
автореферат Калистратов Д.С. "Исследование способов компенсации движения в цифровых динамических видеоизображениях", опубл. 01.04.2015. *

Similar Documents

Publication Publication Date Title
US8711248B2 (en) Global alignment for high-dynamic range image generation
TWI690211B (en) Decoding method for high dynamic range images, processor non-transistory readable medium and computer program product thereof
KR102529013B1 (en) Method and apparatus for encoding and decoding color pictures
US8731315B2 (en) Image compression and decompression for image matting
US11076164B2 (en) Video camera with rate control video compression
US7773816B2 (en) Systems and methods for decoding large images
US8675984B2 (en) Merging multiple exposed images in transform domain
JP2016226001A (en) Decoder and decoding method
US8340442B1 (en) Lossy compression of high-dynamic range image files
RU2518932C2 (en) Reduced dc gain mismatch and dc leakage in overlap transform processing
KR20170115503A (en) Apparatus and method for reverse-ton mapping images
US9398312B2 (en) Adaptive inter-channel transform for wavelet color image compression
RU2616176C1 (en) Method for encoding-decoding of digital video images
TWI390959B (en) Video signal processing device, video signal processing method and video signal processing program
US20230133895A1 (en) Image encoding apparatus and method for controlling the same and non-transitory computer-readable storage medium
US10250899B1 (en) Storing and retrieving high bit depth image data
CN110896432A (en) Image processing method and system
Kyrtsakas et al. An FPGA implementation of a custom JPEG image decoder SoC module
RU2616178C1 (en) Method of encoding-decoding of static digital video images
KR101666927B1 (en) Method and apparatus for generating a compressed file, and terminal having the apparatus
Suzuki Lossless compression of CFA-sampled images using YDgCoCg transforms with CDF wavelets
Lee et al. A new intra prediction method using channel correlations for the H. 264/AVC intra coding
Dar et al. Compression for multiple reconstructions
US20070192393A1 (en) Method and system for hardware and software shareable DCT/IDCT control interface
WO2016047250A1 (en) Signal processing apparatus, imaging apparatus and signal processing method

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20180329