RU2614576C1 - Method for encoding images based on nonlinear forming system - Google Patents

Method for encoding images based on nonlinear forming system Download PDF

Info

Publication number
RU2614576C1
RU2614576C1 RU2016109070A RU2016109070A RU2614576C1 RU 2614576 C1 RU2614576 C1 RU 2614576C1 RU 2016109070 A RU2016109070 A RU 2016109070A RU 2016109070 A RU2016109070 A RU 2016109070A RU 2614576 C1 RU2614576 C1 RU 2614576C1
Authority
RU
Russia
Prior art keywords
signal
encoding
forming system
generating
compressed
Prior art date
Application number
RU2016109070A
Other languages
Russian (ru)
Inventor
Михаил Владимирович Стремоухов
Сергей Владимирович Чистяков
Михаил Владимирович Илюшин
Александр Витальевич Шмойлов
Кирилл Александрович Батенков
Original Assignee
Федеральное государственное казенное военное образовательное учреждение высшего образования "Академия Федеральной службы охраны Российской Федерации" (Академия ФСО России)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное казенное военное образовательное учреждение высшего образования "Академия Федеральной службы охраны Российской Федерации" (Академия ФСО России) filed Critical Федеральное государственное казенное военное образовательное учреждение высшего образования "Академия Федеральной службы охраны Российской Федерации" (Академия ФСО России)
Priority to RU2016109070A priority Critical patent/RU2614576C1/en
Application granted granted Critical
Publication of RU2614576C1 publication Critical patent/RU2614576C1/en

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

FIELD: physics.
SUBSTANCE: method for encoding images is provided based on the nonlinear forming system, wherein the said unit is divided into a plurality of small areas at the stage of forming the prediction signal, and the prediction signal of the non-square small area is formed using the signal of the already reconstructed pixel or the unit of pixels, which contact with the first side. The processed unit is identified at the stage of the compressed signal forming, depending on the range of brightness and contrast belonging to the high contrast or low contrast image, transforming of the said unit is performed to the identified low contrast image in the sequence of pixels, estimating parameters of the nonlinear forming system, the formation the compressed signal is performed by encoding parameters of the nonlinear forming system, the formation of the compressed signal is performed for the identified high contrast image by encoding the residual signal, the compressed signal is decompressed and the decompressed signal is stored as the restored pixel signal.
EFFECT: improving the quality of the reconstructed video information.
3 dwg

Description

Изобретение относится к вычислительной технике, а именно к области обработки видеоинформации.The invention relates to computing, and in particular to the field of video processing.

Важность информационной поддержки деятельности должностных лиц органов управления определяет потребность в расширении перечня и повышении качества предоставляемых им инфокоммуникационных услуг. При этом наибольшей содержательностью и удобством отличается визуальная форма представления информации, обеспечивающая получение таких сведений об объектах управления, которые другими видами и способами информационного обмена получить невозможно. Характерной особенностью видеоинформации является наличие различных видов избыточности. При устранении избыточности видеоинформации в основном используются методы, учитывающие линейные связи между элементами.The importance of information support for the activities of government officials determines the need to expand the list and improve the quality of the information and communication services provided to them. At the same time, the visual presentation of information is the most informative and convenient, providing such information about control objects that cannot be obtained by other types and methods of information exchange. A characteristic feature of video information is the presence of various types of redundancy. When eliminating redundancy of video information, methods that take into account linear relationships between elements are mainly used.

Известен способ (Recommendation ITU-T Н.264. Advanced video coding for generic audiovisual services (Series H: Audiovisual and multimedia systems. Infrastructure of audiovisual services - Coding of moving video) - 2012 - 01 - 01. - ITU, 2012. - 680 с.), согласно которому берут макроблоки размером 16×16 точек обрабатываемого кадра изображения, формируют прогноз макроблока из выборок текущего кадра, предварительно закодированных и восстановленных (INTRA-режим), или с учетом изменений, которые произошли в текущем кадре по сравнению с одним или несколькими предыдущими или последующими (INTER-режим), вычисляют макроблок остаточных коэффициентов путем вычитания полученного прогноза из текущего макроблока, выполняют квазиортогональное частотное преобразование остаточных коэффициентов, квантуют полученный на основе частотного преобразования набор частотных коэффициентов, при этом набор преобразованных и квантованных коэффициентов служит исходным для обратного канала реконструкции данных, далее выстраивают коэффициенты в линейный массив в порядке возрастания и производят энтропийное кодирование упорядоченного массива коэффициентов, при этом формируют выходную битовую последовательность кодера из закодированных коэффициентов и дополнительной информации, требуемой для правильного декодирования макроблока (режима прогноза, коэффициента квантования и т.д.).The known method (Recommendation ITU-T H.264. Advanced video coding for generic audiovisual services (Series H: Audiovisual and multimedia systems. Infrastructure of audiovisual services - Coding of moving video) - 2012 - 01 - 01. - ITU, 2012. - 680 s.), According to which macroblocks with a size of 16 × 16 points of the processed image frame are taken, a macroblock forecast is formed from samples of the current frame previously encoded and restored (INTRA mode), or taking into account changes that have occurred in the current frame compared to one or several previous or subsequent (INTER-mode), calculate the macroblock residual coefficients by subtracting the obtained forecast from the current macroblock, perform quasi-orthogonal frequency conversion of the residual coefficients, quantize the set of frequency coefficients obtained on the basis of the frequency conversion, while the set of converted and quantized coefficients serves as the initial for the reverse data reconstruction channel, then they build the coefficients in a linear array in ascending order and produce entropy coding of an ordered array of coefficients, while forming the output bit sequence encoder reliability from encoded coefficients and additional information required for correct macroblock decoding (prediction mode, quantization coefficient, etc.).

Недостатком указанного способа является недостаточно высокое качество восстановленной видеоинформации при кодировании малоконтрастных изображений и изображениях с малым динамическим диапазоном (d≤100) [Стремоухов, М.В. Проблемы эффективного кодирования изображений с малой контрастностью и узким динамическим диапазоном. / М.В. Стремоухов, С.В. Чистяков, И.В. Фурцев // Актуальные направления развития систем охраны, специальной связи и информации для нужд государственного управления: IX Всероссийская межведомственная научная конференция (Орел, 11-12 февраля 2015 года). В 12 ч. Ч. 9. / Под общ. ред. В.В. Мизерова. - Орел: Академия ФСО России, 2015. - 163 с., С. 148-151].The disadvantage of this method is the insufficiently high quality of the restored video information when encoding low-contrast images and images with a small dynamic range (d≤100) [Stremoukhov, M.V. Problems of efficient coding of images with low contrast and narrow dynamic range. / M.V. Stremoukhov, S.V. Chistyakov, I.V. Furtsev // Actual directions of development of security systems, special communications and information for the needs of public administration: IX All-Russian Interdepartmental Scientific Conference (Orel, February 11-12, 2015). At 12 h. Part 9. / Under the general. ed. V.V. Mizerova. - Eagle: Academy of the Federal Security Service of Russia, 2015. - 163 p., S. 148-151].

Наиболее близким по технической сущности к заявляемому способу и выбранным в качестве прототипа является способ для прогнозирующего кодирования изображений (патент RU 2526764 от 25.12.2009), заключающийся в том, что разделяют входное изображение на множество блоков, формируют сигнал прогнозирования относительно сигнала пикселов, который включен в рассматриваемый блок, который должен обрабатываться, из множества блоков, формируют остаточный сигнал между сигналом пикселов рассматриваемого блока и сформированным сигналом прогнозирования, при этом на этапе формирования сигнала прогнозирования подразделяют рассматриваемый блок на множество небольших областей, причемпо меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны, и на этапе формирования сигнала прогнозирования формируют сигнал прогнозирования неквадратной небольшой области с использованием сигнала уже восстановленного пиксела, который контактирует с первой стороной, формируют сжатый сигнал посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.The closest in technical essence to the claimed method and selected as a prototype is a method for predictive encoding of images (patent RU 2526764 from 12.25.2009), which consists in dividing the input image into many blocks, generating a prediction signal relative to the pixel signal, which is included into the block under consideration, which must be processed, from a plurality of blocks, a residual signal is formed between the pixel signal of the block under consideration and the generated prediction signal, when ohm, at the stage of generating the forecast signal, the block under consideration is divided into many small areas, at least one of the small areas is non-square and the length of the first side of the non-square small area exceeds the length of the second side, which differs from the first side, and at the stage of generating the forecast signal squared small area using the signal of the already restored pixel, which is in contact with the first side, form compressed th signal by encoding the residual signal, decompress the compressed signal and save the decompressed signal as a reconstructed pixel signal.

Недостатком способа-прототипа является недостаточно высокое качество восстановленной видеоинформации на приеме при кодировании изображений, содержащих мелкие контрастные элементы (надписи), малоконтрастных изображений, изображений, полученных в условиях сумерек, слабой освещенности, при тумане и задымлении, определяемое следующим:The disadvantage of the prototype method is the insufficiently high quality of the restored video information at the reception when encoding images containing small contrasting elements (inscriptions), low-contrast images, images obtained in twilight conditions, low light, fog and smoke, defined by the following:

1) применение алгоритмов, основанных на двумерном косинусном преобразовании (ДКП), при стандартных процедурах квантования его коэффициентов приводит к существенному снижению общего субъективного качества восстановленной видеоинформации при достаточно высоких значениях объективного показателя по критерию пикового отношения сигнал/шум (ПОСШ);1) the use of algorithms based on two-dimensional cosine transform (DCT), with standard procedures for quantizing its coefficients, leads to a significant decrease in the overall subjective quality of the reconstructed video information at fairly high values of the objective indicator by the criterion of peak signal to noise ratio (SNR);

2) отсутствие эффективных процедур кодирования, учитывающих нелинейные взаимосвязи между элементами изображений, обладающих малой контрастностью или узким динамическим диапазоном.2) the lack of effective coding procedures that take into account non-linear relationships between image elements with low contrast or narrow dynamic range.

При существующих требованиях к качеству восстанавливаемой на приеме видеоинформации необходима ее более тщательная обработка. В данных условиях способы, не учитывающие нелинейные взаимосвязи между элементами изображений, обладающих малой контрастностью или узким динамическим диапазоном, становятся неприемлемыми и не обеспечивают достаточного качества восстановленной видеоинформации.Given the existing requirements for the quality of the video information being restored at the reception, more thorough processing is necessary. Under these conditions, methods that do not take into account non-linear relationships between image elements with low contrast or narrow dynamic range become unacceptable and do not provide sufficient quality of the restored video information.

Данное обстоятельство определяет необходимость разработки способов повышения качества восстановленной видеоинформации за счет улучшения визуального восприятия изображений, обладающих малой контрастностью или узким динамическим диапазоном, путем добавления при эффективном кодировании процедур, учитывающих нелинейные взаимосвязи между элементами таких изображений.This circumstance determines the need to develop ways to improve the quality of the restored video information by improving the visual perception of images with low contrast or a narrow dynamic range, by adding procedures that take into account non-linear relationships between the elements of such images with effective coding.

Задачей изобретения является разработка способа кодирования изображений на основе нелинейной формирующей системы, позволяющего повысить визуальное субъективное качество восстановленной видеоинформации по сравнению с известным методом частотного преобразования ДКП при достаточно сопоставимых значениях объективного показателя по критерию ПОСШ.The objective of the invention is to develop a method of encoding images based on a nonlinear forming system, which allows to increase the visual subjective quality of the restored video information in comparison with the known method of frequency conversion of DCT at sufficiently comparable values of the objective indicator by the criterion of SEQ.

В заявленном способе эта задача решается тем, что в известном способе для прогнозирующего кодирования изображений, заключающемся в том, что разделяют входное изображение на множество блоков, формируют сигнал прогнозирования относительно сигнала пикселов, который включен в рассматриваемый блок, который должен обрабатываться, из множества блоков, формируют остаточный сигнал между сигналом пикселов рассматриваемого блока и сформированным сигналом прогнозирования, при этом на этапе формирования сигнала прогнозирования подразделяют рассматриваемый блок на множество небольших областей, причем по меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны, и на этапе формирования сигнала прогнозирования формируют сигнал прогнозирования неквадратной небольшой области с использованием сигнала уже восстановленного пиксела, который контактирует с первой стороной, дополнительно на этапе формирования сжатого сигнала идентифицируют обрабатываемый блок на принадлежность к малоконтрастному или высококонтрастному изображению, осуществляют для малоконтрастного изображения предварительную обработку (развертку), оценивают параметры нелинейной формирующей системы, формируют сжатый сигнал посредством кодирования параметров нелинейной формирующей системы, формируют для высококонтрастного изображения сжатый сигнал посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.In the claimed method, this problem is solved in that in the known method for predictive encoding of images, which consists in dividing the input image into a plurality of blocks, generating a prediction signal for a pixel signal, which is included in the considered block to be processed, from a plurality of blocks, form a residual signal between the pixel signal of the considered block and the generated prediction signal, while at the stage of generating the prediction signal, the ra a block being considered into a plurality of small areas, at least one of the small areas being non-square and the length of the first side of the non-square small area exceeds the length of the second side, which is different from the first side, and at the stage of generating the prediction signal, a prediction signal of the non-square small area is generated using the signal already restored pixel, which is in contact with the first side, in addition, at the stage of generating the compressed signal, we identify the processed the second block for belonging to a low-contrast or high-contrast image, preliminary processing (sweep) is carried out for a low-contrast image, the parameters of the nonlinear forming system are evaluated, a compressed signal is generated by encoding the parameters of the non-linear forming system, a compressed signal is generated for the high-contrast image by encoding the residual signal, the compressed signal is unpacked and storing the decompressed signal as a reconstructed pixel signal.

Новая совокупность существенных признаков позволяет достичь указанного технического результата за счет того, что идентифицируют обрабатываемый блок на принадлежность к малоконтрастному или высококонтрастному изображению, осуществляют для малоконтрастного изображения предварительную обработку (развертку), оценивают параметры нелинейной формирующей системы, формируют сжатый сигнал посредством кодирования параметров нелинейной формирующей системы, формируют для высококонтрастного изображения сжатый сигнал посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.A new set of essential features allows you to achieve the specified technical result due to the fact that the processed block is identified as belonging to a low-contrast or high-contrast image, preliminary processing (sweep) is performed for a low-contrast image, the parameters of the nonlinear forming system are evaluated, a compressed signal is generated by encoding the parameters of the nonlinear forming system form a compressed signal for high-contrast image by means of encoded After extracting the residual signal, decompress the compressed signal and save the decompressed signal as a reconstructed pixel signal.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного способа кодирования изображений на основе нелинейной формирующей системы, отсутствуют. Следовательно, заявленное изобретение соответствует условию патентоспособности «новизна».The analysis of the prior art made it possible to establish that there are no analogues that are characterized by a combination of features that are identical to all the features of the claimed method of encoding images based on a nonlinear forming system. Therefore, the claimed invention meets the condition of patentability "novelty."

Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразований на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».Search results for known solutions in this and related fields of technology in order to identify features that match the distinctive features of the claimed object from the prototype showed that they do not follow explicitly from the prior art. The prior art also did not reveal the popularity of the impact provided by the essential features of the claimed invention, the transformations on the achievement of the specified technical result. Therefore, the claimed invention meets the condition of patentability "inventive step".

Заявленное изобретение поясняется следующими чертежами:The claimed invention is illustrated by the following drawings:

фиг. 1 - вариант реализации системы эффективного кодирования видеоинформации, обеспечивающей улучшение восприятия восстановленных изображений согласно предлагаемому способу;FIG. 1 - an embodiment of a system for efficient coding of video information, providing improved perception of the restored images according to the proposed method;

фиг. 2 - этапы эффективного кодирования видеоинформации согласно предлагаемому способу;FIG. 2 - stages of effective coding of video information according to the proposed method;

фиг. 3 - результаты оценки качества восприятия восстановленных изображений в устройствах эффективного кодирования видеоинформации.FIG. 3 - the results of assessing the quality of perception of the reconstructed images in devices for efficient coding of video information.

Реализация заявленного способа включает в себя этапы: разделения входного изображения на множество блоков, дополнительного разделения блока на множество небольших областей, при этом по меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны; формирование сигналов прогнозирования относительно сигнала пикселов, включенного в рассматриваемую небольшую область; формирование остаточного сигнала между сигналами пикселов рассматриваемой небольшой области и сформированным сигналом прогнозирования; формирование сжатого сигнала посредством кодирования остаточного сигнала; и формирование сжатых данных изображений, которые включают в себя сжатый сигнал и связанную с формированием сигналов прогнозирования информацию, указывающую способ формирования сигнала прогнозирования небольшой области при прогнозирующем кодировании; извлечения остаточного сигнала небольшой области из данных сжатых изображений и распаковки восстановленного остаточного сигнала; извлечения связанной с формированием сигналов прогнозирования информации из данных сжатых изображений; и формирования сигнала прогнозирования небольшой области на основе связанной с формированием сигналов прогнозирования информации; распаковки сигнала пикселов небольшой области посредством добавления восстановленного остаточного сигнала к сигналу прогнозирования небольшой области; и сохранения распакованного сигнала пикселов как восстановленного сигнала пикселов.Implementation of the inventive method includes the steps of: splitting an input image into a plurality of blocks, further splitting a block into a plurality of small areas, wherein at least one of the small areas is non-square and the length of the first side of the non-square small area exceeds the length of the second side, which differs from the first parties; generating prediction signals with respect to the pixel signal included in the considered small area; generating a residual signal between the pixel signals of the considered small area and the generated prediction signal; generating a compressed signal by encoding a residual signal; and generating compressed image data, which includes a compressed signal and information related to generating prediction signals, indicating a method for generating a prediction signal of a small area in predictive coding; extracting the residual signal of a small area from the compressed image data and decompressing the reconstructed residual signal; extracting information related to the generation of prediction signals from the compressed image data; and generating a prediction signal of a small area based on information associated with the generation of prediction signals; decompressing the pixel signal of the small region by adding the reconstructed residual signal to the prediction signal of the small region; and storing the decompressed pixel signal as a reconstructed pixel signal.

Кроме того, на этапе формирования сжатого сигнала остаточный сигнал с узкими диапазонами значений яркости и контрастности (d≤100) [Стремоухов, М.В. Проблемы эффективного кодирования изображений с малой контрастностью и узким динамическим диапазоном. / М.В. Стремоухов, С.В. Чистяков, И.В. Фурцев // Актуальные направления развития систем охраны, специальной связи и информации для нужд государственного управления: IX Всероссийская межведомственная научная конференция (Орел, 11-12 февраля 2015 года). В 12 ч. Ч. 9. / Под общ. ред. В.В. Мизерова. - Орел: Академия ФСО России, 2015. - 163 с., С. 148-151] может быть отнесен к изображениям, обладающим малой контрастностью или узким динамическим диапазоном.In addition, at the stage of generating a compressed signal, a residual signal with narrow ranges of brightness and contrast (d≤100) [Stremoukhov, M.V. Problems of efficient coding of images with low contrast and narrow dynamic range. / M.V. Stremoukhov, S.V. Chistyakov, I.V. Furtsev // Actual directions of development of security systems, special communications and information for the needs of public administration: IX All-Russian Interdepartmental Scientific Conference (Orel, February 11-12, 2015). At 12 h. Part 9. / Under the general. ed. V.V. Mizerova. - Eagle: Academy of the Federal Security Service of Russia, 2015. - 163 p., S. 148-151] can be attributed to images with low contrast or narrow dynamic range.

Кроме того, сжатый сигнал для указанного остаточного сигнала может быть получен путем его предварительной обработки, оценки параметров и кодирования параметров нелинейной формирующей системы.In addition, a compressed signal for the specified residual signal can be obtained by pre-processing it, evaluating the parameters and coding the parameters of the nonlinear forming system.

Кроме того, на этапе формирования сжатых данных изображений связанная с формированием сжатого сигнала информация, указывающая способ формирования сжатого сигнала в зависимости от яркости и контрастности, может быть кодирована и сигнал, полученный посредством кодирования, может быть выведен вместе со сжатым сигналом.In addition, at the stage of generating the compressed image data, information related to the generation of the compressed signal indicating the method of generating the compressed signal depending on the brightness and contrast can be encoded and the signal obtained by encoding can be output together with the compressed signal.

Описание способа кодирования изображений на основе нелинейной формирующей системы.Description of the image encoding method based on a non-linear forming system.

Совокупность функциональных блоков и система логических связей между ними, реализующих заявленный способ кодирования, представлены на фиг. 1.The set of functional blocks and the system of logical connections between them that implement the claimed encoding method are presented in FIG. one.

Фиг. 2 является блок-схемой последовательности операций, иллюстрирующей способ кодирования изображений на основе нелинейной формирующей системы согласно варианту осуществления изобретения.FIG. 2 is a flowchart illustrating a method of encoding images based on a non-linear shaping system according to an embodiment of the invention.

В частности, как описано выше, фиг. 2 иллюстрирует процесс кодирования на основе нелинейной формирующей системы для каждого блока разделенного на блоки изображения.In particular, as described above, FIG. 2 illustrates a coding process based on a non-linear generating system for each block of block-divided image.

На этапе 201 по фиг. 2 регистрируют изображение [Фисенко, В.Т. Компьютерная обработка и распознавание изображений: Учеб. пособие. / В.Т. Фисенко, Т.Ю. Фисенко. – СПб.: СПбГУ ИТМО, 2008. - 192 с., С. 3-11, 31-45], которое поблочно поступает на вход системы кодирования в качестве исходных данных.At step 201 of FIG. 2 register the image [Fisenko, V.T. Computer processing and image recognition: Textbook. allowance. / V.T. Fisenko, T.Yu. Fisenko. - St. Petersburg: St. Petersburg State University ITMO, 2008. - 192 p., S. 3-11, 31-45], which is block-wise fed to the input of the coding system as input data.

На этапе 202 подразделяют рассматриваемый блок изображения, имеющий N×N пикселов, на множество небольших областей при помощи делителя на блоки 101 по фиг. 1а. В этом варианте осуществления, несмотря на то, что число N равно 8 (N=8), оно может быть равно другому целому числу. Небольшая область в варианте осуществления прототипа показывается как имеющая неквадратную форму.At step 202, the image block having N × N pixels is subdivided into a plurality of small areas using a divider into blocks 101 of FIG. 1a. In this embodiment, although the number N is 8 (N = 8), it may be equal to another integer. A small area in an embodiment of the prototype is shown as having a non-square shape.

Затем, на этапе 203 выполняют первоначальную установку значения t=1 счетчика t, обеспечивающего идентификацию небольших областей, которые должны обрабатываться, после чего процессы на этапах 204-215, которые должны описываться ниже, выполняются относительно соответствующих небольших областей, определяемых счетчиком t, который после каждого цикла этапов 204-215 прирастает на "1" вплоть до значения t=N. При этом сначала на этапе 204 формируют множество вариантов сигналов прогнозирования относительно рассматриваемой небольшой области (например, при (t=1) - первой небольшой области) при помощи формирователя сигналов прогнозирования 103. В варианте осуществления прототипа на этапе 205 сигнал прогнозирования для первой небольшой области формируют посредством экстраполяции уже восстановленного пиксела (сигнал пикселов группы уже восстановленных пикселов является сигналом пикселов, который кодирован и затем распакован ранее и сохранен в запоминающем устройстве кадров 108), который контактирует с рассматриваемой небольшой областью, путем выбора одного из девяти способов экстраполяции среднего значения уже восстановленных пикселов, дающего наименьшую ошибку из вариантов сигналов прогнозирования, полученных посредством девяти указанных способов в качестве сигнала прогнозирования, и определяет способ формирования определенного сигнала прогнозирования в качестве сигнала режима прогнозирования (в дальнейшем называемого "связанной с формированием сигналов прогнозирования информацией"). Для последующих небольших областей в качестве сигнала прогнозирования используют небольшую область, имеющую наименьшую ошибку из девяти вариантов сигналов прогнозирования, полученных посредством девяти указанных способов. Вышеуказанные этапы 202-203 могут быть выполнены в соответствии с описанием, представленном в прототипе [Пат. 2526764 Российская Федерация, МПК7 H04N 19/50. Устройство, способ и программа для прогнозирующего кодирования изображений, устройство, способ и программа для прогнозирующего декодирования изображений и система и способ кодирования/декодирования. / Боон Ч.С. Сузуки Йосинори, Тан Т.К.; заявитель и патентообладатель НТТ ДОКОМО, ИНК. (JP) - №2011134659/08; заявл. 25.12.09; опубл. 27.08.14, Бюл. №24. - 42 с.: ил., С. 13, 14, 16, 17]. Затем выполняется этап 206, на котором получают разность между сигналом пикселов рассматриваемой t-й небольшой области и сигналом прогнозирования данной небольшой области (называемую в последующем "остаточным сигналом между сигналами пикселов рассматриваемой небольшой области и сформированным сигналом прогнозирования", или "остаточным сигналом", или "разностным изображением") при помощи модуля вычитания 102, отличающийся тем, что анализируется разность между сигналом пикселов рассматриваемой t-й небольшой области и сигналом прогнозирования данной небольшой области и определяется способ формирования определенного сигнала способа формирования сжатого сигнала в зависимости от яркости и контрастности, в качестве сигнала способа формирования сжатого сигнала (в дальнейшем называемого "связанной с формированием сжатого сигнала информацией"), в зависимости от диапазона значений яркости и контрастности относится к обычным изображениям, - тогда с помощью блока переключения режимов кодирования 104 обеспечивают выполнение этапа 207: частотное преобразование полученного остаточного сигнала преобразователем 105, последующее квантование преобразованного остаточного сигнала в блоке 109 и энтропийное кодирование квантованного остаточного сигнала с помощью кода переменной длины или арифметического кода в блоке 113, формируя, тем самым, сжатый сигнал [Пат. 2526764 Российская Федерация, МПК7 H04N 19/50. Устройство, способ и программа для прогнозирующего кодирования изображений, устройство, способ и программа для прогнозирующего декодирования изображений и система и способ кодирования/декодирования. / Боон Ч.С., Сузуки Йосинори, Тан Т.К.; заявитель и патентообладатель НТТ ДОКОМО, ИНК. (JP) - №2011134659/08; заявл. 25.12.09; опубл. 27.08.14, Бюл. №24. - 42 с.: ил., С. 14, 17], - либо к изображениям, обладающим малой контрастностью или узким динамическим диапазоном [Стремоухов, М.В. Проблемы эффективного кодирования изображений с малой контрастностью и узким динамическим диапазоном. / М.В. Стремоухов, С.В. Чистяков, И.В. Фурцев // Актуальные направления развития систем охраны, специальной связи и информации для нужд государственного управления: IX Всероссийская межведомственная научная конференция (Орел, 11-12 февраля 2015 года). В 12 ч. Ч. 9. / Под общ. ред. B.В. Мизерова. - Орел: Академия ФСО России, 2015. - 163 с., С. 148-151]. В последнем случае переключатель режима кодирования 104 обеспечивает: на этапе 208 - преобразование рассматриваемой t-й небольшой области в последовательность пикселов (развертку) при помощи блока предварительной обработки 107 (используя, например, какую-либо рекурсивную развертку [Александров, В.В. Представление и обработка изображений: Рекурсивный подход. / В.В. Александров, Н.Д. Горский. - Л.: Наука, 1985. - 192 с., C. 38-44]) и на этапе 209 - оценку параметров нелинейной формирующей системы блоком 106 путем формирования из полученной на предыдущем этапе последовательности пикселов текущего кодируемого субблока с одновременным формированием соответствующей данному субблоку возбуждающей последовательности (этап 210), обеспечивающих идентификацию параметров нелинейной формирующей системы (этап 211), являющейся параметрической моделью кодируемого субблока [Стремоухов, М.В. Математическая модель формирующей системы, учитывающая нелинейные статистические зависимости изображений. / М.В. Стремоухов, С.В. Чистяков // Известия ЮФУ. Технические науки. - 2012. - №6. - С. 156-161]; затем на этапе 213 - последующее квантование в блоке 109 полученных значений параметров нелинейной формирующей системы и энтропийное кодирование в блоке 113 квантованных значений параметров нелинейной формирующей системы с помощью кода переменной длины или арифметического кода, также формирующее сжатый сигнал в соответствии с процедурами, предусмотренными стандартом Н.264 [Гук, И. Особенности сжатия видеоданных по рекомендации Н.264 / MPEG 4 Part 10 / И. Гук // Компоненты и технологии. – 2006. - №2. - С. 5-7. - Guk_2006_02_20.pdf. Источник: http://www.kit-e.ru]. Затем на следующем этапе 213 выводятся из терминала 114 вывода сжатый сигнал и связанная с формированием сигналов прогнозирования и связанная с формирования сжатого сигнала информация, полученная на этапах 207 или 212.Then, at step 203, the initial setting of the value t = 1 of the counter t, which identifies the small areas to be processed, is performed, after which the processes at steps 204-215, which should be described below, are performed relative to the corresponding small areas determined by the counter t, which after of each cycle of steps 204-215 grows by "1" up to the value t = N. In this case, first, at step 204, a plurality of variants of prediction signals are generated with respect to the small area under consideration (for example, at (t = 1), the first small area) using the prediction signal generator 103. In the prototype embodiment, at step 205, a prediction signal for the first small region is generated by extrapolating an already restored pixel (the pixel signal of a group of already restored pixels is a pixel signal, which is encoded and then decompressed earlier and stored in memory frame monitor 108), which is in contact with the small area under consideration, by selecting one of nine methods for extrapolating the average value of the already restored pixels, which gives the smallest error among the prediction signal variants obtained by the nine indicated methods as the prediction signal, and determines the method for generating a certain signal prediction as a signal of the prediction mode (hereinafter referred to as “associated with the formation of prediction signals and formation "). For subsequent small regions, a small region having the smallest error of the nine variants of the prediction signals obtained by the nine indicated methods is used as a prediction signal. The above steps 202-203 can be performed in accordance with the description presented in the prototype [Pat. 2526764 Russian Federation, IPC 7 H04N 19/50. A device, method and program for predictive image encoding, a device, method and program for predictive image decoding, and an encoding / decoding system and method. / Boon C.S. Suzuki Yoshinori, Tan T.K .; Applicant and patent holder NTT DOCOMO, INC. (JP) No. 20111134659/08; declared 12/25/09; publ. 08/27/14, Bull. Number 24. - 42 p.: Ill., S. 13, 14, 16, 17]. Then, step 206 is performed, in which a difference is obtained between the pixel signal of the considered tth small region and the prediction signal of this small region (hereinafter referred to as the "residual signal between the pixel signals of the considered small region and the generated prediction signal", or "residual signal", or "difference image") using the subtraction module 102, characterized in that the difference between the pixel signal of the considered t-th small area and the predicted signal is analyzed This small area determines the method of generating a certain signal of the method of generating a compressed signal depending on the brightness and contrast, as the signal of the method of generating a compressed signal (hereinafter referred to as “information related to the formation of a compressed signal”), depending on the range of brightness and contrast refers to ordinary images, then using the block switching coding modes 104 provide the execution of step 207: frequency conversion of the resulting residual th signal converter 105, the subsequent quantization of the transformed residual signal in block 109 and entropy coding the quantized residual signal via a variable length code or arithmetic code at block 113, forming thereby the compressed signal [Pat. 2526764 Russian Federation, IPC 7 H04N 19/50. A device, method and program for predictive image encoding, a device, method and program for predictive image decoding, and an encoding / decoding system and method. / Boon C.S., Suzuki Yoshinori, Tan T.K .; Applicant and patent holder NTT DOCOMO, INC. (JP) No. 20111134659/08; declared 12/25/09; publ. 08/27/14, Bull. Number 24. - 42 pp., Ill., S. 14, 17], or to images with low contrast or a narrow dynamic range [Stremoukhov, M.V. Problems of efficient coding of images with low contrast and narrow dynamic range. / M.V. Stremoukhov, S.V. Chistyakov, I.V. Furtsev // Actual directions of development of security systems, special communications and information for the needs of public administration: IX All-Russian Interdepartmental Scientific Conference (Orel, February 11-12, 2015). At 12 h. Part 9. / Under the general. ed. B.V. Mizerova. - Eagle: Academy of the Federal Security Service of Russia, 2015. - 163 p., S. 148-151]. In the latter case, the encoding mode switch 104 provides: at step 208, converting the tth small region under consideration into a sequence of pixels (scan) using the preprocessing unit 107 (using, for example, some recursive scan [Alexandrov, V.V. Presentation and image processing: Recursive approach. / VV Aleksandrov, ND Gorsky. - L .: Nauka, 1985. - 192 p., P. 38-44]) and at step 209 - evaluation of the parameters of the nonlinear forming system block 106 by forming from the last the sequence of pixels of the current encoded subunit with the simultaneous formation of an exciting sequence corresponding to the given subunit (step 210), which provide identification of the parameters of the nonlinear forming system (step 211), which is a parametric model of the encoded subunit [Stremoukhov, M.V. A mathematical model of the forming system, taking into account non-linear statistical dependencies of images. / M.V. Stremoukhov, S.V. Chistyakov // News of SFU. Technical science. - 2012. - No. 6. - S. 156-161]; then, at step 213, subsequent quantization in block 109 of the obtained values of the parameters of the nonlinear forming system and entropy coding in block 113 of the quantized values of the parameters of the nonlinear forming system using a variable-length code or arithmetic code, also generating a compressed signal in accordance with the procedures provided for by standard N. 264 [Guk, I. Features of video compression according to the recommendation of H.264 / MPEG 4 Part 10 / I. Guk // Components and technologies. - 2006. - No. 2. - S. 5-7. - Guk_2006_02_20.pdf. Source: http://www.kit-e.ru]. Then, in the next step 213, the compressed signal and the information obtained in steps 207 or 212 associated with the generation of the prediction signals and related to the generation of the compressed signal are output from the output terminal 114.

Кодированный сигнал t-й небольшой области используется для того, чтобы прогнозировать t+1 небольшую область, которая должна обрабатываться следующей. Вследствие этого остаточный сигнал t-й небольшой области деквантуется посредством деквантователя 110, обратно преобразуется посредством обратного преобразователя 111, при этом в зависимости от связанной с формированием сжатого сигнала информацией блоком переключения режимов кодирования 104 (фиг. 1б) выбирается соответствующий режим обратного преобразования (при помощи блока 111.3 для обычных изображений или при помощи блоков 111.1 и 111.2 для изображений, обладающих малой контрастностью или узким динамическим диапазоном, притом блок 111.1 может быть реализован в соответствии с уже известным решением (патент №125749 от 10.03.2013), а блок 111.2 реализует процедуры, обратные выполняемым блоком 107 (подобно описанным в литературе [Александров, В.В. Представление и обработка изображений: Рекурсивный подход. / В.В. Александров, Н.Д. Горский. - Л.: Наука, 1985. - 192 с., С. 38-44]), и, затем, добавляется к сигналу прогнозирования, полученному так, как указано выше, посредством сумматора 112, чтобы формировать восстановленный сигнал t-й небольшой области (этап 214). Затем, чтобы формировать сигнал прогнозирования следующей t+1 небольшой области, восстановленный сигнал t-й небольшой области временно сохраняется в запоминающем устройстве 108 кадров (этап 215).The encoded signal of the tth small region is used to predict the t + 1 small region to be processed next. As a result of this, the residual signal of the tth small region is decanted by means of a dequantifier 110, is inverted by an inverter 111, and, depending on the information generated by the generation of the compressed signal, the encoding mode switching unit 104 (Fig. 1b) selects the corresponding inverse transformation mode (using block 111.3 for ordinary images or with blocks 111.1 and 111.2 for images with low contrast or narrow dynamic range, while block 111.1 could l is implemented in accordance with the already known solution (patent No. 125749 dated 03/10/2013), and block 111.2 implements the procedures opposite to that performed by block 107 (similar to those described in the literature [Alexandrov, VV Presentation and image processing: Recursive approach. / V .V. Aleksandrov, ND Gorsky. - L .: Nauka, 1985. - 192 p., S. 38-44]), and then, it is added to the prediction signal obtained as described above by the adder 112 to generate the reconstructed signal of the t-th small region (step 214). Then, in order to generate a prediction signal of the next t + 1 small region, the reconstructed signal of the t-th small region is temporarily stored in the frame memory 108 (step 215).

Процессы на этапах 204-215 выполняются относительно соответствующих рассматриваемых блоков, определяемых счетчиком t, и когда определяется то, что обработка всех рассматриваемых блоков завершена (значения t=N), на этапе 203, процесс по фиг. 2 заканчивается.The processes in steps 204-215 are performed relative to the respective blocks in question, determined by the counter t, and when it is determined that the processing of all blocks in question is completed (t = N), in step 203, the process of FIG. 2 ends.

Заявленный способ кодирования изображений на основе нелинейной формирующей системы обеспечивает повышение визуального субъективного качества восстановления видеоинформации по сравнению с известным методом частотного преобразования ДКП при сопоставимых значениях объективного показателя по критерию пикового отношения сигнал/шум (ПОСШ). Для доказательства достижения заявленного технического результата приведены экспериментальные исследования в соответствии с Рекомендацией МСЭ-Т ВТ.500-13 с ограниченной сферой охвата для "домашней среды" группой до 15 наблюдателей, не являющихся экспертами.The claimed method of encoding images based on a nonlinear forming system provides an increase in the visual subjective quality of video information recovery compared to the well-known method of frequency conversion of DCT at comparable values of the objective indicator by the criterion of the peak signal to noise ratio (SNR). To prove the achievement of the claimed technical result, experimental studies are presented in accordance with ITU-T Recommendation VT.500-13 with a limited scope for the "home environment" by a group of up to 15 observers who are not experts.

Для определения субъективной оценки качества использовались наборы тестовых обычных изображений и изображений, являющихся малоконтрастными и обладающих узким динамическим диапазоном.To determine the subjective quality assessment, test sets of ordinary images and images that are low-contrast and have a narrow dynamic range were used.

Указанные изображения обрабатывались с использованием варианта выполнения согласно способу-прототипу и варианта реализации кодирования изображений на основе нелинейной формирующей системы (фиг. 1) согласно предлагаемому способу.These images were processed using the embodiment according to the prototype method and the implementation of the image encoding based on the nonlinear forming system (Fig. 1) according to the proposed method.

Результаты оценивания согласно способу-прототипу и предлагаемому способу (фиг. 3) указывают на повышение визуального субъективного качества восстановления видеоинформации по сравнению с известным методом частотного преобразования ДКП при достаточно сопоставимых значениях объективного показателя по критерию пикового отношения сигнал/шум (ПОСШ) в заявляемом способе и решение поставленной задачи изобретения.The evaluation results according to the prototype method and the proposed method (Fig. 3) indicate an increase in the visual subjective quality of video information recovery compared to the known method of frequency conversion of DCT at sufficiently comparable values of the objective indicator according to the peak signal to noise ratio (SNR) in the claimed method and the solution of the problem of the invention.

Claims (1)

Способ кодирования изображений на основе нелинейной формирующей системы, содержащий этапы, на которых разделяют входное изображение на множество блоков, формируют сигнал прогнозирования относительно сигнала пикселов, который включен в рассматриваемый блок, который должен обрабатываться, из множества блоков, формируют остаточный сигнал между сигналом пикселов рассматриваемого блока и сформированным сигналом прогнозирования, при этом на этапе формирования сигнала прогнозирования подразделяют рассматриваемый блок на множество небольших областей, причем по меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны, и на этапе формирования сигнала прогнозирования формируют сигнал прогнозирования неквадратной небольшой области с использованием сигнала уже восстановленного пиксела или блока пикселов, которые контактируют с первой стороной, отличающийся тем, что на этапе формирования сжатого сигнала идентифицируют обрабатываемый блок в зависимости от диапазона значений яркости и контрастности на принадлежность к высококонтрастному либо обладающему малой контрастностью или узким динамическим диапазоном изображению, осуществляют для идентифицированного как обладающего малой контрастностью или узким динамическим диапазоном изображения преобразование рассматриваемого блока в последовательность пикселов, оценку параметров нелинейной формирующей системы, формирование сжатого сигнала посредством кодирования параметров нелинейной формирующей системы, осуществляют для идентифицированного как высококонтрастного изображения формирование сжатого сигнала посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.A method for encoding images based on a nonlinear forming system, comprising the steps of dividing the input image into a plurality of blocks, generating a prediction signal for a pixel signal that is included in the considered block to be processed, from the plurality of blocks, generating a residual signal between the pixel signal of the considered block and the generated prediction signal, while at the stage of generating the forecast signal, the block under consideration is divided into a plurality of sky smaller areas, at least one of the small areas is non-square and the length of the first side of the non-square small area exceeds the length of the second side, which is different from the first side, and at the stage of generating the prediction signal, a prediction signal of the non-square small region is generated using the signal of the already restored pixel or block of pixels that are in contact with the first side, characterized in that at the stage of forming the compressed signal identify the processed block in depending on the range of brightness and contrast values for belonging to a high-contrast or low contrast or narrow dynamic range image, for the image identified as having a low contrast or narrow dynamic range, the block under consideration is converted into a sequence of pixels, the parameters of the nonlinear forming system are evaluated, and a compressed signal is generated by encoding the parameters of the nonlinear forming system, carry out for a high-contrast image identified as generating a compressed signal by encoding a residual signal, decompress the compressed signal and save the decompressed signal as a reconstructed pixel signal.
RU2016109070A 2016-03-11 2016-03-11 Method for encoding images based on nonlinear forming system RU2614576C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2016109070A RU2614576C1 (en) 2016-03-11 2016-03-11 Method for encoding images based on nonlinear forming system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2016109070A RU2614576C1 (en) 2016-03-11 2016-03-11 Method for encoding images based on nonlinear forming system

Publications (1)

Publication Number Publication Date
RU2614576C1 true RU2614576C1 (en) 2017-03-28

Family

ID=58505466

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016109070A RU2614576C1 (en) 2016-03-11 2016-03-11 Method for encoding images based on nonlinear forming system

Country Status (1)

Country Link
RU (1) RU2614576C1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000064185A1 (en) * 1999-04-15 2000-10-26 Sarnoff Corporation Standard compression with dynamic range enhancement of image regions
WO2012147022A2 (en) * 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
RU125749U1 (en) * 2012-07-27 2013-03-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) NONLINEAR FORMING SYSTEM
RU2526764C2 (en) * 2009-01-22 2014-08-27 Нтт Докомо, Инк. Apparatus, method and programme for image predictive coding, apparatus, method and programme for image predictive decoding and encoding/decoding system and method
WO2015180854A1 (en) * 2014-05-28 2015-12-03 Koninklijke Philips N.V. Methods and apparatuses for encoding an hdr images, and methods and apparatuses for use of such encoded images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000064185A1 (en) * 1999-04-15 2000-10-26 Sarnoff Corporation Standard compression with dynamic range enhancement of image regions
RU2526764C2 (en) * 2009-01-22 2014-08-27 Нтт Докомо, Инк. Apparatus, method and programme for image predictive coding, apparatus, method and programme for image predictive decoding and encoding/decoding system and method
WO2012147022A2 (en) * 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
RU125749U1 (en) * 2012-07-27 2013-03-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) NONLINEAR FORMING SYSTEM
WO2015180854A1 (en) * 2014-05-28 2015-12-03 Koninklijke Philips N.V. Methods and apparatuses for encoding an hdr images, and methods and apparatuses for use of such encoded images

Similar Documents

Publication Publication Date Title
EP3677027B1 (en) Mixing of probabilities for entropy coding in video compression
US10425649B2 (en) Method and apparatus for performing graph-based prediction using optimization function
US8805106B2 (en) System and method for compressing and decompressing images and video
US20180115787A1 (en) Method for encoding and decoding video signal, and apparatus therefor
CN101578880A (en) Video decoding method and video encoding method
KR20080018469A (en) Method and apparatus for transforming and inverse-transforming image
Narmatha et al. A LS-compression scheme for grayscale images using pixel based technique
KR101822677B1 (en) Method for coding and method for reconstruction of a block of an image sequence
US10630974B2 (en) Coding of intra-prediction modes
KR101819762B1 (en) Methods for coding and decoding an image block
CN108182712A (en) Image processing method, apparatus and system
RU2614576C1 (en) Method for encoding images based on nonlinear forming system
RU2573770C2 (en) Method of compressing images
CN103139563A (en) Method for coding and reconstructing a pixel block and corresponding devices
Kumar et al. Lossless Video Compression Using Reinforcement Learning in UAV Applications
US10805638B2 (en) Method for coding a digital image, decoding method, devices, terminal equipment and related computer programs
Mohta et al. Image compression and gamma correction using DCT
CN116708788B (en) Mobile phone file compression system
CN117115433B (en) Display abnormality detection method, device, equipment and storage medium
US20240129546A1 (en) Artificial intelligence-based image encoding and decoding apparatus, and image encoding and decoding method thereby
Zhou et al. Approximate-DCT-derived measurement matrices for compressed sensing
JP2016103852A5 (en)
Montajabi et al. Recurrent Neural Network-Based Video Compression
JP2022112364A (en) Imaging device and measurement coding device
Ismeel Adaptive inter frame compression using image segmented technique

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20180312