RU2614576C1

RU2614576C1 - Method for encoding images based on nonlinear forming system

Info

Publication number: RU2614576C1
Application number: RU2016109070A
Authority: RU
Inventors: Михаил Владимирович Стремоухов; Сергей Владимирович Чистяков; Михаил Владимирович Илюшин; Александр Витальевич Шмойлов; Кирилл Александрович Батенков
Priority date: 2016-03-11
Filing date: 2016-03-11
Publication date: 2017-03-28

Abstract

FIELD: physics.

SUBSTANCE: method for encoding images is provided based on the nonlinear forming system, wherein the said unit is divided into a plurality of small areas at the stage of forming the prediction signal, and the prediction signal of the non-square small area is formed using the signal of the already reconstructed pixel or the unit of pixels, which contact with the first side. The processed unit is identified at the stage of the compressed signal forming, depending on the range of brightness and contrast belonging to the high contrast or low contrast image, transforming of the said unit is performed to the identified low contrast image in the sequence of pixels, estimating parameters of the nonlinear forming system, the formation the compressed signal is performed by encoding parameters of the nonlinear forming system, the formation of the compressed signal is performed for the identified high contrast image by encoding the residual signal, the compressed signal is decompressed and the decompressed signal is stored as the restored pixel signal.

EFFECT: improving the quality of the reconstructed video information.

3 dwg

Description

Изобретение относится к вычислительной технике, а именно к области обработки видеоинформации.The invention relates to computing, and in particular to the field of video processing.

Важность информационной поддержки деятельности должностных лиц органов управления определяет потребность в расширении перечня и повышении качества предоставляемых им инфокоммуникационных услуг. При этом наибольшей содержательностью и удобством отличается визуальная форма представления информации, обеспечивающая получение таких сведений об объектах управления, которые другими видами и способами информационного обмена получить невозможно. Характерной особенностью видеоинформации является наличие различных видов избыточности. При устранении избыточности видеоинформации в основном используются методы, учитывающие линейные связи между элементами.The importance of information support for the activities of government officials determines the need to expand the list and improve the quality of the information and communication services provided to them. At the same time, the visual presentation of information is the most informative and convenient, providing such information about control objects that cannot be obtained by other types and methods of information exchange. A characteristic feature of video information is the presence of various types of redundancy. When eliminating redundancy of video information, methods that take into account linear relationships between elements are mainly used.

Известен способ (Recommendation ITU-T Н.264. Advanced video coding for generic audiovisual services (Series H: Audiovisual and multimedia systems. Infrastructure of audiovisual services - Coding of moving video) - 2012 - 01 - 01. - ITU, 2012. - 680 с.), согласно которому берут макроблоки размером 16×16 точек обрабатываемого кадра изображения, формируют прогноз макроблока из выборок текущего кадра, предварительно закодированных и восстановленных (INTRA-режим), или с учетом изменений, которые произошли в текущем кадре по сравнению с одним или несколькими предыдущими или последующими (INTER-режим), вычисляют макроблок остаточных коэффициентов путем вычитания полученного прогноза из текущего макроблока, выполняют квазиортогональное частотное преобразование остаточных коэффициентов, квантуют полученный на основе частотного преобразования набор частотных коэффициентов, при этом набор преобразованных и квантованных коэффициентов служит исходным для обратного канала реконструкции данных, далее выстраивают коэффициенты в линейный массив в порядке возрастания и производят энтропийное кодирование упорядоченного массива коэффициентов, при этом формируют выходную битовую последовательность кодера из закодированных коэффициентов и дополнительной информации, требуемой для правильного декодирования макроблока (режима прогноза, коэффициента квантования и т.д.).The known method (Recommendation ITU-T H.264. Advanced video coding for generic audiovisual services (Series H: Audiovisual and multimedia systems. Infrastructure of audiovisual services - Coding of moving video) - 2012 - 01 - 01. - ITU, 2012. - 680 s.), According to which macroblocks with a size of 16 × 16 points of the processed image frame are taken, a macroblock forecast is formed from samples of the current frame previously encoded and restored (INTRA mode), or taking into account changes that have occurred in the current frame compared to one or several previous or subsequent (INTER-mode), calculate the macroblock residual coefficients by subtracting the obtained forecast from the current macroblock, perform quasi-orthogonal frequency conversion of the residual coefficients, quantize the set of frequency coefficients obtained on the basis of the frequency conversion, while the set of converted and quantized coefficients serves as the initial for the reverse data reconstruction channel, then they build the coefficients in a linear array in ascending order and produce entropy coding of an ordered array of coefficients, while forming the output bit sequence encoder reliability from encoded coefficients and additional information required for correct macroblock decoding (prediction mode, quantization coefficient, etc.).

Недостатком указанного способа является недостаточно высокое качество восстановленной видеоинформации при кодировании малоконтрастных изображений и изображениях с малым динамическим диапазоном (d≤100) [Стремоухов, М.В. Проблемы эффективного кодирования изображений с малой контрастностью и узким динамическим диапазоном. / М.В. Стремоухов, С.В. Чистяков, И.В. Фурцев // Актуальные направления развития систем охраны, специальной связи и информации для нужд государственного управления: IX Всероссийская межведомственная научная конференция (Орел, 11-12 февраля 2015 года). В 12 ч. Ч. 9. / Под общ. ред. В.В. Мизерова. - Орел: Академия ФСО России, 2015. - 163 с., С. 148-151].The disadvantage of this method is the insufficiently high quality of the restored video information when encoding low-contrast images and images with a small dynamic range (d≤100) [Stremoukhov, M.V. Problems of efficient coding of images with low contrast and narrow dynamic range. / M.V. Stremoukhov, S.V. Chistyakov, I.V. Furtsev // Actual directions of development of security systems, special communications and information for the needs of public administration: IX All-Russian Interdepartmental Scientific Conference (Orel, February 11-12, 2015). At 12 h. Part 9. / Under the general. ed. V.V. Mizerova. - Eagle: Academy of the Federal Security Service of Russia, 2015. - 163 p., S. 148-151].

Наиболее близким по технической сущности к заявляемому способу и выбранным в качестве прототипа является способ для прогнозирующего кодирования изображений (патент RU 2526764 от 25.12.2009), заключающийся в том, что разделяют входное изображение на множество блоков, формируют сигнал прогнозирования относительно сигнала пикселов, который включен в рассматриваемый блок, который должен обрабатываться, из множества блоков, формируют остаточный сигнал между сигналом пикселов рассматриваемого блока и сформированным сигналом прогнозирования, при этом на этапе формирования сигнала прогнозирования подразделяют рассматриваемый блок на множество небольших областей, причемпо меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны, и на этапе формирования сигнала прогнозирования формируют сигнал прогнозирования неквадратной небольшой области с использованием сигнала уже восстановленного пиксела, который контактирует с первой стороной, формируют сжатый сигнал посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.The closest in technical essence to the claimed method and selected as a prototype is a method for predictive encoding of images (patent RU 2526764 from 12.25.2009), which consists in dividing the input image into many blocks, generating a prediction signal relative to the pixel signal, which is included into the block under consideration, which must be processed, from a plurality of blocks, a residual signal is formed between the pixel signal of the block under consideration and the generated prediction signal, when ohm, at the stage of generating the forecast signal, the block under consideration is divided into many small areas, at least one of the small areas is non-square and the length of the first side of the non-square small area exceeds the length of the second side, which differs from the first side, and at the stage of generating the forecast signal squared small area using the signal of the already restored pixel, which is in contact with the first side, form compressed th signal by encoding the residual signal, decompress the compressed signal and save the decompressed signal as a reconstructed pixel signal.

Недостатком способа-прототипа является недостаточно высокое качество восстановленной видеоинформации на приеме при кодировании изображений, содержащих мелкие контрастные элементы (надписи), малоконтрастных изображений, изображений, полученных в условиях сумерек, слабой освещенности, при тумане и задымлении, определяемое следующим:The disadvantage of the prototype method is the insufficiently high quality of the restored video information at the reception when encoding images containing small contrasting elements (inscriptions), low-contrast images, images obtained in twilight conditions, low light, fog and smoke, defined by the following:

1) применение алгоритмов, основанных на двумерном косинусном преобразовании (ДКП), при стандартных процедурах квантования его коэффициентов приводит к существенному снижению общего субъективного качества восстановленной видеоинформации при достаточно высоких значениях объективного показателя по критерию пикового отношения сигнал/шум (ПОСШ);1) the use of algorithms based on two-dimensional cosine transform (DCT), with standard procedures for quantizing its coefficients, leads to a significant decrease in the overall subjective quality of the reconstructed video information at fairly high values of the objective indicator by the criterion of peak signal to noise ratio (SNR);

2) отсутствие эффективных процедур кодирования, учитывающих нелинейные взаимосвязи между элементами изображений, обладающих малой контрастностью или узким динамическим диапазоном.2) the lack of effective coding procedures that take into account non-linear relationships between image elements with low contrast or narrow dynamic range.

При существующих требованиях к качеству восстанавливаемой на приеме видеоинформации необходима ее более тщательная обработка. В данных условиях способы, не учитывающие нелинейные взаимосвязи между элементами изображений, обладающих малой контрастностью или узким динамическим диапазоном, становятся неприемлемыми и не обеспечивают достаточного качества восстановленной видеоинформации.Given the existing requirements for the quality of the video information being restored at the reception, more thorough processing is necessary. Under these conditions, methods that do not take into account non-linear relationships between image elements with low contrast or narrow dynamic range become unacceptable and do not provide sufficient quality of the restored video information.

Данное обстоятельство определяет необходимость разработки способов повышения качества восстановленной видеоинформации за счет улучшения визуального восприятия изображений, обладающих малой контрастностью или узким динамическим диапазоном, путем добавления при эффективном кодировании процедур, учитывающих нелинейные взаимосвязи между элементами таких изображений.This circumstance determines the need to develop ways to improve the quality of the restored video information by improving the visual perception of images with low contrast or a narrow dynamic range, by adding procedures that take into account non-linear relationships between the elements of such images with effective coding.

Задачей изобретения является разработка способа кодирования изображений на основе нелинейной формирующей системы, позволяющего повысить визуальное субъективное качество восстановленной видеоинформации по сравнению с известным методом частотного преобразования ДКП при достаточно сопоставимых значениях объективного показателя по критерию ПОСШ.The objective of the invention is to develop a method of encoding images based on a nonlinear forming system, which allows to increase the visual subjective quality of the restored video information in comparison with the known method of frequency conversion of DCT at sufficiently comparable values of the objective indicator by the criterion of SEQ.

В заявленном способе эта задача решается тем, что в известном способе для прогнозирующего кодирования изображений, заключающемся в том, что разделяют входное изображение на множество блоков, формируют сигнал прогнозирования относительно сигнала пикселов, который включен в рассматриваемый блок, который должен обрабатываться, из множества блоков, формируют остаточный сигнал между сигналом пикселов рассматриваемого блока и сформированным сигналом прогнозирования, при этом на этапе формирования сигнала прогнозирования подразделяют рассматриваемый блок на множество небольших областей, причем по меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны, и на этапе формирования сигнала прогнозирования формируют сигнал прогнозирования неквадратной небольшой области с использованием сигнала уже восстановленного пиксела, который контактирует с первой стороной, дополнительно на этапе формирования сжатого сигнала идентифицируют обрабатываемый блок на принадлежность к малоконтрастному или высококонтрастному изображению, осуществляют для малоконтрастного изображения предварительную обработку (развертку), оценивают параметры нелинейной формирующей системы, формируют сжатый сигнал посредством кодирования параметров нелинейной формирующей системы, формируют для высококонтрастного изображения сжатый сигнал посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.In the claimed method, this problem is solved in that in the known method for predictive encoding of images, which consists in dividing the input image into a plurality of blocks, generating a prediction signal for a pixel signal, which is included in the considered block to be processed, from a plurality of blocks, form a residual signal between the pixel signal of the considered block and the generated prediction signal, while at the stage of generating the prediction signal, the ra a block being considered into a plurality of small areas, at least one of the small areas being non-square and the length of the first side of the non-square small area exceeds the length of the second side, which is different from the first side, and at the stage of generating the prediction signal, a prediction signal of the non-square small area is generated using the signal already restored pixel, which is in contact with the first side, in addition, at the stage of generating the compressed signal, we identify the processed the second block for belonging to a low-contrast or high-contrast image, preliminary processing (sweep) is carried out for a low-contrast image, the parameters of the nonlinear forming system are evaluated, a compressed signal is generated by encoding the parameters of the non-linear forming system, a compressed signal is generated for the high-contrast image by encoding the residual signal, the compressed signal is unpacked and storing the decompressed signal as a reconstructed pixel signal.

Новая совокупность существенных признаков позволяет достичь указанного технического результата за счет того, что идентифицируют обрабатываемый блок на принадлежность к малоконтрастному или высококонтрастному изображению, осуществляют для малоконтрастного изображения предварительную обработку (развертку), оценивают параметры нелинейной формирующей системы, формируют сжатый сигнал посредством кодирования параметров нелинейной формирующей системы, формируют для высококонтрастного изображения сжатый сигнал посредством кодирования остаточного сигнала, распаковывают сжатый сигнал и сохраняют распакованный сигнал в качестве восстановленного сигнала пикселов.A new set of essential features allows you to achieve the specified technical result due to the fact that the processed block is identified as belonging to a low-contrast or high-contrast image, preliminary processing (sweep) is performed for a low-contrast image, the parameters of the nonlinear forming system are evaluated, a compressed signal is generated by encoding the parameters of the nonlinear forming system form a compressed signal for high-contrast image by means of encoded After extracting the residual signal, decompress the compressed signal and save the decompressed signal as a reconstructed pixel signal.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного способа кодирования изображений на основе нелинейной формирующей системы, отсутствуют. Следовательно, заявленное изобретение соответствует условию патентоспособности «новизна».The analysis of the prior art made it possible to establish that there are no analogues that are characterized by a combination of features that are identical to all the features of the claimed method of encoding images based on a nonlinear forming system. Therefore, the claimed invention meets the condition of patentability "novelty."

Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразований на достижение указанного технического результата. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».Search results for known solutions in this and related fields of technology in order to identify features that match the distinctive features of the claimed object from the prototype showed that they do not follow explicitly from the prior art. The prior art also did not reveal the popularity of the impact provided by the essential features of the claimed invention, the transformations on the achievement of the specified technical result. Therefore, the claimed invention meets the condition of patentability "inventive step".

Заявленное изобретение поясняется следующими чертежами:The claimed invention is illustrated by the following drawings:

фиг. 1 - вариант реализации системы эффективного кодирования видеоинформации, обеспечивающей улучшение восприятия восстановленных изображений согласно предлагаемому способу;FIG. 1 - an embodiment of a system for efficient coding of video information, providing improved perception of the restored images according to the proposed method;

фиг. 2 - этапы эффективного кодирования видеоинформации согласно предлагаемому способу;FIG. 2 - stages of effective coding of video information according to the proposed method;

фиг. 3 - результаты оценки качества восприятия восстановленных изображений в устройствах эффективного кодирования видеоинформации.FIG. 3 - the results of assessing the quality of perception of the reconstructed images in devices for efficient coding of video information.

Реализация заявленного способа включает в себя этапы: разделения входного изображения на множество блоков, дополнительного разделения блока на множество небольших областей, при этом по меньшей мере одна из небольших областей является неквадратной и длина первой стороны неквадратной небольшой области превышает длину второй стороны, которая отличается от первой стороны; формирование сигналов прогнозирования относительно сигнала пикселов, включенного в рассматриваемую небольшую область; формирование остаточного сигнала между сигналами пикселов рассматриваемой небольшой области и сформированным сигналом прогнозирования; формирование сжатого сигнала посредством кодирования остаточного сигнала; и формирование сжатых данных изображений, которые включают в себя сжатый сигнал и связанную с формированием сигналов прогнозирования информацию, указывающую способ формирования сигнала прогнозирования небольшой области при прогнозирующем кодировании; извлечения остаточного сигнала небольшой области из данных сжатых изображений и распаковки восстановленного остаточного сигнала; извлечения связанной с формированием сигналов прогнозирования информации из данных сжатых изображений; и формирования сигнала прогнозирования небольшой области на основе связанной с формированием сигналов прогнозирования информации; распаковки сигнала пикселов небольшой области посредством добавления восстановленного остаточного сигнала к сигналу прогнозирования небольшой области; и сохранения распакованного сигнала пикселов как восстановленного сигнала пикселов.Implementation of the inventive method includes the steps of: splitting an input image into a plurality of blocks, further splitting a block into a plurality of small areas, wherein at least one of the small areas is non-square and the length of the first side of the non-square small area exceeds the length of the second side, which differs from the first parties; generating prediction signals with respect to the pixel signal included in the considered small area; generating a residual signal between the pixel signals of the considered small area and the generated prediction signal; generating a compressed signal by encoding a residual signal; and generating compressed image data, which includes a compressed signal and information related to generating prediction signals, indicating a method for generating a prediction signal of a small area in predictive coding; extracting the residual signal of a small area from the compressed image data and decompressing the reconstructed residual signal; extracting information related to the generation of prediction signals from the compressed image data; and generating a prediction signal of a small area based on information associated with the generation of prediction signals; decompressing the pixel signal of the small region by adding the reconstructed residual signal to the prediction signal of the small region; and storing the decompressed pixel signal as a reconstructed pixel signal.

Кроме того, на этапе формирования сжатого сигнала остаточный сигнал с узкими диапазонами значений яркости и контрастности (d≤100) [Стремоухов, М.В. Проблемы эффективного кодирования изображений с малой контрастностью и узким динамическим диапазоном. / М.В. Стремоухов, С.В. Чистяков, И.В. Фурцев // Актуальные направления развития систем охраны, специальной связи и информации для нужд государственного управления: IX Всероссийская межведомственная научная конференция (Орел, 11-12 февраля 2015 года). В 12 ч. Ч. 9. / Под общ. ред. В.В. Мизерова. - Орел: Академия ФСО России, 2015. - 163 с., С. 148-151] может быть отнесен к изображениям, обладающим малой контрастностью или узким динамическим диапазоном.In addition, at the stage of generating a compressed signal, a residual signal with narrow ranges of brightness and contrast (d≤100) [Stremoukhov, M.V. Problems of efficient coding of images with low contrast and narrow dynamic range. / M.V. Stremoukhov, S.V. Chistyakov, I.V. Furtsev // Actual directions of development of security systems, special communications and information for the needs of public administration: IX All-Russian Interdepartmental Scientific Conference (Orel, February 11-12, 2015). At 12 h. Part 9. / Under the general. ed. V.V. Mizerova. - Eagle: Academy of the Federal Security Service of Russia, 2015. - 163 p., S. 148-151] can be attributed to images with low contrast or narrow dynamic range.

Кроме того, сжатый сигнал для указанного остаточного сигнала может быть получен путем его предварительной обработки, оценки параметров и кодирования параметров нелинейной формирующей системы.In addition, a compressed signal for the specified residual signal can be obtained by pre-processing it, evaluating the parameters and coding the parameters of the nonlinear forming system.

Кроме того, на этапе формирования сжатых данных изображений связанная с формированием сжатого сигнала информация, указывающая способ формирования сжатого сигнала в зависимости от яркости и контрастности, может быть кодирована и сигнал, полученный посредством кодирования, может быть выведен вместе со сжатым сигналом.In addition, at the stage of generating the compressed image data, information related to the generation of the compressed signal indicating the method of generating the compressed signal depending on the brightness and contrast can be encoded and the signal obtained by encoding can be output together with the compressed signal.

Описание способа кодирования изображений на основе нелинейной формирующей системы.Description of the image encoding method based on a non-linear forming system.

Совокупность функциональных блоков и система логических связей между ними, реализующих заявленный способ кодирования, представлены на фиг. 1.The set of functional blocks and the system of logical connections between them that implement the claimed encoding method are presented in FIG. one.

Фиг. 2 является блок-схемой последовательности операций, иллюстрирующей способ кодирования изображений на основе нелинейной формирующей системы согласно варианту осуществления изобретения.FIG. 2 is a flowchart illustrating a method of encoding images based on a non-linear shaping system according to an embodiment of the invention.

В частности, как описано выше, фиг. 2 иллюстрирует процесс кодирования на основе нелинейной формирующей системы для каждого блока разделенного на блоки изображения.In particular, as described above, FIG. 2 illustrates a coding process based on a non-linear generating system for each block of block-divided image.

На этапе 201 по фиг. 2 регистрируют изображение [Фисенко, В.Т. Компьютерная обработка и распознавание изображений: Учеб. пособие. / В.Т. Фисенко, Т.Ю. Фисенко. – СПб.: СПбГУ ИТМО, 2008. - 192 с., С. 3-11, 31-45], которое поблочно поступает на вход системы кодирования в качестве исходных данных.At step 201 of FIG. 2 register the image [Fisenko, V.T. Computer processing and image recognition: Textbook. allowance. / V.T. Fisenko, T.Yu. Fisenko. - St. Petersburg: St. Petersburg State University ITMO, 2008. - 192 p., S. 3-11, 31-45], which is block-wise fed to the input of the coding system as input data.

На этапе 202 подразделяют рассматриваемый блок изображения, имеющий N×N пикселов, на множество небольших областей при помощи делителя на блоки 101 по фиг. 1а. В этом варианте осуществления, несмотря на то, что число N равно 8 (N=8), оно может быть равно другому целому числу. Небольшая область в варианте осуществления прототипа показывается как имеющая неквадратную форму.At step 202, the image block having N × N pixels is subdivided into a plurality of small areas using a divider into blocks 101 of FIG. 1a. In this embodiment, although the number N is 8 (N = 8), it may be equal to another integer. A small area in an embodiment of the prototype is shown as having a non-square shape.

Затем, на этапе 203 выполняют первоначальную установку значения t=1 счетчика t, обеспечивающего идентификацию небольших областей, которые должны обрабатываться, после чего процессы на этапах 204-215, которые должны описываться ниже, выполняются относительно соответствующих небольших областей, определяемых счетчиком t, который после каждого цикла этапов 204-215 прирастает на "1" вплоть до значения t=N. При этом сначала на этапе 204 формируют множество вариантов сигналов прогнозирования относительно рассматриваемой небольшой области (например, при (t=1) - первой небольшой области) при помощи формирователя сигналов прогнозирования 103. В варианте осуществления прототипа на этапе 205 сигнал прогнозирования для первой небольшой области формируют посредством экстраполяции уже восстановленного пиксела (сигнал пикселов группы уже восстановленных пикселов является сигналом пикселов, который кодирован и затем распакован ранее и сохранен в запоминающем устройстве кадров 108), который контактирует с рассматриваемой небольшой областью, путем выбора одного из девяти способов экстраполяции среднего значения уже восстановленных пикселов, дающего наименьшую ошибку из вариантов сигналов прогнозирования, полученных посредством девяти указанных способов в качестве сигнала прогнозирования, и определяет способ формирования определенного сигнала прогнозирования в качестве сигнала режима прогнозирования (в дальнейшем называемого "связанной с формированием сигналов прогнозирования информацией"). Для последующих небольших областей в качестве сигнала прогнозирования используют небольшую область, имеющую наименьшую ошибку из девяти вариантов сигналов прогнозирования, полученных посредством девяти указанных способов. Вышеуказанные этапы 202-203 могут быть выполнены в соответствии с описанием, представленном в прототипе [Пат. 2526764 Российская Федерация, МПК⁷ H04N 19/50. Устройство, способ и программа для прогнозирующего кодирования изображений, устройство, способ и программа для прогнозирующего декодирования изображений и система и способ кодирования/декодирования. / Боон Ч.С. Сузуки Йосинори, Тан Т.К.; заявитель и патентообладатель НТТ ДОКОМО, ИНК. (JP) - №2011134659/08; заявл. 25.12.09; опубл. 27.08.14, Бюл. №24. - 42 с.: ил., С. 13, 14, 16, 17]. Затем выполняется этап 206, на котором получают разность между сигналом пикселов рассматриваемой t-й небольшой области и сигналом прогнозирования данной небольшой области (называемую в последующем "остаточным сигналом между сигналами пикселов рассматриваемой небольшой области и сформированным сигналом прогнозирования", или "остаточным сигналом", или "разностным изображением") при помощи модуля вычитания 102, отличающийся тем, что анализируется разность между сигналом пикселов рассматриваемой t-й небольшой области и сигналом прогнозирования данной небольшой области и определяется способ формирования определенного сигнала способа формирования сжатого сигнала в зависимости от яркости и контрастности, в качестве сигнала способа формирования сжатого сигнала (в дальнейшем называемого "связанной с формированием сжатого сигнала информацией"), в зависимости от диапазона значений яркости и контрастности относится к обычным изображениям, - тогда с помощью блока переключения режимов кодирования 104 обеспечивают выполнение этапа 207: частотное преобразование полученного остаточного сигнала преобразователем 105, последующее квантование преобразованного остаточного сигнала в блоке 109 и энтропийное кодирование квантованного остаточного сигнала с помощью кода переменной длины или арифметического кода в блоке 113, формируя, тем самым, сжатый сигнал [Пат. 2526764 Российская Федерация, МПК⁷ H04N 19/50. Устройство, способ и программа для прогнозирующего кодирования изображений, устройство, способ и программа для прогнозирующего декодирования изображений и система и способ кодирования/декодирования. / Боон Ч.С., Сузуки Йосинори, Тан Т.К.; заявитель и патентообладатель НТТ ДОКОМО, ИНК. (JP) - №2011134659/08; заявл. 25.12.09; опубл. 27.08.14, Бюл. №24. - 42 с.: ил., С. 14, 17], - либо к изображениям, обладающим малой контрастностью или узким динамическим диапазоном [Стремоухов, М.В. Проблемы эффективного кодирования изображений с малой контрастностью и узким динамическим диапазоном. / М.В. Стремоухов, С.В. Чистяков, И.В. Фурцев // Актуальные направления развития систем охраны, специальной связи и информации для нужд государственного управления: IX Всероссийская межведомственная научная конференция (Орел, 11-12 февраля 2015 года). В 12 ч. Ч. 9. / Под общ. ред. B.В. Мизерова. - Орел: Академия ФСО России, 2015. - 163 с., С. 148-151]. В последнем случае переключатель режима кодирования 104 обеспечивает: на этапе 208 - преобразование рассматриваемой t-й небольшой области в последовательность пикселов (развертку) при помощи блока предварительной обработки 107 (используя, например, какую-либо рекурсивную развертку [Александров, В.В. Представление и обработка изображений: Рекурсивный подход. / В.В. Александров, Н.Д. Горский. - Л.: Наука, 1985. - 192 с., C. 38-44]) и на этапе 209 - оценку параметров нелинейной формирующей системы блоком 106 путем формирования из полученной на предыдущем этапе последовательности пикселов текущего кодируемого субблока с одновременным формированием соответствующей данному субблоку возбуждающей последовательности (этап 210), обеспечивающих идентификацию параметров нелинейной формирующей системы (этап 211), являющейся параметрической моделью кодируемого субблока [Стремоухов, М.В. Математическая модель формирующей системы, учитывающая нелинейные статистические зависимости изображений. / М.В. Стремоухов, С.В. Чистяков // Известия ЮФУ. Технические науки. - 2012. - №6. - С. 156-161]; затем на этапе 213 - последующее квантование в блоке 109 полученных значений параметров нелинейной формирующей системы и энтропийное кодирование в блоке 113 квантованных значений параметров нелинейной формирующей системы с помощью кода переменной длины или арифметического кода, также формирующее сжатый сигнал в соответствии с процедурами, предусмотренными стандартом Н.264 [Гук, И. Особенности сжатия видеоданных по рекомендации Н.264 / MPEG 4 Part 10 / И. Гук // Компоненты и технологии. – 2006. - №2. - С. 5-7. - Guk_2006_02_20.pdf. Источник: http://www.kit-e.ru]. Затем на следующем этапе 213 выводятся из терминала 114 вывода сжатый сигнал и связанная с формированием сигналов прогнозирования и связанная с формирования сжатого сигнала информация, полученная на этапах 207 или 212.Then, at step 203, the initial setting of the value t = 1 of the counter t, which identifies the small areas to be processed, is performed, after which the processes at steps 204-215, which should be described below, are performed relative to the corresponding small areas determined by the counter t, which after of each cycle of steps 204-215 grows by "1" up to the value t = N. In this case, first, at step 204, a plurality of variants of prediction signals are generated with respect to the small area under consideration (for example, at (t = 1), the first small area) using the prediction signal generator 103. In the prototype embodiment, at step 205, a prediction signal for the first small region is generated by extrapolating an already restored pixel (the pixel signal of a group of already restored pixels is a pixel signal, which is encoded and then decompressed earlier and stored in memory frame monitor 108), which is in contact with the small area under consideration, by selecting one of nine methods for extrapolating the average value of the already restored pixels, which gives the smallest error among the prediction signal variants obtained by the nine indicated methods as the prediction signal, and determines the method for generating a certain signal prediction as a signal of the prediction mode (hereinafter referred to as “associated with the formation of prediction signals and formation "). For subsequent small regions, a small region having the smallest error of the nine variants of the prediction signals obtained by the nine indicated methods is used as a prediction signal. The above steps 202-203 can be performed in accordance with the description presented in the prototype [Pat. 2526764 Russian Federation, IPC ⁷ H04N 19/50. A device, method and program for predictive image encoding, a device, method and program for predictive image decoding, and an encoding / decoding system and method. / Boon C.S. Suzuki Yoshinori, Tan T.K .; Applicant and patent holder NTT DOCOMO, INC. (JP) No. 20111134659/08; declared 12/25/09; publ. 08/27/14, Bull. Number 24. - 42 p.: Ill., S. 13, 14, 16, 17]. Then, step 206 is performed, in which a difference is obtained between the pixel signal of the considered tth small region and the prediction signal of this small region (hereinafter referred to as the "residual signal between the pixel signals of the considered small region and the generated prediction signal", or "residual signal", or "difference image") using the subtraction module 102, characterized in that the difference between the pixel signal of the considered t-th small area and the predicted signal is analyzed This small area determines the method of generating a certain signal of the method of generating a compressed signal depending on the brightness and contrast, as the signal of the method of generating a compressed signal (hereinafter referred to as “information related to the formation of a compressed signal”), depending on the range of brightness and contrast refers to ordinary images, then using the block switching coding modes 104 provide the execution of step 207: frequency conversion of the resulting residual th signal converter 105, the subsequent quantization of the transformed residual signal in block 109 and entropy coding the quantized residual signal via a variable length code or arithmetic code at block 113, forming thereby the compressed signal [Pat. 2526764 Russian Federation, IPC ⁷ H04N 19/50. A device, method and program for predictive image encoding, a device, method and program for predictive image decoding, and an encoding / decoding system and method. / Boon C.S., Suzuki Yoshinori, Tan T.K .; Applicant and patent holder NTT DOCOMO, INC. (JP) No. 20111134659/08; declared 12/25/09; publ. 08/27/14, Bull. Number 24. - 42 pp., Ill., S. 14, 17], or to images with low contrast or a narrow dynamic range [Stremoukhov, M.V. Problems of efficient coding of images with low contrast and narrow dynamic range. / M.V. Stremoukhov, S.V. Chistyakov, I.V. Furtsev // Actual directions of development of security systems, special communications and information for the needs of public administration: IX All-Russian Interdepartmental Scientific Conference (Orel, February 11-12, 2015). At 12 h. Part 9. / Under the general. ed. B.V. Mizerova. - Eagle: Academy of the Federal Security Service of Russia, 2015. - 163 p., S. 148-151]. In the latter case, the encoding mode switch 104 provides: at step 208, converting the tth small region under consideration into a sequence of pixels (scan) using the preprocessing unit 107 (using, for example, some recursive scan [Alexandrov, V.V. Presentation and image processing: Recursive approach. / VV Aleksandrov, ND Gorsky. - L .: Nauka, 1985. - 192 p., P. 38-44]) and at step 209 - evaluation of the parameters of the nonlinear forming system block 106 by forming from the last the sequence of pixels of the current encoded subunit with the simultaneous formation of an exciting sequence corresponding to the given subunit (step 210), which provide identification of the parameters of the nonlinear forming system (step 211), which is a parametric model of the encoded subunit [Stremoukhov, M.V. A mathematical model of the forming system, taking into account non-linear statistical dependencies of images. / M.V. Stremoukhov, S.V. Chistyakov // News of SFU. Technical science. - 2012. - No. 6. - S. 156-161]; then, at step 213, subsequent quantization in block 109 of the obtained values of the parameters of the nonlinear forming system and entropy coding in block 113 of the quantized values of the parameters of the nonlinear forming system using a variable-length code or arithmetic code, also generating a compressed signal in accordance with the procedures provided for by standard N. 264 [Guk, I. Features of video compression according to the recommendation of H.264 / MPEG 4 Part 10 / I. Guk // Components and technologies. - 2006. - No. 2. - S. 5-7. - Guk_2006_02_20.pdf. Source: http://www.kit-e.ru]. Then, in the next step 213, the compressed signal and the information obtained in steps 207 or 212 associated with the generation of the prediction signals and related to the generation of the compressed signal are output from the output terminal 114.

Кодированный сигнал t-й небольшой области используется для того, чтобы прогнозировать t+1 небольшую область, которая должна обрабатываться следующей. Вследствие этого остаточный сигнал t-й небольшой области деквантуется посредством деквантователя 110, обратно преобразуется посредством обратного преобразователя 111, при этом в зависимости от связанной с формированием сжатого сигнала информацией блоком переключения режимов кодирования 104 (фиг. 1б) выбирается соответствующий режим обратного преобразования (при помощи блока 111.3 для обычных изображений или при помощи блоков 111.1 и 111.2 для изображений, обладающих малой контрастностью или узким динамическим диапазоном, притом блок 111.1 может быть реализован в соответствии с уже известным решением (патент №125749 от 10.03.2013), а блок 111.2 реализует процедуры, обратные выполняемым блоком 107 (подобно описанным в литературе [Александров, В.В. Представление и обработка изображений: Рекурсивный подход. / В.В. Александров, Н.Д. Горский. - Л.: Наука, 1985. - 192 с., С. 38-44]), и, затем, добавляется к сигналу прогнозирования, полученному так, как указано выше, посредством сумматора 112, чтобы формировать восстановленный сигнал t-й небольшой области (этап 214). Затем, чтобы формировать сигнал прогнозирования следующей t+1 небольшой области, восстановленный сигнал t-й небольшой области временно сохраняется в запоминающем устройстве 108 кадров (этап 215).The encoded signal of the tth small region is used to predict the t + 1 small region to be processed next. As a result of this, the residual signal of the tth small region is decanted by means of a dequantifier 110, is inverted by an inverter 111, and, depending on the information generated by the generation of the compressed signal, the encoding mode switching unit 104 (Fig. 1b) selects the corresponding inverse transformation mode (using block 111.3 for ordinary images or with blocks 111.1 and 111.2 for images with low contrast or narrow dynamic range, while block 111.1 could l is implemented in accordance with the already known solution (patent No. 125749 dated 03/10/2013), and block 111.2 implements the procedures opposite to that performed by block 107 (similar to those described in the literature [Alexandrov, VV Presentation and image processing: Recursive approach. / V .V. Aleksandrov, ND Gorsky. - L .: Nauka, 1985. - 192 p., S. 38-44]), and then, it is added to the prediction signal obtained as described above by the adder 112 to generate the reconstructed signal of the t-th small region (step 214). Then, in order to generate a prediction signal of the next t + 1 small region, the reconstructed signal of the t-th small region is temporarily stored in the frame memory 108 (step 215).

Процессы на этапах 204-215 выполняются относительно соответствующих рассматриваемых блоков, определяемых счетчиком t, и когда определяется то, что обработка всех рассматриваемых блоков завершена (значения t=N), на этапе 203, процесс по фиг. 2 заканчивается.The processes in steps 204-215 are performed relative to the respective blocks in question, determined by the counter t, and when it is determined that the processing of all blocks in question is completed (t = N), in step 203, the process of FIG. 2 ends.

Заявленный способ кодирования изображений на основе нелинейной формирующей системы обеспечивает повышение визуального субъективного качества восстановления видеоинформации по сравнению с известным методом частотного преобразования ДКП при сопоставимых значениях объективного показателя по критерию пикового отношения сигнал/шум (ПОСШ). Для доказательства достижения заявленного технического результата приведены экспериментальные исследования в соответствии с Рекомендацией МСЭ-Т ВТ.500-13 с ограниченной сферой охвата для "домашней среды" группой до 15 наблюдателей, не являющихся экспертами.The claimed method of encoding images based on a nonlinear forming system provides an increase in the visual subjective quality of video information recovery compared to the well-known method of frequency conversion of DCT at comparable values of the objective indicator by the criterion of the peak signal to noise ratio (SNR). To prove the achievement of the claimed technical result, experimental studies are presented in accordance with ITU-T Recommendation VT.500-13 with a limited scope for the "home environment" by a group of up to 15 observers who are not experts.

Для определения субъективной оценки качества использовались наборы тестовых обычных изображений и изображений, являющихся малоконтрастными и обладающих узким динамическим диапазоном.To determine the subjective quality assessment, test sets of ordinary images and images that are low-contrast and have a narrow dynamic range were used.

Указанные изображения обрабатывались с использованием варианта выполнения согласно способу-прототипу и варианта реализации кодирования изображений на основе нелинейной формирующей системы (фиг. 1) согласно предлагаемому способу.These images were processed using the embodiment according to the prototype method and the implementation of the image encoding based on the nonlinear forming system (Fig. 1) according to the proposed method.

Результаты оценивания согласно способу-прототипу и предлагаемому способу (фиг. 3) указывают на повышение визуального субъективного качества восстановления видеоинформации по сравнению с известным методом частотного преобразования ДКП при достаточно сопоставимых значениях объективного показателя по критерию пикового отношения сигнал/шум (ПОСШ) в заявляемом способе и решение поставленной задачи изобретения.The evaluation results according to the prototype method and the proposed method (Fig. 3) indicate an increase in the visual subjective quality of video information recovery compared to the known method of frequency conversion of DCT at sufficiently comparable values of the objective indicator according to the peak signal to noise ratio (SNR) in the claimed method and the solution of the problem of the invention.

Claims

A method for encoding images based on a nonlinear forming system, comprising the steps of dividing the input image into a plurality of blocks, generating a prediction signal for a pixel signal that is included in the considered block to be processed, from the plurality of blocks, generating a residual signal between the pixel signal of the considered block and the generated prediction signal, while at the stage of generating the forecast signal, the block under consideration is divided into a plurality of sky smaller areas, at least one of the small areas is non-square and the length of the first side of the non-square small area exceeds the length of the second side, which is different from the first side, and at the stage of generating the prediction signal, a prediction signal of the non-square small region is generated using the signal of the already restored pixel or block of pixels that are in contact with the first side, characterized in that at the stage of forming the compressed signal identify the processed block in depending on the range of brightness and contrast values for belonging to a high-contrast or low contrast or narrow dynamic range image, for the image identified as having a low contrast or narrow dynamic range, the block under consideration is converted into a sequence of pixels, the parameters of the nonlinear forming system are evaluated, and a compressed signal is generated by encoding the parameters of the nonlinear forming system, carry out for a high-contrast image identified as generating a compressed signal by encoding a residual signal, decompress the compressed signal and save the decompressed signal as a reconstructed pixel signal.