BG63586B1 - Method and device for pyramidal pattern encoding - Google Patents

Method and device for pyramidal pattern encoding Download PDF

Info

Publication number
BG63586B1
BG63586B1 BG103619A BG10361999A BG63586B1 BG 63586 B1 BG63586 B1 BG 63586B1 BG 103619 A BG103619 A BG 103619A BG 10361999 A BG10361999 A BG 10361999A BG 63586 B1 BG63586 B1 BG 63586B1
Authority
BG
Bulgaria
Prior art keywords
input
output
image
pyramid
coefficients
Prior art date
Application number
BG103619A
Other languages
Bulgarian (bg)
Other versions
BG103619A (en
Inventor
Румен КУНЧЕВ
Original Assignee
Румен КУНЧЕВ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Румен КУНЧЕВ filed Critical Румен КУНЧЕВ
Priority to BG103619A priority Critical patent/BG63586B1/en
Priority to AU16454/00A priority patent/AU1645400A/en
Priority to PCT/BG1999/000027 priority patent/WO2001010130A1/en
Publication of BG103619A publication Critical patent/BG103619A/en
Publication of BG63586B1 publication Critical patent/BG63586B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

The method and the device are used in the systems for transmitting photo- and TV-patterns across digital networks of the ISDN, ATM, Internet, satellite and cable connection canal types, etc. According to the method based on the pattern decomposition by inverse differential pyramid, the pattern is approximated by polynomial function the coefficients of which are determined by regression analysis, or by a pattern produced by inverse orthogonal conversion of the filtered transformant of the input pattern after preserving in it a small number of low frequency coefficients. These coefficients form the "zero" level (peak) of the pyramid. For forming its next level from the input pattern its approximation is subtracted, determined by the coefficients of the "zero" level. The "zero" difference pattern produced is divided in four equal in form and size sub-patterns and for each of them analogous operations are applied for finding their respective approximating patterns. For loss-free (reversible) compression 1/4 of the coefficient in the adjacent sub-patterns are reduced based on their relations, and entropy encoding is applied on the remaining ones. To increase the compression coefficient encoding without visual losses is applied without bilateral "trimming" from top and bottom of the low information levels of the pyramid and quantizing the coefficients in the remaining levels before their entropy encoding. The device allows recursive calculation of the decomposition without any use of decimation and interpolation. 2 claims, 2 figure

Description

Изобретението се отнася до метод и устройство за пирамидално кодиране на изображения с приложение в системите за компресиране на фото- и телевизионни изображения (видеосигнали) при предаването им по цифрови 10 мрежи от типа ISDN и ATM, Интернет, наземни, сателитни и кабелни канали за връзка, за видеотелефонни и видеоконферентни системи, системи за наблюдение и охрана на обекти, системи за нелинейно редактиране, за архиви- 15 ране на цифрови изображения върху твърди дискове, компакт-дискове, магнитни ленти и др.The invention relates to a method and device for pyramid encoding of images for use in photo and television image compression systems (video signals) when transmitted on digital 10 networks of type ISDN and ATM, Internet, terrestrial, satellite and cable channels , for video and videoconferencing systems, object monitoring and security systems, nonlinear editing systems, for archiving digital images on hard disks, CDs, magnetic tapes and more.

Предшестващо състояние на техникатаBACKGROUND OF THE INVENTION

Известни са методи и устройства за пирамидално кодиране на изображения чрез декомпозиция от ортогонален и неортогонален тип /1, 2/. В съответствие с първия метод, основан на дискретното преобразуване Wave- 25 let /3/, с помощта на банка от цифрови филтри и блокове за субдискретизация (децимация), входното изображение се разлага на четири изображения с двукратно намалени размери, съставящи първото ниво на ортогонал- 30 ната пирамида. В двумерната спектрална област на Фурие на тези изображения съответстват четири честотни ленти: първата от тях съдържа информация за нискочестотните компоненти в хоризонтално направление на спек- 35 търа и за високочестотните компоненти - във вертикално; втората - за високочестотните компоненти в хоризонтално направление и за нискочестотните - във вертикално; третата - за високочестотните компоненти в диагоналните 40 направления, и четвъртата - за нискочестотните компоненти едновременно в хоризонтално и вертикално направление. Изображението, съответстващо на последната лента, служи като входно (основа) за рекурентно построяване на 45 следващото ниво на пирамидата, а при завършване на разлагането представлява нейния връх. Компресиране на изображението се постига чрез предаване по канала за връзка на квантуваните пиксели от нивата на Wavelet пира- 50 мидата. При декомпресирането тези пиксели се квантуват инверсно и се обработват в обра тен ред чрез блокове за супердискретизация и банка от квадратурно-огледално (QMF) цифрови филтри. В резултат се получава ресурсивно възстановяване на изображението.Methods and apparatus for pyramidal image encoding by decomposition of orthogonal and non-orthogonal type are known (1, 2). In accordance with the first method, based on the discrete Wave-25 let / 3 / transformation, using a digital filter bank and sub-sampling units, the input image is decomposed into four images of twice the reduced size that make up the first orthogonal level - 30th pyramid. In the two-dimensional Fourier spectral region, these images correspond to four bands: the first one contains information about the low frequency components in the horizontal direction of the spectrum and the high frequency components in the vertical; the second is for the high frequency components in the horizontal direction and for the low frequency components in the vertical direction; the third for the high frequency components in diagonal 40 directions, and the fourth for the low frequency components in both horizontal and vertical directions. The image corresponding to the last lane serves as an input (basis) for the recurrent construction of the next level of the pyramid 45 and, at the completion of the decomposition, represents its apex. Image compression is achieved by transmitting quantized pixels from the Wavelet Pyramid Levels through the link channel. When decompressing, these pixels are inverted and processed in reverse order using super-sampling blocks and quadrature-mirror (QMF) digital filter banks. The result is a resounding image recovery.

Известно е устройство /4/, осъществяващо описания метод, чийто вход е свързан паралелно с два цифрови филтъра за обработка на изображението в хоризонтално направление, първият от които е високочестотен, а вторият - нискочестотен. Изходите на тези филтри са свързани през блокове за двукратна децимация съответно с две двойки от паралелно свързани цифрови филтри - високочестотен и нискочестотен за обработка на изображението във вертикално направление. Четирите изхода на двойките филтри са свързани през блокове за двукратна децимация с квантуващи блокове, чиито изходи през мултиплексор са свързани с канала за връзка. Същевременно, изходът на четвъртия квантуващ блок е свързан през блок за инверсно квантуване и буферна видеопамет с входа на кодера. Входът на декодера е свързан през демултиплексор съответно с четири блока за инверсно квантуване, двукратна супердискритизация (интерполация) и филтрация с помощта на банка от инверсни квадратурно-огледални филтри. Четири от тях са предназначени за обработка на изображенията в хоризонтално направление и два за вертикално, но след извършване на двукратна интерполация на хоризонтално филтрираните изображения от първата група филтри.A device (4) is known to carry out the method described, the input of which is connected in parallel with two digital filters for image processing in the horizontal direction, the first of which is high-frequency and the second - low-frequency. The outputs of these filters are connected via double decimation blocks respectively to two pairs of parallel connected digital filters - high frequency and low frequency for image processing in the vertical direction. The four outputs of the pairs of filters are connected via double decimation blocks to quantizing blocks whose outputs through the multiplexer are connected to the link channel. At the same time, the output of the fourth quantization unit is connected via an inverse quantization unit and a buffer video memory to the encoder input. The input of the decoder is connected via a demultiplexer respectively to four blocks for inverse quantization, double superdiscritization (interpolation) and filtration using a bank of inverted quadrature-mirror filters. Four of them are intended for image processing in the horizontal direction and two for the vertical image, but after double interpolation of the horizontally filtered images from the first group of filters.

В съответствие с втория метод, основан на неортогоналната декомпозиция чрез лапласова пирамида /5/, входното изображение се приема за нулево ниво (основа) на помощната гаусова пирамида. В процеса на пирамидално кодиране размерите на изображението се редуцират многократно чрез последователно прилагане на операциите двумерна нискочестотна филтрация и децимация. В резултат от поредната филтрация и децимация се съкращава всеки втори пиксел на изображението в хоризонтално и вертикално направление, с което се намалява двукратно неговата пространствена разделителна способност. Изображението след първата редукция представлява първото ниво (сечение) на гаусовата пирамида. Всяко следващо ниво на пирамидата се получава от по-долното по аналогичен начин чрез намаляване на размерите на съответното изображение с помощта на нискочестотна филт рация и децимация. Редукцията се прекратява, когато след нейното поредно изпълнение размерите на изображението достигнат минималния размер един пиксел (т.е. 1x1). Това изображение представлява последното ниво на гаусовата пирамида и съответства на нейния връх. Едновременно с построяване на гаусовата пирамида се изгражда и т.нар. “лапласова” пирамида на изображението. Нейното нулево ниво (основа) представлява разлика на изображенията от нулевото ниво на гаусовата пирамида и нейното следващо (първо) ниво, разширено два пъти по хоризонтала и вертикала с помощта на двумерна интерполация. Следващото (първо) ниво на лапласовата пирамида се получава по аналогичен начин на нулевото и представлява разлика на първото ниво на гаусовата пирамида и нейното следващо (второ) ниво, разширено два пъти чрез двумерна интерполация, и т.н. Последното ниво (върха) на лапласовата пирамида е изображение с размери 1x1 пиксела, което съвпада с това на гаусовата.In accordance with the second method, based on non-orthogonal decomposition by the Laplace Pyramid / 5 /, the input image is assumed to be zero (basis) of the auxiliary Gaussian Pyramid. In the process of pyramid coding, image sizes are repeatedly reduced by successive operations of two-dimensional low-pass filtration and decimation. As a result of sequential filtration and decimation, every second pixel of the image is reduced horizontally and vertically, reducing its spatial resolution twice. The image after the first reduction represents the first level (section) of the Gaussian pyramid. Each subsequent level of the pyramid is similarly obtained from the lower by reducing the size of the corresponding image by means of low pass filtering and decimation. The reduction is aborted when, after its sequential execution, the image sizes reach the minimum size of one pixel (ie 1x1). This image represents the last level of the Gaussian pyramid and corresponds to its apex. Simultaneously with the construction of the Gaussian pyramid, the so-called. "Laplace" image pyramid. Its zero level (base) is a difference of images from the zero level of the Gaussian pyramid and its next (first) level, expanded twice horizontally and vertically by two-dimensional interpolation. The next (first) level of the Laplace pyramid is obtained in a similar way to the zero and represents a difference between the first level of the Gaussian pyramid and its next (second) level, expanded twice by two-dimensional interpolation, etc. The last level (top) of the Laplace Pyramid is a 1x1 pixel image, which is the same as the Gaussian one.

Компресия на декомпозираното чрез лапласовата пирамида изображение се постига чрез редуциране на 1/3 от общия брой пиксели на пирамидата (съкращава се един от всеки четири пиксела в дадено ниво) в съответствие с алгоритъм, наречен “редуцирана” разликова пирамида /2/. За нейната по-нататъшна компресия се прилагат операциите квантуване на елементите от всяко ниво и ентропийно кодиране /6/. Данните за компресираните нива на пирамидата се предават по канала за връзка последователно от върха към нейната основа и по този начин се осъществява т.нар. “прогресивно” предаване на изображението с постепенно нарастване на неговата разделителна способност и размери.Compression of the Laplace Pyramid image is achieved by reducing 1/3 of the total number of pixels of the pyramid (shortening one of every four pixels at a given level) according to an algorithm called a "reduced" differential pyramid (2). For its further compression, the operations of quantization of the elements of each level and entropy coding / 6 / are applied. The data on the compressed levels of the pyramid are transmitted through the communication channel in series from the top to its base and thus the so-called. "Progressive" rendering of the image with a gradual increase in its resolution and size.

В процеса на декодиране на компресираното изображение при прогресивно предаване на нивата на неговата лапласова пирамида върху приетите данни се прилагат операциите инверсно квантуване и ентропийно декодиране. Първото получено изображение, съответстващо на върха на пирамидата (нейното последно ниво), се разширява двукратно чрез двумерна интерполация и се сумира със следващото изображение от предпоследното ниво на лапласовата пирамида и т.н. По този начин последователно се възстановяват изображенията, съответстващи на нивата на гау совата пирамида до достигането на нейната основа (нулевото ниво).In the process of decoding the compressed image in the progressive transmission of the levels of its Laplace pyramid, the inverse quantization and entropy decoding operations are applied to the received data. The first image obtained corresponding to the top of the pyramid (its last level) is expanded twice by two-dimensional interpolation and summed with the next image from the penultimate level of the Laplace pyramid, etc. In this way, images corresponding to the levels of the Gau Pyramid are consistently restored to their base (zero level).

Известно е устройство /7/, осъществяващо описания метод, което съдържа източник на изображение, свързан с входа на кодер за рекурсивно изчисляване на нивата на гаусовата и лапласовата пирамида. От своя страна кодерът съдържа последователно свързани блокове: за редуциране, квантуване, инверсно квантуване и разширяване на изображението. Изходът на блока за комутация е свързан също така и със сумиращия вход на суматор, чийто изваждащ вход е свързан с изхода на блока за разширяване. Изходът на този суматор е свързан с блок за квантуване, чийто изход представлява изхода на кодера, свързан с канала за предаване на разликовите изображения към декодера. Изходът на блока за квантуване, свързан с блока за редуциране, е свързан през буферна памет с входа на блока за кодера. Декодерът за рекурсивно възстановяване на предаденото изображение, чийто вход е свързан с канала за връзка, съдържа входен блок за инверсно квантуване. Той е свързан с първия вход на суматор, чийто втори вход е свързан с изхода на блок за разширяване. Неговият вход е свързан с изхода на буферна памет, входът на която е свързан с изхода на декодера.A device (7) is known to implement the method described, which comprises an image source coupled to an encoder input for recursively calculating Gaussian and Laplace pyramid levels. For its part, the encoder contains sequentially linked blocks: for reduction, quantization, inverse quantization and image enlargement. The output of the switching block is also connected to the summing input of an adder whose pull-out input is connected to the output of the expansion block. The output of this adder is connected to a quantization unit whose output represents the encoder output associated with the channel for transmitting the differential images to the decoder. The output of the quantization unit associated with the reduction unit is connected via a buffer memory to the input of the encoder unit. The recursive recovery decoder of the transmitted image whose input is coupled to the link channel comprises an inverse quantization input block. It is connected to the first input of an adder whose second input is connected to the output of an expansion block. Its input is connected to the output of the buffer memory, the input of which is connected to the output of the decoder.

Техническа същност на изобретениетоSUMMARY OF THE INVENTION

Задачата на изобретението е да се създаде метод за пирамидално кодиране на изображения, който се основава на един нов тип декомпозиция на цифрови изображения, наречена инверсна диференциална пирамида. Съгласно този метод в процеса на кодиране входното цифрово изображение се апроксимира по един от следните два начина: чрез двумерна полиномна функция с ш коефициента, чиито стойности са определени от изискването за минимизация на средноквадратичната грешка, или с изображение, получено чрез инверсно ортогонално преобразуване на филтрираната трансформанта (дискретния спектър) на входното изображение след запазването в нея само на група от ш избрани нискочестотни коефициенти, като тази трансформанта може да бъде определена с всяко от известните линейни ортогонални преобразувания, като дискретно косинусно преобразуване, преобразуването наIt is an object of the invention to provide a method for pyramidal image encoding based on a new type of digital image decomposition called the inverse differential pyramid. According to this method, the input digital image is approximated in one of the following two ways in the coding process: by a two-dimensional polynomial function with the coefficient whose values are determined by the requirement to minimize the root mean square error, or by an image obtained by inverse orthogonal transformation of the filtered the transform (discrete spectrum) of the input image after saving in it only a group of selected low frequency coefficients, this transformant can be determined by any of the stnite orthogonal linear transformation, discrete cosine transformation, transformation

Уолш-Адамар и др. Апроксимиращото изображение се описва с m коефициента независимо от вида на избраната апроксимация. Тези коефициенти представляват нивото “нула” (върха) на инверсната диференциална пирамида. За формиране на нейното следващо ниво се извършва поелементно изваждане на входното изображение и неговата апроксимация, определена въз основа на коефициентите за нивото “нула”. Полученото “нулево” разликово изображение се разделя на четири еднакви по форма и размери подизображения и за всяко от тях се прилагат същите операции за определяне на съответните им апроксимиращи подизображения по аналогия с входното. В резултат се получава съставената от апроксимиращите подизображения “нулева” разлика, която се описва общо с 4ш коефициента. Последните представляват първо ниво на пирамидата. Нейното второ ниво се формира, като от изображението на “нулевата” разлика се изважда нейната апроксимация и полученото “първо” разликово изображение се разделя на 16 еднакви по форма и размери подизображения. Върху всяко от тях се прилагат рекурсивно същите операции за апроксимация както върху подизображенията от предишната “нулева” разлика и т.н. При входно изображение с размери 2 х 2 пиксела на предпоследното (п-1)-во ниво от неговата инверсна пирамида съответства разликовото изображение п-2, което се описва с 4 'ш коефициента. Последното ниво на пирамидата представлява остатъчното разликово изображение η-l, чийто размери са равни на тези на входното. Построената по този начин пирамида има п+1 нива и се описва общо с 4+1(πι/3) коефициента, които са достатъчни за пълното възстановяване (без загуби) на произволно по съдържание изображение. За да се постигне беззагубна (обратима) компресия, 1 /4 от коефициентите на съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране. За увеличаване на коефициента на компресия се прилага т.нар. кодиране без визуални загуби. За тази цел се извършва двустранно “отсичане” от горе и от долу на нискоинформативните нива на пирамидата и квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране. Редът на предаване по канала за връзка на данните за нивата на пирамидата е от върха към нейната основа. Декодирането на изображението се извършва, като върху приетите данни се прилагат последователно операциите ентропийно декодиране и инверсно квантуване (последното само в случай на кодиране без визуални загуби). С помощта на получените коефициенти на подизображенията в предадените нива на пирамидата се извършва реконструиране на съответните им полиномни функции или апроксимиращи изображения като резултат от инверсното ортогонално преобразуване на коефициентите. Възстановените по този начин изображения за всяко ниво на пирамидата се сумират последователно чрез натрупване от върха към нейната основа и се получава изходното изображение, което се възпроизвежда с постепенно нарастваща разделителна способност в съответствие с поредния номер на предаденото ниво на пирамидата.Walsh-Adamar et al. The approximation image is described by the m factor regardless of the type of approximation selected. These coefficients represent the "zero" (peak) level of the inverse differential pyramid. To form its next level, a subtractive subtraction of the input image and its approximation, determined on the basis of the coefficients for the "zero" level, are carried out. The resulting "zero" difference image is divided into four sub-images of the same shape and size and the same operations are applied to each of them to determine their respective approximating sub-images by analogy with the input. As a result, the "zero" difference composed by the approximating sub-images is obtained, which is described by a total of 4x coefficients. The latter represent the first level of the pyramid. Its second level is formed by subtracting its approximation from the image of the "zero" difference and dividing the obtained "first" difference image into 16 sub-images of the same shape and size. Each of them is recursively applied the same approximation operations as the sub-images of the previous "zero" difference, etc. For an input image of 2 x 2 pixels, the penultimate (n-1) level of its inverse pyramid corresponds to the differential image n-2, which is described by the 4 'w coefficient. The last level of the pyramid is the residual differential image η-l whose dimensions are equal to those of the input. The pyramid constructed in this way has n + 1 levels and is described by a total of 4 +1 (πι / 3) coefficients, which are sufficient for the complete restoration (without loss) of any arbitrary content image. In order to achieve lossless (reversible) compression, 1/4 of the coefficients of the neighboring sub-images are reduced based on the dependencies between them, and entropy coding is applied to the others. To increase the compression ratio, the so-called lossless coding. For this purpose, two-sided "clipping" of the lower and lower levels of the pyramid levels and quantization of the coefficients in the remaining levels is performed before entropy coding. The order of transmission over the Pyramid Level Data Link Channel is from the top to its base. The decoding of the image is carried out using the entropy decoding and inverse quantization operations (the latter only in case of non-visual coding). The obtained sub-image coefficients in the transmitted pyramid levels reconstruct their respective polynomial functions or approximate images as a result of the inverse orthogonal transformation of the coefficients. The images thus reconstructed for each level of the pyramid are summed up successively by stacking from the top to its base, yielding a source image that is reproduced with a gradually increasing resolution in accordance with the order number of the pyramid level transmitted.

Изборът на вида на апроксимацията на подизображенията - полиномна или чрез ортогонално преобразуване, се определя предварително в зависимост от изискванията за необходимото време на компресия и точност на апроксимация. Полиномната апроксимация осигурява по-голяма точност, което води до повишаване на качеството на възстановеното изображение за сметка на по-големия брой изчисления. Апроксимацията чрез ортогонално преобразуване се избира, когато е необходимо по-високо бързодействие на компресията (за работа в реално време) и е допустимо понижаване на качеството на възстановеното изображение.The choice of the type of subimage approximation - polynomial or by orthogonal transformation, is determined in advance depending on the requirements for the required compression time and the approximation accuracy. Polynomial approximation provides greater accuracy, which results in improved image quality at the expense of more calculations. Orthogonal transformation approximation is chosen when a higher compression speed (for real-time operation) is required and a reduction in the quality of the reconstructed image is acceptable.

Предимствата на метода са следните: за построяване на инверсната диференциална пирамида не са необходими операциите децимация и интерполация, които причиняват специфични изкривявания на изображението (ефекта на Гибс) вследствие промяна на структурата на пространствената дискретизираща решетка и неидеалната нискочестотна филтрация; улеснява реализирането на прогресивно предаване на изображението, тъй като нивата на пирамидата се определят последователно от върха към нейната основа в ред, който е инверсен на този при лапласовата пирамида; нивата на пирамидата съдържат коефициенти на трансформанти или полиномни функции, чиито изменения вследствие на случайни грешки при предаването им в канала за връзка влияят по-слабо върху визуалното качество на възстановеното изображение в сравнение с влиянието на грешките при лапласовата пирамида, тъй като нейните нива представляват разликови изображения; осигурява по-голям коефициент на компресия в сравнение с лапласовата и “редуцираната” разликова пирамида /2/ при една и съща точност на възстановяване на изображението.The advantages of the method are the following: no decimation and interpolation operations are required for the construction of the inverse differential pyramid, which cause specific distortions of the image (Gibbs effect) due to changes in the structure of the spatial sampling lattice and non-ideal low-pass filtration; facilitates the progressive transmission of the image, since the levels of the pyramid are sequentially determined from the top to its base in an order inverse to that of the Laplace pyramid; pyramid levels contain coefficients of transformants or polynomial functions whose changes due to random errors in their transmission in the communication channel affect the visual quality of the reconstructed less than the effects of errors in the Laplace pyramid, since their levels represent different images; provides a higher compression ratio than the Laplace and "reduced" differential pyramid / 2 / with the same image restoration accuracy.

Същността на изобретението се състои и в устройство за пирамидално кодиране на изображения, което съдържа източник на изображение, свързан с входа на кодер за рекурсивно изчисляване на инверсната диференциална пирамида. Кодерът се състои от първи комутатор, чийто първи вход е свързан с източника на изображение, а изходът му е свързан с входа на първа видеопамет и първия вход на втори комутатор. Изходът на първата видеопамет е свързан с вторите входове съответно на втория комутатор и първи суматор. От своя страна изходът на втория комутатор през електронен ключ е свързан с първия вход на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване. Вторият вход на същия блок е свързан с изхода на първи блок за формиране на тегловни или “базови” изображения, а изходът му е свързан с входа на блок за квантуване. Изходът на последния е свързан с първия вход на трети комутатор и входа на блок за инверсно квантуване, чийто изход е свързан с входа на втора видеопамет. Нейният изход е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ортогонално преобразуване, чийто втори вход е свързан с изхода на първия блок за формиране на тегловни или “базови” изображения, а изходът му е свързан с първия изваждащ вход на първия суматор. Неговият изход е свързан с вторите входове съответно на първия и третия комутатор. Изходът на третия комутатор е свързан през блок за ентропийно кодиране с изхода на кодера за рекурсивно изчисляване на инверсната диференциална пирамида. Този изход от своя страна е свързан през канала за връзка с входа на съответен пирамидален декодер. Последният се състои от блок за ентропийно декодиране, чийто вход представлява входа на пирамидалния декодер, а изходът му е свързан с входа на демултиплексор. Неговият първи изход е свързан с входа на втори блок за инверсно квантуване, чийто изход е свързан през трета видеопамет с първия вход на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване, вторият вход на който е свързан с изхода на втори блок за формиране на тегловни или “базови” изображения. Изходът на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване е свързан с първия вход на четвърти комутатор, вторият вход на който е свързан с втория изход на демултиплексора, а изходът му е свързан с първия вход на втори суматор, чийто втори вход е свързан с изхода на четвърта видеопамет. Нейният вход е свързан с изхода на втория суматор и представлява изхода на пирамидалния декодер.The invention also relates to a pyramidal image encoding device comprising an image source connected to an encoder input for recursively calculating the inverse differential pyramid. The encoder consists of a first switch whose first input is connected to the image source and its output is connected to the input of the first video memory and the first input of the second switch. The output of the first video memory is connected to the second inputs of the second switch and the first adder respectively. In turn, the output of the second switch via an electronic key is connected to the first input of a block for determining polynomial coefficients or coefficients of "truncated" orthogonal transformation. The second input of the same block is connected to the output of the first block for forming weight or "base" images, and its output is connected to the input of the quantization block. The output of the latter is connected to the first input of a third switch and the input of an inverse quantization unit whose output is connected to the input of a second video memory. Its output is connected to the first input of the first block for polynomial reconstruction or inverse orthogonal transformation, the second input of which is connected to the output of the first block for forming weight or "base" images, and its output is connected to the first subtractive input of the first adder . Its output is connected to the second inputs of the first and third switch respectively. The output of the third switch is connected via an entropy coding unit to the encoder output for recursively calculating the inverse differential pyramid. This output, in turn, is connected via the channel of communication to the input of the corresponding pyramidal decoder. The latter consists of an entropy decoding unit whose input represents the input of the pyramidal decoder and its output is connected to the input of a demultiplexer. Its first output is connected to the input of a second block for inverse quantization whose output is connected through a third video memory to the first input of a second block for polynomial reconstruction or inverse orthogonal transformation, the second input of which is connected to the output of a second block for weight formation or "base" images. The output of the second block for polynomial reconstruction or inverse orthogonal conversion is connected to the first input of a fourth switch, the second input of which is connected to the second output of the demultiplexer, and its output is connected to the first input of a second adder whose second input is connected to the output of the fourth video memory. Its input is connected to the output of the second adder and represents the output of the pyramidal decoder.

Предимство на устройството, реализиращо метода, е неговата опростена структура в сравнение с тази на устройството за пирамидално кодиране на изображения чрез лапласовата пирамида, още повече в случая на въвеждане на обратна връзка за шума от квантуване /7/. Това предимство се дължи на каноничната структура на инверсната диференциална пирамида и на липсата на блокове за редуциране и разширяване на изображения, използвани в лапласовата пирамида. Тези блокове от своя страна се реализират с помощта на децимацитори, интерполатори и двумерни цифрови филтри с минимални размери 5x5 елемента, за които са необходими голям брой изчислителни операции.An advantage of the device implementing the method is its simplified structure compared to that of the device for pyramidal image encoding through the Laplace pyramid, even more so in the case of input of quantization noise feedback / 7 /. This advantage is due to the canonical structure of the inverse differential pyramid and the lack of image reduction and enlargement blocks used in the Laplace pyramid. These blocks, in turn, are implemented using decimators, interpolators and two-dimensional digital filters with a minimum size of 5x5 elements, which require a large number of computational operations.

Пояснение на приложените фигуриExplanation of the annexed figures

По-подробно изобретението е пояснено с приложените фигури, илюстриращи едно примерно изпълнение на устройството, реализиращо метода за пирамидално кодиране на изображения, от които:The invention is illustrated in more detail with the accompanying drawings, illustrating an exemplary embodiment of a device implementing the method of pyramid-encoding images, of which:

фигура 1 представлява блокова схема на устройството за пирамидално кодиране на изображения, която се основава на декомпозицията, наречена инверсна диференциална пирамида за прогресивно предаване на изображения;Figure 1 is a block diagram of a decomposition-based pyramidal image encoder called an inverse differential pyramid for progressive image transmission;

фигура 2 - етапите на възстановяване на тестовото изображение LENA с размериFigure 2 - Recovery steps of the LENA test image with dimensions

512x512 с 8 бита на пиксел при последователно предаване на нивата на съответната инверсна диференциална пирамида с пореден номер рМ),1,2,...,7.512x512 with 8 bits per pixel in successive transmission of the levels of the corresponding inverse differential pyramid with order number pM), 1,2, ..., 7.

Примери за изпълнение на изобретениетоExamples of carrying out the invention

Примерното изпълнение на устройството за пирамидално кодиране на изображения съгласно изобретението е показано на фигура 1, 5 която представлява блокова схема на устройството, състоящо се от кодер и декодер. В техния състав са включени четири двувходови комутатора 1, четири видеопамети 2, блок за определяне на полиномните коефициенти или тези 10 на “отсеченото” ортогонално преобразуване 3, два блока за полиномна реконструкция или инверсно ортогонално преобразуване 4, блокове за квантуване и инверсно квантуване съответно 5 и 6, два блока за формиране на тегловни 15 или “базови” изображения 7, два суматора 8, блокове за ентропийно кодиране и декодиране съответно 9 и 10, де мултиплексор 11 и електронен ключ 12. Съгласно блоковата схема от фиг. 1 източникът на изображение е свързан с 20 първия вход а на първи комутатор 1, а изходът му b е свързан с входа на първа видеопамет 2 и първия вход на втори комутатор 1. Изходът с на първата видеопамет 2 е свързан с вторите входове съответно на втория комутатор 1 25 и първи суматор 8. От своя страна изходът на втория комутатор d през електронен ключ 12 е свързан с първия вход е на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване 3. 30 Вторият вход на същия блок 3 е свързан с изхода m на първи блок за формиране на тегловни или “базови” изображения 7, а изходът му f е свързан с входа на блок за квантуване 5. Изходът на последния g е свързан с първия 35 вход на трети комутатор 1 и входа на блок за инверсно квантуване 6, чийто изход h е свързан с входа на втора видеопамет 2. Нейният изход к е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ор- 40 тогонално преобразуване 4, чийто втори вход е свързан с изхода m на първия блок за формиране на тегловни или “базови” изображения 7, а изходът му 1 е свързан с първия изваждаш вход на първия суматор 8. Неговият изход i е 45 свързан с вторите входове съответно на първия и третия комутатор 1. Изходът η на третия комутатор 1 е свързан през блок за ентропийно кодиране 9 с изхода р на кодера за рекурсивно изчисляване на инверсната диференци- 50 ална пирамида. Този изход р от своя страна е свързан през канала за връзка с входа на съ ответен пирамидален декодер. Последният се състои от блок за ентропийно декодиране 10, чийто вход представлява входа на пирамидалния декодер, а изходът му х е свързан с входа на демултиплексор 11. Неговият първи изход г е свързан с входа на втори блок за инверсно квантуване 6, чийто изход s е свързан през трета видеопамет 2 с първия вход t на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване 4, вторият вход на който е свързан с изхода m на втори блок за формиране на тегловни или “базови” изображения 7. Изходът и на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване 4 е свързан с първия вход на четвърти комутатор 1, вторият вход q на който е свързан с втория изход на демултиплексора 11, а изходът му v е свързан с първия вход на втори суматор 8, чийто втори вход у е свързан с изхода на четвърта видеопамет 2. Нейният вход w е свързан с изхода на втория суматор 2 и представлява изхода на пирамидалния декодер.An exemplary embodiment of the pyramidal image encoder according to the invention is shown in Figure 1, 5 which is a block diagram of the device comprising an encoder and a decoder. Their composition includes four dual input switches 1, four video memories 2, a block for determining polynomial coefficients or those 10 of the "truncated" orthogonal transformation 3, two blocks for polynomial reconstruction or inverse orthogonal transformation 4, quantization blocks and inverse quantization 5 and 6, two blocks for forming weight 15 or "base" images 7, two adders 8, entropy encoding and decoding blocks 9 and 10, respectively, multiplexer 11 and electronic key 12. According to the block diagram of FIG. 1, the image source is connected to the 20 first input a of the first switch 1, and its output b is connected to the input of the first video memory 2 and the first input of the second switch 1. The output of the first video memory 2 is connected to the second inputs respectively to the second switch 1 25 and first adder 8. In turn, the output of the second switch d via an electronic key 12 is connected to the first input by a block for determining polynomial coefficients or coefficients of “truncated” orthogonal transformation 3. 30 Second input of the same block 3 is connected to the output m of the first block for u framing weight or "base" images 7 and its output f is connected to the input of the quantization block 5. The output of the last g is connected to the first 35 input of the third switch 1 and the input of the inverse quantization block 6, whose output h is connected to the input of the second video memory 2. Its output k is connected to the first input of the first block for polynomial reconstruction or inverse orthogonal transformation 4, the second input of which is connected to the output m of the first block for forming weight or “base 7 and its output 1 is connected to the first subtraction of the input 8. Its output i is 45 connected to the second inputs of the first and third switch respectively 1. The output η of the third switch 1 is connected through an entropy coding unit 9 to the output p of the encoder for recursively calculating the inverse differential 50 pyramid. . This output p is, in turn, connected through the channel of communication to the input of the corresponding pyramidal decoder. The latter consists of an entropy decoding unit 10 whose input represents the input of the pyramidal decoder and its output x is connected to the input of the demultiplexer 11. Its first output d is connected to the input of a second inverse quantization unit 6 whose output s is connected through third video memory 2 to the first input t of the second block for polynomial reconstruction or inverse orthogonal transformation 4, the second input to which is connected to the output m of the second block for forming weight or "base" images 7. The output of the second block for polynomial reconstruction ation or inverse orthogonal transform 4 is connected to the first input of the fourth switch 1, the second input q of which is connected to the second output of the demultiplexer 11, and its output v is connected to the first input of the second adder 8, whose second input y is connected with the output of the fourth video memory 2. Its input w is connected to the output of the second adder 2 and represents the output of the pyramid decoder.

Действието на устройството съгласно изобретението е следното. В първия цикъл на рекурсивна обработка на изображението неговият сигнал се подава на входа на пирамидалния кодер през входния комутатор 1 и се записва във видеопаметта 2. Същевременно през втория комутатор 1 и ключа 12 сигналът на изображението постъпва в блока за определяне на полиномните коефициенти или тези на “отсеченото” ортогонално преобразуване 3. За тази цел към същия блок се подават едновременно тегловни или “базови” изображения от блок за тяхното формиране 7. Видът на тези изображения при първия тип апроксимация се определя предварително в зависимост от реда на полиномната регресионна функция и размерите на входното изображение (или подизображение), а при втория - от избрания вид линейно ортогонално преобразуване (напр. дискретно косинусно, преобразуване на УолшАдамар и др.) и размерите на изображението (или подизображението). Всеки коефициент, изчислен в блок 3, се определя от корелацията на входното изображение (или подизображение) със съответно тегловно или “базово” изображение в зависимост от типа на избраната апроксимация - полиномна или чрез “отсечено” ортогонално преобразуване. Броят на коефициентите се задава предварително, като за първия тип апроксимация зависи от избраната полиномна функция, напр. шест коефициента за повърхност от втора степен, три за равнина и т.н. За втората апроксимация броят на коефициентите, съответстващи на ниските пространствени честоти в трансформантата на изображението (или подизображението), може да се избере напр. четири, три, и т.н. С увеличаването на този брой нараства точността на апроксимацията, но от друга страна намалява коефициентът на компресия на изображението и затова този брой се избира компромисно, напр. общо четири. Стойностите на тези коефициенти се определят, след като завърши записът на цялото входно изображение във видеопаметта 2. От изход f на блок 3 получените коефициенти се квантуват (скаларно или векторно) в блока 5. Квантуваните коефициенти от изход g на блок 5 преминават през комутатор 1 и постъпват в блок 9 за ентропийно кодиране. В него могат да се приложат алгоритми от типа: кодиране с променлива дължина, код на Хъфман, аритметично кодиране и др. Компресираната последователност от символи за поредното ниво на пирамидата от изхода р на блок 9 се предава по канала за връзка към входа на пирамидалния декодер. От друга страна квантуваните коефициенти в изхода g се деквантуват в блока за инверсно квантуване 6 и се записват във видеопаметта 2 за съхраняване на коефициентите на апроксимиращото изображение (или подизображението). Във втория цикъл на неговата обработка двете видеопамети (за изображението и за коефициентите на апроксимацията) се прочитат едновременно, като от изход к на втората получените коефициенти се преобразуват в блока за реконструиране на полиномни функции или за инверсно ортогонално преобразуване 4 в съответно апроксимиращо изображение (или подизображение). Във втория случай към блок 5 от изхода m на блок 7 се подават сигнал за съответното “базово” изображение. Полученият сигнал на изход 1 на блок 4 се изважда в суматора 8 от този на изход с на входната видеопамет 2. Разликовият сигнал на изхода i на суматора 8 през входния комутатор 1 се записва във входната видеопамет 2, като замества информацията за изображението от предишния първи цикъл на рекурсивно изчисление на нивата на инверсната диференциална пирамида. При за почване на следващия цикъл на работа на пирамидалния кодер входната памет, съдържаща нулевото разликово изображение, се прочита два пъти, като в процеса на първото четене данните в нея се подреждат в последователни блокове, съответстващи на нейните четири подизображения. За всяко от тях по аналогичен начин както в първия цикъл се изчисляват с помощта на блоковете 3, 5 и 6 техните квантувани коефициенти, записват се във видеопаметта 2 и се предават чрез ентропийно кодиране по канала за връзка към декодера. В процеса на второто четене на входната видеопамет 2 от нейните изходни данни, подредени в блокове според подизображенията, се изваждат тези, получени на изхода I на блок 4, и се записват отново във входната видеопамет 2 и т.н. В последния (п+1)-ви цикъл на работа на кодера, който се използва само за компресия без загуби, при второто четене на входната видеопамет 2 на изхода i на суматора 8 се получава остатъчното изображение, което не се записва повторно във входната видеопамет 2, а се предава през изходния комутатор 2 към ентропийния кодер 9 и от неговия изход - към канала за връзка. Приетите в пирамидалния декодер данни от последователните нива на пирамидата през ентропийния декодер 10 се разделят чрез демултиплексора 11, като на първия му изход г се получават данните за нивата на пирамидата до п-то, а на втория му изход q - тези за остатъчното изображение в (п+1)-то ниво. Действието на блоковете 6, 2, 4 и 7 в декодера е аналогично на това на същите блокове в кодера, обяснено по-горе. Чрез суматора 8 и видеопаметта 2 е реализиран натрупващ суматор, който служи за възстановяване на изходното изображение с постепенно нарастваща разделителна способност в процеса на предаване на нивата на съответната инверсна диференциална пирамида.The operation of the device according to the invention is as follows. In the first recursive image processing cycle, its signal is transmitted to the input of the pyramidal encoder through the input switch 1 and is recorded in the video memory 2. At the same time, through the second switch 1 and switch 12, the image signal enters the block for determining polynomial coefficients or those of "Truncated" orthogonal transformation 3. For this purpose, weight or "base" images from the block for their formation are simultaneously fed to the same block 7. The type of these images in the first type of approximation is determined before varying depending on the order of the polynomial regression function and the dimensions of the input image (or sub-image), and for the second one the selected type of linear orthogonal transformation (eg, discrete cosine, Walsh-Adamar transform, etc.) and image size (or sub-image) . Each coefficient calculated in block 3 is determined by the correlation of the input image (or sub-image) with the corresponding weight or "base" image, depending on the type of selected approximation - polynomial or by "truncated" orthogonal transformation. The number of coefficients is predetermined, for the first type of approximation depends on the polynomial function chosen, e.g. six coefficients for a second degree surface, three for a plane, etc. For the second approximation, the number of coefficients corresponding to the low spatial frequencies in the image transformer (or sub-image) can be chosen e.g. four, three, etc. As this number increases, the accuracy of the approximation increases, but on the other hand, the image compression ratio decreases and so this number is chosen by compromise, e.g. four in total. The values of these coefficients are determined after the recording of the entire input image in the video memory is completed 2. From the output f of block 3, the coefficients obtained are quantized (scalar or vector) in block 5. The quantized coefficients from the output g of block 5 pass through switch 1 and enter block 9 for entropy coding. Algorithms of this type can be used: variable length encoding, Huffman code, arithmetic coding, and more. The compressed sequence of symbols for the sequential pyramid level from the output p of block 9 is transmitted through the link channel to the pyramidal decoder input. On the other hand, the quantized coefficients in the output g are quantized in the inverse quantization unit 6 and recorded in the video memory 2 for storing the coefficients of the approximating image (or sub-image). In the second cycle of its processing, the two video memories (for the image and for the coefficients of approximation) are read at the same time, from the output to the second coefficients are transformed into the block for reconstruction of polynomial functions or for inverse orthogonal transformation (4) or corresponding inverse apox sub-image). In the second case, a signal for the corresponding "base" image is output to block 5 of output m of block 7. The received signal of output 1 of block 4 is subtracted in the adder 8 from that of the output with the input video memory 2. The differential signal of the output i of the adder 8 through the input switch 1 is recorded in the input video memory 2, replacing the image information from the previous first cycle of recursive calculation of the levels of the inverse differential pyramid. At the beginning of the next cycle of operation of the pyramidal encoder, the input memory containing the zero difference image is read twice, and in the process of first reading, the data in it are arranged in consecutive blocks corresponding to its four sub-images. For each of them, in the same way as in the first cycle, their quantized coefficients are calculated using blocks 3, 5 and 6, recorded in the video memory 2 and transmitted by entropy encoding through the channel for connection to the decoder. In the process of the second reading of the input video memory 2 from its output data, arranged in blocks according to the sub-images, those obtained at the output I of block 4 are subtracted and re-written to the input video memory 2, etc. In the last (n + 1) encoder cycle, which is used only for lossless compression, the second reading of the input video memory 2 at the output i of the adder 8 results in a residual image that is not re-written to the video input memory 2, and is transmitted through the output switch 2 to the entropy encoder 9 and from its output to the communication channel. The data received in the pyramid decoder from the successive levels of the pyramid through the entropy decoder 10 are separated by the demultiplexer 11, at its first output r the data on the levels of the pyramid to the nth, and at its second output q, those for the residual image in (n + 1) level. The operation of blocks 6, 2, 4 and 7 in the decoder is analogous to that of the same blocks in the encoder explained above. Through the adder 8 and the video memory 2 is implemented a cumulative adder, which serves to restore the original image with gradually increasing resolution in the process of transmitting the levels of the respective inverse differential pyramid.

Методът за пирамидално кодиране на изображения съгласно изобретението се илюстрира от следния пример за компресиране на изображение с размери 4x4, което се описва със следната матрица:The method for pyramid-encoding images according to the invention is illustrated by the following example of 4x4 image compression, which is described by the following matrix:

В(1,1) В(2,1) В(3,1) В(4,1) B (1,1) B (2,1) B (3,1) B (4,1) '12 3 4' '12 3 4 ' B(L2) В(2,2) В(ЗД) В(4,2) B (L2) B (2.2) V (ZD) B (4.2) 2 3 4 5 2 3 4 5 В(1Л) В(2Л) ад В(43) B (1L) B (2L) from B (43) 3 3 3 4 5 6 3 4 5 6 _Β(ζ4) В(2,4) В(3,4) В(4,4) _Β (ζ4) V (2.4) V (3.4) V (4.4) 4 5 6 7 4 5 6 7

Ако изберем апроксимиращ полином от първа степен от типа B(i,j) = ai + bj + с, т.е. “ориентирана” равнина, чийто коефициенти а, b и с са определени предварително чрез авто регресионен анализ, за техните тегловни изоб ражения (матрици) се получава съответно:If we choose a first-degree approximating polynomial of type B (i, j) = ai + bj + c, i.e. An "oriented" plane whose coefficients a, b, and c are predetermined by auto-regression analysis, for their weight images (matrices), respectively:

-3 -1 1 3' -3 -1 1 3 ' -3 -3 -3 -3 -3 -3 -3 -3 [la(U)] = ^[ l a (U)] = ^ -3-113 -3-113 -3-113 -3-113 -1 -1 -1 -1 1111 -1 -1 -1 -1 1111 -3 -1 1 3 -3 -1 1 3 3 3 3 3 3 3 3 3

3 3 г Mr 1 1 -1 -1 -1 -1 -3 -3 -3 -3 -5 -5

Тогава стойностите на коефициентите на ражение, са следните:Then the values of the coefficients of birth are as follows:

равнината, апроксимираща примерното изоб20the plane approximating exemplary image20

4 4 4 4 4 а= ZZta(k>l)B(k,l) = l , b= ZZlb(M)B(k,l) = l , c=££tc(k,l)B(k,l) = -l к=П»1 к=11=1 к=11=14 4 4 4 4 a = ZZta (k> l) B (k, l) = l, b = ZZ l b (M) B (k, l) = l, c = ££ tc (k, l) B (k, l) = -l k = P »1 k = 11 = 1 k = 11 = 1

В този случай съответният апроксимиращ полином за нулевото ниво на пирамидата се описва с функцията B.(i,j) = i+j+1. Тогава разυ ЧЛ ликата между входното изображение B(i,j) и функцията B0(i,j) за всяка стойност на i,j = 1,2,3,4 е равна на нула и затова пирамидата на изображението се описва само с нейното нулево ниво, за което е достатъчно да се пре35 дадат само коефициентите а=Ь=1 и с=-1. При декодиране изображението се възстановява без загуби с коефициент на компресия К=16/3=5.33.In this case, the corresponding approximating polynomial for the zero level of the pyramid is described by the function B. (i, j) = i + j + 1. Then diff υ ART difference between the input image B (i, j) and the function B 0 (i, j) for each value of i, j = 1,2,3,4 is zero and therefore the pyramid image describes only with its zero level, for which it is sufficient to give only the coefficients a = b = 1 and c = -1. When decoding, the image is restored without loss with a compression ratio of K = 16/3 = 5.33.

Някои от резултатите при моделирането на метода за инверсно пирамидално кодиране с помощта на апроксимиращи полиноми с 6, 3 и 1 коефициента (съответно ИДП-6,3,1) и в сравнението му с метода, използващ редуцираната диференциална пирамида (РДП) /2/, са дадени в таблица 1. Тук К(р) е коефициентът на компресия на изображението при ограничаване броя на нивата на пирамидата до р=0,1,...,7, a PSNR(p) е пиковото отношение сигнал/шум на възстановеното изображение при достигане на р-то ниво на пирамидата. Резултатите в таб лицата се отнасят за тестовото изображение LENA с размери 512x512 и 8 бита на пиксел. От нея се вижда, че при стойност на PSNR > 34 dB, когато на практика в изображението не се забелязват видими изкривявания, коефициентът на компресия за редуцираната диференциална пирамида е два пъти по-малък от този за инверсната.Some of the results in the modeling of the inverse pyramidal coding method using approximate polynomials with 6, 3 and 1 coefficients (IDP-6,3,1, respectively) and in comparison with the reduced differential pyramid (PDD) method / 2 / are given in Table 1. Here K (p) is the image compression ratio when limiting the number of pyramid levels to p = 0.1, ..., 7, and PSNR (p) is the peak signal-to-noise ratio of the restored image upon reaching the pth level of the pyramid. The results in the tab faces refer to the LENA test image of 512x512 and 8 bits per pixel. It shows that at a PSNR value> 34 dB, when in practice no visible distortion is observed in the image, the compression ratio for the reduced differential pyramid is twice less than that for the inverse.

На фиг. 2 е дадена разпечатка на същото тестово изображение, декодирано без квантуване на коефициентите на инверсна диференциална пирамида с предадени нива р=0,1,2,...,7. Тези изображения илюстрират метода и позволяват да се оцени визуално качеството на възстановяването им във всеки етап на прогресивното им предаване. Методът и устройството съгласно изобретението дават възможност за осъществяване на пирамидално кодиране без загуби (или без визуални загуби) на неподвижни изображения и видеопоследователности, които от своя страна могат да бъдат както черно-бели многоградационни,така и цветни.In FIG. 2 is a printout of the same test image decoded without quantizing the coefficients of an inverse differential pyramid with transmitted levels p = 0,1,2, ..., 7. These images illustrate the method and make it possible to visually evaluate the quality of their recovery at each stage of their progressive transmission. The method and apparatus of the invention make it possible to perform lossless (or no visual loss) pyramidal encoding of still images and video sequences, which in turn can be both black and white multigrade and color.

Таблица 1Table 1

Коефициент на компресия К и пиково отношение сигнал/шум PSNR в [dB] Compression ratio K and peak signal-to-noise ratio PSNR in [dB] ЬЩИ ниворч Still nothing ИДП-1 IDP-1 ИДП-3 IDP-3 ИДП-6 IDP-6 РДП RDP К(р) K (p) PSNR(p) PSNR (p) К(р) K (p) PSNR(p) PSNR (p) ВД VD PSNR(p) PSNR (p) К(р) PSNR(p) K (p) PSNR (p) 0 0 147456 147456 13,67 13,67 65384 65384 13.95 13.95 32768 32768 14,02 14.02 262144 13,66 262144 13.66 1 1 36864 36864 14,20 14,20 16384 16384 14,44 14,44 8192 8192 14,76 14,76 65536 13,94 65536 13.94 2 2 9216 9216 14,67 14,67 4096 4096 15,54 15.54 2048 2048 16,31 16,31 16384 14,49 16384 14.49 3 3 2304 2304 16,04 16.04 1024 1024 17,85 17,85 512 512 18,97 18,97 4096 15,35 4096 15.35 4 4 576 576 17,97 17,97 256 256 20,06 20.06 128 128 21,71 21,71 1024 17,11 1024 17.11 5 5 144 144 19,98 19,98 64 64 22,82 22,82 32 32 24,69 24,69 256 19,33 256 19.33 6 6 48 48 22,63 22,63 16 16 26,15 26.15 8 8 28,40 28.40 64 21,99 64 21.99 7 7 12 12 25,74 25.74 4 4 30,51 30.51 2 2 34,29 34.29 16 25,21 16 25.21 8 8 3 3 30,17 30.17 1 1 40,03 40.03 0,5 0.5 * * 4 28,90 4 28.90 9 9 0,75 * 0.75 * 0,25 0.25 - - - - 1 33,80 1 33,80

* декомпозиция без загуби* lossless decomposition

В последния случай изображението се описва с три компоненти (матрици), към всяка от които поотделно може да се приложи компресиране съгласно метода и устройството. При компресиране на видеопоследователности (подвижни изображения) с описания метод и устройство всеки кадър трябва да бъде обработен вътрешнокадрово в реален мащаб на времето.In the latter case, the image is described with three components (matrices), each of which can be individually compressed according to the method and device. When compressing video sequences (moving images) with the method and device described, each frame must be real-time in-frame processing.

Claims (2)

1. Метод за пирамидално кодиране на изображения, използващ пирамидално представяне на изображението, ортогонални преобразувания, квантуване на трансформационните коефициенти и ентропийно кодиране, характеризиращ се с това, че в процеса на кодиране входното цифрово изображение се апроксимира чрез предварително избрана дву- мерна полиномна функция с m коефициента, определени от изискването за минимизация на 35 средноквадратичната грешка на апроксимацията, или чрез изображение, получено с помощта на инверсно ортогонално преобразуване на филтрирана трансформанта на входното изображение, определена от него чрез прилагане 40 на право ортогонално преобразуване и запазване само на m избрани нискочестотни коефициента, съставящи във всеки от двата случая нулевото ниво (върха) на т.нар. инверсна диференциална пирамида, като нейното следва45 що ниво се формира чрез поелементно изваждане на входното изображение и неговата апроксимация, определена чрез коефициентите за нивото “нула”, полученото като резултат “нулево” разликово изображение се разделя на 50 четири еднакви по форма и размери подизображения, за всяко от които се прилагат аналогични операции за определяне на съответ ните им апроксимиращи подизображения, и се получава “нулевата” разлика за първо ниво на пирамидата, представено от 4т коефициента, като за формирането на нейното второ ниво от “нулевата” разлика се изважда нейната апроксимация и полученото “първо” разликово изображение се разделя на 16 еднакви по форма и размери подизображения, върху всяко от които се прилагат рекурсивно същите операции за апроксимация както върху подизображенията от предишната “нулева” разлика и т.н. до достигане на последното ниво на пирамидата, представляващо остатъчно разликово изображение с размери, равни на входното, като при беззагубна компресия 1/4 от коефициентите на съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране, а за кодиране без визуални загуби се извършва двустранно “отсичане” от горе и от долу на нискоинформативните нива на пирамидата и квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране, при което за декодиране на изображението върху компресираните данни се прилагат последователно ентропийно декодиране и инверсно квантуване, последното само в случай на кодиране без визуални загуби, и с помощта на получените коефициенти от подизображенията в предадените нива на пирамидата се извършва реконструиране на съответните им полиномни функции или апроксимиращи изображения чрез инверсно ортогонално преобразуване на коефициентите, като възстановените по този начин изображения за всяко ниво на пирамидата се сумират последователно чрез натрупване от върха към нейната основа и в резултат се получава изходното изображение с постепенно нарастваща разделителна способност в съответствие с номера на предаденото ниво на пирамидата.A method for pyramidal image encoding using pyramidal image representation, orthogonal transformations, quantization of transformation coefficients, and entropy coding, characterized in that, during the encoding process, the input digital image is approximated by a pre-selected two-dimensional polynomial function m is the coefficient determined by the requirement to minimize the 35 rms error of the approximation, or by an image obtained by inverse orthogonal transformation of iltrirana transformant input image defined by it by applying 40 straight orthogonal transformation and preservation of m only selected low frequency coefficients constituting in each case the zero level (top) of the so called. the inverse differential pyramid, its next level45 being formed by elemental subtraction of the input image and its approximation, determined by the coefficients for the "zero" level, the resulting "zero" differential image is divided into 50 four sub-image sizes and sizes, for each of which similar operations are applied to determine their corresponding approximating sub-images, and a "zero" difference is obtained for the first level of the pyramid represented by the 4t coefficient, as for the forms the wounding of its second level from the "zero" difference subtracts its approximation, and the resulting "first" differential image is divided into 16 uniform and sub-image sizes, each of which is recursively applied to the same approximation operations as the sub-images from the previous "zero" "Difference, etc. to the last level of the pyramid, which is a residual difference image with dimensions equal to the input, and at lossless compression 1/4 of the coefficients of the neighboring sub-images are reduced based on the dependencies between them, while the others are entropy-encoded and coding without visual loss is performed by two-sided "clipping" from the top and bottom of the low-information levels of the pyramid and quantization of the coefficients in the remaining levels before their entropy coding, whereby for decoding and the image on the compressed data is applied sequentially entropy decoding and inverse quantization, the latter only in the case of coding without visual loss, and with the help of the obtained coefficients of the sub-images in the transmitted levels of the pyramid, the corresponding polynomial functions or images are approximated or approximated orthogonal conversion of the coefficients, the images thus reconstructed for each level of the pyramid are summed up successively by the accumulation of in pXA to its base, and the result is an output image with gradually increasing resolution in accordance with the number of surrendered level of the pyramid. 2. Устройство за пирамидално кодиране на изображения съгласно метода, състоящо се от кодер и декодер, включващи комутатори, видеопамети, блокове за ортогонално преобразуване, квантуване и ентропийно кодиране, характеризиращо се с това, че източникът на изображение е свързан с първия вход (а) на първи комутатор (1), а изходът му (Ь) е свързан с входа на първа видеопамет (2) и първия вход на втори комутатор (1), изход (с) на първата видеопамет (2) е свързан с вторите входове съответно на втория комутатор (1) и първи суматор (8), като от своя страна изходът на втория комутатор (d) през електронен ключ (12) е свързан с първия вход (е) на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване (3), вторият вход на същия блок (3) е свързан с изхода (ш) на първи блок за формиране на тегловни или “базови” изображения (7), а изходът му (f) е свързан с входа на блок за квантуване (5), изходът на който (g) е свързан с първия вход на трети комутатор (1) и входа на блок за инверсно квантуване (6), чийто изход (h) е свързан с входа на втора видеопамет (2), а нейният изход (к) е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ортогонално преобразуване (4), чийто втори вход е свързан с изхода (ш) на първия блок за формиране на тегловни или “базови” изображения (7), а изходът му (1) е свързан с първия изваждащ вход на първия суматор (8), изходът на който (i) е свързан с вторите входове съответно на първия и третия комутатор (1), а изходът (п) на ‘ третия комутатор (1) е свързан през блок за ентропийно кодиране (9) с изход (р) на кодера за рекурсивно изчисляване на пирамидата на изображението, като неговият изход (р) от своя страна е свързан през канала за връзка с входа на съответен пирамидален декодер, със- * тоящ се от блок за ентропийно декодиране (10), чийто вход представлява входа на пирамидалния декодер, а изходът му (х) е свързан с входа на демултиплексор (11), първият изход на който (г) е свързан с входа на втори блок за инверсно квантуване (6), чийто изход (s) е свързан през трета видеопамет (2) с първия вход (t) на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване (4), вторият вход на който е свързан с изхода (ш) на втори блок за формиране на тегловни или “базови” изображения (7), като изходът (и) на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване (4) е свързан с първия вход на четвърти комутатор (1), вторият вход (q) на който е свързан с втория изход на демултиплексора (11), а изходът му (v) е свързан с първия вход на втори суматор (8), чийто втори вход (у) е свързан с изхода на четвърта видеопамет (2), а нейният вход (w) е свързан с изхода на втория суматор (2) и представля10 ва изхода на пирамидалния декодер.2. Pyramidal image encoder according to the method, comprising an encoder and decoder comprising switches, video memories, blocks for orthogonal conversion, quantization and entropy coding, characterized in that the image source is connected to the first input (s) of the first switch (1) and its output (b) is connected to the input of the first video memory (2) and the first input of the second switch (1), the output (c) of the first video memory (2) is connected to the second inputs respectively. the second switch (1) and the first adder (8), in turn the output and the second switch (d) via an electronic key (12) is connected to the first input (e) of a block for determining polynomial coefficients or coefficients of "truncated" orthogonal transformation (3), the second input of the same block (3) is connected to the output (w) of the first block for forming weight or "base" images (7), and its output (f) is connected to the input of the quantization block (5), the output of which (g) is connected to the first input of a third switch (1) and the input of an inverse quantization unit (6) whose output (h) is connected to the input of a second video memory (2) and its output (k) is connected with the first input of the first block for polynomial reconstruction or inverse orthogonal transformation (4), the second input of which is connected to the output (w) of the first block for forming weight or "base" images (7) and its output (1) is connected to the first subtractor input of the first adder (8), the output of which (i) is connected to the second inputs of the first and third switch (1) respectively, and the output (n) of the 'third switch (1) is connected via block for entropy coding (9) with the output (p) of the encoder for recursively calculating the image pyramid, such as its output e (q) is, in turn, connected through the channel of communication to the input of the corresponding pyramidal decoder, consisting of an entropy decoding unit (10) whose input represents the input of the pyramidal decoder and its output (x) is connected with the input of the demultiplexer (11), the first output of which (d) is connected to the input of a second inverse quantization block (6) whose output (s) is connected via a third video memory (2) to the first input (t) of the second block for polynomial reconstruction or inverse orthogonal transformation (4), the second input of which is connected to the output (w) of a second block for u Arrangement of weight or "base" images (7), with the output (s) of the second polynomial reconstruction or inverse orthogonal transformation (4) connected to the first input of a fourth switch (1), the second input (q) of which is connected to the second output of the demultiplexer (11) and its output (v) is connected to the first input of a second adder (8) whose second input (y) is connected to the output of the fourth video memory (2) and its input (w ) is connected to the output of the second adder (2) and represents the output of the pyramidal decoder.
BG103619A 1999-07-29 1999-07-29 Method and device for pyramidal pattern encoding BG63586B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
BG103619A BG63586B1 (en) 1999-07-29 1999-07-29 Method and device for pyramidal pattern encoding
AU16454/00A AU1645400A (en) 1999-07-29 1999-12-09 Method and device for pyramidal image coding
PCT/BG1999/000027 WO2001010130A1 (en) 1999-07-29 1999-12-09 Method and device for pyramidal image coding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BG103619A BG63586B1 (en) 1999-07-29 1999-07-29 Method and device for pyramidal pattern encoding

Publications (2)

Publication Number Publication Date
BG103619A BG103619A (en) 2001-01-31
BG63586B1 true BG63586B1 (en) 2002-05-31

Family

ID=3927850

Family Applications (1)

Application Number Title Priority Date Filing Date
BG103619A BG63586B1 (en) 1999-07-29 1999-07-29 Method and device for pyramidal pattern encoding

Country Status (3)

Country Link
AU (1) AU1645400A (en)
BG (1) BG63586B1 (en)
WO (1) WO2001010130A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3679083B2 (en) * 2002-10-08 2005-08-03 株式会社エヌ・ティ・ティ・ドコモ Image encoding method, image decoding method, image encoding device, image decoding device, image encoding program, image decoding program
US8050446B2 (en) * 2005-07-12 2011-11-01 The Board Of Trustees Of The University Of Arkansas Method and system for digital watermarking of multimedia signals
AU2015332438A1 (en) 2014-10-15 2017-05-04 Nucleushealth, Llc Remote viewing of large image files
CN112465792A (en) * 2020-12-04 2021-03-09 北京华捷艾米科技有限公司 Human face quality evaluation method and related device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148498A (en) * 1990-08-01 1992-09-15 Aware, Inc. Image coding apparatus and method utilizing separable transformations

Also Published As

Publication number Publication date
AU1645400A (en) 2001-02-19
BG103619A (en) 2001-01-31
WO2001010130A1 (en) 2001-02-08

Similar Documents

Publication Publication Date Title
Konstantinides et al. Noise estimation and filtering using block-based singular value decomposition
US5659363A (en) Coding and decoding of video signals
JP4559622B2 (en) Color image compression based on two-dimensional discrete wavelet transform yielding perceptually lossless images
US5126962A (en) Discrete cosine transform processing system
US5420636A (en) Apparatus for and method of transmitting video signal
KR100254505B1 (en) Encoding apparatus
JPH05304610A (en) Method and device for decoding picture data
WO1991003902A1 (en) Improved image compression method and apparatus
JPH10503359A (en) Method and apparatus for reducing image data compression noise
Hsu et al. A new adaptive separable median filter for removing blocking effects
EP0842586A1 (en) Jpeg compression circuit with filtering
CN109257608B (en) Image processing method, device and system
JPH0746139A (en) Signal processor and application thereof
US5426673A (en) Discrete cosine transform-based image coding and decoding method
JPH08214309A (en) Image signal encoder
JP3686695B2 (en) Image processing device
Kim et al. Lossless and lossy image compression using biorthogonal wavelet transforms with multiplierless operations
BG63586B1 (en) Method and device for pyramidal pattern encoding
JP2002064821A (en) Method for compressing dynamic image information and its system
US6754433B2 (en) Image data recording and transmission
Goel et al. Pre-processing for MPEG compression using adaptive spatial filtering
Konstantinides et al. Application of SVD based spatial filtering to video sequences
KR101259063B1 (en) A image processing device and blocking effect removal method of the same
Taranath et al. Image Compression and Decompression using Fence Decimation
JPH0732457B2 (en) Image data compression device