BG63586B1

BG63586B1 - Метод и устройство за пирамидално кодиране на изображения

Info

Publication number: BG63586B1
Application number: BG103619A
Authority: BG
Inventors: Румен КУНЧЕВ
Original assignee: Румен КУНЧЕВ
Priority date: 1999-07-29
Filing date: 1999-07-29
Publication date: 2002-05-31
Also published as: WO2001010130A1; BG103619A; AU1645400A

Abstract

Методът и устройството намират приложение в системите за предаване на фото- и телевизионни изображения по цифрови мрежи от типа ISDN, ATM, Internet, сателитни и кабелни канали за връзка и други. Съгласно метода, основан на декомпозиция на изображението чрез инверсна диференциална пирамида, изображението се апроксимира с полиномна функция, чийто коефициенти са определени с регресионен анализ, или с изображение, получено чрез инверсно ортогонално преобразуване на филтрираната трансформанта на входното изображение след запазване в нея на малък брой нискочестотни коефициенти. Тези коефициенти представляват нивото "нула" (върха) на пирамидата. Заформиране на следващото й ниво от входното изображение се изважда неговата апроксимация, определеначрез коефициентите от нивото "нула". Полученото "нулево" разликово изображение се разделя на четириеднакви по форма и размери подизображения и за всяко от тях се прилагат аналогични операции за намиране на съответните им апроксимиращи изображения. За беззагубна (обратима) компресия 1/4 от коефициентите в съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране. За увеличаванекоефициента на компресия се прилага кодиране без визуални загуби чрез двустранно "отсичане" отгоре и отдолу на нискоинформативните нива на пирамидатаи квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране. Устройството позволява рекурсивно

Description

Изобретението се отнася до метод и устройство за пирамидално кодиране на изображения с приложение в системите за компресиране на фото- и телевизионни изображения (видеосигнали) при предаването им по цифрови 10 мрежи от типа ISDN и ATM, Интернет, наземни, сателитни и кабелни канали за връзка, за видеотелефонни и видеоконферентни системи, системи за наблюдение и охрана на обекти, системи за нелинейно редактиране, за архиви- 15 ране на цифрови изображения върху твърди дискове, компакт-дискове, магнитни ленти и др.

Предшестващо състояние на техниката

Известни са методи и устройства за пирамидално кодиране на изображения чрез декомпозиция от ортогонален и неортогонален тип /1, 2/. В съответствие с първия метод, основан на дискретното преобразуване Wave- 25 let /3/, с помощта на банка от цифрови филтри и блокове за субдискретизация (децимация), входното изображение се разлага на четири изображения с двукратно намалени размери, съставящи първото ниво на ортогонал- 30 ната пирамида. В двумерната спектрална област на Фурие на тези изображения съответстват четири честотни ленти: първата от тях съдържа информация за нискочестотните компоненти в хоризонтално направление на спек- 35 търа и за високочестотните компоненти - във вертикално; втората - за високочестотните компоненти в хоризонтално направление и за нискочестотните - във вертикално; третата - за високочестотните компоненти в диагоналните 40 направления, и четвъртата - за нискочестотните компоненти едновременно в хоризонтално и вертикално направление. Изображението, съответстващо на последната лента, служи като входно (основа) за рекурентно построяване на 45 следващото ниво на пирамидата, а при завършване на разлагането представлява нейния връх. Компресиране на изображението се постига чрез предаване по канала за връзка на квантуваните пиксели от нивата на Wavelet пира- 50 мидата. При декомпресирането тези пиксели се квантуват инверсно и се обработват в обра тен ред чрез блокове за супердискретизация и банка от квадратурно-огледално (QMF) цифрови филтри. В резултат се получава ресурсивно възстановяване на изображението.

Известно е устройство /4/, осъществяващо описания метод, чийто вход е свързан паралелно с два цифрови филтъра за обработка на изображението в хоризонтално направление, първият от които е високочестотен, а вторият - нискочестотен. Изходите на тези филтри са свързани през блокове за двукратна децимация съответно с две двойки от паралелно свързани цифрови филтри - високочестотен и нискочестотен за обработка на изображението във вертикално направление. Четирите изхода на двойките филтри са свързани през блокове за двукратна децимация с квантуващи блокове, чиито изходи през мултиплексор са свързани с канала за връзка. Същевременно, изходът на четвъртия квантуващ блок е свързан през блок за инверсно квантуване и буферна видеопамет с входа на кодера. Входът на декодера е свързан през демултиплексор съответно с четири блока за инверсно квантуване, двукратна супердискритизация (интерполация) и филтрация с помощта на банка от инверсни квадратурно-огледални филтри. Четири от тях са предназначени за обработка на изображенията в хоризонтално направление и два за вертикално, но след извършване на двукратна интерполация на хоризонтално филтрираните изображения от първата група филтри.

В съответствие с втория метод, основан на неортогоналната декомпозиция чрез лапласова пирамида /5/, входното изображение се приема за нулево ниво (основа) на помощната гаусова пирамида. В процеса на пирамидално кодиране размерите на изображението се редуцират многократно чрез последователно прилагане на операциите двумерна нискочестотна филтрация и децимация. В резултат от поредната филтрация и децимация се съкращава всеки втори пиксел на изображението в хоризонтално и вертикално направление, с което се намалява двукратно неговата пространствена разделителна способност. Изображението след първата редукция представлява първото ниво (сечение) на гаусовата пирамида. Всяко следващо ниво на пирамидата се получава от по-долното по аналогичен начин чрез намаляване на размерите на съответното изображение с помощта на нискочестотна филт рация и децимация. Редукцията се прекратява, когато след нейното поредно изпълнение размерите на изображението достигнат минималния размер един пиксел (т.е. 1x1). Това изображение представлява последното ниво на гаусовата пирамида и съответства на нейния връх. Едновременно с построяване на гаусовата пирамида се изгражда и т.нар. “лапласова” пирамида на изображението. Нейното нулево ниво (основа) представлява разлика на изображенията от нулевото ниво на гаусовата пирамида и нейното следващо (първо) ниво, разширено два пъти по хоризонтала и вертикала с помощта на двумерна интерполация. Следващото (първо) ниво на лапласовата пирамида се получава по аналогичен начин на нулевото и представлява разлика на първото ниво на гаусовата пирамида и нейното следващо (второ) ниво, разширено два пъти чрез двумерна интерполация, и т.н. Последното ниво (върха) на лапласовата пирамида е изображение с размери 1x1 пиксела, което съвпада с това на гаусовата.

Компресия на декомпозираното чрез лапласовата пирамида изображение се постига чрез редуциране на 1/3 от общия брой пиксели на пирамидата (съкращава се един от всеки четири пиксела в дадено ниво) в съответствие с алгоритъм, наречен “редуцирана” разликова пирамида /2/. За нейната по-нататъшна компресия се прилагат операциите квантуване на елементите от всяко ниво и ентропийно кодиране /6/. Данните за компресираните нива на пирамидата се предават по канала за връзка последователно от върха към нейната основа и по този начин се осъществява т.нар. “прогресивно” предаване на изображението с постепенно нарастване на неговата разделителна способност и размери.

В процеса на декодиране на компресираното изображение при прогресивно предаване на нивата на неговата лапласова пирамида върху приетите данни се прилагат операциите инверсно квантуване и ентропийно декодиране. Първото получено изображение, съответстващо на върха на пирамидата (нейното последно ниво), се разширява двукратно чрез двумерна интерполация и се сумира със следващото изображение от предпоследното ниво на лапласовата пирамида и т.н. По този начин последователно се възстановяват изображенията, съответстващи на нивата на гау совата пирамида до достигането на нейната основа (нулевото ниво).

Известно е устройство /7/, осъществяващо описания метод, което съдържа източник на изображение, свързан с входа на кодер за рекурсивно изчисляване на нивата на гаусовата и лапласовата пирамида. От своя страна кодерът съдържа последователно свързани блокове: за редуциране, квантуване, инверсно квантуване и разширяване на изображението. Изходът на блока за комутация е свързан също така и със сумиращия вход на суматор, чийто изваждащ вход е свързан с изхода на блока за разширяване. Изходът на този суматор е свързан с блок за квантуване, чийто изход представлява изхода на кодера, свързан с канала за предаване на разликовите изображения към декодера. Изходът на блока за квантуване, свързан с блока за редуциране, е свързан през буферна памет с входа на блока за кодера. Декодерът за рекурсивно възстановяване на предаденото изображение, чийто вход е свързан с канала за връзка, съдържа входен блок за инверсно квантуване. Той е свързан с първия вход на суматор, чийто втори вход е свързан с изхода на блок за разширяване. Неговият вход е свързан с изхода на буферна памет, входът на която е свързан с изхода на декодера.

Техническа същност на изобретението

Задачата на изобретението е да се създаде метод за пирамидално кодиране на изображения, който се основава на един нов тип декомпозиция на цифрови изображения, наречена инверсна диференциална пирамида. Съгласно този метод в процеса на кодиране входното цифрово изображение се апроксимира по един от следните два начина: чрез двумерна полиномна функция с ш коефициента, чиито стойности са определени от изискването за минимизация на средноквадратичната грешка, или с изображение, получено чрез инверсно ортогонално преобразуване на филтрираната трансформанта (дискретния спектър) на входното изображение след запазването в нея само на група от ш избрани нискочестотни коефициенти, като тази трансформанта може да бъде определена с всяко от известните линейни ортогонални преобразувания, като дискретно косинусно преобразуване, преобразуването на

Уолш-Адамар и др. Апроксимиращото изображение се описва с m коефициента независимо от вида на избраната апроксимация. Тези коефициенти представляват нивото “нула” (върха) на инверсната диференциална пирамида. За формиране на нейното следващо ниво се извършва поелементно изваждане на входното изображение и неговата апроксимация, определена въз основа на коефициентите за нивото “нула”. Полученото “нулево” разликово изображение се разделя на четири еднакви по форма и размери подизображения и за всяко от тях се прилагат същите операции за определяне на съответните им апроксимиращи подизображения по аналогия с входното. В резултат се получава съставената от апроксимиращите подизображения “нулева” разлика, която се описва общо с 4ш коефициента. Последните представляват първо ниво на пирамидата. Нейното второ ниво се формира, като от изображението на “нулевата” разлика се изважда нейната апроксимация и полученото “първо” разликово изображение се разделя на 16 еднакви по форма и размери подизображения. Върху всяко от тях се прилагат рекурсивно същите операции за апроксимация както върху подизображенията от предишната “нулева” разлика и т.н. При входно изображение с размери 2 х 2 пиксела на предпоследното (п-1)-во ниво от неговата инверсна пирамида съответства разликовото изображение п-2, което се описва с 4 'ш коефициента. Последното ниво на пирамидата представлява остатъчното разликово изображение η-l, чийто размери са равни на тези на входното. Построената по този начин пирамида има п+1 нива и се описва общо с 4⁺¹(πι/3) коефициента, които са достатъчни за пълното възстановяване (без загуби) на произволно по съдържание изображение. За да се постигне беззагубна (обратима) компресия, 1 /4 от коефициентите на съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране. За увеличаване на коефициента на компресия се прилага т.нар. кодиране без визуални загуби. За тази цел се извършва двустранно “отсичане” от горе и от долу на нискоинформативните нива на пирамидата и квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране. Редът на предаване по канала за връзка на данните за нивата на пирамидата е от върха към нейната основа. Декодирането на изображението се извършва, като върху приетите данни се прилагат последователно операциите ентропийно декодиране и инверсно квантуване (последното само в случай на кодиране без визуални загуби). С помощта на получените коефициенти на подизображенията в предадените нива на пирамидата се извършва реконструиране на съответните им полиномни функции или апроксимиращи изображения като резултат от инверсното ортогонално преобразуване на коефициентите. Възстановените по този начин изображения за всяко ниво на пирамидата се сумират последователно чрез натрупване от върха към нейната основа и се получава изходното изображение, което се възпроизвежда с постепенно нарастваща разделителна способност в съответствие с поредния номер на предаденото ниво на пирамидата.

Изборът на вида на апроксимацията на подизображенията - полиномна или чрез ортогонално преобразуване, се определя предварително в зависимост от изискванията за необходимото време на компресия и точност на апроксимация. Полиномната апроксимация осигурява по-голяма точност, което води до повишаване на качеството на възстановеното изображение за сметка на по-големия брой изчисления. Апроксимацията чрез ортогонално преобразуване се избира, когато е необходимо по-високо бързодействие на компресията (за работа в реално време) и е допустимо понижаване на качеството на възстановеното изображение.

Предимствата на метода са следните: за построяване на инверсната диференциална пирамида не са необходими операциите децимация и интерполация, които причиняват специфични изкривявания на изображението (ефекта на Гибс) вследствие промяна на структурата на пространствената дискретизираща решетка и неидеалната нискочестотна филтрация; улеснява реализирането на прогресивно предаване на изображението, тъй като нивата на пирамидата се определят последователно от върха към нейната основа в ред, който е инверсен на този при лапласовата пирамида; нивата на пирамидата съдържат коефициенти на трансформанти или полиномни функции, чиито изменения вследствие на случайни грешки при предаването им в канала за връзка влияят по-слабо върху визуалното качество на възстановеното изображение в сравнение с влиянието на грешките при лапласовата пирамида, тъй като нейните нива представляват разликови изображения; осигурява по-голям коефициент на компресия в сравнение с лапласовата и “редуцираната” разликова пирамида /2/ при една и съща точност на възстановяване на изображението.

Същността на изобретението се състои и в устройство за пирамидално кодиране на изображения, което съдържа източник на изображение, свързан с входа на кодер за рекурсивно изчисляване на инверсната диференциална пирамида. Кодерът се състои от първи комутатор, чийто първи вход е свързан с източника на изображение, а изходът му е свързан с входа на първа видеопамет и първия вход на втори комутатор. Изходът на първата видеопамет е свързан с вторите входове съответно на втория комутатор и първи суматор. От своя страна изходът на втория комутатор през електронен ключ е свързан с първия вход на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване. Вторият вход на същия блок е свързан с изхода на първи блок за формиране на тегловни или “базови” изображения, а изходът му е свързан с входа на блок за квантуване. Изходът на последния е свързан с първия вход на трети комутатор и входа на блок за инверсно квантуване, чийто изход е свързан с входа на втора видеопамет. Нейният изход е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ортогонално преобразуване, чийто втори вход е свързан с изхода на първия блок за формиране на тегловни или “базови” изображения, а изходът му е свързан с първия изваждащ вход на първия суматор. Неговият изход е свързан с вторите входове съответно на първия и третия комутатор. Изходът на третия комутатор е свързан през блок за ентропийно кодиране с изхода на кодера за рекурсивно изчисляване на инверсната диференциална пирамида. Този изход от своя страна е свързан през канала за връзка с входа на съответен пирамидален декодер. Последният се състои от блок за ентропийно декодиране, чийто вход представлява входа на пирамидалния декодер, а изходът му е свързан с входа на демултиплексор. Неговият първи изход е свързан с входа на втори блок за инверсно квантуване, чийто изход е свързан през трета видеопамет с първия вход на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване, вторият вход на който е свързан с изхода на втори блок за формиране на тегловни или “базови” изображения. Изходът на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване е свързан с първия вход на четвърти комутатор, вторият вход на който е свързан с втория изход на демултиплексора, а изходът му е свързан с първия вход на втори суматор, чийто втори вход е свързан с изхода на четвърта видеопамет. Нейният вход е свързан с изхода на втория суматор и представлява изхода на пирамидалния декодер.

Предимство на устройството, реализиращо метода, е неговата опростена структура в сравнение с тази на устройството за пирамидално кодиране на изображения чрез лапласовата пирамида, още повече в случая на въвеждане на обратна връзка за шума от квантуване /7/. Това предимство се дължи на каноничната структура на инверсната диференциална пирамида и на липсата на блокове за редуциране и разширяване на изображения, използвани в лапласовата пирамида. Тези блокове от своя страна се реализират с помощта на децимацитори, интерполатори и двумерни цифрови филтри с минимални размери 5x5 елемента, за които са необходими голям брой изчислителни операции.

Пояснение на приложените фигури

По-подробно изобретението е пояснено с приложените фигури, илюстриращи едно примерно изпълнение на устройството, реализиращо метода за пирамидално кодиране на изображения, от които:

фигура 1 представлява блокова схема на устройството за пирамидално кодиране на изображения, която се основава на декомпозицията, наречена инверсна диференциална пирамида за прогресивно предаване на изображения;

фигура 2 - етапите на възстановяване на тестовото изображение LENA с размери

512x512 с 8 бита на пиксел при последователно предаване на нивата на съответната инверсна диференциална пирамида с пореден номер рМ),1,2,...,7.

Примери за изпълнение на изобретението

Примерното изпълнение на устройството за пирамидално кодиране на изображения съгласно изобретението е показано на фигура 1, 5 която представлява блокова схема на устройството, състоящо се от кодер и декодер. В техния състав са включени четири двувходови комутатора 1, четири видеопамети 2, блок за определяне на полиномните коефициенти или тези 10 на “отсеченото” ортогонално преобразуване 3, два блока за полиномна реконструкция или инверсно ортогонално преобразуване 4, блокове за квантуване и инверсно квантуване съответно 5 и 6, два блока за формиране на тегловни 15 или “базови” изображения 7, два суматора 8, блокове за ентропийно кодиране и декодиране съответно 9 и 10, де мултиплексор 11 и електронен ключ 12. Съгласно блоковата схема от фиг. 1 източникът на изображение е свързан с 20 първия вход а на първи комутатор 1, а изходът му b е свързан с входа на първа видеопамет 2 и първия вход на втори комутатор 1. Изходът с на първата видеопамет 2 е свързан с вторите входове съответно на втория комутатор 1 25 и първи суматор 8. От своя страна изходът на втория комутатор d през електронен ключ 12 е свързан с първия вход е на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване 3. 30 Вторият вход на същия блок 3 е свързан с изхода m на първи блок за формиране на тегловни или “базови” изображения 7, а изходът му f е свързан с входа на блок за квантуване 5. Изходът на последния g е свързан с първия 35 вход на трети комутатор 1 и входа на блок за инверсно квантуване 6, чийто изход h е свързан с входа на втора видеопамет 2. Нейният изход к е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ор- 40 тогонално преобразуване 4, чийто втори вход е свързан с изхода m на първия блок за формиране на тегловни или “базови” изображения 7, а изходът му 1 е свързан с първия изваждаш вход на първия суматор 8. Неговият изход i е 45 свързан с вторите входове съответно на първия и третия комутатор 1. Изходът η на третия комутатор 1 е свързан през блок за ентропийно кодиране 9 с изхода р на кодера за рекурсивно изчисляване на инверсната диференци- 50 ална пирамида. Този изход р от своя страна е свързан през канала за връзка с входа на съ ответен пирамидален декодер. Последният се състои от блок за ентропийно декодиране 10, чийто вход представлява входа на пирамидалния декодер, а изходът му х е свързан с входа на демултиплексор 11. Неговият първи изход г е свързан с входа на втори блок за инверсно квантуване 6, чийто изход s е свързан през трета видеопамет 2 с първия вход t на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване 4, вторият вход на който е свързан с изхода m на втори блок за формиране на тегловни или “базови” изображения 7. Изходът и на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване 4 е свързан с първия вход на четвърти комутатор 1, вторият вход q на който е свързан с втория изход на демултиплексора 11, а изходът му v е свързан с първия вход на втори суматор 8, чийто втори вход у е свързан с изхода на четвърта видеопамет 2. Нейният вход w е свързан с изхода на втория суматор 2 и представлява изхода на пирамидалния декодер.

Действието на устройството съгласно изобретението е следното. В първия цикъл на рекурсивна обработка на изображението неговият сигнал се подава на входа на пирамидалния кодер през входния комутатор 1 и се записва във видеопаметта 2. Същевременно през втория комутатор 1 и ключа 12 сигналът на изображението постъпва в блока за определяне на полиномните коефициенти или тези на “отсеченото” ортогонално преобразуване 3. За тази цел към същия блок се подават едновременно тегловни или “базови” изображения от блок за тяхното формиране 7. Видът на тези изображения при първия тип апроксимация се определя предварително в зависимост от реда на полиномната регресионна функция и размерите на входното изображение (или подизображение), а при втория - от избрания вид линейно ортогонално преобразуване (напр. дискретно косинусно, преобразуване на УолшАдамар и др.) и размерите на изображението (или подизображението). Всеки коефициент, изчислен в блок 3, се определя от корелацията на входното изображение (или подизображение) със съответно тегловно или “базово” изображение в зависимост от типа на избраната апроксимация - полиномна или чрез “отсечено” ортогонално преобразуване. Броят на коефициентите се задава предварително, като за първия тип апроксимация зависи от избраната полиномна функция, напр. шест коефициента за повърхност от втора степен, три за равнина и т.н. За втората апроксимация броят на коефициентите, съответстващи на ниските пространствени честоти в трансформантата на изображението (или подизображението), може да се избере напр. четири, три, и т.н. С увеличаването на този брой нараства точността на апроксимацията, но от друга страна намалява коефициентът на компресия на изображението и затова този брой се избира компромисно, напр. общо четири. Стойностите на тези коефициенти се определят, след като завърши записът на цялото входно изображение във видеопаметта 2. От изход f на блок 3 получените коефициенти се квантуват (скаларно или векторно) в блока 5. Квантуваните коефициенти от изход g на блок 5 преминават през комутатор 1 и постъпват в блок 9 за ентропийно кодиране. В него могат да се приложат алгоритми от типа: кодиране с променлива дължина, код на Хъфман, аритметично кодиране и др. Компресираната последователност от символи за поредното ниво на пирамидата от изхода р на блок 9 се предава по канала за връзка към входа на пирамидалния декодер. От друга страна квантуваните коефициенти в изхода g се деквантуват в блока за инверсно квантуване 6 и се записват във видеопаметта 2 за съхраняване на коефициентите на апроксимиращото изображение (или подизображението). Във втория цикъл на неговата обработка двете видеопамети (за изображението и за коефициентите на апроксимацията) се прочитат едновременно, като от изход к на втората получените коефициенти се преобразуват в блока за реконструиране на полиномни функции или за инверсно ортогонално преобразуване 4 в съответно апроксимиращо изображение (или подизображение). Във втория случай към блок 5 от изхода m на блок 7 се подават сигнал за съответното “базово” изображение. Полученият сигнал на изход 1 на блок 4 се изважда в суматора 8 от този на изход с на входната видеопамет 2. Разликовият сигнал на изхода i на суматора 8 през входния комутатор 1 се записва във входната видеопамет 2, като замества информацията за изображението от предишния първи цикъл на рекурсивно изчисление на нивата на инверсната диференциална пирамида. При за почване на следващия цикъл на работа на пирамидалния кодер входната памет, съдържаща нулевото разликово изображение, се прочита два пъти, като в процеса на първото четене данните в нея се подреждат в последователни блокове, съответстващи на нейните четири подизображения. За всяко от тях по аналогичен начин както в първия цикъл се изчисляват с помощта на блоковете 3, 5 и 6 техните квантувани коефициенти, записват се във видеопаметта 2 и се предават чрез ентропийно кодиране по канала за връзка към декодера. В процеса на второто четене на входната видеопамет 2 от нейните изходни данни, подредени в блокове според подизображенията, се изваждат тези, получени на изхода I на блок 4, и се записват отново във входната видеопамет 2 и т.н. В последния (п+1)-ви цикъл на работа на кодера, който се използва само за компресия без загуби, при второто четене на входната видеопамет 2 на изхода i на суматора 8 се получава остатъчното изображение, което не се записва повторно във входната видеопамет 2, а се предава през изходния комутатор 2 към ентропийния кодер 9 и от неговия изход - към канала за връзка. Приетите в пирамидалния декодер данни от последователните нива на пирамидата през ентропийния декодер 10 се разделят чрез демултиплексора 11, като на първия му изход г се получават данните за нивата на пирамидата до п-то, а на втория му изход q - тези за остатъчното изображение в (п+1)-то ниво. Действието на блоковете 6, 2, 4 и 7 в декодера е аналогично на това на същите блокове в кодера, обяснено по-горе. Чрез суматора 8 и видеопаметта 2 е реализиран натрупващ суматор, който служи за възстановяване на изходното изображение с постепенно нарастваща разделителна способност в процеса на предаване на нивата на съответната инверсна диференциална пирамида.

Методът за пирамидално кодиране на изображения съгласно изобретението се илюстрира от следния пример за компресиране на изображение с размери 4x4, което се описва със следната матрица:

В(1,1) В(2,1) В(3,1) В(4,1)		'12 3 4'
B(L2) В(2,2) В(ЗД) В(4,2)		2 3 4 5
В(1Л) В(2Л) ад В(43)	3	3 4 5 6
_Β(ζ4) В(2,4) В(3,4) В(4,4)		4 5 6 7

Ако изберем апроксимиращ полином от първа степен от типа B(i,j) = ai + bj + с, т.е. “ориентирана” равнина, чийто коефициенти а, b и с са определени предварително чрез авто регресионен анализ, за техните тегловни изоб ражения (матрици) се получава съответно:

	-3 -1 1 3'	-3 -3 -3 -3
[^la(U)] = ^	-3-113 -3-113	-1 -1 -1 -1 1111
	-3 -1 1 3	3 3 3 3

3	г
1	-1
-1	-3
-3	-5

Тогава стойностите на коефициентите на ражение, са следните:

равнината, апроксимираща примерното изоб20

4 4 4 4 4 ^а= ZZta(k>l)B(k,l) = l , b= ZZ^lb(M)B(k,l) = l , c=££tc(k,l)B(k,l) = -l к=П»1 к=11=1 к=11=1

В този случай съответният апроксимиращ полином за нулевото ниво на пирамидата се описва с функцията B.(i,j) = i+j+1. Тогава раз^υ ЧЛ ликата между входното изображение B(i,j) и функцията B₀(i,j) за всяка стойност на i,j = 1,2,3,4 е равна на нула и затова пирамидата на изображението се описва само с нейното нулево ниво, за което е достатъчно да се пре35 дадат само коефициентите а=Ь=1 и с=-1. При декодиране изображението се възстановява без загуби с коефициент на компресия К=16/3=5.33.

Някои от резултатите при моделирането на метода за инверсно пирамидално кодиране с помощта на апроксимиращи полиноми с 6, 3 и 1 коефициента (съответно ИДП-6,3,1) и в сравнението му с метода, използващ редуцираната диференциална пирамида (РДП) /2/, са дадени в таблица 1. Тук К(р) е коефициентът на компресия на изображението при ограничаване броя на нивата на пирамидата до р=0,1,...,7, a PSNR(p) е пиковото отношение сигнал/шум на възстановеното изображение при достигане на р-то ниво на пирамидата. Резултатите в таб лицата се отнасят за тестовото изображение LENA с размери 512x512 и 8 бита на пиксел. От нея се вижда, че при стойност на PSNR > 34 dB, когато на практика в изображението не се забелязват видими изкривявания, коефициентът на компресия за редуцираната диференциална пирамида е два пъти по-малък от този за инверсната.

На фиг. 2 е дадена разпечатка на същото тестово изображение, декодирано без квантуване на коефициентите на инверсна диференциална пирамида с предадени нива р=0,1,2,...,7. Тези изображения илюстрират метода и позволяват да се оцени визуално качеството на възстановяването им във всеки етап на прогресивното им предаване. Методът и устройството съгласно изобретението дават възможност за осъществяване на пирамидално кодиране без загуби (или без визуални загуби) на неподвижни изображения и видеопоследователности, които от своя страна могат да бъдат както черно-бели многоградационни,така и цветни.

Таблица 1

Коефициент на компресия К и пиково отношение сигнал/шум PSNR в [dB]
ЬЩИ ниворч	ИДП-1	ИДП-3	ИДП-6	РДП
К(р)	PSNR(p)	К(р)	PSNR(p)	ВД	PSNR(p)	К(р) PSNR(p)
0	147456	13,67	65384	13.95	32768	14,02	262144 13,66
1	36864	14,20	16384	14,44	8192	14,76	65536 13,94
2	9216	14,67	4096	15,54	2048	16,31	16384 14,49
3	2304	16,04	1024	17,85	512	18,97	4096 15,35
4	576	17,97	256	20,06	128	21,71	1024 17,11
5	144	19,98	64	22,82	32	24,69	256 19,33
6	48	22,63	16	26,15	8	28,40	64 21,99
7	12	25,74	4	30,51	2	34,29	16 25,21
8	3	30,17	1	40,03	0,5	*	4 28,90
9	0,75 *	0,25	-	-	1 33,80

* декомпозиция без загуби

В последния случай изображението се описва с три компоненти (матрици), към всяка от които поотделно може да се приложи компресиране съгласно метода и устройството. При компресиране на видеопоследователности (подвижни изображения) с описания метод и устройство всеки кадър трябва да бъде обработен вътрешнокадрово в реален мащаб на времето.

Claims

1. Метод за пирамидално кодиране на изображения, използващ пирамидално представяне на изображението, ортогонални преобразувания, квантуване на трансформационните коефициенти и ентропийно кодиране, характеризиращ се с това, че в процеса на кодиране входното цифрово изображение се апроксимира чрез предварително избрана дву- мерна полиномна функция с m коефициента, определени от изискването за минимизация на 35 средноквадратичната грешка на апроксимацията, или чрез изображение, получено с помощта на инверсно ортогонално преобразуване на филтрирана трансформанта на входното изображение, определена от него чрез прилагане 40 на право ортогонално преобразуване и запазване само на m избрани нискочестотни коефициента, съставящи във всеки от двата случая нулевото ниво (върха) на т.нар. инверсна диференциална пирамида, като нейното следва45 що ниво се формира чрез поелементно изваждане на входното изображение и неговата апроксимация, определена чрез коефициентите за нивото “нула”, полученото като резултат “нулево” разликово изображение се разделя на 50 четири еднакви по форма и размери подизображения, за всяко от които се прилагат аналогични операции за определяне на съответ ните им апроксимиращи подизображения, и се получава “нулевата” разлика за първо ниво на пирамидата, представено от 4т коефициента, като за формирането на нейното второ ниво от “нулевата” разлика се изважда нейната апроксимация и полученото “първо” разликово изображение се разделя на 16 еднакви по форма и размери подизображения, върху всяко от които се прилагат рекурсивно същите операции за апроксимация както върху подизображенията от предишната “нулева” разлика и т.н. до достигане на последното ниво на пирамидата, представляващо остатъчно разликово изображение с размери, равни на входното, като при беззагубна компресия 1/4 от коефициентите на съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране, а за кодиране без визуални загуби се извършва двустранно “отсичане” от горе и от долу на нискоинформативните нива на пирамидата и квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране, при което за декодиране на изображението върху компресираните данни се прилагат последователно ентропийно декодиране и инверсно квантуване, последното само в случай на кодиране без визуални загуби, и с помощта на получените коефициенти от подизображенията в предадените нива на пирамидата се извършва реконструиране на съответните им полиномни функции или апроксимиращи изображения чрез инверсно ортогонално преобразуване на коефициентите, като възстановените по този начин изображения за всяко ниво на пирамидата се сумират последователно чрез натрупване от върха към нейната основа и в резултат се получава изходното изображение с постепенно нарастваща разделителна способност в съответствие с номера на предаденото ниво на пирамидата.

2. Устройство за пирамидално кодиране на изображения съгласно метода, състоящо се от кодер и декодер, включващи комутатори, видеопамети, блокове за ортогонално преобразуване, квантуване и ентропийно кодиране, характеризиращо се с това, че източникът на изображение е свързан с първия вход (а) на първи комутатор (1), а изходът му (Ь) е свързан с входа на първа видеопамет (2) и първия вход на втори комутатор (1), изход (с) на първата видеопамет (2) е свързан с вторите входове съответно на втория комутатор (1) и първи суматор (8), като от своя страна изходът на втория комутатор (d) през електронен ключ (12) е свързан с първия вход (е) на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване (3), вторият вход на същия блок (3) е свързан с изхода (ш) на първи блок за формиране на тегловни или “базови” изображения (7), а изходът му (f) е свързан с входа на блок за квантуване (5), изходът на който (g) е свързан с първия вход на трети комутатор (1) и входа на блок за инверсно квантуване (6), чийто изход (h) е свързан с входа на втора видеопамет (2), а нейният изход (к) е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ортогонално преобразуване (4), чийто втори вход е свързан с изхода (ш) на първия блок за формиране на тегловни или “базови” изображения (7), а изходът му (1) е свързан с първия изваждащ вход на първия суматор (8), изходът на който (i) е свързан с вторите входове съответно на първия и третия комутатор (1), а изходът (п) на ‘ третия комутатор (1) е свързан през блок за ентропийно кодиране (9) с изход (р) на кодера за рекурсивно изчисляване на пирамидата на изображението, като неговият изход (р) от своя страна е свързан през канала за връзка с входа на съответен пирамидален декодер, със- * тоящ се от блок за ентропийно декодиране (10), чийто вход представлява входа на пирамидалния декодер, а изходът му (х) е свързан с входа на демултиплексор (11), първият изход на който (г) е свързан с входа на втори блок за инверсно квантуване (6), чийто изход (s) е свързан през трета видеопамет (2) с първия вход (t) на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване (4), вторият вход на който е свързан с изхода (ш) на втори блок за формиране на тегловни или “базови” изображения (7), като изходът (и) на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване (4) е свързан с първия вход на четвърти комутатор (1), вторият вход (q) на който е свързан с втория изход на демултиплексора (11), а изходът му (v) е свързан с първия вход на втори суматор (8), чийто втори вход (у) е свързан с изхода на четвърта видеопамет (2), а нейният вход (w) е свързан с изхода на втория суматор (2) и представля10 ва изхода на пирамидалния декодер.