BG63586B1 - Метод и устройство за пирамидално кодиране на изображения - Google Patents

Метод и устройство за пирамидално кодиране на изображения Download PDF

Info

Publication number
BG63586B1
BG63586B1 BG103619A BG10361999A BG63586B1 BG 63586 B1 BG63586 B1 BG 63586B1 BG 103619 A BG103619 A BG 103619A BG 10361999 A BG10361999 A BG 10361999A BG 63586 B1 BG63586 B1 BG 63586B1
Authority
BG
Bulgaria
Prior art keywords
input
output
image
pyramid
coefficients
Prior art date
Application number
BG103619A
Other languages
English (en)
Other versions
BG103619A (bg
Inventor
Румен КУНЧЕВ
Original Assignee
Румен КУНЧЕВ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Румен КУНЧЕВ filed Critical Румен КУНЧЕВ
Priority to BG103619A priority Critical patent/BG63586B1/bg
Priority to PCT/BG1999/000027 priority patent/WO2001010130A1/en
Priority to AU16454/00A priority patent/AU1645400A/en
Publication of BG103619A publication Critical patent/BG103619A/bg
Publication of BG63586B1 publication Critical patent/BG63586B1/bg

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Методът и устройството намират приложение в системите за предаване на фото- и телевизионни изображения по цифрови мрежи от типа ISDN, ATM, Internet, сателитни и кабелни канали за връзка и други. Съгласно метода, основан на декомпозиция на изображението чрез инверсна диференциална пирамида, изображението се апроксимира с полиномна функция, чийто коефициенти са определени с регресионен анализ, или с изображение, получено чрез инверсно ортогонално преобразуване на филтрираната трансформанта на входното изображение след запазване в нея на малък брой нискочестотни коефициенти. Тези коефициенти представляват нивото "нула" (върха) на пирамидата. Заформиране на следващото й ниво от входното изображение се изважда неговата апроксимация, определеначрез коефициентите от нивото "нула". Полученото "нулево" разликово изображение се разделя на четириеднакви по форма и размери подизображения и за всяко от тях се прилагат аналогични операции за намиране на съответните им апроксимиращи изображения. За беззагубна (обратима) компресия 1/4 от коефициентите в съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране. За увеличаванекоефициента на компресия се прилага кодиране без визуални загуби чрез двустранно "отсичане" отгоре и отдолу на нискоинформативните нива на пирамидатаи квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране. Устройството позволява рекурсивно

Description

Изобретението се отнася до метод и устройство за пирамидално кодиране на изображения с приложение в системите за компресиране на фото- и телевизионни изображения (видеосигнали) при предаването им по цифрови 10 мрежи от типа ISDN и ATM, Интернет, наземни, сателитни и кабелни канали за връзка, за видеотелефонни и видеоконферентни системи, системи за наблюдение и охрана на обекти, системи за нелинейно редактиране, за архиви- 15 ране на цифрови изображения върху твърди дискове, компакт-дискове, магнитни ленти и др.
Предшестващо състояние на техниката
Известни са методи и устройства за пирамидално кодиране на изображения чрез декомпозиция от ортогонален и неортогонален тип /1, 2/. В съответствие с първия метод, основан на дискретното преобразуване Wave- 25 let /3/, с помощта на банка от цифрови филтри и блокове за субдискретизация (децимация), входното изображение се разлага на четири изображения с двукратно намалени размери, съставящи първото ниво на ортогонал- 30 ната пирамида. В двумерната спектрална област на Фурие на тези изображения съответстват четири честотни ленти: първата от тях съдържа информация за нискочестотните компоненти в хоризонтално направление на спек- 35 търа и за високочестотните компоненти - във вертикално; втората - за високочестотните компоненти в хоризонтално направление и за нискочестотните - във вертикално; третата - за високочестотните компоненти в диагоналните 40 направления, и четвъртата - за нискочестотните компоненти едновременно в хоризонтално и вертикално направление. Изображението, съответстващо на последната лента, служи като входно (основа) за рекурентно построяване на 45 следващото ниво на пирамидата, а при завършване на разлагането представлява нейния връх. Компресиране на изображението се постига чрез предаване по канала за връзка на квантуваните пиксели от нивата на Wavelet пира- 50 мидата. При декомпресирането тези пиксели се квантуват инверсно и се обработват в обра тен ред чрез блокове за супердискретизация и банка от квадратурно-огледално (QMF) цифрови филтри. В резултат се получава ресурсивно възстановяване на изображението.
Известно е устройство /4/, осъществяващо описания метод, чийто вход е свързан паралелно с два цифрови филтъра за обработка на изображението в хоризонтално направление, първият от които е високочестотен, а вторият - нискочестотен. Изходите на тези филтри са свързани през блокове за двукратна децимация съответно с две двойки от паралелно свързани цифрови филтри - високочестотен и нискочестотен за обработка на изображението във вертикално направление. Четирите изхода на двойките филтри са свързани през блокове за двукратна децимация с квантуващи блокове, чиито изходи през мултиплексор са свързани с канала за връзка. Същевременно, изходът на четвъртия квантуващ блок е свързан през блок за инверсно квантуване и буферна видеопамет с входа на кодера. Входът на декодера е свързан през демултиплексор съответно с четири блока за инверсно квантуване, двукратна супердискритизация (интерполация) и филтрация с помощта на банка от инверсни квадратурно-огледални филтри. Четири от тях са предназначени за обработка на изображенията в хоризонтално направление и два за вертикално, но след извършване на двукратна интерполация на хоризонтално филтрираните изображения от първата група филтри.
В съответствие с втория метод, основан на неортогоналната декомпозиция чрез лапласова пирамида /5/, входното изображение се приема за нулево ниво (основа) на помощната гаусова пирамида. В процеса на пирамидално кодиране размерите на изображението се редуцират многократно чрез последователно прилагане на операциите двумерна нискочестотна филтрация и децимация. В резултат от поредната филтрация и децимация се съкращава всеки втори пиксел на изображението в хоризонтално и вертикално направление, с което се намалява двукратно неговата пространствена разделителна способност. Изображението след първата редукция представлява първото ниво (сечение) на гаусовата пирамида. Всяко следващо ниво на пирамидата се получава от по-долното по аналогичен начин чрез намаляване на размерите на съответното изображение с помощта на нискочестотна филт рация и децимация. Редукцията се прекратява, когато след нейното поредно изпълнение размерите на изображението достигнат минималния размер един пиксел (т.е. 1x1). Това изображение представлява последното ниво на гаусовата пирамида и съответства на нейния връх. Едновременно с построяване на гаусовата пирамида се изгражда и т.нар. “лапласова” пирамида на изображението. Нейното нулево ниво (основа) представлява разлика на изображенията от нулевото ниво на гаусовата пирамида и нейното следващо (първо) ниво, разширено два пъти по хоризонтала и вертикала с помощта на двумерна интерполация. Следващото (първо) ниво на лапласовата пирамида се получава по аналогичен начин на нулевото и представлява разлика на първото ниво на гаусовата пирамида и нейното следващо (второ) ниво, разширено два пъти чрез двумерна интерполация, и т.н. Последното ниво (върха) на лапласовата пирамида е изображение с размери 1x1 пиксела, което съвпада с това на гаусовата.
Компресия на декомпозираното чрез лапласовата пирамида изображение се постига чрез редуциране на 1/3 от общия брой пиксели на пирамидата (съкращава се един от всеки четири пиксела в дадено ниво) в съответствие с алгоритъм, наречен “редуцирана” разликова пирамида /2/. За нейната по-нататъшна компресия се прилагат операциите квантуване на елементите от всяко ниво и ентропийно кодиране /6/. Данните за компресираните нива на пирамидата се предават по канала за връзка последователно от върха към нейната основа и по този начин се осъществява т.нар. “прогресивно” предаване на изображението с постепенно нарастване на неговата разделителна способност и размери.
В процеса на декодиране на компресираното изображение при прогресивно предаване на нивата на неговата лапласова пирамида върху приетите данни се прилагат операциите инверсно квантуване и ентропийно декодиране. Първото получено изображение, съответстващо на върха на пирамидата (нейното последно ниво), се разширява двукратно чрез двумерна интерполация и се сумира със следващото изображение от предпоследното ниво на лапласовата пирамида и т.н. По този начин последователно се възстановяват изображенията, съответстващи на нивата на гау совата пирамида до достигането на нейната основа (нулевото ниво).
Известно е устройство /7/, осъществяващо описания метод, което съдържа източник на изображение, свързан с входа на кодер за рекурсивно изчисляване на нивата на гаусовата и лапласовата пирамида. От своя страна кодерът съдържа последователно свързани блокове: за редуциране, квантуване, инверсно квантуване и разширяване на изображението. Изходът на блока за комутация е свързан също така и със сумиращия вход на суматор, чийто изваждащ вход е свързан с изхода на блока за разширяване. Изходът на този суматор е свързан с блок за квантуване, чийто изход представлява изхода на кодера, свързан с канала за предаване на разликовите изображения към декодера. Изходът на блока за квантуване, свързан с блока за редуциране, е свързан през буферна памет с входа на блока за кодера. Декодерът за рекурсивно възстановяване на предаденото изображение, чийто вход е свързан с канала за връзка, съдържа входен блок за инверсно квантуване. Той е свързан с първия вход на суматор, чийто втори вход е свързан с изхода на блок за разширяване. Неговият вход е свързан с изхода на буферна памет, входът на която е свързан с изхода на декодера.
Техническа същност на изобретението
Задачата на изобретението е да се създаде метод за пирамидално кодиране на изображения, който се основава на един нов тип декомпозиция на цифрови изображения, наречена инверсна диференциална пирамида. Съгласно този метод в процеса на кодиране входното цифрово изображение се апроксимира по един от следните два начина: чрез двумерна полиномна функция с ш коефициента, чиито стойности са определени от изискването за минимизация на средноквадратичната грешка, или с изображение, получено чрез инверсно ортогонално преобразуване на филтрираната трансформанта (дискретния спектър) на входното изображение след запазването в нея само на група от ш избрани нискочестотни коефициенти, като тази трансформанта може да бъде определена с всяко от известните линейни ортогонални преобразувания, като дискретно косинусно преобразуване, преобразуването на
Уолш-Адамар и др. Апроксимиращото изображение се описва с m коефициента независимо от вида на избраната апроксимация. Тези коефициенти представляват нивото “нула” (върха) на инверсната диференциална пирамида. За формиране на нейното следващо ниво се извършва поелементно изваждане на входното изображение и неговата апроксимация, определена въз основа на коефициентите за нивото “нула”. Полученото “нулево” разликово изображение се разделя на четири еднакви по форма и размери подизображения и за всяко от тях се прилагат същите операции за определяне на съответните им апроксимиращи подизображения по аналогия с входното. В резултат се получава съставената от апроксимиращите подизображения “нулева” разлика, която се описва общо с 4ш коефициента. Последните представляват първо ниво на пирамидата. Нейното второ ниво се формира, като от изображението на “нулевата” разлика се изважда нейната апроксимация и полученото “първо” разликово изображение се разделя на 16 еднакви по форма и размери подизображения. Върху всяко от тях се прилагат рекурсивно същите операции за апроксимация както върху подизображенията от предишната “нулева” разлика и т.н. При входно изображение с размери 2 х 2 пиксела на предпоследното (п-1)-во ниво от неговата инверсна пирамида съответства разликовото изображение п-2, което се описва с 4 'ш коефициента. Последното ниво на пирамидата представлява остатъчното разликово изображение η-l, чийто размери са равни на тези на входното. Построената по този начин пирамида има п+1 нива и се описва общо с 4+1(πι/3) коефициента, които са достатъчни за пълното възстановяване (без загуби) на произволно по съдържание изображение. За да се постигне беззагубна (обратима) компресия, 1 /4 от коефициентите на съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране. За увеличаване на коефициента на компресия се прилага т.нар. кодиране без визуални загуби. За тази цел се извършва двустранно “отсичане” от горе и от долу на нискоинформативните нива на пирамидата и квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране. Редът на предаване по канала за връзка на данните за нивата на пирамидата е от върха към нейната основа. Декодирането на изображението се извършва, като върху приетите данни се прилагат последователно операциите ентропийно декодиране и инверсно квантуване (последното само в случай на кодиране без визуални загуби). С помощта на получените коефициенти на подизображенията в предадените нива на пирамидата се извършва реконструиране на съответните им полиномни функции или апроксимиращи изображения като резултат от инверсното ортогонално преобразуване на коефициентите. Възстановените по този начин изображения за всяко ниво на пирамидата се сумират последователно чрез натрупване от върха към нейната основа и се получава изходното изображение, което се възпроизвежда с постепенно нарастваща разделителна способност в съответствие с поредния номер на предаденото ниво на пирамидата.
Изборът на вида на апроксимацията на подизображенията - полиномна или чрез ортогонално преобразуване, се определя предварително в зависимост от изискванията за необходимото време на компресия и точност на апроксимация. Полиномната апроксимация осигурява по-голяма точност, което води до повишаване на качеството на възстановеното изображение за сметка на по-големия брой изчисления. Апроксимацията чрез ортогонално преобразуване се избира, когато е необходимо по-високо бързодействие на компресията (за работа в реално време) и е допустимо понижаване на качеството на възстановеното изображение.
Предимствата на метода са следните: за построяване на инверсната диференциална пирамида не са необходими операциите децимация и интерполация, които причиняват специфични изкривявания на изображението (ефекта на Гибс) вследствие промяна на структурата на пространствената дискретизираща решетка и неидеалната нискочестотна филтрация; улеснява реализирането на прогресивно предаване на изображението, тъй като нивата на пирамидата се определят последователно от върха към нейната основа в ред, който е инверсен на този при лапласовата пирамида; нивата на пирамидата съдържат коефициенти на трансформанти или полиномни функции, чиито изменения вследствие на случайни грешки при предаването им в канала за връзка влияят по-слабо върху визуалното качество на възстановеното изображение в сравнение с влиянието на грешките при лапласовата пирамида, тъй като нейните нива представляват разликови изображения; осигурява по-голям коефициент на компресия в сравнение с лапласовата и “редуцираната” разликова пирамида /2/ при една и съща точност на възстановяване на изображението.
Същността на изобретението се състои и в устройство за пирамидално кодиране на изображения, което съдържа източник на изображение, свързан с входа на кодер за рекурсивно изчисляване на инверсната диференциална пирамида. Кодерът се състои от първи комутатор, чийто първи вход е свързан с източника на изображение, а изходът му е свързан с входа на първа видеопамет и първия вход на втори комутатор. Изходът на първата видеопамет е свързан с вторите входове съответно на втория комутатор и първи суматор. От своя страна изходът на втория комутатор през електронен ключ е свързан с първия вход на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване. Вторият вход на същия блок е свързан с изхода на първи блок за формиране на тегловни или “базови” изображения, а изходът му е свързан с входа на блок за квантуване. Изходът на последния е свързан с първия вход на трети комутатор и входа на блок за инверсно квантуване, чийто изход е свързан с входа на втора видеопамет. Нейният изход е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ортогонално преобразуване, чийто втори вход е свързан с изхода на първия блок за формиране на тегловни или “базови” изображения, а изходът му е свързан с първия изваждащ вход на първия суматор. Неговият изход е свързан с вторите входове съответно на първия и третия комутатор. Изходът на третия комутатор е свързан през блок за ентропийно кодиране с изхода на кодера за рекурсивно изчисляване на инверсната диференциална пирамида. Този изход от своя страна е свързан през канала за връзка с входа на съответен пирамидален декодер. Последният се състои от блок за ентропийно декодиране, чийто вход представлява входа на пирамидалния декодер, а изходът му е свързан с входа на демултиплексор. Неговият първи изход е свързан с входа на втори блок за инверсно квантуване, чийто изход е свързан през трета видеопамет с първия вход на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване, вторият вход на който е свързан с изхода на втори блок за формиране на тегловни или “базови” изображения. Изходът на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване е свързан с първия вход на четвърти комутатор, вторият вход на който е свързан с втория изход на демултиплексора, а изходът му е свързан с първия вход на втори суматор, чийто втори вход е свързан с изхода на четвърта видеопамет. Нейният вход е свързан с изхода на втория суматор и представлява изхода на пирамидалния декодер.
Предимство на устройството, реализиращо метода, е неговата опростена структура в сравнение с тази на устройството за пирамидално кодиране на изображения чрез лапласовата пирамида, още повече в случая на въвеждане на обратна връзка за шума от квантуване /7/. Това предимство се дължи на каноничната структура на инверсната диференциална пирамида и на липсата на блокове за редуциране и разширяване на изображения, използвани в лапласовата пирамида. Тези блокове от своя страна се реализират с помощта на децимацитори, интерполатори и двумерни цифрови филтри с минимални размери 5x5 елемента, за които са необходими голям брой изчислителни операции.
Пояснение на приложените фигури
По-подробно изобретението е пояснено с приложените фигури, илюстриращи едно примерно изпълнение на устройството, реализиращо метода за пирамидално кодиране на изображения, от които:
фигура 1 представлява блокова схема на устройството за пирамидално кодиране на изображения, която се основава на декомпозицията, наречена инверсна диференциална пирамида за прогресивно предаване на изображения;
фигура 2 - етапите на възстановяване на тестовото изображение LENA с размери
512x512 с 8 бита на пиксел при последователно предаване на нивата на съответната инверсна диференциална пирамида с пореден номер рМ),1,2,...,7.
Примери за изпълнение на изобретението
Примерното изпълнение на устройството за пирамидално кодиране на изображения съгласно изобретението е показано на фигура 1, 5 която представлява блокова схема на устройството, състоящо се от кодер и декодер. В техния състав са включени четири двувходови комутатора 1, четири видеопамети 2, блок за определяне на полиномните коефициенти или тези 10 на “отсеченото” ортогонално преобразуване 3, два блока за полиномна реконструкция или инверсно ортогонално преобразуване 4, блокове за квантуване и инверсно квантуване съответно 5 и 6, два блока за формиране на тегловни 15 или “базови” изображения 7, два суматора 8, блокове за ентропийно кодиране и декодиране съответно 9 и 10, де мултиплексор 11 и електронен ключ 12. Съгласно блоковата схема от фиг. 1 източникът на изображение е свързан с 20 първия вход а на първи комутатор 1, а изходът му b е свързан с входа на първа видеопамет 2 и първия вход на втори комутатор 1. Изходът с на първата видеопамет 2 е свързан с вторите входове съответно на втория комутатор 1 25 и първи суматор 8. От своя страна изходът на втория комутатор d през електронен ключ 12 е свързан с първия вход е на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване 3. 30 Вторият вход на същия блок 3 е свързан с изхода m на първи блок за формиране на тегловни или “базови” изображения 7, а изходът му f е свързан с входа на блок за квантуване 5. Изходът на последния g е свързан с първия 35 вход на трети комутатор 1 и входа на блок за инверсно квантуване 6, чийто изход h е свързан с входа на втора видеопамет 2. Нейният изход к е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ор- 40 тогонално преобразуване 4, чийто втори вход е свързан с изхода m на първия блок за формиране на тегловни или “базови” изображения 7, а изходът му 1 е свързан с първия изваждаш вход на първия суматор 8. Неговият изход i е 45 свързан с вторите входове съответно на първия и третия комутатор 1. Изходът η на третия комутатор 1 е свързан през блок за ентропийно кодиране 9 с изхода р на кодера за рекурсивно изчисляване на инверсната диференци- 50 ална пирамида. Този изход р от своя страна е свързан през канала за връзка с входа на съ ответен пирамидален декодер. Последният се състои от блок за ентропийно декодиране 10, чийто вход представлява входа на пирамидалния декодер, а изходът му х е свързан с входа на демултиплексор 11. Неговият първи изход г е свързан с входа на втори блок за инверсно квантуване 6, чийто изход s е свързан през трета видеопамет 2 с първия вход t на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване 4, вторият вход на който е свързан с изхода m на втори блок за формиране на тегловни или “базови” изображения 7. Изходът и на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване 4 е свързан с първия вход на четвърти комутатор 1, вторият вход q на който е свързан с втория изход на демултиплексора 11, а изходът му v е свързан с първия вход на втори суматор 8, чийто втори вход у е свързан с изхода на четвърта видеопамет 2. Нейният вход w е свързан с изхода на втория суматор 2 и представлява изхода на пирамидалния декодер.
Действието на устройството съгласно изобретението е следното. В първия цикъл на рекурсивна обработка на изображението неговият сигнал се подава на входа на пирамидалния кодер през входния комутатор 1 и се записва във видеопаметта 2. Същевременно през втория комутатор 1 и ключа 12 сигналът на изображението постъпва в блока за определяне на полиномните коефициенти или тези на “отсеченото” ортогонално преобразуване 3. За тази цел към същия блок се подават едновременно тегловни или “базови” изображения от блок за тяхното формиране 7. Видът на тези изображения при първия тип апроксимация се определя предварително в зависимост от реда на полиномната регресионна функция и размерите на входното изображение (или подизображение), а при втория - от избрания вид линейно ортогонално преобразуване (напр. дискретно косинусно, преобразуване на УолшАдамар и др.) и размерите на изображението (или подизображението). Всеки коефициент, изчислен в блок 3, се определя от корелацията на входното изображение (или подизображение) със съответно тегловно или “базово” изображение в зависимост от типа на избраната апроксимация - полиномна или чрез “отсечено” ортогонално преобразуване. Броят на коефициентите се задава предварително, като за първия тип апроксимация зависи от избраната полиномна функция, напр. шест коефициента за повърхност от втора степен, три за равнина и т.н. За втората апроксимация броят на коефициентите, съответстващи на ниските пространствени честоти в трансформантата на изображението (или подизображението), може да се избере напр. четири, три, и т.н. С увеличаването на този брой нараства точността на апроксимацията, но от друга страна намалява коефициентът на компресия на изображението и затова този брой се избира компромисно, напр. общо четири. Стойностите на тези коефициенти се определят, след като завърши записът на цялото входно изображение във видеопаметта 2. От изход f на блок 3 получените коефициенти се квантуват (скаларно или векторно) в блока 5. Квантуваните коефициенти от изход g на блок 5 преминават през комутатор 1 и постъпват в блок 9 за ентропийно кодиране. В него могат да се приложат алгоритми от типа: кодиране с променлива дължина, код на Хъфман, аритметично кодиране и др. Компресираната последователност от символи за поредното ниво на пирамидата от изхода р на блок 9 се предава по канала за връзка към входа на пирамидалния декодер. От друга страна квантуваните коефициенти в изхода g се деквантуват в блока за инверсно квантуване 6 и се записват във видеопаметта 2 за съхраняване на коефициентите на апроксимиращото изображение (или подизображението). Във втория цикъл на неговата обработка двете видеопамети (за изображението и за коефициентите на апроксимацията) се прочитат едновременно, като от изход к на втората получените коефициенти се преобразуват в блока за реконструиране на полиномни функции или за инверсно ортогонално преобразуване 4 в съответно апроксимиращо изображение (или подизображение). Във втория случай към блок 5 от изхода m на блок 7 се подават сигнал за съответното “базово” изображение. Полученият сигнал на изход 1 на блок 4 се изважда в суматора 8 от този на изход с на входната видеопамет 2. Разликовият сигнал на изхода i на суматора 8 през входния комутатор 1 се записва във входната видеопамет 2, като замества информацията за изображението от предишния първи цикъл на рекурсивно изчисление на нивата на инверсната диференциална пирамида. При за почване на следващия цикъл на работа на пирамидалния кодер входната памет, съдържаща нулевото разликово изображение, се прочита два пъти, като в процеса на първото четене данните в нея се подреждат в последователни блокове, съответстващи на нейните четири подизображения. За всяко от тях по аналогичен начин както в първия цикъл се изчисляват с помощта на блоковете 3, 5 и 6 техните квантувани коефициенти, записват се във видеопаметта 2 и се предават чрез ентропийно кодиране по канала за връзка към декодера. В процеса на второто четене на входната видеопамет 2 от нейните изходни данни, подредени в блокове според подизображенията, се изваждат тези, получени на изхода I на блок 4, и се записват отново във входната видеопамет 2 и т.н. В последния (п+1)-ви цикъл на работа на кодера, който се използва само за компресия без загуби, при второто четене на входната видеопамет 2 на изхода i на суматора 8 се получава остатъчното изображение, което не се записва повторно във входната видеопамет 2, а се предава през изходния комутатор 2 към ентропийния кодер 9 и от неговия изход - към канала за връзка. Приетите в пирамидалния декодер данни от последователните нива на пирамидата през ентропийния декодер 10 се разделят чрез демултиплексора 11, като на първия му изход г се получават данните за нивата на пирамидата до п-то, а на втория му изход q - тези за остатъчното изображение в (п+1)-то ниво. Действието на блоковете 6, 2, 4 и 7 в декодера е аналогично на това на същите блокове в кодера, обяснено по-горе. Чрез суматора 8 и видеопаметта 2 е реализиран натрупващ суматор, който служи за възстановяване на изходното изображение с постепенно нарастваща разделителна способност в процеса на предаване на нивата на съответната инверсна диференциална пирамида.
Методът за пирамидално кодиране на изображения съгласно изобретението се илюстрира от следния пример за компресиране на изображение с размери 4x4, което се описва със следната матрица:
В(1,1) В(2,1) В(3,1) В(4,1) '12 3 4'
B(L2) В(2,2) В(ЗД) В(4,2) 2 3 4 5
В(1Л) В(2Л) ад В(43) 3 3 4 5 6
_Β(ζ4) В(2,4) В(3,4) В(4,4) 4 5 6 7
Ако изберем апроксимиращ полином от първа степен от типа B(i,j) = ai + bj + с, т.е. “ориентирана” равнина, чийто коефициенти а, b и с са определени предварително чрез авто регресионен анализ, за техните тегловни изоб ражения (матрици) се получава съответно:
-3 -1 1 3' -3 -3 -3 -3
[la(U)] = ^ -3-113 -3-113 -1 -1 -1 -1 1111
-3 -1 1 3 3 3 3 3
3 г
1 -1
-1 -3
-3 -5
Тогава стойностите на коефициентите на ражение, са следните:
равнината, апроксимираща примерното изоб20
4 4 4 4 4 а= ZZta(k>l)B(k,l) = l , b= ZZlb(M)B(k,l) = l , c=££tc(k,l)B(k,l) = -l к=П»1 к=11=1 к=11=1
В този случай съответният апроксимиращ полином за нулевото ниво на пирамидата се описва с функцията B.(i,j) = i+j+1. Тогава разυ ЧЛ ликата между входното изображение B(i,j) и функцията B0(i,j) за всяка стойност на i,j = 1,2,3,4 е равна на нула и затова пирамидата на изображението се описва само с нейното нулево ниво, за което е достатъчно да се пре35 дадат само коефициентите а=Ь=1 и с=-1. При декодиране изображението се възстановява без загуби с коефициент на компресия К=16/3=5.33.
Някои от резултатите при моделирането на метода за инверсно пирамидално кодиране с помощта на апроксимиращи полиноми с 6, 3 и 1 коефициента (съответно ИДП-6,3,1) и в сравнението му с метода, използващ редуцираната диференциална пирамида (РДП) /2/, са дадени в таблица 1. Тук К(р) е коефициентът на компресия на изображението при ограничаване броя на нивата на пирамидата до р=0,1,...,7, a PSNR(p) е пиковото отношение сигнал/шум на възстановеното изображение при достигане на р-то ниво на пирамидата. Резултатите в таб лицата се отнасят за тестовото изображение LENA с размери 512x512 и 8 бита на пиксел. От нея се вижда, че при стойност на PSNR > 34 dB, когато на практика в изображението не се забелязват видими изкривявания, коефициентът на компресия за редуцираната диференциална пирамида е два пъти по-малък от този за инверсната.
На фиг. 2 е дадена разпечатка на същото тестово изображение, декодирано без квантуване на коефициентите на инверсна диференциална пирамида с предадени нива р=0,1,2,...,7. Тези изображения илюстрират метода и позволяват да се оцени визуално качеството на възстановяването им във всеки етап на прогресивното им предаване. Методът и устройството съгласно изобретението дават възможност за осъществяване на пирамидално кодиране без загуби (или без визуални загуби) на неподвижни изображения и видеопоследователности, които от своя страна могат да бъдат както черно-бели многоградационни,така и цветни.
Таблица 1
Коефициент на компресия К и пиково отношение сигнал/шум PSNR в [dB]
ЬЩИ ниворч ИДП-1 ИДП-3 ИДП-6 РДП
К(р) PSNR(p) К(р) PSNR(p) ВД PSNR(p) К(р) PSNR(p)
0 147456 13,67 65384 13.95 32768 14,02 262144 13,66
1 36864 14,20 16384 14,44 8192 14,76 65536 13,94
2 9216 14,67 4096 15,54 2048 16,31 16384 14,49
3 2304 16,04 1024 17,85 512 18,97 4096 15,35
4 576 17,97 256 20,06 128 21,71 1024 17,11
5 144 19,98 64 22,82 32 24,69 256 19,33
6 48 22,63 16 26,15 8 28,40 64 21,99
7 12 25,74 4 30,51 2 34,29 16 25,21
8 3 30,17 1 40,03 0,5 * 4 28,90
9 0,75 * 0,25 - - 1 33,80
* декомпозиция без загуби
В последния случай изображението се описва с три компоненти (матрици), към всяка от които поотделно може да се приложи компресиране съгласно метода и устройството. При компресиране на видеопоследователности (подвижни изображения) с описания метод и устройство всеки кадър трябва да бъде обработен вътрешнокадрово в реален мащаб на времето.

Claims (2)

1. Метод за пирамидално кодиране на изображения, използващ пирамидално представяне на изображението, ортогонални преобразувания, квантуване на трансформационните коефициенти и ентропийно кодиране, характеризиращ се с това, че в процеса на кодиране входното цифрово изображение се апроксимира чрез предварително избрана дву- мерна полиномна функция с m коефициента, определени от изискването за минимизация на 35 средноквадратичната грешка на апроксимацията, или чрез изображение, получено с помощта на инверсно ортогонално преобразуване на филтрирана трансформанта на входното изображение, определена от него чрез прилагане 40 на право ортогонално преобразуване и запазване само на m избрани нискочестотни коефициента, съставящи във всеки от двата случая нулевото ниво (върха) на т.нар. инверсна диференциална пирамида, като нейното следва45 що ниво се формира чрез поелементно изваждане на входното изображение и неговата апроксимация, определена чрез коефициентите за нивото “нула”, полученото като резултат “нулево” разликово изображение се разделя на 50 четири еднакви по форма и размери подизображения, за всяко от които се прилагат аналогични операции за определяне на съответ ните им апроксимиращи подизображения, и се получава “нулевата” разлика за първо ниво на пирамидата, представено от 4т коефициента, като за формирането на нейното второ ниво от “нулевата” разлика се изважда нейната апроксимация и полученото “първо” разликово изображение се разделя на 16 еднакви по форма и размери подизображения, върху всяко от които се прилагат рекурсивно същите операции за апроксимация както върху подизображенията от предишната “нулева” разлика и т.н. до достигане на последното ниво на пирамидата, представляващо остатъчно разликово изображение с размери, равни на входното, като при беззагубна компресия 1/4 от коефициентите на съседните подизображения се редуцират въз основа на зависимостите между тях, а върху останалите се прилага ентропийно кодиране, а за кодиране без визуални загуби се извършва двустранно “отсичане” от горе и от долу на нискоинформативните нива на пирамидата и квантуване на коефициентите в останалите нива преди тяхното ентропийно кодиране, при което за декодиране на изображението върху компресираните данни се прилагат последователно ентропийно декодиране и инверсно квантуване, последното само в случай на кодиране без визуални загуби, и с помощта на получените коефициенти от подизображенията в предадените нива на пирамидата се извършва реконструиране на съответните им полиномни функции или апроксимиращи изображения чрез инверсно ортогонално преобразуване на коефициентите, като възстановените по този начин изображения за всяко ниво на пирамидата се сумират последователно чрез натрупване от върха към нейната основа и в резултат се получава изходното изображение с постепенно нарастваща разделителна способност в съответствие с номера на предаденото ниво на пирамидата.
2. Устройство за пирамидално кодиране на изображения съгласно метода, състоящо се от кодер и декодер, включващи комутатори, видеопамети, блокове за ортогонално преобразуване, квантуване и ентропийно кодиране, характеризиращо се с това, че източникът на изображение е свързан с първия вход (а) на първи комутатор (1), а изходът му (Ь) е свързан с входа на първа видеопамет (2) и първия вход на втори комутатор (1), изход (с) на първата видеопамет (2) е свързан с вторите входове съответно на втория комутатор (1) и първи суматор (8), като от своя страна изходът на втория комутатор (d) през електронен ключ (12) е свързан с първия вход (е) на блок за определяне на полиномните коефициенти или коефициентите на “отсечено” ортогонално преобразуване (3), вторият вход на същия блок (3) е свързан с изхода (ш) на първи блок за формиране на тегловни или “базови” изображения (7), а изходът му (f) е свързан с входа на блок за квантуване (5), изходът на който (g) е свързан с първия вход на трети комутатор (1) и входа на блок за инверсно квантуване (6), чийто изход (h) е свързан с входа на втора видеопамет (2), а нейният изход (к) е свързан с първия вход на първи блок за полиномна реконструкция или инверсно ортогонално преобразуване (4), чийто втори вход е свързан с изхода (ш) на първия блок за формиране на тегловни или “базови” изображения (7), а изходът му (1) е свързан с първия изваждащ вход на първия суматор (8), изходът на който (i) е свързан с вторите входове съответно на първия и третия комутатор (1), а изходът (п) на ‘ третия комутатор (1) е свързан през блок за ентропийно кодиране (9) с изход (р) на кодера за рекурсивно изчисляване на пирамидата на изображението, като неговият изход (р) от своя страна е свързан през канала за връзка с входа на съответен пирамидален декодер, със- * тоящ се от блок за ентропийно декодиране (10), чийто вход представлява входа на пирамидалния декодер, а изходът му (х) е свързан с входа на демултиплексор (11), първият изход на който (г) е свързан с входа на втори блок за инверсно квантуване (6), чийто изход (s) е свързан през трета видеопамет (2) с първия вход (t) на втори блок за полиномна реконструкция или инверсно ортогонално преобразуване (4), вторият вход на който е свързан с изхода (ш) на втори блок за формиране на тегловни или “базови” изображения (7), като изходът (и) на втория блок за полиномна реконструкция или инверсно ортогонално преобразуване (4) е свързан с първия вход на четвърти комутатор (1), вторият вход (q) на който е свързан с втория изход на демултиплексора (11), а изходът му (v) е свързан с първия вход на втори суматор (8), чийто втори вход (у) е свързан с изхода на четвърта видеопамет (2), а нейният вход (w) е свързан с изхода на втория суматор (2) и представля10 ва изхода на пирамидалния декодер.
BG103619A 1999-07-29 1999-07-29 Метод и устройство за пирамидално кодиране на изображения BG63586B1 (bg)

Priority Applications (3)

Application Number Priority Date Filing Date Title
BG103619A BG63586B1 (bg) 1999-07-29 1999-07-29 Метод и устройство за пирамидално кодиране на изображения
PCT/BG1999/000027 WO2001010130A1 (en) 1999-07-29 1999-12-09 Method and device for pyramidal image coding
AU16454/00A AU1645400A (en) 1999-07-29 1999-12-09 Method and device for pyramidal image coding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BG103619A BG63586B1 (bg) 1999-07-29 1999-07-29 Метод и устройство за пирамидално кодиране на изображения

Publications (2)

Publication Number Publication Date
BG103619A BG103619A (bg) 2001-01-31
BG63586B1 true BG63586B1 (bg) 2002-05-31

Family

ID=3927850

Family Applications (1)

Application Number Title Priority Date Filing Date
BG103619A BG63586B1 (bg) 1999-07-29 1999-07-29 Метод и устройство за пирамидално кодиране на изображения

Country Status (3)

Country Link
AU (1) AU1645400A (bg)
BG (1) BG63586B1 (bg)
WO (1) WO2001010130A1 (bg)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3679083B2 (ja) * 2002-10-08 2005-08-03 株式会社エヌ・ティ・ティ・ドコモ 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム
US8050446B2 (en) * 2005-07-12 2011-11-01 The Board Of Trustees Of The University Of Arkansas Method and system for digital watermarking of multimedia signals
CA2964773A1 (en) 2014-10-15 2016-04-21 Nucleushealth, Llc Remote viewing of large image files
CN112465792A (zh) * 2020-12-04 2021-03-09 北京华捷艾米科技有限公司 一种人脸质量的评估方法及相关装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148498A (en) * 1990-08-01 1992-09-15 Aware, Inc. Image coding apparatus and method utilizing separable transformations

Also Published As

Publication number Publication date
BG103619A (bg) 2001-01-31
WO2001010130A1 (en) 2001-02-08
AU1645400A (en) 2001-02-19

Similar Documents

Publication Publication Date Title
Konstantinides et al. Noise estimation and filtering using block-based singular value decomposition
US5659363A (en) Coding and decoding of video signals
JP4559622B2 (ja) 知覚的に無損失の画像をもたらす2次元離散ウェーブレット変換に基づくカラー画像の圧縮
US5126962A (en) Discrete cosine transform processing system
US5420636A (en) Apparatus for and method of transmitting video signal
KR100254505B1 (ko) 부호화 장치
Krupnik et al. Fractal representation of images via the discrete wavelet transform
JPH05304610A (ja) 画像データ復号化方法及び装置
EP0491779A4 (en) Improved image compression method and apparatus
JPH10503359A (ja) 画像データ圧縮ノイズの低減のための方法および装置
WO1999016234A2 (en) System, method and medium for increasing compression of an image while minimizing image degradation
Hsu et al. A new adaptive separable median filter for removing blocking effects
EP0842586A1 (en) Jpeg compression circuit with filtering
CN109257608B (zh) 图像处理方法、设备及系统
JPH0746139A (ja) 信号処理装置及びその応用
US5426673A (en) Discrete cosine transform-based image coding and decoding method
Kim et al. Lossless and lossy image compression using biorthogonal wavelet transforms with multiplierless operations
JPH08214309A (ja) 画像信号復号装置
JP3686695B2 (ja) 画像処理装置
BG63586B1 (bg) Метод и устройство за пирамидално кодиране на изображения
JP2002064821A (ja) 動画像情報の圧縮方法およびそのシステム
US6754433B2 (en) Image data recording and transmission
Goel et al. Pre-processing for MPEG compression using adaptive spatial filtering
KR101259063B1 (ko) 영상 처리장치 및 이의 블록화 현상 제거방법
Taranath et al. Image Compression and Decompression using Fence Decimation