PL240833B1 - System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego - Google Patents

System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego Download PDF

Info

Publication number
PL240833B1
PL240833B1 PL431478A PL43147819A PL240833B1 PL 240833 B1 PL240833 B1 PL 240833B1 PL 431478 A PL431478 A PL 431478A PL 43147819 A PL43147819 A PL 43147819A PL 240833 B1 PL240833 B1 PL 240833B1
Authority
PL
Poland
Prior art keywords
subband
sample
dwt
samples
signal
Prior art date
Application number
PL431478A
Other languages
English (en)
Other versions
PL431478A1 (pl
Inventor
Roman Starosolski
Original Assignee
Politechnika Slaska Im Wincent
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Politechnika Slaska Im Wincent filed Critical Politechnika Slaska Im Wincent
Priority to PL431478A priority Critical patent/PL240833B1/pl
Publication of PL431478A1 publication Critical patent/PL431478A1/pl
Publication of PL240833B1 publication Critical patent/PL240833B1/pl

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

PL 340 833 B1
Opis wynalazku
Przedmiotem wynalazku jest system i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego.
Dotychczas znanych jest wiele systemów akwizycji, przetwarzania i składowania lub transmisji obrazów, w których przeprowadza się kompresję danych. Z kompresji korzystamy, ponieważ obecnie przetwarzane obrazy charakteryzują się dużymi wielkościami, a dzięki kompresji istotnie ograniczamy rozmiary sygnałów cyfrowych zawierających obrazy i w konsekwencji oszczędniej wykorzystujemy zarówno pamięci masowe systemów przetwarzających obrazy, w których sygnały te zapisywane są w postaci plików, jak i szerokości pasm przenoszenia sieci teleinformatycznych, którymi te sygnały są transmitowane.
Celem kompresji jest usuwanie nadmiarowości z sygnałów cyfrowych. Nadmiarowość jest naturalna dla niektórych klas sygnałów, takich jak sygnały zawierające teksty pisane, gdzie często powtarzają się niektóre wyrazy lub ich fragmenty, czy też sygnały zawierające obrazy, w których sąsiadujące piksele mają zazwyczaj zbliżoną barwę. Podstawowym kryterium determinującym przydatność danej metody kompresji jest uzyskiwany z jej użyciem współczynnik kompresji, który jest wprost proporcjonalny do stosunku rozmiaru sygnału po kompresji do rozmiaru przed kompresją. Bezstratna metoda kompresji to taka, której działanie jest w pełni odwracalne, tzn. z każdego skompresowanego nią sygnału można odtworzyć sygnał identyczny z sygnałem poddanym kompresji. W przypadku sygnałów zawierających obrazy cyfrowe stosowane są również metody stratne. Metody stratne pozwalają na odtworzenie jedynie przybliżonej zawartości obrazu sprzed kompresji, przy czym uzyskują współczynniki kompresji istotnie lepsze od metod bezstratnych. W pewnych obszarach zastosowania kompresji takich jak: obrazy medyczne będące podstawą diagnozy, obrazy traktowane jako dokumenty, obrazy które będą podlegać dalszemu przetwarzaniu bądź analizie, obrazy których akwizycja jest kosztowna, należy stosować kompresję bezstratną.
Obraz cyfrowy jest dyskretną reprezentacją naturalnego obrazu otrzymaną w wyniku procesu akwizycji bądź wygenerowaną w sposób sztuczny. Obraz najczęściej jest reprezentowany w pamięci operacyjnej maszyny cyfrowej jako prostokątna tablica pikseli. Piksel, jako element obrazu cyfrowego, reprezentuje odpowiadający mu fragment powierzchni obrazu rzeczywistego. Rozróżniamy wiele klas obrazów cyfrowych, w tym obrazy w stopniach szarości oraz obrazy barwne. Piksel obrazu w stopniach szarości jest liczbą całkowitą proporcjonalną do jasności odpowiadającego temu pikselowi fragmentu obrazu rzeczywistego. Sygnał z obrazem zazwyczaj ma postać ciągu pól bitowych, przy czym dla każdego piksela obrazu odpowiadające mu pole bitowe zawiera próbkę sygnału o wartości równej wartości piksela, a pola te zazwyczaj umieszczone są w sygnale w kolejności rastrowej, tzn. od najwyżej do najniżej położonego wiersza obrazu, a w ramach danego wiersza obrazu od skrajnego lewego do skrajnego prawego piksela. Ponadto sygnał z obrazem może zawierać, zazwyczaj umieszczone na początku sygnału, metadane obrazu, czyli informacje dodatkowe, takie jak parametry procesu akwizycji, rozdzielczość i zakres dynamiczny obrazu, prawa autorskie, itd.
Dla obrazu barwnego, barwa piksela (kolor, nasycenie i jasność) obrazu barwnego opisywana jest za pomocą kilku wartości - składowych barwy w pewnej przestrzeni barw. Powszechnie stosowaną w urządzeniach prezentacji obrazów cyfrowych - takich jak monitory komputerowe, przestrzenią barw jest przestrzeń RGB w której zawarte składowe R, G i B oznaczają odpowiednio składowe jasności koloru czerwonego, zielonego i niebieskiego. Przestrzeń RGB jest stosowana, gdyż ze względu na budowę zmysłu wzroku człowieka zaprezentowanie mu barwy będącej sumą składowych R, G i B pozwala wywołać wrażenie odbierania barwy z prawie pełnego spektrum barw występujących w naturze. Również urządzenia akwizycji i przetwarzania obrazów często wykorzystują przestrzeń barw RGB. Metody kompresji obrazów barwnych oparte zazwyczaj są o metody kompresji obrazów w stopniach szarości. W najprostszym przypadku składowe R, G i B obrazu cyfrowego traktowane są jak trzy niezależne obrazy w stopniach szarości (jasność danej składowej traktowana jest jako jasność stopnia szarości) i kompresowane niezależnie od siebie. Składowe przestrzeni RGB są silnie skorelowane. Dla przykładu jasny fragment obrazu będzie zazwyczaj miał dużą jasność we wszystkich trzech składowych obrazu. Dlatego też lepsze współczynniki kompresji uzyska się, poprzedzając kompresję transformacją składowych barwy do innego, mniej nadmiarowego, zestawu składowych, gdyż w ten sposób unikniemy wielokrotnego kompresowania tej samej informacji.
Transformacje składowych stosowane w kompresji bezstratnej muszą być odwracalne, na przykład takie, jak transformacja składowych znana z polskiego opisu patentowego PL229208 lub prostsze transformacje przestrzeni barw znane z polskich opisów patentowych PL224996 i PL227649, lub transformacje zgodne ze standardami kompresji obrazów: transformacja Reversible Color Transform (RCT)
PL 240 833 B1 zdefiniowana w międzynarodowym standardzie kompresji stratnej i bezstratnej obrazów JPEG 2000 [ITU-T; ISO/IEC: „Information technology - JPEG 2000 image coding system: Core coding system”, ITU-T Recommendation T.800 and ISO/IEC International Standard 15444-1, 2016] i transformacja YCoCg-R zdefiniowana w międzynarodowym standardzie kompresji stratnej i bezstratnej obrazów JPEG XR [ITU-T; ISO/IEC: „Information technology - JPEG XR image coding system - Image coding specification”, ITU-T Recommendation T.832 and ISO/IEC International Standard 29199-2,2 019].
Nowoczesne metody kompresji obrazów w stopniach szarości wykorzystują kodery entropijne, takie jak koder Huffmana bądź koder arytmetyczny. Kodery te kodują próbki sygnału reprezentującego obraz na podstawie prawdopodobieństw występowania poszczególnych wartości próbek tak, aby wyrażona w bitach długość zakodowanej próbki była jak najbliższa pomnożonemu przez -1 logarytmowi o podstawie 2 z prawdopodobieństwa wystąpienia wartości tej próbki, czyli dążą do tego, aby długość zakodowanego sygnału była bliska entropii tego sygnału (stąd nazwa entropijne). Koder entropijny zatem nie zredukuje skutecznie rozmiaru sygnału, którego rozkład prawdopodobieństwa próbek jest równomierny, a poradzi sobie tym lepiej, w im większym stopniu rozkład będzie nierównomierny. Ponieważ rozkłady prawdopodobieństw dla typowych obrazów w stopniach szarości (oraz dla składowych obrazów barwnych, również tych przetransformowanych z użyciem transformacji przestrzeni barw) są zbliżone do równomiernych to, aby umożliwić efektywne zastosowanie kodera entropijnego, konieczne jest odpowiednie przetworzenie obrazów przed zastosowaniem do nich kodera entropijnego. Znane i praktycznie stosowane w kompresji obrazów są dwa sposoby przetwarzania obrazów, które powodują, że rozkład prawdopodobieństwa sygnału reprezentującego obraz staje się w przybliżeniu wykładniczy lub symetryczny wykładniczy (rozkład Laplace’a), a więc silnie nierównomierny, tym samym znacznie redukując entropię sygnału.
Pierwszy sposób określa się mianem kodowania predykcyjnego, a polega on na tym, że dla każdej próbki sygnału reprezentującej piksel obrazu, za pomocą funkcji zwanej predyktorem, przewiduje się wartość próbki (proces przewidywania wartości próbek nazywamy predykcją). Następnie kodowaniu entropijnemu podlega, zamiast oryginalnego sygnału, sygnał różnicowy zawierający próbki, które wyznaczane są jako różnice pomiędzy próbkami oryginalnego sygnału a przewidywanymi wartościami tych próbek wyznaczonymi z użyciem predyktora. Predyktor przewiduje wartość próbki reprezentującej dany piksel obrazu na podstawie próbek reprezentujących inne piksele, zazwyczaj wyłącznie te, dla których już wyznaczono wartości próbek sygnału różnicowego. Przykładem metody predykcyjnej jest międzynarodowy standard kompresji stratnej JPEG-LS [ITU-T; ISO/IEC: „Information technology - Lossless and near-lossless compression of continuous-tone still images - Baseline”, ITU-T Recommendation T.87 and ISO/IEC International Standard 14495-1,2000]. Standard ten między innymi definiuje predyktor MED, który przewiduje, że wartość próbki reprezentującej dany piksel obrazu równa jest medianie z następujących trzech wartości: A, B, oraz A + B - C, gdzie A oznacza wartość próbki reprezentującej górnego sąsiada danego piksela, B oznacza wartość próbki reprezentującej lewego sąsiada danego piksela, a C oznacza wartość próbki reprezentującej lewego górnego sąsiada danego piksela.
Odmienną metodę przekształcania pikseli obrazu do postaci lepiej nadającej się do kodowania entropijnego określa się mianem kodowania transformacyjnego. Kodowanie transformacyjne polega na zastosowaniu dwuwymiarowych transformacji, na przykład takich jak DWT wykorzystywana w JPEG 2000. W metodach transformacyjnych kodowaniu podlega sygnał zawierający, zamiast pikseli obrazu, macierz próbek uzyskanych po transformacji przeprowadzonej na obrazie w całości bądź po dekompozycji obrazu na fragmenty. Transformacja DWT w kompresji obrazów wykorzystywana jest do dekompozycji sygnału zawierającego obraz na kodowane osobno i zazwyczaj niezależnie od siebie podpasma reprezentujące detale obrazu o różnych orientacjach i wielkościach, przy czym dokładnie jedno z podpasm (podpasmo LL) reprezentuje obraz poddany filtracji dolnoprzepustowej, zazwyczaj pozbawiony detali (w zależności od ich rozdzielczości) oraz pomniejszony. Łączna liczba próbek wszystkich podpasm po DWT równa jest liczbie pikseli obrazu. Kodowanie entropijne podpasm po DWT jest ułatwione ze względu na ich wąskie i dobrze zdefiniowane charakterystyki, które łatwo jest efektywnie modelować. Piksele obrazu reprezentowane są za pomocą liczb całkowitych i również jako liczby całkowite kodowane są przetransformowane próbki, zatem kompresja bezstratna obrazów wymaga użycia odwracalnych transformacji całkowitoliczbowych. Przykładem takiej transformacji jest DWT z filtrem falkowym Cohen Daubechies Faveau (5, 3) zdefiniowana jednoznacznie w standardzie JPEG 2000 i skrótowo przedstawiona poniżej.
Jednowymiarowa DWT (1D-DWT) transformuje jednowymiarowy dyskretny sygnał S do dwóch podpasm:
podpasma L, tj. sygnału po filtrowaniu dolnoprzepustowym, które reprezentuje niskoczęstotliwościowe składniki zawarte w S;
PL 340 833 B1 podpasma H zawierającego wysokoczęstotliwościowe składniki S, które razem z podpasmem L pozwala na idealną rekonstrukcję S.
Transformacja realizowana jest w miejscu, czyli tak, że przetransformowany sygnał zastępuje sygnał oryginalny; do zrealizowania transformacji konieczne jest umieszczenie próbek sygnału w buforze pamięciowym umożliwiającym modyfikację ich wartości i położenia. S jest transformowany w trzech krokach. Najpierw (krok 1) wykonujemy górnoprzepustowe filtrowanie próbek nieparzystych (pojęcie parzystości próbki odnosi się tutaj i w dalszej części niniejszego tekstu do położenia próbki w sygnale, a nie do jej wartości) przez pomniejszenie wartości każdej próbki nieparzystej o połowę sumy sąsiadujących z nią próbek parzystych, zaokrągloną w dół do najbliższej liczby całkowitej. W następnym kroku (krok 2) każdą próbkę parzystą powiększamy o sumę sąsiadujących z nią próbek nieparzystych i liczby 2, podzieloną przez 4 oraz zaokrągloną w dół do najbliższej liczby całkowitej. W ostatnim kroku (krok 3) przemieszczamy parzyste próbki do początkowej części oryginalnego sygnału, zachowując ich wzajemnie uporządkowanie (i ta próbka sygnału jest przemieszczana na pozycję i/2), a nieparzyste do końcowej części sygnału. Otrzymujemy oddzielne podpasma oznaczane odpowiednio L i H.
Dwuwymiarowa DWT jest dla obrazu (30) (patrz rysunek Fig. 3) uzyskiwana przez zastosowanie najpierw 1D-DWT do każdej kolumny obrazu, czego efektem (31) jest dekompozycja obrazu na podpasma L (32) i H (33). Następnie, stosując 1D-DWT do każdego wiersza podpasm L i H, uzyskujemy DWT rzędu 1 obrazu (34), składającą się z podpasm LL (35) i HL (36) (uzyska nych z transformacji podpasma L (32)) oraz LH (37) i HH (38) (z transformacji podpasma H (33)). Stosowane są również transformacje rzędów innych niż 1, uzyskiwane są one za pomocą tak zwanej dekompozycji Mallata. Transformację rzędu t+1 uzyskujemy, stosując transformację rzędu 1 do podpasma LL uzyskanego w wyniku transformacji rzędu t. W wyniku transformacji rzędu wyższego niż 1 otrzymujemy dekompozycję sygnału na podpasma dostarczające wielorozdzielczej reprezentacji obrazu. Na przykład obraz po transformacji DWT rzędu 2 (39) zawiera podpasma uzyskane w wyniku transformacji rzędu 1 (40) (wszystkie za wyjątkiem podpasma LL (35), które podlegało dalszemu transformowaniu w miejscu), reprezentujące detale obrazu o najwyższej rozdzielczości oraz podpasma (41) uzyskane przez zastosowanie DWT rzędu 1 do podpasma LL transformacji rzędu 1 (35) reprezentujące detale o niższej rozdzielczości (podpasma HL (42), LH (43) i HH (44)) i pozostałą niskoczęstotliwościową informację obrazową - zawartą w podpaśmie LL transformacji rzędu 2 (45).
Niezależnie od rzędu DWT, podpasmo LL występuje w przetransformowanym obrazie tylko raz, a sygnał w nim zawarty reprezentuje pomniejszony oryginalny obraz. W przeciwieństwie do podpasm reprezentujących detale (które zawierają próbki sygnału, do których ostatnio zastosowanym rodzajem filtracji była filtracja górnoprzepustowa) podpasmo LL zawiera próbki, które nie były poddane filtracji górnoprzepustowej. Charakterystyki podpasma LL, takie jak rozkład prawdopodobieństwa próbek, zbliżone są do charakterystyk oryginalnego obrazu.
W przypadku systemu przeprowadzającego kompresję stratną, wpływ modułów realizujących niektóre z wyżej opisanych transformacji sygnału na stan i postać próbek sygnału może być jedynie w przybliżeniu odwracalny; takie transformacje nazywamy nieodwracalnymi. Na przykład, w systemie kompresji zgodnym ze standardem JPEG 2000 podczas kompresji stratnej stosowana może być nieodwracalna transformacja przestrzeni barw ICT oraz nieodwracalny wariant transformacji DWT oparty o filtr falkowy (9, 7). Ponadto system taki zazwyczaj zawiera przynajmniej jeden dodatkowy moduł, którego celem jest odrzucenie z przetwarzanego sygnału tej części zawartej w nim informacji obrazowej, która jest najmniej istotna dla końcowego odbiorcy obrazu. Na przykład w standardzie JPEG 2000 wśród takich opcjonalnie stosowanych modułów są: moduł podpróbkowania składowych chrominancji uzyskanych po transformacji przestrzeni barw oraz moduł kwantyzacji próbek podpasm uzyskanych po DWT.
System przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego, charakteryzuje się tym, że zawiera umieszczony w torze przetwarzania obrazu, po module DWT dekomponującym obraz na podpasma a przed modułem kodowania entropijnego podpasm uzyskanych po DWT, moduł predykcji warunkowej, w którym sygnał zawierający podpasma po DWT wprowadzany jest na wejście połączonego z buforem metadanych podpasma układu selektora kodowania sygnału różnicowego, który próbki podpasma niskiej częstotliwości LL wyprowadza na szynę układu predykcji prowadzącą do połączonego z buforem próbek podpasma układu predykcji, który przewidywanie wartości próbek korzystnie przeprowadza na podstawie
PL 240 833 B1 już przetransformowanych próbek tego samego podpasma LL przechowywanych w buforze próbek podpasma, a przewidziane wartości próbek wyprowadza za pośrednictwem szyny pomocniczej na wejście sumatora, który wyznacza tworzące sygnał różnicowy próbki różnicowe jako różnice pomiędzy wartościami rzeczywistych próbek podpasma dostarczonymi szyną układu predykcji, a dostarczonymi za pośrednictwem szyny pomocniczej wartościami próbek przewidzianymi za pomocą układu predykcji i wyprowadza je na wyjście modułu predykcji warunkowej przez szynę próbek różnicowych i przełącznik sygnałów wysterowany przez układ selektora kodowania sygnału różnicowego za pomocą szyny sterującej, transformując w ten sposób uzyskane po DWT podpasmo niskiej częstotliwości LL do postaci sygnału różnicowego, w którym próbki podpasma LL są przetransformowane do postaci próbek różnicowych.
Korzystnie w systemie przetwarzania obrazów według wynalazku moduł DWT i moduł kodowania entropijnego zbudowane są zgodnie ze standardem JPEG 2000.
Korzystnie w systemie przetwarzania obrazów według wynalazku przewidywanie wartości próbki w układzie predykcji przeprowadza się z użyciem predyktora MED zdefiniowanego w standardzie JPEG-LS.
Korzystnie w systemie przetwarzania obrazów według wynalazku po zastosowaniu DWT rzędu zerowego w module DWT cały sygnał wprowadzany na wejście modułu predykcji warunkowej transformowany jest z użyciem układu predykcji do postaci sygnału różnicowego, przy czym w miejsce próbek podpasma LL transformowane są próbki reprezentujące piksele obrazu.
Korzystnie system przetwarzania obrazów według wynalazku zawiera umieszczony w torze przetwarzania obrazu jeden lub więcej dodatkowych modułów, na przykład moduł przeprowadzający kwantyzację próbek podpasm uzyskanych po DWT, przy czym jeżeli taki dodatkowy moduł umieszczony jest przed modułem kodowania entropijnego i po module DWT, to korzystnie moduł predykcji warunkowej umieszczony jest bezpośrednio przed modułem kodowania entropijnego.
Sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego, polega na tym, że przed przeprowadzeniem kodowania entropijnego podpasm otrzymanych po DWT transformuje się podpasmo niskiej częstotliwości LL do postaci sygnału różnicowego, w którym próbki podpasma LL są przetransformowane do postaci próbek różnicowych, przy czym próbkę różnicową wyznacza się dla danej próbki podpasma LL, jako różnicę pomiędzy rzeczywistą wartością tej próbki podpasma, a jej wartością przewidywaną, a przewidywanie wartości próbki korzystnie przeprowadza się na podstawie już przetransformowanych próbek tego samego podpasma LL.
Korzystnie w sposobie według wynalazku transformację DWT i kodowanie entropijne przeprowadza się zgodnie ze standardem JPEG 2000.
Korzystnie w sposobie według wynalazku przewidywanie wartości próbki przeprowadza się z użyciem predyktora MED zdefiniowanego w standardzie JPEG-LS.
Korzystnie w sposobie według wynalazku poddawany transformacji DWT sygnał zawierający obraz jest w postaci cyfrowej oraz zawiera ciąg D E-bitowych pól, z których każde zawiera próbkę sygnału reprezentującą jasność pojedynczego piksela, a pola te umieszczone są w sygnale w kolejności rastrowej od najwyżej do najniżej położonego wiersza, a w ramach wiersza od skrajnego lewego do skrajnego prawego piksela, gdzie D jest liczbą pikseli obrazu, przy czym długość E pola bitowego korzystnie wynosi 8 bitów, przy czym w sygnale poddawanym transformacji DWT próbki sygnału reprezentujące jasności pikseli obrazu umieszczone są po próbkach zawierających metadane obrazu opisujące przynajmniej wymiary obrazu i zakres dynamiczny próbek obrazu.
Korzystnie w sposobie według wynalazku sygnał zawierający podpasma otrzymane po DWT jest w postaci cyfrowej, a dla każdego podpasma uzyskanego po DWT zawiera ciąg pól bitowych zawierających próbki podpasma umieszczone w kolejności rastrowej, przy czym w sygnale zawierającym podpasma otrzymane po DWT, dla każdego podpasma otrzymanego po DWT, próbki tego podpasma umieszczone są po próbkach zawierających metadane tego podpasma, pozwalające jednoznacznie zidentyfikować to podpasmo oraz opisujące przynajmniej wymiary podpasma i zakres dynamiczny próbek podpasma.
Korzystnie w sposobie według wynalazku, jeżeli użyto transformacji DWT rzędu zerowego to cały sygnał zawierający obraz transformowany jest do postaci sygnału różnicowego, przy czym w miejsce próbek podpasma LL transformowane są próbki reprezentujące piksele obrazu.
Korzystnie w sposobie według wynalazku przed przeprowadzeniem kodowania entropijnego podpasm otrzymanych po DWT sygnał je zawierający poddaje się dodatkowym transformacjom sygnału, na przykład kwantyzacji próbek podpasm uzyskanych po DWT, przy czym korzystnie transformacje te wykonuje się przed transformowaniem podpasma LL do postaci sygnału różnicowego.
PL 340 833 B1
Zaletą rozwiązania według wynalazku, w odniesieniu do systemu przetwarzającego obraz z wykorzystaniem DWT oraz kodowania entropijnego, ale nie zawierającego modułu predykcji warunkowej na torze przetwarzania sygnału zawierającego obraz, jest poprawa średniego współczynnika kompresji uzyskiwanego przez system. Tym samym po kompresji objętości sygnałów cyfrowych zawierających obrazy są mniejsze, co pozwala oszczędniej wykorzystywać zarówno pamięci masowe systemów przetwarzających obrazy, jak i szerokości pasm przenoszenia sieci teleinformatycznych.
Poprawa współczynnika w systemie zbudowanym według wynalazku, w przeciwieństwie do znanych systemów wykorzystujących wyłącznie kodowanie predykcyjne (na przykład systemy zgodne ze standardem JPEG-LS) lub wyłącznie kodowanie transformacyjne (na przykład systemy zgodne ze standardem JPEG 2000 lub JPEG XR), jest efektem łącznego wykorzystania obu wyżej wymienionych sposobów poprawy stanu sygnału zawierającego obraz tak, by lepiej nadawał się on do kodowania entropijnego. Podpasmo LL uzyskane po DWT jest jednym z wielu podpasm, które podlegają kodowaniu entropijnemu. Jeżeli zastosowano DWT rzędu 1, to liczba próbek podpasma LL wynosi 1/4 liczby wszystkich próbek, które są kodowane entropijnie, jeżeli rząd DWT jest wyższy, to udział próbek podpasma LL we wszystkich kodowanych próbkach jest niższy. Jednak wpływ efektywności kodowania podpasma LL na współczynnik kompresji całego obrazu jest większy niż by to wynikało jedynie z liczby próbek podpasma LL. Wpływ ten również wynika z charakterystyki podpasma LL i charakterystyki pozostałych podpasm po DWT. W typowym przypadku pozostałe podpasma, dzięki przeprowadzonej filtracji górnoprzepustowej, zawierają pewne detale obrazu, których udział jest niewielki w całości obrazu, a zatem ilość informacji i entropia przypadająca na próbkę takiego pasma jest znacznie mniejsza niż w przypadku oryginalnego obrazu. Natomiast charakterystyka podpasma LL zbliżona jest do charakterystyki oryginalnego obrazu. W konsekwencji współczynnik kompresji próbek podpasma LL jest gorszy od współczynników uzyskiwanych w koderze entropijnym dla pozostałych podpasm. Stosując do podpasma LL predykcję, poprawiamy ten współczynnik. W przypadku niektórych obrazów, uzyskana dla podpasma LL dzięki zastosowaniu predykcji poprawa współczynnika kompresji bezstratnej (wyrażonego w bitach na próbkę, a zatem wprost proporcjonalnego do rozmiaru przetransformowanego podpasma po kodowaniu entropijnym) przekracza 50%.
Ponadto, w przypadku kompresji stratnej, stosowana jest kwantyzacja próbek podpasm po DWT, przy czym krok kwantyzacji stosowany do próbek podpasma LL jest mniejszy od kroku dla pozostałych podpasm, co w efekcie skutkuje powiększeniem różnicy pomiędzy współczynnikami kompresji uzyskiwanymi dla podpasma LL i dla pozostałych podpasm oraz zwiększeniem wpływu poprawy współczynnika kompresji podpasma LL na współczynnik kompresji sygnału reprezentującego cały obraz.
Zastosowanie DWT sprawdza się w przypadku typowych obrazów fotograficznych - za takie obrazy uważa się obrazy uzyskane na drodze akwizycji ze scen ze świata rzeczywistego dostępnych dla nieuzbrojonego oka ludzkiego. Dla niektórych innych obrazów, zwłaszcza dla obrazów niefotograficznych (na przykład zawierających komputerowo wygenerowany tekst, rysunki techniczne, czy przedstawiających zawartość ekranu roboczego komputera) zastosowanie DWT może prowadzić do pogorszenia współczynnika kompresji. W takiej sytuacji w systemie, w którym na torze przetwarzania sygnału obrazowego występuje moduł DWT, na przykład w systemach zgodnych z JPEG 2000, można użyć DWT rzędu zerowego, dzięki czemu moduł DWT nie zmieni stanu ani postaci sygnału, co z kolei pozwoli uniknąć pogorszenia współczynnika kompresji. Z drugiej strony dla obrazów niefotograficznych dobrze sprawdza się kodowanie predykcyjne; w przypadku takich obrazów system przetwarzania obrazu zawierający moduł DWT, ale zbudowany na sposób według wynalazku, uzyska znacznie lepsze współczynniki kompresji. Dzięki modułowi predykcji warunkowej, dla niektórych obrazów niefotograficznych, podobnie jak w przypadku podpasma LL po DWT rzędu większego lub równego 1, poprawa współczynników kompresji przekracza 50%.
W systemach przeprowadzających kompresję obrazów barwnych (na przykład zgodnych z JPEG 2000), w których poszczególne składowe obrazu, po ewentualnej transformacji przestrzeni barw oraz ewentualnym podpróbkowaniu składowych obrazu barwnego, kompresowane są z wykorzystaniem DWT oraz kodowania entropijnego, rozwiązanie według wynalazku stosowane jest przez umieszczenie na torze przetwarzania obrazu modułu predykcji warunkowej tak samo jak w przypadku systemów kompresujących obrazy w stopniach szarości. W systemie kompresji obrazu barwnego część toru przetwarzania obrazu od modułu DWT do modułu kodowania entropijnego nie różni się istotnie od analogicznej części toru w systemie kompresji obrazu w stopniach szarości.
Celem umieszczenia modułu predykcji warunkowej w torze przetwarzania obrazu jest zmiana cech technicznych sygnału zawierającego obraz tak, aby poprawić współczynnik kompresji uzyskany po kodowaniu entropijnym tego sygnału. W szczególności zmiana stanu sygnału polega na zmniejszeniu
PL 240 833 B1 entropii próbek sygnału zawierających próbki podpasma LL, osiąganym dzięki diametralnej zmianie rozkładu prawdopodobieństwa próbek. Próbkę różnicową w module predykcji warunkowej wyznacza się jako różnicę pomiędzy rzeczywistą wartością odpowiadającej jej próbki podpasma LL a wartością przewidywaną tej próbki podpasma LL. Zakres dynamiczny przewidywanych wartości próbek jest taki sam jak zakres dynamiczny próbek podpasma LL. Zatem zakres dynamiczny próbek różnicowych będzie większy od zakresu próbek podpasma LL i będzie wynosił 2*Z-1, gdzie Z to zakres dynamiczny próbek podpasma LL. Dla przykładu, jeżeli próbki podpasma LL przyjmują wartości z przedziału -127... 128 (zakres dynamiczny Z = 256) i kodowane są na polach bitowych o długości 8 bitów oraz mają równomierny (w przybliżeniu, dla typowych obrazów) rozkład wartości to zakres dynamiczny próbek różnicowych w sygnale różnicowym uzyskanym w wyniku transformacji tego podpasma LL przez moduł predykcji warunkowej wynosił będzie 511 (jego próbki będą przyjmować wartości z przedziału -255...255) i będzie wymagał kodowania z użyciem pól o długości 9 bitów, a przede wszystkim ich rozkład będzie silnie nierównomierny (w przybliżeniu rozkład Laplace'a). Dla kodowania entropijnego sygnału, zwiększenie rozmiaru pola bitowego o 1 bit nie jest korzystne, jednak w praktyce rozmiar pola jest się znacznie mniej istotny od jednocześnie zmienionego rozkładu prawdopodobieństwa, dzięki któremu entropia sygnału zostaje zmniejszona i w konsekwencji sygnał po kompresji ma mniejszą objętość.
Przedmiot wynalazku przedstawiono w przykładzie wykonania na rysunku na którym Fig. 1 przedstawia tor przetwarzania sygnału z obrazem w urządzeniu dokonującym akwizycji i kompresji obrazu, a Fig.2 przedstawia tor przetwarzania w urządzeniu prezentującym na wyświetlaczu cyfrowym obraz zapisany w postaci skompresowanej na nośniku pamięci masowej.
Przykładowy system przetwarzania obrazów zastosowany jest w cyfrowym aparacie fotograficznym zapisującym na karcie pamięci zdjęcia monochromatyczne (w poziomach szarości) w postaci skompresowanej bezstratnie. Uzyskiwany w aparacie fotograficznym wysokorozdzielczy obraz zajmuje dużą objętość, przez co jest kłopotliwy w transmisji i składowaniu. Niedogodności związane z wielkością generowanych przez aparat sygnałów zawierających obrazy ograniczamy stosując kompresję, przy czym w ogólnym przypadku, gdy nie znamy przeznaczenia pozyskiwanych obrazów, nie należy stosować kompresji stratnej. W aparacie, na wyjściu modułu akwizycji obrazu (1), uzyskujemy przeznaczony do kompresji sygnał zawierający piksele obrazu (2), który należy przetworzyć w taki sposób, aby zajmował niewiele miejsca oraz aby możliwe było jego bezstratne odtworzenie. Zatem zastosujemy kompresję bezstratną.
Tor przetwarzania obrazu w aparacie zbudowany jest zgodnie ze standardem JPEG 2000 [ITU-T; ISO/IEC: „Information technology - JPEG 2000 image coding system: Core coding system”, ITU-T Recommendation T.800 and ISO/IEC International Standard 15444-1, 2016] za wyjątkiem umieszczonego na tym torze na sposób według wynalazku modułu predykcji warunkowej (7). Sygnał zawierający piksele obrazu (2) wprowadzany jest na wejście modułu DWT (3). Transformacja DWT wykonywana jest w miejscu, dlatego moduł DWT (3) zawiera bufor zdolny pomieścić wszystkie piksele obrazu. Odczytywane w module DWT (3) z sygnału zawierającego piksele obrazu (2) piksele obrazu są zapisywane w tym buforze. Po zapisaniu wszystkich pikseli w buforze jest na nich wykonywana transformacja DWT z filtrem falkowym Cohen Daubechies Faveau (5, 3) zgodnie ze standardem JPEG 2000, w wyniku której w buforze w miejscu pikseli obrazu otrzymujemy podpasma po DWT w liczbie zależnej od zastosowanego rzędu transformacji DWT. Niezależnie od rzędu transformacji DWT łączna liczba próbek podpasm po DWT równa jest liczbie pikseli obrazu. Jeżeli rząd transformacji wynosi 0, to wszystkie piksele obrazu traktowane dalej są jako próbki pojedynczego podpasma po DWT. Następnie poszczególne podpasma po DWT są odczytywane z bufora i wyprowadzane na zewnątrz modułu w postaci sygnału zawierającego podpasma po DWT (4). Każde z podpasm w tym sygnale reprezentowane jest przez ciągły fragment sygnału zawierający pola bitowe zawierające metadane podpasma (czyli informacje o rodzaju podpasma, wielkości podpasma i zakresie dynamicznym jego próbek) po których znajdują się pola z próbkami podpasma. Sygnał zawierający podpasma po DWT (4) wprowadzany jest na wejście modułu kwantyzacji próbek podpasm (5), jednak gdy system przeprowadza kompresję bezstratną, to ten moduł nie zmienia parametrów technicznych sygnału, zatem próbki wszystkich podpasm w sygnale zawierającym podpasma po DWT i kwantyzacji (6) są takie same jak odpowiednie próbki w sygnale zawierającym podpasma po DWT (4).
Sygnał zawierający podpasma po DWT i kwantyzacji (6) wprowadzany jest na wejście modułu predykcji warunkowej (7) zbudowanego na sposób według wynalazku. Sygnał ten trafia najpierw do układu selektora kodowania sygnału różnicowego (12), który wyodrębnia z sygnału zawierającego podpasma po DWT i kwantyzacji (6) kolejne podpasma po DWT na podstawie pól z metadanymi podpasm. Selektor kodowania sygnału różnicowego (12) wyposażony jest w bufor metadanych (13) do którego zapisywane na bieżąco są odczytywane metadane podpasma. Dla danego podpasma po DWT,
PL 340 833 B1 po zapisaniu w buforze metadanych (13) jego metadanych, selektor kodowania sygnału różnicowego (12) sprawdza, czy odczytywane podpasmo to podpasmo LL lub czy zastosowano DWT rzędu zerowego. Jeżeli jest to podpasmo inne niż LL i nie zastosowano DWT rzędu zerowego, to selektor kodowania sygnału różnicowego (12):
1. za pomocą szyny sterującej (14) ustawia przełącznik sygnałów (21) tak, aby na wyjście przełącznika sygnałów (21) jako pola sygnału kodera entropijnego (8) wyprowadzane były pola bitowe transmitowane szyną próbek niezmodyfikowanych (15);
2. następnie wyprowadza na szynę próbek niezmodyfikowanych (15) zawartość bufora metadanych (13);
3. następnie pobiera z sygnału zawierającego podpasma po DWT i kwantyzacji (6) wszystkie próbki podpasma na bieżąco wyprowadzając je na szynę próbek niezmodyfikowanych (15).
Jeżeli jest to podpasmo LL lub zastosowano DWT rzędu zerowego, to selektor kodowania sygnału różnicowego (12):
1. w buforze metadanych zmienia wartość pola opisującego zakres dynamiczny próbek podpasma na 2*Z-1, gdzie Z to zakres dynamiczny próbek podpasma po DWT;
2. następnie za pomocą szyny sterującej (14) ustawia przełącznik sygnałów (21) tak, aby na wyjście przełącznika sygnałów (21) jako pola sygnału kodera entropijnego (8) wyprowadzane były pola bitowe transmitowane szyną próbek niezmodyfikowanych (15);
3. następnie wyprowadza na szynę próbek niezmodyfikowanych (15) zawartość bufora metadanych (13);
4. następnie za pomocą szyny sterującej (14) ustawia przełącznik sygnałów (21) tak, aby na wyjście przełącznika sygnałów (21) jako pola sygnału kodera entropijnego (8) wyprowadzane były pola bitowe transmitowane szyną próbek różnicowych (20);
5. następnie pobiera z sygnału zawierającego podpasma po DWT i kwantyzacji (6) wszystkie próbki podpasma, na bieżąco wyprowadzając je na szynę układu predykcji (16).
Próbki różnicowe transmitowane szyną próbek różnicowych (20) wyznaczane są dla danej próbki różnicowej jako różnica pomiędzy wartością odpowiadającej jej próbki podpasma po DWT transmitowanej szyną układu predykcji (16) a przewidywaną wartością tej próbki podpasma po DWT wyznaczoną w układzie predykcji (17) i wyprowadzoną na szynę pomocniczą (19). Układ predykcji (17) dla danej próbki podpasma po DWT transmitowanej szyną układu predykcji (16) przewiduje jej wartość na podstawie już przetworzonych próbek za pomocą predyktora MED ze standardu JPEG-LS [ITU-T; ISO/IEC: „Information technology - Lossless and near-loss less compression of continuous-tone still images - Baseline”, ITU-T Recommendation T.87 and ISO/IEC International Standard 14495-1, 2000]. Ponieważ predyktor MED przewiduje wartość danej próbki na podstawie już przetworzonych próbek z poprzedniego i aktualnego wiersza podpasma, to układ predykcji (17) korzysta z bufora próbek podpasma (18) zdolnego pomieścić 2 wiersze podpasma. Układ predykcji (17), dla danej próbki otrzymanej szyną układu predykcji (16), wyznacza jej przewidywaną wartość na podstawie próbek znajdujących się w buforze próbek podpasma (18), bez uwzględnienia wartości tej próbki. Dopiero po wyznaczeniu wartości przewidywanej próbka ta zapisywana jest do bufora próbek podpasma (18). Dla przykładu, jeżeli dana próbka P podpasma po DWT otrzymana szyną układu predykcji (16) ma wartość 12 i wszystkie próbki sąsiadujące z nią w podpaśmie po DWT mają taką samą wartość wynoszącą 10, to układ predykcji (17), wyłącznie na podstawie już przetworzonych próbek sąsiadujących w podpaśmie po DWT z P i jednocześnie już znajdujących się w buforze próbek podpasma (18), przewidzi że wartość próbki P wynosi 10. Następnie próbka P (o wartości 12) zostanie zapisana do bufora próbek podpasma (18), a przewidziana jej wartość wynosząca 10 zostanie wyprowadzona na szynę pomocniczą (19). Następnie przewidziana wartość próbki (wynosząca 10) zostanie odjęta od rzeczywistej wartości próbki (wynoszącej 12) i w ten sposób wyznaczona próbka różnicowa R o wartości 2 wyprowadzona zostanie na szynę próbek różnicowych (20).
Sygnał kodera entropijnego (8) zawiera wszystkie podpasma po DWT za wyjątkiem podpasma LL, które zostało w module predykcji warunkowej zastąpione sygnałem różnicowym i którego entropia jest znacznie mniejsza, niż entropia podpasma LL. Dzięki temu sygnał zawierający skompresowany obraz (10) otrzymany na wyjściu modułu kodowania entropijnego (9) będzie miał w przeciętnym przypadku mniejszą objętość i zajmie mniej miejsca w module pamięci masowej (11), niż gdyby na wejście tego kodera wprowadzono niezmodyfikowany sygnał zawierający podpasma po DWT i kwantyzacji (6).
Zaprezentowany na fig. 2 tor przetwarzania obrazu w urządzeniu prezentującym za pomocą modułu wyświetlacza cyfrowego (26) obraz zapisany w postaci skompresowanej na nośniku pamięci masowej w module pamięci masowej (11), zawiera moduły zgodne ze standardem JPEG 2000 odwracające

Claims (11)

  1. PL 240 833 B1 efekty działania odpowiednich modułów aparatu fotograficznego (z fig. 1): modułu dekodowania entropijnego (22) odwracającego efekty działania modułu kodowania entropijnego (9), modułu dekwantyzacji próbek podpasm (24) odwracającego efekty działania modułu kwantyzacji próbek podpasm (5) oraz modułu odwrotnej DWT (25) odwracającego efekty działania modułu DWT (3). Objaśnienia wymaga działanie modułu odwrotnej predykcji warunkowej (23) odwracającego efekty działania modułu predykcji warunkowej (7), a zawierającego kilka układów nieco różniących się od analogicznych układów z modułu predykcji warunkowej (7) oraz nieco inny układ połączeń wewnętrznych. Przełącznik sygnałów (29) modułu odwrotnej predykcji warunkowej (23) różni się od przełącznika sygnałów (21) modułu predykcji warunkowej (7) jedynie tym, że podłączone są do niego inne szyny danych (szynami podłączonymi do przełącznika sygnałów (21) transmitowane są próbki o zwiększonym zakresie dynamicznym). Zawarty module odwrotnej predykcji warunkowej (23) selektor dekodowania sygnału różnicowego (27), podobnie jak selektor kodowania sygnału różnicowego (12) najpierw pobiera do bufora metadanych podpasma (13) metadane podpasma, a następnie jeżeli nie jest to podpasmo LL, ani podczas kompresji nie zastosowano DWT rzędu zerowego, to poprzez przełącznik sygnałów (29) wyprowadza metadane z bufora metadanych podpasma (13), a po nich wyprowadza na bieżąco odczytywane wszystkie próbki podpasma. Jeżeli jest to podpasmo LL albo podczas kompresji zastosowano DWT rzędu zerowego, to poprzez przełącznik sygnałów (29) wyprowadzane są metadane z bufora metadanych podpasma (13) po uprzednim odpowiednim zmniejszeniu wartości pola opisującego zakres dynamiczny próbek podpasma, a następnie na bieżąco odczytywane wszystkie próbki, będące próbkami różnicowymi sygnału różnicowego, wyprowadzane są na szynę próbek różnicowych (20), po czym podlegają one transformacji odwrotnej z użyciem układu predykcji (28) i wyprowadzane są poprzez przełącznik sygnałów (29). Układ predykcji (28) różni się od układu predykcji (17) tym, że jego zadaniem jest, po otrzymaniu szyną układu predykcji (16) danej próbki M wyznaczenie przewidywanej wartości dla następnej próbki P, tj. próbki, która pojawi się na szynie układu predykcji (16) po próbce M. Dlatego układ predykcji (28), po otrzymaniu szyną układu predykcji (16) danej próbki M, najpierw zapisuje ją do bufora próbek podpasma (18), a następnie na podstawie próbek znajdujących się w buforze próbek podpasma (18) wyznacza przewidywaną wartość następnej próbki (P). Na podstawie próbek różnicowych odtwarzane są próbki podpasma po DWT. Dana próbka podpasma po DWT odtwarzana jest jako suma próbki różnicowej umieszczonej na szynie próbek różnicowych (20) i przewidywanej wartości odpowiadającej jej próbki podpasma po DWT wyznaczonej w układzie predykcji (28) i wyprowadzonej na szynę pomocniczą (19). Dla przykładu, jeżeli znajdująca się na szynie próbek różnicowych (20) dana próbka różnicowa R, na podstawie której zostanie odtworzona próbka P, ma wartość 2, a wszystkie już odtworzone próbki, które sąsiadować będą podpaśmie po DWT z próbką P, mają taką samą wartość 10, to układ predykcji (28), wyłącznie na podstawie już odtworzonych próbek sąsiadujących z P przewidzi za pomocą predyktora MED, że wartość próbki P wynosi 10 i wyprowadzi próbkę o wartości 10 na szynę pomocniczą (19), po czym przewidziana wartość próbki P (wynosząca 10) zostanie dodana do wartości próbki różnicowej R (wynoszącej 2) i na szynę układu predykcji (16) wyprowadzona zostanie odtworzona próbka P o wartości 12.
    Zastrzeżenia patentowe
    1. System przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego, znamienny tym, że zawiera umieszczony w torze przetwarzania obrazu, po module DWT (3) dekomponującym obraz na podpasma a przed modułem kodowania entropijnego (9) podpasm uzyskanych po DWT, moduł predykcji warunkowej (7), w którym sygnał zawierający podpasma po DWT wprowadzany jest na wejście połączonego z buforem metadanych podpasma (13) układu selektora kodowania sygnału różnicowego (12), który próbki podpasma niskiej częstotliwości LL wyprowadza na szynę układu predykcji (16) prowadzącą do połączonego z buforem próbek podpasma (18) układu predykcji (17), który przewidywanie wartości próbek korzystnie przeprowadza na podstawie już przetransformowanych próbek tego samego podpasma LL przechowywanych w buforze próbek podpasma (18), a przewidziane wartości próbek wyprowadza za pośrednictwem szyny pomocniczej (19) na wejście sumatora, który wyznacza tworzące sygnał różnicowy próbki różnicowe jako różnice pomiędzy wartościami rzeczywistych próbek podpasma
    PL 340 833 B1 dostarczonymi szyną układu predykcji (16) a dostarczonymi za pośrednictwem szyny pomocniczej (19) wartościami próbek przewidzianymi za pomocą układu predykcji (17) i wyprowadza je na wyjście modułu predykcji warunkowej (7) przez szynę próbek różnicowych (20) i przełącznik sygnałów (21) wysterowany przez układ selektora kodowania sygnału różnicowego (12) za pomocą szyny sterującej (14), transformując w ten sposób uzyskane po DWT podpasmo niskiej częstotliwości LL do postaci sygnału różnicowego, w którym próbki podpasma LL są przetransformowane do postaci próbek różnicowych.
  2. 2. System według zastrz. 1, znamienny tym, że moduł DWT (3) i moduł kodowania entropijnego (9) zbudowane są zgodnie ze standardem JPEG 2000.
  3. 3. System według zastrz. 1, znamienny tym, że przewidywanie wartości próbki w układzie predykcji (17) przeprowadza się z użyciem predyktora MED zdefiniowanego w standardzie JPEG-LS.
  4. 4. System według zastrz. 1, znamienny tym, że po zastosowaniu DWT rzędu zerowego w module DWT (3) cały sygnał wprowadzany na wejście modułu predykcji warunkowej (7) transformowany jest z użyciem układu predykcji (17) do postaci sygnału różnicowego, przy czym w miejsce próbek podpasma LL transformowane są próbki reprezentujące piksele obrazu.
  5. 5. System według zastrz, 1, znamienny tym, że zawiera umieszczony w torze przetwarzania obrazu jeden lub więcej dodatkowych modułów (5), na przykład moduł przeprowadzający kwantyzację próbek podpasm uzyskanych po DWT, przy czym jeżeli taki dodatkowy moduł (5) umieszczony jest przed modułem kodowania entropijnego (9) i po module DWT (3), to korzystnie moduł predykcji warunkowej (7) umieszczony jest bezpośrednio przed modułem kodowania entropijnego (9).
  6. 6. Sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania, i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego, znamienny tym, że przed przeprowadzeniem kodowania entropijnego podpasm otrzymanych po DWT transformuje się podpasmo niskiej częstotliwości LL do postaci sygnału różnicowego, w którym próbki podpasma LL są przetransformowane do postaci próbek różnicowych, przy czym próbkę różnicową wyznacza się dla danej próbki podpasma LL, jako różnicę pomiędzy rzeczywistą wartością tej próbki podpasma a jej wartością przewidywaną, a przewidywanie wartości próbki korzystnie przeprowadza się na podstawie już przetransformowanych próbek tego samego podpasma LL.
  7. 7. Sposób według zastrz, 6, znamienny tym, że transformację DWT i kodowanie entropijne przeprowadza się zgodnie ze standardem JPEG 2000.
  8. 8. Sposób według zastrz. 6, znamienny tym, że przewidywanie wartości próbki przeprowadza się z użyciem predyktora MED zdefiniowanego w standardzie JPEG-LS.
  9. 9. Sposób według zastrz. 6, znamienny tym, że poddawany transformacji DWT sygnał zawierający obraz jest w postaci cyfrowej oraz zawiera ciąg D E-bitowych pól, z których każde zawiera próbkę sygnału reprezentującą jasność pojedynczego piksela, a pola te umieszczone są w sygnale w kolejności rastrowej od najwyżej do najniżej położonego wiersza, a w ramach wiersza od skrajnego lewego do skrajnego prawego piksela, gdzie D jest liczbą pikseli obrazu, przy czym długość E pola bitowego korzystnie wynosi 8 bitów, przy czym w sygnale poddawanym transformacji DWT próbki sygnału reprezentujące jasności pikseli obrazu umieszczone są po próbkach zawierających metadane obrazu opisujące przynajmniej wymiary obrazu i zakres dynamiczny próbek obrazu.
  10. 10. Sposób według zastrz. 6, znamienny tym, że sygnał zawierający podpasma otrzymane po DWT jest w postaci cyfrowej, a dla każdego podpasma uzyskanego po DWT zawiera ciąg pól bitowych zawierających próbki podpasma umieszczone w kolejności rastrowej, przy czym w sygnale zawierającym podpasma otrzymane po DWT, dla każdego podpasma otrzymanego po DWT, próbki tego podpasma umieszczone są po próbkach zawierających metadane tego podpasma, pozwalające jednoznacznie zidentyfikować to podpasmo oraz opisujące przynajmniej wymiary podpasma i zakres dynamiczny próbek podpasma.
  11. 11. Sposób według zastrz. 6, znamienny tym, że jeżeli użyto transformacji DWT rzędu zerowego, to cały sygnał zawierający obraz transformowany jest do postaci sygnału różnicowego, przy czym w miejsce próbek podpasma LL transformowane są próbki reprezentujące piksele obrazu.
PL431478A 2019-10-15 2019-10-15 System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego PL240833B1 (pl)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PL431478A PL240833B1 (pl) 2019-10-15 2019-10-15 System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PL431478A PL240833B1 (pl) 2019-10-15 2019-10-15 System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego

Publications (2)

Publication Number Publication Date
PL431478A1 PL431478A1 (pl) 2021-04-19
PL240833B1 true PL240833B1 (pl) 2022-06-13

Family

ID=75469855

Family Applications (1)

Application Number Title Priority Date Filing Date
PL431478A PL240833B1 (pl) 2019-10-15 2019-10-15 System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego

Country Status (1)

Country Link
PL (1) PL240833B1 (pl)

Also Published As

Publication number Publication date
PL431478A1 (pl) 2021-04-19

Similar Documents

Publication Publication Date Title
JP4559622B2 (ja) 知覚的に無損失の画像をもたらす2次元離散ウェーブレット変換に基づくカラー画像の圧縮
DE69907798T2 (de) Umwandlungen von komprimierten Bildern
KR100880039B1 (ko) 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템
US20020018597A1 (en) Image processing system, image processing apparatus, image input apparatus, image output apparatus and method, and storage medium
EP2144432A1 (en) Adaptive color format conversion and deconversion
US7302105B2 (en) Moving image coding apparatus, moving image decoding apparatus, and methods therefor
EP1535239A2 (en) Image processing using probabilistic local behavior assumptions
EP1271928B1 (en) System and method for processing demosaiced images to reduce color aliasing artifacts
US6563946B2 (en) Image processing apparatus and method
US10867412B2 (en) Data compression by means of adaptive subsampling
US8611686B2 (en) Coding apparatus and method
CN110896483A (zh) 压缩和解压缩图像数据的方法
JP4293912B2 (ja) ウェーブレット変換を使用するカラー画像のデータ圧縮
DE19819405B4 (de) Implementation eines reversiblen eingebetteten Wavelet-Systems
CN114245989A (zh) 编码器和编码帧序列的方法
JP2010098352A (ja) 画像情報符号化装置
Richter et al. Bayer pattern compression with JPEG XS
CN111491163B (zh) 基于对图像块的像素域预处理操作的图像块编码
US8031782B2 (en) Systems and methods for compression, transmission and decompression of video codecs
PL240833B1 (pl) System i sposób przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego
PL241052B1 (pl) System i sposób adaptacyjnego przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego
DE60319742T2 (de) Lauflängencodierung eines quantisierten digitalen bildes
PL242013B1 (pl) System i sposób hybrydowego przetwarzania obrazów zwłaszcza w urządzeniach akwizycji, przetwarzania i składowania lub transmisji przeprowadzających kompresję obrazów cyfrowych z wykorzystaniem dyskretnej transformacji falkowej DWT i kodowania entropijnego
DE602004011213T2 (de) Intraframe-komprimierung und dekomprimierung von videosignalen mit fester bitrate
US20090074059A1 (en) Encoding method and device for image data