PL231160B1 - Sposób dekodowania sygnału wideo - Google Patents

Sposób dekodowania sygnału wideo

Info

Publication number
PL231160B1
PL231160B1 PL408821A PL40882112A PL231160B1 PL 231160 B1 PL231160 B1 PL 231160B1 PL 408821 A PL408821 A PL 408821A PL 40882112 A PL40882112 A PL 40882112A PL 231160 B1 PL231160 B1 PL 231160B1
Authority
PL
Poland
Prior art keywords
transform
block
prediction
mode
current block
Prior art date
Application number
PL408821A
Other languages
English (en)
Other versions
PL408821A1 (pl
Inventor
Bae Keun Lee
Jae Cheol Kwon
Joo Young Kim
Original Assignee
Kt Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kt Corp filed Critical Kt Corp
Publication of PL408821A1 publication Critical patent/PL408821A1/pl
Publication of PL231160B1 publication Critical patent/PL231160B1/pl

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Opis wynalazku
Niniejszy wynalazek dotyczy kodowania i dekodowania wideo, a w szczególności, sposobu dekodowania sygnału wideo.
Stan techniki
W ostatnim czasie, w różnych zakresach zastosowań wzrosło zapotrzebowanie na wideo o wysokiej rozdzielczości i wysokiej jakości, takie jak wideo o wysokiej rozdzielczości (HD) i wideo o bardzo wysokiej rozdzielczości (UHD).
W miarę większej rozdzielczości i wyższej jakości danych wideo, bardziej wzrasta ilość danych względem istniejących danych wideo. W związku z tym, gdy dane wideo są przesyłane z wykorzystaniem środków takich jak istniejące przewodowe i bezprzewodowe linie szerokopasmowe lub są zapisywane na istniejących nośnikach pamięci, wzrasta koszt przesyłu i koszt przechowywania.
W celu rozwiązania tych problemów pojawiających się wraz ze wzrostem rozdzielczości i jakości danych wideo, mogą być wykorzystane techniki kompresji wideo o dużej wydajności.
Technologia kompresji wideo obejmuje różne techniki, takie jak technika predykcji międzyklatkowej polegająca na przewidywaniu wartości piksela zawartego w bieżącym obrazie z poprzednich lub następnych obrazów względem bieżącego obrazu, technika predykcji wewnątrzklatkowej polegająca na przewidywaniu wartości piksela zawartego w bieżącym obrazie z wykorzystaniem informacji piksela w bieżącym obrazie, technika przekształcania informacji pikseli do dziedziny częstotliwości przez z góry określoną jednostkę i kwantyzowania współczynnika przekształcenia oraz technika kodowania entropijnego polegająca na przypisywaniu krótkiego kodu do wartości o dużej częstotliwości występowania i przypisywaniu długiego kodu do wartości o małej częstotliwości występowania.
Dane wideo mogą być skutecznie kompresowane i przesyłane lub zachowywane z wykorzystaniem takich technik kompresji wideo.
Opis wynalazku
Cel i istota wynalazku
Celem wynalazku jest zapewnienie sposobu dekodowania sygnału wideo. Cel ten jest osiągnięty przez sposób dekodowania sygnału wideo, obejmujący otrzymywanie, przez moduł dekodowania entropijnego, współczynników resztkowych dotyczących bieżącego bloku oraz wskaźnika pomijania przekształcenia dla bieżącego bloku z sygnału wideo, przy czym wskaźnik pomijania przekształcenia określa, czy przekształcenie odwrotne jest pomijane dla bieżącego bloku, przy czym resztkowe współczynniki są kwantyzowane odwrotnie przez moduł dekwantyzacji; i otrzymywanie, przez moduł przekształcenia odwrotnego, resztkowych próbek przez selektywne wykonywanie przekształcenia odwrotnego dla kwantyzowanych odwrotnie współczynników resztkowych bieżącego bloku na podstawie wskaźnika pomijania przekształcenia, przy czym przekształcenie odwrotne jest wykonywane przez wykorzystanie jednego przekształcenia spośród dyskretnej transformacji kosinusowej (DCT) i dyskretnej transformacji sinusowej (DST).
Korzystnie, gdy wskaźnik pomijania przekształcenia określa, że przekształcenie odwrotne jest pomijane dla bieżącego bloku, resztkowe próbki są otrzymywane przez skalowanie kwantyzowanych odwrotnie współczynników resztkowych przez z góry określoną wartość.
Korzystnie, skalowanie jest wykonywane przez wykorzystanie operacji przemieszczenia bitów.
Korzystnie, wskaźnik pomijania przekształcenia jest otrzymywany na podstawie rozmiaru jednostki przekształcenia, przy czym jednostka przekształcenia stanowi reprezentację jednostki, gdy przekształcenie odwrotne jest wykonywane dla bieżącego bloku.
Korzystnie, wskaźnik pomijania przekształcenia jest otrzymywany, gdy rozmiar jednostki przekształcenia jest równy rozmiarowi minimalnego bloku NxN.
Korzystnie, przekształcenie odwrotne obejmuje przekształcenie na wierszach bieżącego bloku i przekształcenie na kolumnach bieżącego bloku.
Poniżej przedstawiono przykłady, które są użyteczne dla zrozumienia wynalazku.
Jeden przykład przedstawia sposób kodowania wideo obejmujący wykonywanie predykcji dla bieżącego bloku i przekształcanie resztki generowanej przez predykcję, przy czym, w etapie przekształcania, drugie przekształcenie jest wykonywane w dziedzinie niskiej częstotliwości po wykonaniu pierwszego przekształcenia na resztce, i określa tryb drugiego przekształcenia na podstawie trybu pierwszego przekształcenia.
PL 231 160 B1
W etapie wykonywania, predykcja wewnątrzklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia może być określony jako jeden spośród: 2-kierunkowego (2D) przekształcenia, 1-kierunkowego (1D) przekształcenia pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kierunku trybu predykcji dla predykcji wewnątrzklatkowej. W tym przypadku, tryb drugiego przekształcenia może być taki sam, jak tryb pierwszego przekształcenia.
W etapie wykonywania, predykcja międzyklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia może być określony jako jeden spośród: przekształcenia 2D, przekształcenia 1D pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kształtu bieżącego bloku. W tym przypadku, tryb drugiego przekształcenia może być taki sam, jak tryb pierwszego przekształcenia.
W etapie przekształcania, tryb pierwszego przekształcenia może być określony na podstawie optymalizacji przepływność-zniekształcenie. W tym przypadku, mogą być transmitowane informacje wskazujące określony tryb pierwszego przekształcenia.
Drugie przekształcenie może być dyskretną transformacją sinusową (DST) wykonaną przez blok 4x4.
Inny przykład przedstawia sposób dekodowania wideo obejmujący wykonywanie przekształcenia odwrotnego w celu generowania bloku resztkowego dla bieżącego bloku i wykonywanie predykcji w celu generowania przewidywanego bloku dla bieżącego bloku, przy czym, podczas wykonywania przekształcenia odwrotnego, drugie przekształcenie odwrotne w dziedzinie niskiej częstotliwości może być wykonane po wykonaniu pierwszego przekształcenia odwrotnego na zakodowanych informacjach resztkowych dla bieżącego bloku, a tryb drugiego przekształcenia może być określony na podstawie trybu pierwszego przekształcenia.
Podczas wykonywania predykcji, predykcja wewnątrzklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia odwrotnego może być określony jako jeden spośród: przekształcenia 2D, przekształcenia 1D pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kierunku trybu predykcji dla predykcji wewnątrzklatkowej. W tym przypadku, tryb drugiego przekształcenia odwrotnego może być taki sam, jak tryb pierwszego przekształcenia odwrotnego.
Podczas wykonywania predykcji, predykcja międzyklatkowa może być wykonana dla bieżącego bloku, a tryb pierwszego przekształcenia odwrotnego jest określony jako jeden spośród: przekształcenia 2D, przekształcenia 1D pionowego, przekształcenia 1D poziomego i bez przekształcenia na podstawie kształtu bieżącego bloku. W tym przypadku, tryb drugiego przekształcenia odwrotnego może być taki sam, jak tryb pierwszego przekształcenia odwrotnego.
Podczas wykonywania przekształcenia odwrotnego, pierwsze przekształcenie odwrotne może być wykonane zgodnie z trybem wskazanym przez odebrane informacje, a odebrane informacje wskazują jeden tryb spośród: przekształcenia 2D, przekształcenia 1 D pionowego, przekształcenia 1D poziomego i bez przekształcenia jako tryb pierwszego przekształcenia odwrotnego. W tym przypadku, tryb drugiego przekształcenia odwrotnego może być taki sam, jak tryb pierwszego przekształcenia odwrotnego.
Drugie przekształcenie może być transformacją DST wykonaną przez blok 4x4.
Jeszcze inny przykład przedstawia urządzenie kodujące wideo zawierające moduł predykcji do wykonywania predykcji dla bieżącego bloku, i moduł przekształcania do przekształcania resztki generowanej przez predykcję, przy czym moduł przekształcania wykonuje drugie przekształcenie w dziedzinie niskiej częstotliwości po wykonaniu pierwszego przekształcenia na resztce i określa tryb drugiego przekształcenia na podstawie trybu pierwszego przekształcenia.
Jeszcze inny przykład przedstawia sposób dekodowania wideo zawierający moduł przekształcenia odwrotnego do generowania bloku resztkowego dla bieżącego bloku przez wykonywanie przekształcenia odwrotnego i moduł predykcji do generowania przewidywanego bloku dla bieżącego bloku, przy czym moduł przekształcenia odwrotnego wykonuje drugie przekształcenie odwrotne w dziedzinie niskiej częstotliwości po wykonaniu pierwszego przekształcenia odwrotnego na zakodowanych informacjach resztkowych dla bieżącego bloku, i określa tryb drugiego przekształcenia na podstawie trybu pierwszego przekształcenia.
Korzystne skutki
Zgodnie z przedstawionym przykładem, informacje resztkowe mogą być wydajnie przekształcane i przekształcane odwrotnie.
PL 231 160 B1
Zgodnie z przedstawionym przykładem, pierwsze przekształcenie może być wykonane zgodnie ze sposobem predykcji, a drugie przekształcenie może być wykonane w dziedzinie niskiej częstotliwości zgodnie z pierwszym przekształceniem, zwiększając w ten sposób wydajność kompresji i transmisji.
Zgodnie z przedstawionym przykładem, pierwsze przekształcenie może być wykonane zgodnie z podzielonym kształtem, a drugie przekształcenie może być wykonane w dziedzinie niskiej częstotliwości zgodnie z pierwszym przekształceniem, zwiększając w ten sposób wydajność kompresji i transmisji.
Opis rysunków
FIG. 1 przedstawia schemat blokowy ilustrujący urządzenie kodujące wideo.
FIG. 2 przedstawia schemat blokowy ilustrujący urządzenie dekodujące wideo.
FIG. 3 schematycznie przedstawia tryb predykcji wykorzystywany dla predykcji wewnątrzklatkowej.
FIG. 4 schematycznie przedstawia tryb pomijania przekształcenia (TMS).
FIG. 5 przedstawia sieć działań schematycznie ilustrującą proces kodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie.
FIG. 6 schematycznie przedstawia informacje o sąsiednim bloku dostępne w trybie pomijania, trybie łączenia i trybie AMVP.
FIG. 7 przedstawia sieć działań schematycznie ilustrującą proces dekodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie.
Tryb dla wynalazku
Niniejszy wynalazek może być w różny sposób zmieniany i modyfikowany i może być zilustrowany w odniesieniu do różnych przykładów wykonania, z których niektóre zostaną opisane i przedstawione na rysunkach. Jednakże, przedstawione przykłady wykonania nie mają na celu ograniczania wynalazku, ale są interpretowane jako obejmujące wszystkie modyfikacje, ekwiwalenty i zastąpienia, które należą do istoty i technicznego zakresu wynalazku. Te same oznaczenia odsyłające na rysunkach odnoszą się do tych samych elementów w całym opisie.
Mimo że określenia pierwszy, drugi, itd. mogą być wykorzystane do opisania różnych elementów, to te elementy nie powinny być ograniczane przez te określenia. Te określenia są wykorzystywane tylko do odróżnienia jednego elementu od drugiego elementu. Na przykład, pierwszy element mógłby być nazwany drugim elementem, a drugi element mógłby być nazwany pierwszym elementem bez odbiegania od treści niniejszego wynalazku.
Określenie „i/lub” obejmuje dowolne i wszystkie kombinacje spośród wielu powiązanych wymienionych elementów.
Zrozumiale będzie, że, gdy element jest określany jako „połączony z” lub „podłączony do” innego elementu, to element może być bezpośrednio połączony lub podłączony do innego elementu lub elementów pośredniczących. Z drugiej strony, gdy element jest określony jako „bezpośrednio połączony z” lub „bezpośrednio podłączony do” innego elementu, nie występują żadne elementy pośredniczące.
Terminologia wykorzystana w niniejszym dokumencie ma na celu opisanie tylko szczególnych przykładów wykonania i nie ma na celu ograniczania wynalazku. Wykorzystane w niniejszym dokumencie formy w liczbie pojedynczej mają na celu objęcie także form w liczbie mnogiej, o ile kontekst wyraźnie nie wskazuje inaczej. Będzie ponadto zrozumiałe, że określenia „obejmuje” i/lub „posiada”, gdy są wykorzystywane w tym opisie, określają występowanie wskazanych cech, liczb całkowitych, etapów, operacji, elementów i/lub komponentów, ale nie wykluczają występowania lub dodania jednej lub większej liczby cech, liczb całkowitych, etapów, operacji, elementów, komponentów i/lub ich grup.
W dalszej części opisu, przykłady użyteczne dla zrozumienia wynalazku zostaną szczegółowo opisane w odniesieniu do dołączonych rysunków. Te same oznaczenia odsyłające na rysunkach odnoszą się do tych samych elementów w całym opisie, a zbędny opis tych samych elementów zostanie w niniejszym opisie pominięty.
FIG. 1 przedstawia schemat blokowy ilustrujący urządzenie kodujące wideo.
Odnosząc się do FIG. 1, urządzenie 100 kodujące wideo zawiera moduł 105 podziału obrazu, moduł 110 predykcji, moduł 115 przekształcania, moduł 120 kwantyzacji, moduł 125 przegrupowania, moduł 130 kodowania entropijnego, moduł 135 dekwantyzacji, moduł 140 przekształcenia odwrotnego, moduł 145 filtra i pamięć 150.
Mimo że elementy zilustrowane na FIG. 1 są niezależnie przedstawione w celu reprezentowania różnych charakterystycznych funkcji w urządzeniu kodującym wideo, to taka konfiguracja nie wskazuje,
PL 231 160 B1 że każdy element jest utworzony przez oddzielny komponent sprzętowy lub komponent oprogramowania. To oznacza, że elementy są niezależnie rozmieszczone dla ułatwienia opisu, przy czym co najmniej dwa elementy mogą być połączone w pojedynczy element, lub pojedynczy element może być podzielony na wiele elementów w celu wykonywania funkcji. Należy zaznaczyć, że przykłady wykonania, w których niektóre elementy są zintegrowane w jeden połączony element i/lub element jest podzielony na wiele oddzielnych elementów, należą do zakresu niniejszego wynalazku bez odchodzenia od istoty niniejszego wynalazku.
Niektóre elementy mogą nie być istotne dla zasadniczych funkcji w wynalazku i mogą być opcjonalnymi składnikami jedynie zwiększającymi wydajność. Wynalazek może być zrealizowany przez zawarcie tylko tych składników, które są istotne dla realizacji wynalazku, z wyjątkiem składników wykorzystywanych jedynie do zwiększenia wydajności. Struktura zawierająca tylko istotne składniki z wyjątkiem optycznych składników wykorzystywanych jedynie do zwiększenia wydajności należy do zakresu wynalazku.
Moduł 105 podziału obrazu może dzielić obraz wejściowy na co najmniej jedną jednostkę procesu. W tym przypadku, jednostka procesu może być jednostką predykcji (PU), jednostką przekształcenia (TU) lub jednostką kodowania (CU). Moduł 105 podziału obrazu może dzielić jeden obraz na wiele kombinacji jednostek kodowania, jednostek predykcji i jednostek przekształcenia i wybierać jedną kombinację jednostek kodowania, jednostek predykcji i jednostek przekształcenia na podstawie z góry określonego kryterium (na przykład, funkcji kosztu), kodując w ten sposób obraz.
Na przykład, jeden obraz może być podzielony na wiele jednostek kodowania. Struktura drzewa rekursywnego, taka jak struktura drzewa czwórkowego, może być wykorzystana do podzielenia obrazu na jednostki kodowania. Będąc obrazem lub jednostką kodowania o maksymalnym rozmiarze jako korzeń, jednostka kodowania może być podzielona na podjednostki kodowania z tyloma węzłami potomnymi, ile jest podzielonych jednostek kodowania. Jednostka kodowania, która nie jest już dalej dzielona zgodnie z określonym z góry ograniczeniem, jest węzłem-liściem. Oznacza to, że przy założeniu, że jednostka kodowania może być podzielona tylko na kwadraty, pojedyncza jednostka kodowania może być podzielona na maksymalnie cztery jednostki kodowania.
W przykładach, jednostka kodowania może być wykorzystana do odnoszenia się nie tylko do jednostki kodowania, ale także do jednostki dekodowania.
Jednostka predykcji może być podzielona na co najmniej jedną postać kwadratową lub prostokątną o tym samym rozmiarze w jednostce kodowania lub może być podzielona tak, że kształt podzielonej jednostki predykcji jest inny, niż kształt innej jednostki predykcji w jednostce kodowania.
Gdy jednostka predykcji, która ma być poddana predykcji wewnątrzklatkowej, jest generowana na podstawie jednostki kodowania i jednostka kodowania nie jest minimalną jednostką kodowania, predykcja wewnątrzklatkowa może być wykonana bez dzielenia jednostki kodowania na wiele jednostek predykcji (NxN).
Moduł 110 predykcji może zawierać moduł predykcji międzyklatkowej do wykonywania predykcji międzyklatkowej i moduł predykcji wewnątrzklatkowej do wykonywania predykcji wewnątrzklatkowej. Moduł predykcji może określać to, która predykcja spośród predykcji międzyklatkowej lub predykcji wewnątrzklatkowej powinna być wykonana na jednostce predykcji, i może określać specyficzne informacje (na przykład, tryb predykcji wewnątrzklatkowej, wektor ruchu i obraz referencyjny, itd.) zgodnie z określonym sposobem predykcji. W tym przypadku, jednostka procesu, na której wykonywana jest predykcja, może być inna, niż jednostka procesu, dla której określany jest sposób predykcji i specyficzne informacje. Na przykład, sposób predykcji i tryb predykcji mogą być określone dla każdej jednostki predykcji, natomiast predykcja może być wykonana dla każdej jednostki przekształcenia. Wartość resztkowa (blok resztkowy) między generowanym przewidywanym blokiem i oryginalnym blokiem może być wprowadzana do modułu 115 przekształcania. Ponadto, informacje trybu predykcji, informacje wektora ruchu i temu podobne wykorzystywane dla predykcji mogą być zakodowane razem z wartością resztkową przez moduł 130 kodowania entropijnego i mogą być transmitowane do urządzenia dekodującego. Gdy wykorzystywany jest specyficzny tryb kodowania, oryginalny blok może być zakodowany i przetransmitowany do urządzenia dekodującego bez generowania przewidywanego bloku za pośrednictwem modułu 110 predykcji.
Moduł predykcji międzyklatkowej może przewidywać jednostkę predykcji na podstawie informacji dotyczących co najmniej jednego obrazu spośród poprzedniego obrazu i następnego obrazu bieżącego obrazu. Moduł predykcji międzyklatkowej może zawierać moduł interpolacji obrazu referencyjnego, moduł predykcji ruchu i moduł kompensacji ruchu.
PL 231 160 B1
Moduł interpolacji obrazu referencyjnego może odbierać z pamięci 150 informacje obrazu referencyjnego i generować informacje pikseli mniejsze niż całkowitoliczbowa jednostka pozycji pikseli (całkowitoliczbowa jednostka pikseli lub jednostka pikseli) z obrazu referencyjnego. W przypadku pikseli jasności, oparty na transformacji DCT 8-segmentowy filtr interpolacyjny mający zmienny współczynnik filtra może być wykorzystany do generowania informacji pikseli mniejszych niż całkowitoliczbowa jednostka pikseli w jednostce 1/4 pozycji piksela (jednostka 1/4 piksela). W przypadku pikseli chrominancji, oparty na transformacji DCT 4-segmentowy filtr interpolacyjny mający zmienny współczynnik filtra może być wykorzystany do generowania informacji pikseli mniejszych niż całkowitoliczbowa jednostka pikseli w jednostce 1/8 piksela.
Moduł predykcji ruchu może wykonywać predykcję r uchu na podstawie obrazu referencyjnego interpolowanego przez moduł interpolacji obrazu referencyjnego. Różne metody, takie jak algorytm dopasowania bloków oparty na pełnym poszukiwaniu (FBMA), algorytm trzystopniowego poszukiwania (TSS) i nowy algorytm tr zystopniowego poszukiwania (NTS) mogą być wykorzystane do obliczania wektora ruchu. Wektor ruchu ma wartość wektora ruchu w jednostce 1/2 lub 1/4 piksela na podstawie interpolowanego piksela. Moduł predykcji ruchu może wykonywać predykcję na bieżącej jednostce predykcji z wykorzystaniem innych sposobów predykcji ruchu. Różne metody, takie jak pomijanie, łączenie i zaawansowana predykcja wektora ruchu (AMVP) itd. mogą być wykorzystane jako sposób predykcji ruchu.
Moduł predykcji wewnątrzklatkowej może generować blok predykcji na podstawie informacji piksela referencyjnego sąsiadujący z bieżącym blokiem, które stanowią informacje pikseli w bieżącym obrazie. Gdy blok sąsiadujący z aktualną jednostką predykcji jest blokiem poddawanym predykcji międzyklatkowej i piksel referencyjny jest pikselem poddawanym predykcji międzyklatkowej, informacje pikseli referencyjnych zawarte w bloku poddawanym predykcji międzyklatkowej mogą być zastąpione informacjami pikseli referencyjnych w bloku poddawanym predykcji wewnątrzklatkowej. Oznacza to, że, gdy piksel referencyjny nie jest dostępny, informacje o niedostępnym pikselu referencyjnym mogą być zastąpione co najmniej jednym pikselem referencyjnym spośród dostępnych pikseli referencyjnych.
Tryb predykcji dla predykcji wewnątrzklatkowej obejmuje tryb predykcji kierunkowej, w którym informacje o pikselu referencyjnym są wykorzystywane zgodnie z kierunkiem predykcji, oraz tryb predykcji bezkierunkowej, w którym informacje kierunku nie są wykorzystywane przy wykonywaniu predykcji. Tryb przewidywania informacji o jasności i tryb przewidywania informacji o chrominancji mogą być od siebie różne. Informacje trybu predykcji wewnątrzklatkowej wykorzystywane do otrzymywania informacji o jasności lub informacji o przewidywanym sygnale jasności mogą być wykorzystywane do przewidywania informacji o chrominancji.
Gdy jednostka predykcji i jednostka przekształcenia mają ten sam rozmiar przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa na jednostce predykcji może być wykonana na podstawie pikseli z lewej strony, górnego lewego piksela i górnych pikseli jednostki predykcji. Z drugiej strony, gdy jednostka predykcji i jednostka przekształcenia mają różne rozmiary przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa może być wykonana z wykorzystaniem pikseli referencyjnych na podstawie jednostki przekształcenia. Predykcja wewnątrzklatkowa z podziałem NxN może być wykonana tylko dla minimalnej jednostki kodowania.
W sposobie predykcji wewnątrzklatkowej, filtr adaptacyjnego wygładzania wewnątrzklatkowego (AIS) może być stosowany względem pikseli referencyjnych zgodnie z trybem predykcji przed generowaniem przewidywanego bloku. Różne rodzaje filtrów AIS mogą być stosowane względem pikseli referencyjnych. W sposobie predykcji wewnątrzklatkowej, tryb predykcji wewnątrzklatkowej bieżącej jednostki predykcji może być przewidziany na podstawie trybu predykcji wewnątrzklatkowej jednostki predykcji zlokalizowanej sąsiadująco z bieżącą jednostką predykcji. W przewidywaniu dla trybu predykcji bieżącej jednostki predykcji z wykorzystaniem informacji trybu przewidywanych na podstawie sąsiedniej jednostki predykcji, gdy bieżąca jednostka predykcji i sąsiednia jednostka predykcji mają ten sam tryb predykcji wewnątrzklatkowej, informacje wskazujące, że bieżąca jednostka predykcji i sąsiednia jednostka predykcji mają ten sam tryb predykcji, mogą być transmitowane z wykorzystaniem z góry określonych informacji znacznika. Jeżeli bieżąca jednostka predykcji i sąsiednia jednostka predykcji mają różne tryby predykcji, informacje dotyczące trybu predykcji bieżącego bloku mogą być zakodowane przez kodowanie entropijne.
PL 231 160 B1
Blok resztkowy zawierający informacje resztkowe, które dotyczą różnicy między przewidywanym blokiem i oryginalnym blokiem jednostki predykcji, może być generowany na podstawie jednostki predykcji przez moduł 110 predykcji. Wygenerowany blok resztkowy może być wprowadzany do modułu 115 przekształcania.
Moduł 115 przekształcania może przekształcać blok resztkowy zawierający informacje resztkowe jednostki predykcji generowanej na podstawie oryginalnego bloku przez moduł 110 predykcji z wykorzystaniem sposobu przekształcania takiego jak dyskretna transformacja kosinusowa (DCT) lub Dyskretna transformacja sinusowa (DST). Sposób przekształcania, który ma być wykorzystany do przekształcania bloku resztkowego, może być określony spośród transformacji DCT i transformacji DST na podstawie informacji trybu predykcji wewnątrzklatkowej jednostki predykcji wykorzystywanego do generowania bloku resztkowego.
Moduł 120 kwantyzacji może kwantyzować wartości przekształcone do dziedziny częstotliwości przez moduł 115 przekształcania. Parametr kwantyzacji może się zmieniać w zależności od bloku lub ważności obrazu. Wartości dostarczane z modułu 120 kwantyzacji mogą być dostarczane do modułu 135 dekwantyzacji i modułu 125 przegrupowania.
Dla kwantyzowanych resztkowych wartości, moduł 125 przegrupowania może przeorganizować współczynniki.
Moduł 125 przegrupowania może zmieniać dwuwymiarowy (2D) blok współczynników na jednowymiarowy (1D) wektor współczynników poprzez skanowanie współczynników. Na przykład, moduł 125 przegrupowania może zmieniać blok 2D współczynników na wektor 1D współczynników z wykorzystaniem skanowania prostopadłego. Skanowanie pionowe bloku 2D współczynników w kierunku kolumny i skanowanie poziome bloku 2D współczynników w kierunku wiersza może być wykorzystane w zależności od rozmiaru jednostki przekształcenia i trybu predykcji wewnątrzklatkowej, zamiast skanowania prostopadłego. Oznacza to, że sposób skanowania do wykorzystania może być wybrany na podstawie rozmiaru jednostki przekształcenia i trybu predykcji wewnątrzklatkowej spośród skanowania prostopadłego, skanowania pionowego i skanowania poziomego.
Moduł 130 kodowania entropijnego może wykonywać kodowanie entropijne na podstawie wartości otrzymanych przez moduł 125 przegrupowania. Różne sposoby kodowania, takie jak wykładnicze kodowanie Golomba, kontekstowe adaptacyjne kodowanie o zmiennej długości słowa (CAVLC) i kontekstowe adaptacyjne kodowanie ciągu symboli binarnych (CABAC) może być wykorzystane dla kodowania entropijnego.
Moduł 130 kodowania entropijnego może kodować wiele różnych informacji, takich jak informacje resztkowe współczynnika i informacje o rodzaju bloku dotyczące jednostki kodowania, informacje trybu predykcji, informacje o jednostce podziału, informacje o jednostce predykcji, informacje o jednostce transferu, informacje wektora ruchu, informacje o klatce odniesienia, informacje o interpolacji bloku i informacje o filtrowaniu, które mogą być otrzymane z modułu 125 przegrupowania i modułu 110 predykcji.
Moduł 130 kodowania entropijnego może kodować entropijnie współczynniki jednostki kodowania wprowadzane z modułu 125 przegrupowania.
Moduł 135 dekwantyzacji i moduł 140 przekształcenia odwrotnego dekwantyzują wartości kwantyzowane przez moduł 120 kwantyzacji i przekształcają odwrotnie wartości przekształcone przez moduł 115 przekształcania. Resztka generowana przez moduł 135 dekwantyzacji i moduł 140 przekształcenia odwrotnego może być dodawana do przewidywanego bloku, który jest przewidywany przez moduł predykcji wektora ruchu, moduł kompensacji ruchu i moduł predykcji wewnątrzklatkowej modułu 110 predykcji, generując w ten sposób zrekonstruowany blok.
Moduł 145 filtra może zawierać co najmniej jeden spośród: filtra rozbioru bloku, modułu korekcji przesunięcia i adaptacyjnego filtra pętlowego (ALF).
Filtr 145 rozbioru bloku może usuwać zniekształcenia bloku generowane na granicach między blokami w zrekonstruowanym obrazie. To, czy należy zastosować filtr rozbioru bloku względem bieżącego bloku, może być określone na podstawie pikseli zawartych w kilku rzędach lub kolumnach bloku. Gdy filtr rozbioru bloku jest stosowany względem bloku, może być zastosowany silny filtr lub słaby filtr w zależności od wymaganej siły filtrowania rozbioru bloku. Ponadto, gdy filtrowanie poziome i filtrowanie pionowe są realizowane podczas stosowania filtra rozbioru bloku, filtrowanie poziome i filtrowanie pionowe może być wykonane równolegle.
Moduł korekcji przesunięcia może korygować przesunięcie obrazu filtrowanego przez rozbiór bloku względem oryginalnego obrazu o piksel. Sposób podziału pikseli obrazu na z góry określoną
PL 231 160 B1 liczbę obszarów, określania obszaru, który ma być poddany korekcji przesunięcia i stosowania korekcji przesunięcia względem określonego obszaru lub sposób stosowania korekcji przesunięcia przy uwzględnieniu informacji brzegowych dla każdego piksela może być wykorzystany do wykonania korekcji przesunięcia względem określonego obrazu.
Filtr ALF może wykonywać filtrowanie na podstawie wyniku porównania filtrowanego zrekonstruowanego obrazu i oryginalnego obrazu. Piksele zawarte w obrazie mogą być podzielone na z góry określone grupy, może być określony filtr, który ma być zastosowany względem każdej grupy i dla każdej grupy może być wykonane filtrowanie różnicowe. Informacje o tym, czy zastosować filtr ALF mogą być przesyłane przez każdą jednostkę kodowania (CU), a kształt i współczynnik filtra ALF, które mają być zastosowane względem każdego bloku, mogą się zmieniać. Filtr ALF może mieć różne rodzaje i może się zmieniać liczba współczynników zawartych w odpowiednim filtrze. Ponadto, filtr ALF o tej samej postaci (stałej postaci) może być stosowany względem bloku niezależnie od charakterystyk bloku.
Pamięć 150 może przechowywać zrekonstruowany blok lub obraz dostarczany z modułu 145 filtra, a zachowany zrekonstruowany blok lub obraz może być dostarczony do modułu 110 predykcji podczas wykonywania predykcji międzyklatkowej.
FIG. 2 przedstawia schemat blokowy ilustrujący urządzenie dekodujące wideo.
Odnosząc się do FIG. 2, urządzenie 200 dekodujące wideo może zawierać moduł 210 dekodowania entropijnego, moduł 215 przegrupowania, moduł 220 dekwantyzacji, moduł 225 przekształcenia odwrotnego, moduł predykcji 230, moduł 235 filtra i pamięć 240.
Gdy strumień bitów wideo jest wprowadzany z urządzenia kodującego wideo, wejściowy strumień bitów może być dekodowany zgodnie z procesem odwrotnym dla procesu kodowania wideo przez urządzenie kodujące wideo.
Moduł 210 dekodowania entropijnego może wykonywać dekodowanie entropijne zgodnie z procesem odwrotnym dla procesu kodowania entropijnego przez moduł kodowania entropijnego urządzenia kodującego wideo. Na przykład, różne sposoby, takie jak wykładnicze kodowanie Golomba, kodowanie CAVLC i CABAC, mogą być wykorzystane dla dekodowania entropijnego, odpowiadające sposobowi wykorzystanemu przez urządzenie kodujące wideo.
Moduł 210 dekodowania entropijnego może dekodować informacje powiązane z predykcją wewnątrzklatkową i predykcją międzyklatkową wykonywanymi przez urządzenie kodujące.
Moduł 215 przegrupowania może wykonywać przegrupowanie strumienia bitów dekodowanego entropijnie przez moduł 210 dekodowania entropijnego na podstawie sposobu przegrupowania modułu kodowania. Moduł 215 przegrupowania może rekonstruować i przegrupowywać współczynniki wyrażone w postaci wektora 1D na współczynniki w bloku 2D. Moduł 215 przegrupowania może mieć dostarczone informacje związane ze skanowaniem współczynników wykonywanym przez moduł kodowania i może wykonywać przegrupowanie z wykorzystaniem sposobu skanowania odwrotnego współczynników na podstawie porządku skanowania, zgodnie z którym skanowanie jest wykonywane przez moduł kodowania.
Moduł 220 dekwantyzacji może wykonywać dekwantyzację na podstawie parametru kwantyzacji dostarczanego z urządzenia kodującego i przegrupowanych współczynników bloku.
Moduł 225 przekształcenia odwrotnego może wykonywać odwrotną transformację DCT i odwrotną transformację DST względem transformacji DCT i DST wykonywanych przez moduł przekształcania, przy czym transformacje DCT i DST zostały wykonane na wyniku kwantyzacji wykonanej przez urządzenie kodujące wideo. Przekształcenie odwrotne może być wykonane na podstawie jednostki przekształcenia określonej przez urządzenie kodujące wideo. Moduł przekształcania urządzenia kodującego wideo może selektywnie wykonywać transformacje DCT i DST w zależności od wielu elementów informacji, takich jak sposób predykcji, rozmiar bieżącego bloku i kierunek predykcji, itd., a moduł 225 przekształcenia odwrotnego urządzenia dekodującego wideo może wykonywać przekształcenie odwrotne na podstawie informacji dotyczących przekształcenia wykonywanego przez moduł przekształcania urządzenia kodującego wideo.
Moduł 230 predykcji może generować przewidywany blok na podstawie informacji generowania przewidywanego bloku dostarczonych z modułu 210 dekodowania entropijnego i informacji dotyczących wcześniej dekodowanego bloku lub obrazu dostarczonych z pamięci 240.
Podobnie do działania urządzenia kodującego wideo jak opisano powyżej, gdy jednostka predykcji i jednostka przekształcenia mają ten sam rozmiar przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa na jednostce predykcji jest wykonywana na podstawie pikseli z lewej strony, górnego lewego piksela i górnych pikseli jednostki predykcji. Z drugiej strony, gdy jednostka
PL 231 160 B1 predykcji i jednostka przekształcenia mają różne rozmiary przy wykonywaniu predykcji wewnątrzklatkowej, predykcja wewnątrzklatkowa może być wykonana z wykorzystaniem pikseli referencyjnych na podstawie jednostki przekształcenia. Predykcja wewnątrzklatkowa z podziałem NxN może być wykonana tylko dla minimalnej jednostki kodowania.
Moduł 230 predykcji zawiera moduł określania jednostki predykcji, moduł predykcji międzyklatkowej i moduł predykcji wewnątrzklatkowej. Moduł określania jednostki predykcji może odbierać różne informacje, takie jak informacje o jednostce predykcji wprowadzane z modułu dekodowania entropijnego, informacje trybu predykcji sposobu predykcji wewnątrzklatkowej i informacje związane z predykcją ruchu dotyczące sposobu predykcji międzyklatkowej. Moduł określania jednostki predykcji może określać jednostkę predykcji w bieżącej jednostce kodowania i może określać, która spośród predykcji międzyklatkowej i predykcji wewnątrzklatkowej jest wykonywana na jednostce predykcji. Moduł predykcji międzyklatkowej może wykonywać predykcję międzyklatkową na bieżącej jednostce predykcji na podstawie informacji o co najmniej jednym obrazie spośród poprzedniego obrazu i następnego obrazu dla bieżącego obrazu zawierającego bieżącą jednostkę predykcji z wykorzystaniem informacji niezbędnych dla predykcji międzyklatkowej dla bieżącej jednostki predykcji dostarczanych z urządzenia kodującego wideo.
W celu wykonania predykcji międzyklatkowej, może być określone na podstawie jednostki kodowania to, czy sposób predykcji ruchu dla jednostki predykcji zawartej w jednostce kodowania jest trybem pomijania, trybem łączenia, czy trybem AMVP.
Moduł predykcji wewnątrzklatkowej może generować przewidywany blok na podstawie informacji pikseli w bieżącym obrazie. Gdy jednostka predykcji jest jednostką predykcji, na której wykonywana jest predykcja wewnątrzklatkowa, predykcja wewnątrzklatkowa może być wykonana na podstawie informacji trybu predykcji wewnątrzklatkowej dotyczących jednostki predykcji dostarczanych z urządzenia kodującego wideo. Moduł predykcji wewnątrzklatkowej może zawierać filtr AIS, moduł interpolacji piksela odniesienia i filtr DC. Filtr AIS wykonuje filtrowanie pikseli referencyjnych bieżącego bloku i to, czy należy zastosować filtr AIS może być określone w zależności od trybu predykcji dla bieżącej jednostki predykcji. Filtrowanie AIS może być wykonane na pikselach referencyjnych bieżącego bloku z wykorzystaniem trybu predykcji dla jednostki predykcji i informacji dotyczących filtra AIS dostarczanych z urządzenia kodującego wideo. Gdy tryb predykcji dla bieżącego bloku jest trybem nieobejmującym filtrowania AIS, filtr AIS może nie być stosowany.
Gdy tryb predykcji dla jednostki predykcji jest trybem predykcji dla wykonywania predykcji wewnątrzklatkowej na podstawie wartości pikseli otrzymanych przez interpolowanie pikse li referencyjnych, moduł interpolacji piksela odniesienia może generować piksele referencyjne w jednostce piksela mniejszej niż całkowitoliczbowa jednostka pozycji przez interpolowanie pikseli referencyjnych. Gdy tryb predykcji dla bieżącej jednostki predykcji jest trybem predykcji dla generowania przewidywanego bloku bez interpolowania pikseli referencyjnych, piksele referencyjne mogą nie być interpolowane. Filtr DC może generować przewidywany blok poprzez filtrowanie, gdy trybem predykcji dla bieżącego bloku jest tryb DC.
Zrekonstruowany blok lub obraz może być dostarczony do modułu 235 filtra. Moduł 235 filtra może zawierać filtr rozbioru bloku, moduł korekcji przesunięcia lub filtr ALF.
Informacje o tym, czy filtr rozbioru bloku jest stosowany względem odpowiedniego bloku lub obrazu i informacje o tym, który filtr jest stosowany spośród silnego filtra i słabego filtra, gdy filtr rozbioru bloku jest wykorzystywany, mogą być dostarczone z urządzenia kodującego wideo. Filtr rozbioru bloku urządzenia dekodującego wideo może mieć dostarczone informacje dotyczące filtrowania rozbioru bloku z urządzenia kodującego wideo i może wykonywać filtrowanie rozbioru bloku względem odpowiedniego bloku.
Moduł korekcji przesunięcia może wykonywać korekcję przesunięcia na zrekonstruowanym obrazie na podstawie typu korekcji przesunięcia i informacji o wartości przesunięcia zastosowanego względem obrazu w procesie kodowania.
Filtr ALF może być stosowany względem jednostki kodowania na podstawie informacji o tym, czy filtr ALF jest stosowany czy nie, i informacji o współczynniku ALF dostarczanych z urządzenia kodującego. Informacje o filtrze ALF mogą być zawarte i dostarczone w określonym zestawie parametrów.
Pamięć 240 może przechowywać zrekonstruowany obraz lub blok do wykorzystania jako obraz referencyjny lub blok referencyjny, i może dostarczać zrekonstruowany obraz do modułu wyjściowego.
PL 231 160 B1
Jak opisano powyżej, w przykładach użytecznych dla zrozumienia wynalazku, określenie „jednostka kodowania” jest stosowane jako jednostka kodowania i może być także wykorzystana jako jednostka dekodowania (jednostka dekodowania).
Jak zilustrowano na fig. 1 i 2, moduły przekształcania urządzenia kodującego i urządzenia dekodującego mogą wykonywać przekształcenie oparte na bloku, takie jak transformacja DST lub DCT, na bloku resztkowym (bloku przekształcenia).
W tym przypadku, jeżeli blok resztkowy jest generowany na podstawie przewidywanego bloku generowanego przez predykcję wewnątrzklatkową, przekształcenie może być określone zgodnie z trybem predykcji.
FIG. 3 schematycznie przedstawia tryb predykcji wykorzystywany dla predykcji wewnątrzklatkowej. Odnosząc się do FIG. 3, predykcja wewnątrzklatkowa jest przeprowadzana z wykorzystaniem dwóch trybów predykcji bezkierunkowej i 32 trybów predykcji kierunkowej.
Urządzenie kodujące i urządzenie dekodujące mogą wykonywać predykcję wewnątrzklatkową na bieżącym bloku z wykorzystaniem trybu predykcji wybranego spośród dwóch trybów predykcji bezkierunkowej, trybu płaskiego i trybu DC, oraz 32 trybów predykcji kierunkowej odpowiadających kierunkom przedstawionym na FIG. 3.
Gdy wykorzystywany jest tryb predykcji kierunkowej wewnątrzklatkowej, urządzenie kodujące i urządzenie dekodujące mogą wykonywać predykcję na bieżącym bloku w celu generowania przewidywanego bloku na podstawie próbek znajdujących się w odpowiednim kierunku wśród próbek sąsiednich dla bieżącego bloku.
Zatem, jak opisano powyżej, urządzenie kodujące i urządzenie dekodujące mogą określać sposób przekształcania na podstawie trybu predykcji wykorzystywanego do generowania przewidywanego bloku.
Natomiast, gdy zawarty jest rzadki sygnał, lub gdy sygnały poziome i pionowe mają różne charakterystyki, przekształcenie pionowe lub przekształcenie poziome może być pominięte lub oba przekształcenia mogą być pominięte dla sygnału, redukując w ten sposób złożoność przetwarzania w urządzeniu dekodującym i poprawiając wydajność kodowania.
Dla urządzenia kodującego, tryb pomijania przekształcenia (TSM) jest sposobem zwiększania wydajności kodowania przez wykonanie wszystkich 2-wymiarowych (2D) przekształceń, pomijając przekształcenie pionowe lub przekształcenie poziome, lub pomijając zarówno przekształcenie poziome, jak i przekształcenie pionowe.
Wśród trybów pomijania przekształcenia, TS0 jest trybem wykonywania przekształcenia 2D na bloku przekształcenia. TS1 jest trybem wykonywania przekształcenia tylko na wierszach w bloku przekształcenia (przekształcenie na wierszach), a TS2 jest trybem wykonywania przekształcenia tylko na kolumnach w bloku przekształcenia (przekształcenie na kolumnach). TS3 jest trybem bez wykonywania ani przekształcenia na wierszach (przekształcenia poziomego), ani przekształcenia na kolumnach (przekształcenia pionowego).
Dla urządzenia dekodującego, tryb pomijania przekształcenia jest sposobem wykonywania wszystkich przekształceń odwrotnych 2D, pomijania pionowego przekształcenia odwrotnego lub poziomego przekształcenia odwrotnego, lub pomijania zarówno poziomego, jak i pionowego przekształcenia odwrotnego.
Na przykład, w procesie dekodowania, wśród trybów pomijania przekształcenia, TS0 jest trybem wykonywania przekształcenia odwrotnego 2D na bloku przekształcenia. TS1 jest trybem wykonywania przekształcenia odwrotnego tylko na wierszach w bloku przekształcenia (przekształcenie odwrotne na wierszach), a TS2 jest trybem wykonywania przekształcenia odwrotnego tylko na kolumnach w bloku przekształcenia (przekształcenie odwrotne na kolumnach). TS3 jest trybem bez wykonywania ani przekształcenia odwrotnego na wierszach (poziomego przekształcenia odwrotnego), ani przekształcenia odwrotnego na kolumnach (pionowego przekształcenia odwrotnego).
FIG. 4 schematycznie przedstawia tryb pomijania przekształcenia.
Gdy wykorzystywany jest tryb TS0 400 w urządzeniu kodującym, przekształcenie 2D jest stosowane względem bloku przekształcenia. W tym przypadku, gdy wykorzystywany jest tryb TS0 400, przekształcenie poziome może być wykonane przed przekształceniem pionowym lub przekształcenie pionowe może być wykonane przed przekształceniem poziomym. Gdy wykorzystywany jest tryb TS1 420, przekształcenie poziome jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb TS2 440, przekształcenie pionowe jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb
PL 231 160 B1
TS3 460, na bloku przekształcenia nie jest wykonywane ani przekształcenie poziome, ani przekształcenia pionowe.
Gdy wykorzystywany jest tryb TS0 400 w urządzeniu dekodującym, przekształcenie odwrotne 2D jest stosowane względem bloku przekształcenia. W tym przypadku, gdy wykorzystywany jest tryb TSO 400, poziome przekształcenie odwrotne może być wykonane przed pionowym przekształceniem odwrotnym lub pionowe przekształcenie odwrotne może być wykonane przed poziomym przekształceniem odwrotnym. Gdy wykorzystywany jest tryb TS1 420, poziome przekształcenie odwrotne jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb TS2 440, pionowe przekształcenie odwrotne jest wykonywane na bloku przekształcenia. Gdy wykorzystywany jest tryb TS3 460, na bloku przekształcenia nie jest wykonywane ani poziome przekształcenie odwrotne, ani pionowe przekształcenie odwrotne.
Tabela 1 ilustruje słowo kodowe przydzielone do każdego trybu w trybach pomijania przekształcenia.
[T a b e l a 1]
TSM Przekształcenie na wierszach Przekształcenie na kolumnach Słowo kodowe Opis
TS0 O O 1 Przekształcenie 2D
TS1 O - 01 Przekształcenie 1D
TS2 - O 001 Przekształcenie 1D
TS3 - - 000 Bez przekształcenia
Gdy stosowany jest tryb pomijania przekształcenia, skalowanie może być wykonane bez zmiany lub modyfikowania macierzy kwantyzacji.
Równanie 1 ilustruje przykład skalowania, które ma być wykonane przez urządzenie kodujące i urządzenie dekodujące [Równanie 1]
Y = (X - skala + przesunięcie) >> przemieszczenie
W równaniu 1, X jest docelowym parametrem skalowania, a Y jest wartością skalowanego parametru. Współczynnik operacji przemieszczenia (przemieszczenie) może być adaptacyjnie określony w urządzeniu kodującym lub może być określony wcześniej.
Współczynnik skalowania (skala) jest zależny od rozmiaru jednostki TU i może być określony na podstawie rozmiaru jednostki TU. Tabela 2 ilustruje współczynnik skalowania zgodnie z rozmiarem bloku (na przykład, jednostki TU).
[T a b e l a 2]
N 4 8 16 32
Skala 128 181 256 362
Odnosząc się do tabeli 2, współczynnik skalowania może być określony zgodnie z rozmiarem bloku (NxN), na przykład, współczynnikiem skalowania dla bloku 4x4 jest 128, współczynnikiem skalowania dla bloku 8x8 jest 181, współczynnikiem skalowania dla bloku 16x16 jest 256, a współczynnikiem skalowania dla bloku 32x32 jest 362.
Mimo że w powyższym opisie stosowany jest tryb pomijania przekształcenia na podstawie trybu predykcji wewnątrzklatkowej, niniejszy wynalazek nie jest do tego ograniczony, a tryb pomijania przekształcenia może być także zastosowany w predykcji międzyklatkowej.
Tryb pomijania przekształcenia może być zastosowany na podstawie wykorzystanego trybu predykcji wewnątrzklatkowej, gdy stosowana jest predykcja wewnątrzklatkowa, natomiast tryb pomijania przekształcenia może być zastosowany na podstawie kształtu bloku, gdy stosowana jest predykcja międzyklatkowa.
Kształtami bloku, względem których predykcja międzyklatkowa może być zastosowana, są: kwadratowy blok 2Nx2N, blok minimalnych rozmiarów NxN, i asymetryczne bloki 2NxN, Nx2N, 2NxnU, 2NxnD, nLx2N i nRx2N, a tryb pomijania przekształcenia może być zastosowany na podstawie kształtu bloku.
Tabela 3 ilustruje tryby pomijania przekształcenia możliwe do zastosowania w predykcji międzyklatkowej.
PL 231 160 B1 [T a b e l a 3]
TSM Przekształcenie na wierszach Przekształcenie na kolumnach Słowo kodowe Opis
TS0 O O 1 Przekształcenie 2D
TS1 O - 01 Przekształcenie 1D
TS2 - O 001 Przekształcenie 1D
TS3 - - 000 Bez przekształcenia
Natomiast, po przekształceniu bloku przekształcenia, inne przekształcenie może być stosowane względem dziedziny niskiej częstotliwości, które dla ułatwienia jest określane jako drugie przekształcenie. Na przykład, po zastosowaniu przekształcenia, transformacja DST może być stosowana względem dziedziny niskiej częstotliwości przez każdy blok 4x4 w celu zwiększenia wydajności.
Zastosowana transformacja DST jako drugie przekształcenie może być transformacją DST 2D, poziomą transformacją DST lub pionową transformacją DST zgodnie z trybami predykcji wewnątrzklatkowej zilustrowanymi na FIG. 3. Tabela 4 ilustruje rodzaje transformacji DST możliwe do zastosowania zgodnie z trybami predykcji wewnątrzklatkowej.
T a b e l a 4
IntraPred- Mode 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
horizTrType 0 1 0 1 1 0 0 1 1 1 1 1 0 0 1 1 1 1
vertTrType 1 0 0 1 1 1 1 1 0 0 1 1 1 1 1 1 0 0
IntraPred- Mode 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
horizTrType 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1
vertTrType 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1
Odnosząc się do tabeli 4, określone jest, czy należy wykonać poziomą transformację DST (horizTrType=1), czy pionową transformację DST (vertTrType=1) na podstawie trybu predykcji wewnątrzklatkowej.
Mimo że tabela 4 ilustruje, że to, czy należy wykonać poziomą transformację DST, czy pionową transformację DST jest określone na podstawie trybu predykcji wewnątrzklatkowej, to zarówno pionowa transformacja DST, jak i pozioma transformacja DST mogą być zastosowane przez bloki 4x4 niezależnie od trybów predykcji wewnątrzklatkowej.
Natomiast, gdy stosowany jest tryb pomijania przekształcenia, kwestię może stanowić to, jak zastosować drugie przekształcenie. W tym przypadku, drugie przekształcenie może być wykonane na podstawie zastosowanego trybu pomijania przekształcenia.
Na przykład, transformacja DST w drugim przekształceniu może być wykonana w ten sam sposób przekształcania, jak w trybie pomijania przekształcenia. W tym przypadku, jako przykład tego samego sposobu przekształcania jak został wykorzystany w trybie pomijania przekształcenia (TSM), może być rozważony kierunek przekształcenia. W szczególności, gdy tryb przekształcenia 2D TS0 jest stosowany jako tryb pomijania przekształcenia, transformacja DST 2D może być zastosowana jako drugie przekształcenie. Gdy przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia, pozioma transformacja DST może być zastosowana jako drugie przekształcenie. Gdy przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia, pionowa transformacja DST może być zastosowana jako drugie przekształcenie. Gdy TS3 jest stosowane, to znaczy, gdy nie jest stosowane ani przekształcenie poziome, ani przekształcenie pionowe, drugie przekształcenie może nie być zastosowane.
PL 231 160 B1
T a b e l a 5 ilustruje typ drugiego przekształcenia (tryb) zgodnie z TSM
TSM TS0 TS1 TS2 TS3
Drugie przekształcenie horizTrType=1 1 1 0 0
vertTrType=1 1 0 1 0
Mimo że zilustrowano drugie przekształcenie w predykcji wewnątrzklatkowej, niniejszy wynalazek nie jest do tego ograniczony, a drugie przekształcenie może być zastosowane w ten sam sposób w predykcji międzyklatkowej. Na przykład, gdy została wykonana predykcja międzyklatkowa, drugie przekształcenie może być także zastosowane na podstawie trybu pomijania przekształcenia zastosowanego względem odpowiedniego bloku. W szczególności, gdy tryb przekształcenia 2D TS0 jest stosowany jako tryb pomijania przekształcenia, transformacja DST 2D może być zastosowana jako drugie przekształcenie. Gdy przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia, pozioma transformacja DST może być zastosowana jako drugie przekształcenie. Gdy przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia, pionowa transformacja DST może być zastosowana jako drugie przekształcenie. Gdy TS3 jest stosowane, to znaczy, gdy nie jest stosowane ani przekształcenie poziome, ani przekształcenia pionowe, drugie przekształcenie może nie być stosowane.
FIG. 5 przedstawia sieć działań schematycznie ilustrującą proces kodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie zgodnie z przedstawionym przykładem.
Odnosząc się do FIG. 5, urządzenie kodujące może dzielić obraz wejściowy (S510). Obra z wejściowy może być podzielony na bloki, takie jak jednostki CU, PU i TU.
Urządzenie kodujące może wykonywać predykcję dla docelowego bloku przetwarzania, który jest bieżącym blokiem (S520). Urządzenie kodujące może wykonywać predykcję międzyklatkową lub predykcję wewnątrzklatkową dla bieżącego bloku w celu generowania przewidywanego bloku i generować blok resztkowy na podstawie przewidywanego bloku.
Urządzenie kodujące może kodować informacje predykcji (S530). Urządzenie kodujące może kodować informacje dotyczące ruchu, gdy predykcja międzyklatkowa jest stosowana i kodować informacje wskazujące tryb predykcji wewnątrzklatkowej, gdy predykcja wewnątrzklatkowa jest stosowana.
Urządzenie kodujące może przekształcać resztkowy sygnał i kodować przekształcony resztkowy sygnał (S540). Urządzenie kodujące może stosować tryb pomijania przekształcenia względem resztkowego sygnału i wykonywać drugie przekształcenie na podstawie trybu pomijania przekształcenia.
Urządzenie kodujące może określać informacje do transmisji (S550). Urządzenie kodujące może określać poprzez optymalizację przepływność-zniekształcenie (RDO), co transmitować spośród bloku resztkowego i współczynników przekształcenia.
W celu transmitowania współczynników przekształcenia, urządzenie kodujące może skanować współczynniki przekształcenia (S560). Współczynniki przekształcenia są przeorganizowywane poprzez skanowanie.
Urządzenie kodujące może kodować entropijnie skanowane współczynniki przekształcenia (S570). Urządzenie kodujące może transmitować kodowane entropijnie współczynniki przekształcenia jako strumień bitów.
W dalszej części opisu, proces kodowania zilustrowany na FIG. 5 jest opisany szczegółowo.
Urządzenie kodujące może dzielić obraz wejściowy (S510). Obraz wejściowy jest dzielony dla kodowania. Na przykład, bieżący obraz lub klatka może być dzielony na jednostki kodowania (CU).
Jedna jednostka kodowania wewnętrznego CU może zawierać wiele jednostek predykcji międzyklatkowej PU i posiadać wiele trybów predykcji PreMode. Na przykład, wiele trybów predykcji może obejmować tryb pomijania MODE_SKIP i tryb międzyklatkowy MODE_INTER. W trybie pomijania, predykcja może być wykonana dla bloku mającego tryb podziału PartMode w postaci PART_2Nx2N, bez dzielenia na mniejsze jednostki predykcji PU. Zatem, predykcja jest wykonywana z wykorzystaniem informacji o ruchu dotyczących sąsiedniego bloku jako informacji o ruchu przydzielonych do jednostki predykcji PU PART_2Nx2N, a resztkowy sygnał nie jest transmitowany.
W trybie międzyklatkowym, jednostka kodowania może zawierać cztery rodzaje podziałów jednostki predykcji, na przykład, PART_2Nx2N, PART_2NxN, PART_Nx2N i PART_NxN. W tym przypadku, urządzenie kodujące może sygnalizować, że tryb predykcji PreMode jest trybem międzyklatkowym MODE_INTER i informacje PartMode wskazujące urządzeniu dekodującemu, który jest to typ podziału spośród czterech typów.
PL 231 160 B1
Gdy jednostka kodowania jest podzielona na wiele jednostek predykcji, predykcja może być wykonana dla jednostki predykcji, która ma być aktualnie zakodowana (bieżący blok).
Urządzenie kodujące może wykonywać predykcję dla docelowego bloku predykcji, to znaczy dla bieżącego bloku (S520).
Gdy predykcja międzyklatkowa jest wykonywana dla bieżącego bloku lub bieżącej jednostki predykcji, urządzenie kodujące może wykonywać predykcję ruchu dla bieżącego bloku z wykorzystaniem poprzednich obrazów. Lub, gdy predykcja międzyklatkowa jest wykonywana dla bieżącego bloku lub bieżącej jednostki predykcji, urządzenie kodujące może wykonywać predykcję ruchu dla bieżącego bloku z wykorzystaniem klatek; lub poprzedniego i następnego obrazu; lub klatek. Informacje dotyczące ruchu obejmujące wektor ruchu i wykaz obrazów referencyjnych, itd. mogą być otrzymane przez predykcję ruchu. Gdy predykcja wewnątrzklatkowa jest wykonywana dla bieżącego bloku, urządzenie kodujące może wykonywać predykcję wewnątrzklatkową dla bieżącego bloku z wykorzystaniem próbek sąsiadujących z bieżącym blokiem i wyznaczać tryb predykcji wewnątrzklatkowej.
Informacje dotyczące bieżącej jednostki predykcji nie są transmitowane w swojej postaci, lecz wartość różnicowa względem przewidzianej wartości otrzymanej z sąsiednich bloków może być transmitowana, aby zwiększyć wydajność kompresji. W tym przypadku, w trybie pomijania, predykcja jest wykonywana z wykorzystaniem informacji o ruchu dotyczących sąsiedniego bloku jako informacji o ruchu dotyczących bieżącego bloku, ale wartość różnicowa nie jest transmitowana.
W trybie łączenia i trybie AMVP, predykcja jest wykonywana z wykorzystaniem informacji o ruchu dotyczących sąsiedniego bloku i wartość różnicowa (resztkowy sygnał) jest transmitowana.
FIG. 6 schematycznie przedstawia informacje o sąsiednim bloku dostępne w trybie pomijania, trybie łączenia i trybie AMVP.
W celu otrzymania przewidywanej wartości ruchu bieżącego bloku 600, urządzenie kodujące może utworzyć potencjalną listę łączenia i potencjalną listę AMVP. Potencjalne listy mogą być utworzone na podstawie potencjalnych bloków przestrzennych A0, A1, B0, B1 i B2 sąsiadujących z bieżącym blokiem 600 i odpowiedniego bloku we współumiejscowionym obrazie 610 jako tymczasowego potencjalnego bloku. W tym przypadku, tymczasowy potencjalny blok może być jednym spośród: C0, C3, BR i H. Na potencjalnej liście łączenia, potencjalne bloki A (A0 >A1), B (B0 >B1 >B2) i tymczasowy potencjalny blok mogą być rozpatrywane w kolejności. Na potencjalnej liście AMVP, potencjalne bloki mogą być rozpatrywane w tej samej kolejności jak w przypadku potencjalnej listy łączenia lub potencjalne bloki mogą być rozpatrywane w kolejności tymczasowego potencjalnego bloku, A (A0>A1) i B (B0>B1>B2).
Urządzenie kodujące może wykonywać predykcję dla bieżącego bloku z wykorzystaniem informacji o ruchu dotyczących potencjalnych bloków.
Gdy stosowany jest tryb łączenia, urządzenie kodujące wyznacza potencjalne łączenia na podstawie informacji o ruchu dotyczących bloków tymczasowo i przestrzennie sąsiadujących z bieżącym blokiem (na przykład, jednostką predykcji). Jeżeli potencjalny blok posiadający te same informacje o ruchu jak bieżący blok jest obecny wśród potencjalnych bloków, urządzenie kodujące transmituje znacznik wskazujący, że tryb łączenia jest wykorzystywany i indeks potencjalnego bloku zawierającego te same informacje dotyczące ruchu jak bieżący blok. Na przykład, w trybie łączenia, (i) urządzenie kodujące może wyznaczać dostępną tymczasową wartość predykcji wektora ruchu z wykorzystaniem wyznaczonego indeksu obrazu referencyjnego (refldxLX, X=0 lub 1). (ii) Urządzenie kodujące może utworzyć potencjalną listę łączenia (MergeCandList). (iii), gdy obecny jest potencjalny blok zawierający te same informacje dotyczące ruchu jak bieżący blok, urządzenie kodujące ustawia znacznik łączenia (Merge_flag) równy 1 i koduje indeks (Merge_Idx) dla potencjalnego bloku.
W trybie AMVP, urządzenie kodujące wyznacza potencjalne bloki AMVP na podstawie informacji o ruchu dotyczących bloków tymczasowo i przestrzennie sąsiadujących z bieżącym blokiem (na przykład, jednostką PU). (i) Urządzenie kodujące wyznacza potencjalne predyktory przestrzennego wektora ruchu (MVP) spośród sąsiednich bloków (na przykład, jednostek PU) dla bieżącego bloku. Sąsiednie bloki przedstawione na FIG. 6 mogą być wykorzystane do wyznaczenia potencjalnych przestrzennych wektorów ruchu. (ii) Urządzenie kodujące wyznacza tymczasowy potencjalny wektor ruchu współumiejscowionego bloku z wykorzystaniem indeksu obrazu referencyjnego (RefldxLX) otrzymanego w procesie oszacowania ruchu. (iii) Urządzenie kodujące tworzy listę MVP (mvpListLX). W tym przypadku, wektory ruchu mogą mieć priorytety w kolejności: © wektor ruchu tymczasowego współumiejscowionego bloku (mvLXCol), na przykład, współumiejscowiony blok może być jednym z odpowiednich bloków: C0, C3, BR i H z FIG. 6, © wektory ruchu sąsiadujących bloków po lewej stronie bieżącego bloku (mvLXA)
PL 231 160 B1 i ® wektory ruchu sąsiadujących bloków po górnej stronie bieżącego bloku (mvLXB), spośród dostępnych wektorów ruchu. W tym przypadku, dostępne bloki, takie jak współumiejscowiony blok, sąsiednie bloki po lewej stronie bieżącego bloku i sąsiednie bloki po górnej stronie bieżącego bloku, są zilustrowane powyżej na FIG. 6. (iv), gdy wiele wektorów ruchu ma tę samą wartość, urządzenie kodujące usuwa wektory ruchu innej niż wektor ruchu mający najwyższy priorytet wśród wektorów ruchu mających tę samą wartość z listy MVP. (v) Urządzenie kodujące ustawia optymalny MVP wśród potencjalnych wektorów ruchu na liście MVP (mvListLX) jako MVP dla bieżącego bloku. Optymalny MVP stanowi MVP potencjalnego bloku minimalizujący funkcję kosztu.
Natomiast, gdy tryb predykcji wewnątrzklatkowej jest stosowany, urządzenie kodujące wykonuje predykcję z wykorzystaniem próbek sąsiadujących z bieżącym blokiem. Urządzenie kodujące może określać optymalny tryb predykcji wewnątrzklatkowej z wykorzystaniem optymalizacji RDO. W trybie DC lub trybie płaskim, urządzenie kodujące może generować przewidywany blok dla bieżącego bloku z wykorzystaniem wartości piksela wyznaczonej na podstawie średniej wartości pikseli sąsiednich próbek lub wartości pikseli sąsiednich próbek niezależnie od kierunku sąsiednich próbek. Gdy wykorzystywany jest tryb kierunkowy, urządzenie kodujące może generować przewidywany blok dla bieżącego bloku z wykorzystaniem próbki w kierunku wskazanym przez tryb predykcji wewnątrzklatkowej dla bieżącego bloku.
Urządzenie kodujące może kodować informacje predykcji (S530).
W trybie łączenia, gdy potencjalny blok zawiera te same informacje dotyczące ruchu jak bieżący blok (na przykład, jednostka PU) wśród potencjalnych bloków łączenia, urządzenie kodujące wskazuje, że bieżący blok jest w trybie łączenia i transmituje znacznik łączenia wskazujący, że tryb łączenia jest wykorzystywany i indeks łączenia (Merge_Idx) wskazujący, który potencjalny blok jest wybrany spośród potencjalnych bloków łączenia. Urządzenie kodujące otrzymuje sygnał różnicowy (resztkowy sygnał) między bieżącym blokiem i blokiem przewidywanym przez tryb łączenia po kompensacji ruchu. Gdy nie występuje resztkowy sygnał do transmisji, urządzenie kodujące może transmitować informacje wskazujące, że wykorzystywany jest tryb pomijania łączenia.
W trybie AMVP, urządzenie kodujące określa potencjalny blok minimalizujący funkcję kosztu spośród potencjalnych bloków AMVP przez porównywanie informacji wektora ruchu potencjalnych bloków AMVP i informacji wektora ruchu bloku, który ma być aktualnie zakodowany. Urządzenie kodujące otrzymuje wartość różnicową w informacjach dotyczących ruchu między bieżącym blokiem i potencjalnym blokiem minimalizującym funkcję kosztu, i resztkowy sygnał przez kompensację ruchu z wykorzystaniem potencjalnego bloku AMVP. Urządzenie kodujące koduje entropijnie różnicę wektora ruchu między wektorem ruchu bieżącego bloku (na przykład, jednostki predykcji) i wektorem ruchu potencjalnego bloku (optymalnego predyktora) minimalizującego funkcję kosztu.
Gdy wykorzystywana jest predykcja wewnątrzklatkowa, urządzenie kodujące uzyskuje resztkowy sygnał jako różnicę między bieżącym blokiem i przewidywanym blokiem generowanym z wykorzystaniem trybu predykcji wewnątrzklatkowej. Urządzenie kodujące może kodować entropijnie resztkowy sygnał. Urządzenie kodujące może także kodować informacje wskazujące, że stosowany jest tryb predykcji wewnątrzklatkowej.
Jak opisano powyżej, urządzenie kodujące może przekształcać i kodować resztkowy sygnał generowany za pomocą predykcji (S540). Urządzenie kodujące może wyznaczać resztkowy sygnał przez otrzymywanie różnicy między wartością piksela bieżącego bloku i wartością piksela przewidywanego bloku z pikselem jako jednostką.
Urządzenie kodujące może przekształcać i kodować generowany resztkowy sygnał. W tym przypadku, dostępnymi jądrami przekształcania i kodowania mogą być bloki 2x2, 4x4, 8x8, 16x16, 32x32 i 64x64, wśród których może być wcześniej ustalone z góry określone jądro kodowania jako jądro do wykorzystania dla przekształcenia.
Gdy wykorzystywana jest predykcja wewnątrzklatkowa, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie kierunku trybu predykcji wewnątrzklatkowej. Mimo że powyższy opis ilustruje, że tryb pomijania przekształcenia jest określony zgodnie z kierunkiem trybu predykcji wewnątrzklatkowej, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie optymalizacji RDO i może sygnalizować informacje o określonym trybie pomijania przekształcenia. W tym przypadku, liczba potencjalnych trybów pomijania przekształcenia może być określona inaczej zgodnie z kierunkami trybów predykcji wewnątrzklatkowej. Ponadto, informacje wskazujące tryby pomijania przekształcenia mogą być kodowane z wykorzystaniem różnych słów kodowych na p odstawie kierunków trybów predykcji wewnątrzklatkowej.
PL 231 160 B1
Gdy wykorzystywana jest predykcja międzyklatkowa, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie kształtu bieżącego bloku (na przykład, jednostki predykcji). Mimo że powyższy opis ilustruje, że tryb pomijania przekształcenia jest określony na podstawie kształtu bieżącego bloku, urządzenie kodujące może określać tryb pomijania przekształcenia na podstawie optymalizacji RDO i może sygnalizować informacje o określonym trybie pomijania przekształcenia. W tym przypadku, liczba potencjalnych trybów pomijania przekształcenia może być określona inaczej na podstawie kształtów bieżącego bloku. Ponadto, informacje wskazujące tryby pomijania przekształcenia mogą być kodowane z wykorzystaniem różnych słów kodowych na podstawie kształtów bieżącego bloku.
Urządzenie kodujące może wykonywać przekształcenie 2D, przekształcenie 1D (przekształcenie na kolumnach i przekształcenie na wierszach) lub pomijanie przekształcenia zgodnie z trybem pomijania przekształcenia.
Natomiast, ten sam tryb pomijania przekształcenia jak dla składowej jasności może być stosowany względem składowej chrominancji.
Po zastosowaniu trybu pomijania przekształcenia, urządzenie kodujące może wykonywać drugie przekształcenie na podstawie zastosowanego trybu pomijania przekształcenia. Drugie przekształcenie może być wykonywane przez stosowanie transformacji DST względem każdego bloku 4x4. Urządzenie kodujące określa typ drugiego przekształcenia na podstawie trybu pomijania przekształcenia i stosuje określony typ drugiego przekształcenia względem dziedziny niskiej częstotliwości. Na przykład, urządzenie kodujące może wykonywać transformację DST w dziedzinie niskiej częstotliwości z wykorzystaniem bloku o rozmiarze 4x4.
Jako typ drugich sposobów przekształcania określony zgodnie z trybami pomijania przekształcenia, jak opisano powyżej, transformacja DST 2D jest stosowana jako drugie przekształcenie, gdy tryb przekształcenia 2D TS0 jest stosowany jako tryb pomijania przekształcenia; pozioma transformacja DST jest stosowana jako drugie przekształcenie, gdy przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia; pionowa transformacja DST jest stosowana jako drugie przekształcenie, gdy przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia; i drugie przekształcenie może nie być stosowane, gdy TS3 jest stosowane, to znaczy, gdy nie jest stosowane ani przekształcenie poziome, ani przekształcenia pionowe.
Natomiast, współczynnik przekształcenia C dla bloku n x n może być określone przez równanie 2. [Równanie 2]
C(n, n) = T(n, n) x B(n, n) x T(n, n)T
W równaniu 2, T jest macierzą przekształcenia, a B jest blokiem resztkowym.
Urządzenie kodujące kwantyzuje współczynniki przekształcenia.
Urządzenie kodujące może określać informacje do transmisji (S550). Urządzenie kodujące może określać, co będzie transmitować spośród resztkowego sygnału i współczynników przekształcenia za pomocą optymalizacji przepływność-zniekształcenie (RDO). Jeżeli resztkowy sygnał jest mały, gdy predykcja jest prawidłowo wykonana, urządzenie kodujące może transmitować resztkowy sygnał w jego postaci. Alternatywnie, urządzenie kodujące może transmitować informacje, które minimalizują koszt przez porównanie kosztów przed i po przekształceniu i kodowaniu. Gdy określone są informacje do transmisji, urządzenie kodujące może sygnalizować typ określonych informacji, to znaczy, czy określone informacje stanowią resztkowy sygnał czy współczynniki przekształcenia.
W celu transmitowania współczynników przekształcenia, urządzenie kodujące może skanować współczynniki przekształcenia (S560). Współczynniki przekształcenia są przeorganizowywane poprzez skanowanie.
Urządzenie kodujące może kodować entropijnie skanowane współczynniki przekształcenia (S570). Urządzenie kodujące może transmitować kodowane entropijnie współczynniki przekształcenia jako strumień bitów.
FIG. 7 przedstawia sieć działań schematycznie ilustrującą proces dekodowania przyjmujący tryb pomijania przekształcenia i drugie przekształcenie zgodnie z przedstawionym przykładem.
Odnosząc się do FIG. 7, urządzenie dekodujące dekoduje entropijnie strumień bitów odebrany z urządzenia kodującego (S710). Urządzenie dekodujące może wykonywać dekodowanie entropijne z wykorzystaniem odpowiedniego sposobu dla kodowania entropijnego stosowanego przez urządzenie kodujące.
PL 231 160 B1
Urządzenie dekodujące może przekształcać odwrotnie entropijnie dekodowane informacje (S720). Urządzenie dekodujące może skanować odwrotnie entropijnie dekodowane inform acje w celu generowania dwuwymiarowego bloku.
Urządzenie dekodujące wykonuje predykcję dla bieżącego bloku (na przykład, jednostki PU) (S730). Urządzenie dekodujące może generować przewidywany blok dla bieżącego bloku zgodnie ze sposobem predykcji wykorzystywanym dla urządzenia kodującego.
Urządzenie dekodujące może generować zrekonstruowany sygnał dla bieżącego bloku (S740). Urządzenie dekodujące może dodawać przewidywany blok i blok resztkowy w celu rekonstruowania bieżącego bloku.
W dalszej części opisu, proces dekodowania zilustrowany na fig. 7 jest szczegółowo opisany.
Na początku, urządzenie dekodujące dekoduje entropijnie strumień bitów odebrany z urządzenia kodującego (S710). Urządzenie dekodujące może otrzymywać, z odebranego strumienia bitów, typ bloku dla bieżącego bloku i informacje dotyczące trybu predykcji dla bieżącego bloku. Na przykład, gdy wykorzystywane jest kodowanie o zmiennej długości słowa (VLC) względem bieżącego bloku w kodowaniu entropijnym.
Urządzenie dekodujące może określić na podstawie typu informacji, czy transmitowane informacje dotyczące bieżącego bloku stanowią sygnały resztkowe czy współczynniki przekształcenia. Urządzenie dekodujące może otrzymywać informacje dotyczące resztkowego sygnału lub współczynników przekształcenia bieżącego bloku.
Urządzenie dekodujące może przekształcać odwrotnie entropijnie dekodowane informacje (S720). Urządzenie dekodujące może skanować odwrotnie entropijnie dekodowany resztkowy sygnał lub współczynnik przekształcenia w celu generowania dwuwymiarowego bloku.
Gdy predykcja wewnątrzklatkowa jest stosowana względem bieżącego bloku, urządzenie dekodujące może wyznaczać tryb pomijania przekształcenia na podstawie trybu predykcji wewnątrzklatkowej i wykonywać przekształcenie odwrotne zgodnie z wyznaczonym trybem pomijania przekształcenia. Gdy tryb pomijania przekształcenia jest określony niezależnie od trybu predykcji wewnątrzklatkowej (na przykład, określony na podstawie optymalizacji RDO), urządzenie dekodujące może dekodować informacje, odebrane z urządzenia kodującego, wskazujące tryb pomijania przekształcenia i wykonywać proces przekształcania odwrotnego zgodnie z trybem pomijania przekształcenia.
Gdy predykcja międzyklatkowa jest stosowana względem bieżącego bloku, urządzenie dekodujące może wyznaczać tryb pomijania przekształcenia na podstawie kształtu bieżącego bloku (na przykład, jednostki predykcji) i wykonywać przekształcenie odwrotne zgodnie z wyznaczonym trybem pomijania przekształcenia. Gdy tryb pomijania przekształcenia jest określony niezależnie od kształtu bieżącego bloku (na przykład, określony na podstawie optymalizacji RDO), urządzenie dekodujące może dekodować informacje, odebrane z urządzenia kodującego, wskazujące tryb pomijania przekształcenia i wykonywać przekształcenie odwrotne zgodnie z informacjami odebranymi z urządzenia kodującego.
Te same informacje jak informacje wykorzystywane dla składowej jasności mogą być ponownie wykorzystane do określania trybu pomijania przekształcenia dla składowej chrominancji.
Po zastosowaniu trybu pomijania przekształcenia, urządzenie dekodujące może wykonywać drugie przekształcenie odwrotne na podstawie trybu pomijania przekształcenia zastosowanego względem bieżącego bloku. Drugie przekształcenie odwrotne może być wykonywane przez zastosowanie odwrotnej transformacji DST względem każdego bloku 4x4. Urządzenie dekodujące określa typ drugiego sposobu odwrotnego przekształcania na podstawie trybu pomijania przekształcenia i stosuje określony typ drugiego przekształcenia odwrotnego względem dziedziny niskiej częstotliwości. Na przykład, urządzenie dekodujące może wykonywać odwrotną transformację DST w dziedzinie niskiej częstotliwości z wykorzystaniem bloku o rozmiarze 4x4.
Jako typ drugiego przekształcenia odwrotnego określony zgodnie z trybami pomijania przekształcenia, odwrotna transformacja DST 2D jest stosowana jako drugie przekształcenie odwrotne, gdy odwrotne przekształcenie 2D TS0 jest stosowane jako tryb pomijania przekształcenia; odwrotna pozioma transformacja DST jest stosowana jako drugie przekształcenie odwrotne, gdy odwrotne przekształcenie poziome TS1 jest stosowane jako tryb pomijania przekształcenia; odwrotna pionowa transformacja DST jest stosowana jako drugie przekształcenie odwrotne, gdy odwrotne przekształcenie pionowe TS2 jest stosowane jako tryb pomijania przekształcenia; i drugie przekształcenie odwrotne może nie być stosowane, gdy TS3 jest stosowane jako tryb pomijania przekształcenia, to znaczy, gdy nie jest stosowane ani odwrotne przekształcenie poziome, ani odwrotne przekształcenie pionowe.
PL 231 160 B1
Gdy transmitowany sygnał jest resztkowym sygnałem, urządzenie dekodujące może generować blok resztkowy na podstawie resztkowego sygnału.
Gdy transmitowany sygnał jest współczynnikiem przekształcenia, urządzenie dekodujące może generować blok współczynnika przekształcenia na podstawie współczynnika przekształcenia. Urządzenie dekodujące może dekwantyzować i przekształcać odwrotnie blok współczynnika przekształcenia w celu wyznaczenia bloku resztkowego.
Równanie 3 ilustruje przykład przekształcenia odwrotnego stosowanego względem bieżącego bloku współczynnika przekształcenia.
[Równanie 3]
B(n, n) = T(n, n) x C(n, n) x T(n, n)T
W równaniu 3, każdy współczynnik jest taki sam, jak opisano powyżej w równaniu 2.
Urządzenie dekodujące wykonuje predykcję dla bieżącego bloku (na przykład, jednostki predykcji) (S730).
Nawet jeżeli informacje transmitowane z urządzenia kodującego wskazują, że tryb predykcji jest trybem pomijania (PredMode=MODE_SKIP), urządzenie dekodujące może otrzymywać wektor ruchu (mvLX) i indeks obrazu referencyjnego za pomocą trybu łączenia, gdy znacznik łączenia ma wartość wynoszącą 1.
Urządzenie dekodujące może wyznaczać potencjalne bloki łączenia spośród bloków (na przykład, jednostek predykcji) sąsiadujących z bieżącym blokiem (na przykład, jednostką predykcji). Ponadto, urządzenie dekodujące może wyznaczać indeks obrazu referencyjnego (refldxLX) tak, aby otrzymać tymczasowy potencjalny blok łączenia. Potencjalne bloki łączenia zostały zilustrowane na FIG. 6.
Urządzenie dekodujące wyznacza dostępną tymczasową wartość predyktora wektora ruchu (MUP) z wykorzystaniem wyznaczonego indeksu obrazu referencyjnego.
Gdy liczba potencjalnych bloków (NumMergeCand) na potencjalnej liście łączenia (MergeCandList) wynosi 1, urządzenie dekodujące może ustawić indeks łączenia (Merge_Idx) równy 1. W innym przypadku, urządzenie dekodujące może ustawić indeks łączenia równy wartości indeksu odebranego z urządzenia kodującego.
Urządzenie dekodujące może wyznaczać wektor ruchu (mvLX) potencjalnego bloku łączenia wskazanego przez indeks łączenia i indeks obrazu referencyjnego (refldxLX), i wykonywać kompensację ruchu z wykorzystaniem wyznaczonego wektora ruchu i indeksu obrazu referencyjnego.
Gdy stosowany jest tryb AMVP, urządzenie dekodujące może wyznaczać indeks obrazu referencyjnego (refldxLX) bieżącego bloku (na przykład, jednostki predykcji).
Urządzenie dekodujące może wyznaczać wartość predyktora wektora ruchu (MVP) z wykorzystaniem indeksu obrazu referencyjnego.
W tym celu, urządzenie dekodujące może wyznaczać potencjalne przestrzenne wektory ruchu (MVP) na podstawie bloków (na przykład, jednostek predykcji) sąsiadujących z bieżącym blokiem. Urządzenie dekodujące może także wyznaczać tymczasowy predyktor wektora ruchu (MVP) współumiejscowionego bloku wskazanego przez indeks obrazu referencyjnego. Urządzenie dekodujące może tworzyć listę MVP (mvpListLX). W tym przypadku, wektory ruchu mogą mieć priorytety w kolejności: © wektor ruchu tymczasowego współumiejscowionego bloku (mvLXCol), na przykład, tymczasowy współumiejscowiony blok może być jednym z odpowiednich bloków: C0, C3, BR i H na FIG. 6, ®) wektory ruchu sąsiadujących bloków po lewej stronie bieżącego bloku (mvLXA) i ® wektory ruchu sąsiadujących bloków po górnej stronie bieżącego bloku (mvLXB) spośród dostępnych wektorów.
Gdy wiele wektorów ruchu ma tę samą wartość, urządzenie dekodujące może usuwać z listy MVP wektory ruchu inne niż wektor ruchu mający najwyższy priorytet spośród wektorów ruchu mających tę samą wartość.
Gdy liczba (NumMVPCand(LX)) potencjalnych MVP na liście MVP wynosi 1, urządzenie dekodujące może ustawić indeks mvpldx równy 1. Gdy liczba potencjalnych MVP wynosi 2 lub więcej, urządzenie dekodujące może ustawić indeks mvpldx równy wartości indeksu odebranej z urządzenia kodującego. Urządzenie dekodujące umieszcza wektor ruchu wskazany przez indeks mvpldx spośród potencjalnych MVP na liście mvpListLX jako wartość predyktora wektora ruchu mvpLX.
Urządzenie dekodujące może wyznaczać wektor ruchu dla bieżącego bloku z wykorzystaniem równania 4.
PL 231 160 B1 [Równanie 4] mvLX[0] = mvdLX[0] + mvpLX[0] mvLX[l] = mvdLX[l] + mvpLX[1]
W równaniu 4, mvLX[0] jest składową x wektora ruchu dla bieżącego bloku, mvdLX[0] jest składową x wartości różnicowej wektora ruchu dla bieżącego bloku, a mvpLX[0] jest składową x wartości predyktora wektora ruchu dla bieżącego bloku. mvLX[1] jest składową y wektora ruchu dla bieżącego bloku, mvdLX[1] jest składową y wartości różnicowej wektora ruchu dla bieżącego bloku, a mvpLX[1] jest składową y wartości predyktora wektora ruchu dla bieżącego bloku.
Natomiast, gdy stosowana jest predykcja wewnątrzklatkowa, urządzenie dekodujące może generować przewidywany blok dla bieżącego bloku na podstawie sąsiednich próbek z wykorzystaniem trybu predykcji wewnątrzklatkowej dla bieżącego bloku.
Urządzenie dekodujące może generować zrekonstruowany sygnał dla bieżącego bloku (S740). Gdy stosowana jest predykcja międzyklatkowa, urządzenie dekodujące może generować przewidywany blok z wykorzystaniem wyznaczonego wektora ruchu i dodawać przewidywany blok i blok resztkowy w celu rekonstruowania bieżącego bloku. Gdy stosowana jest predykcja wewnątrzklatkowa, urządzenie dekodujące może także dodać przewidywany blok i blok resztkowy w celu rekonstruowania bieżącego bloku jak opisano.
Mimo że sposoby zostały opisane przez ciąg etapów lub bloków na podstawie sieci działań we wcześniej wspomnianych przykładach wykonania, niniejszy wynalazek nie jest ograniczony do wyżej wspomnianej sekwencji etapów. Niektóre etapy mogą być wykonane w innej kolejności niż kolejność opisana powyżej lub w tym samym czasie. Ponadto, wspomniane wyżej przykłady wykonania obejmują przykłady różnych aspektów. Na przykład, zilustrowane przykłady wykonania mogą być uzyskane w różnych kombinacjach w zakresie niniejszego wynalazku. Znawcy z dziedziny zauważą, że można dokonać zmian, modyfikacji i alternatyw w tych przykładach wykonania bez odchodzenia od zasad i istoty wynalazku, którego zakres jest określony w dołączonych zastrzeżeniach i ich ekwiwalentach.

Claims (6)

  1. Zastrzeżenia patentowe
    1. Sposób dekodowania sygnału wideo, znamienny tym, że obejmuje:
    otrzymywanie, przez moduł (210) dekodowania entropijnego, współczynników resztkowych dotyczących bieżącego bloku oraz wskaźnika pomijania przekształcenia dla bieżącego bloku z sygnału wideo, przy czym wskaźnik pomijania przekształcenia określa, czy przekształcenie odwrotne jest pomijane dla bieżącego bloku, przy czym resztkowe współczynniki są kwantyzowane odwrotnie przez moduł (220) dekwantyzacji (S710); i otrzymywanie, przez moduł (225) przekształcenia odwrotnego, resztkowych próbek przez selektywne wykonywanie przekształcenia odwrotnego dla kwantyzowanych odwrotnie współczynników resztkowych bieżącego bloku na podstawie wskaźnika pomijania przekształcenia (S720), przy czym przekształcenie odwrotne jest wykonywane przez wykorzystanie jednego przekształcenia spośród dyskretnej transformacji kosinusowej (DCT) i dyskretnej transformacji sinusowej (DST).
  2. 2. Sposób według zastrz. 1, znamienny tym, że, gdy wskaźnik pomijania przekształcenia określa, że przekształcenie odwrotne jest pomijane dla bieżącego bloku, resztkowe próbki są otrzymywane przez skalowanie kwantyzowanych odwrotnie współczynników resztkowych przez z góry określoną wartość.
  3. 3. Sposób według zastrz. 2, znamienny tym, że skalowanie jest wykonywane przez wykorzystanie operacji przemieszczenia bitów.
  4. 4. Sposób według zastrz. 1, znamienny tym, że wskaźnik pomijania przekształcenia jest otrzymywany na podstawie rozmiaru jednostki przekształcenia, przy czym jednostka przekształcenia stanowi reprezentację jednostki, gdy przekształcenie odwrotne jest wykonywane dla bieżącego bloku.
  5. 5. Sposób według zastrz. 4, znamienny tym, że wskaźnik pomijania przekształcenia jest otrzymywany, gdy rozmiar jednostki przekształcenia jest równy rozmiarowi minimalnego bloku NxN.
  6. 6. Sposób według zastrz. 1, znamienny tym, że przekształcenie odwrotne obejmuje przekształcenie na wierszach bieżącego bloku i przekształcenie na kolumnach bieżącego bloku.
PL408821A 2011-10-18 2012-10-18 Sposób dekodowania sygnału wideo PL231160B1 (pl)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20110106624 2011-10-18
KR2011-0106624 2011-10-18
PCT/KR2012/008563 WO2013058583A1 (ko) 2011-10-18 2012-10-18 영상 부호화 방법, 영상 복호화 방법, 영상 부호화기 및 영상 복호화기

Publications (2)

Publication Number Publication Date
PL408821A1 PL408821A1 (pl) 2015-07-20
PL231160B1 true PL231160B1 (pl) 2019-01-31

Family

ID=48141128

Family Applications (1)

Application Number Title Priority Date Filing Date
PL408821A PL231160B1 (pl) 2011-10-18 2012-10-18 Sposób dekodowania sygnału wideo

Country Status (11)

Country Link
US (3) US10264283B2 (pl)
KR (10) KR102030718B1 (pl)
CN (19) CN107835420B (pl)
AU (5) AU2012326819B2 (pl)
BR (1) BR112014009449B1 (pl)
CA (2) CA2853002C (pl)
GB (3) GB2509670B (pl)
MX (4) MX2014004851A (pl)
PL (1) PL231160B1 (pl)
RU (10) RU2719377C2 (pl)
WO (1) WO2013058583A1 (pl)

Families Citing this family (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2559062B (en) * 2011-10-17 2018-11-14 Kt Corp Video decoding method using transform method selected from a transform method set
KR20140122673A (ko) * 2013-04-05 2014-10-20 삼성전자주식회사 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
JPWO2015053115A1 (ja) * 2013-10-11 2017-03-09 ソニー株式会社 復号装置および復号方法、並びに、符号化装置および符号化方法
US10321157B2 (en) 2013-10-18 2019-06-11 Lg Electronics Inc. Video decoding method and apparatus for decoding multi-view video
CN112584140B (zh) * 2014-11-27 2024-08-13 株式会社Kt 对视频信号进行解码或编码的方法
KR102294016B1 (ko) * 2014-12-05 2021-08-25 성균관대학교산학협력단 변환생략을 참조하는 디블록킹 필터링을 이용한 영상의 부호화/복호화 방법 및 이를 이용하는 장치
FR3032583B1 (fr) * 2015-02-06 2018-03-02 Orange Procede de codage d'une image numerique, procede de decodage, dispositifs, et programmes d'ordinateurs associes
US11477484B2 (en) * 2015-06-22 2022-10-18 Qualcomm Incorporated Video intra prediction using hybrid recursive filters
EP3340632B1 (en) * 2015-08-19 2021-08-11 LG Electronics Inc. Method and device for processing video signals
WO2017039501A1 (en) * 2015-09-01 2017-03-09 Telefonaktiebolaget Lm Ericsson (Publ) Spatial improvement of transform blocks
CN112929661B (zh) 2015-10-13 2023-04-21 三星电子株式会社 解码方法和编码方法
US9883137B2 (en) 2015-11-03 2018-01-30 Qualcomm Incorporated Updating regions for display based on video decoding mode
US11695958B2 (en) 2016-02-01 2023-07-04 Lg Electronics Inc. Method and apparatus for encoding/decoding video signal by using edge-adaptive graph-based transform
US20210195241A1 (en) * 2016-02-01 2021-06-24 Lg Electronics Inc. Method and device for performing transform using row-column transforms
EP3389270A4 (en) 2016-02-12 2019-02-27 Samsung Electronics Co., Ltd. BILDCODING DEVICE AND METHOD AND IMAGE DECODING METHOD AND DEVICE
JP2017158183A (ja) * 2016-02-29 2017-09-07 大学共同利用機関法人情報・システム研究機構 画像処理装置
US10904526B2 (en) * 2016-03-28 2021-01-26 Kt Corporation Method and apparatus for processing video signal
CN113810705B (zh) * 2016-04-29 2024-05-10 世宗大学校产学协力团 用于对图像信号进行编码和解码的方法和装置
JP6868786B2 (ja) * 2016-05-13 2021-05-12 ソニーグループ株式会社 画像処理装置および方法
US10735720B2 (en) * 2016-06-24 2020-08-04 Kt Corporation Method and apparatus for processing video signal
CN114401407A (zh) * 2016-06-24 2022-04-26 韩国电子通信研究院 用于基于变换的图像编码/解码的方法和设备
EP3484158A4 (en) * 2016-07-05 2019-12-25 KT Corporation VIDEO SIGNAL PROCESSING METHOD AND DEVICE
CN114363636B (zh) * 2016-07-05 2024-06-04 株式会社Kt 用于处理视频信号的方法和装置
CN117412042A (zh) * 2016-07-13 2024-01-16 韩国电子通信研究院 图像编码/解码方法和装置
KR102321394B1 (ko) * 2016-08-01 2021-11-03 한국전자통신연구원 영상 부호화/복호화 방법
US11638027B2 (en) 2016-08-08 2023-04-25 Hfi Innovation, Inc. Pattern-based motion vector derivation for video coding
WO2018037737A1 (ja) * 2016-08-24 2018-03-01 ソニー株式会社 画像処理装置、画像処理方法、及びプログラム
WO2018038554A1 (ko) * 2016-08-24 2018-03-01 엘지전자(주) 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치
CN117412037A (zh) 2016-08-31 2024-01-16 株式会社Kt 用于处理视频信号的方法和设备
KR102424419B1 (ko) * 2016-08-31 2022-07-22 주식회사 케이티 비디오 신호 처리 방법 및 장치
EP3522533A4 (en) * 2016-09-30 2019-09-11 Sony Corporation IMAGE PROCESSING APPARATUS AND METHOD
US10880564B2 (en) * 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
CN118474340A (zh) 2016-10-04 2024-08-09 有限公司B1影像技术研究所 图像数据编码/解码方法、介质和传输数据的方法
WO2018093184A1 (ko) * 2016-11-18 2018-05-24 주식회사 케이티 비디오 신호 처리 방법 및 장치
BR112019012707A2 (pt) * 2016-12-28 2019-11-19 Sony Corp aparelho e método de processamento de imagem.
US12063387B2 (en) * 2017-01-05 2024-08-13 Hfi Innovation Inc. Decoder-side motion vector restoration for video coding
WO2018143687A1 (ko) * 2017-02-01 2018-08-09 엘지전자(주) 행-열 변환을 이용하여 변환을 수행하는 방법 및 장치
US11405645B2 (en) * 2017-02-28 2022-08-02 Google Llc Transform kernel selection and entropy coding
CN110622511B (zh) * 2017-04-13 2022-04-15 Lg 电子株式会社 图像编码/解码方法及其设备
AU2018270853B2 (en) * 2017-05-17 2021-04-01 Kt Corporation Method and device for video signal processing
JP6770192B2 (ja) * 2017-06-01 2020-10-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、符号化方法、復号装置及び復号方法
KR102361010B1 (ko) * 2017-06-21 2022-02-09 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
KR102389869B1 (ko) 2017-07-04 2022-04-22 삼성전자주식회사 다중 코어 변환에 의한 비디오 복호화 방법 및 장치, 다중 코어 변환에 의한 비디오 부호화 방법 및 장치
TWI777907B (zh) * 2017-07-13 2022-09-11 美商松下電器(美國)知識產權公司 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體
BR112020002205A2 (pt) * 2017-08-22 2020-07-28 Panasonic Intellectual Property Corporation Of America codificador de imagem, decodificador de imagem, método de codificação de imagem e método de decodificação de imagem
WO2019076138A1 (en) 2017-10-16 2019-04-25 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR ENCODING
CN109922348B (zh) * 2017-12-13 2020-09-18 华为技术有限公司 图像编解码方法和装置
EP4376412A3 (en) * 2017-12-15 2024-07-17 LG Electronics Inc. Image coding method on basis of transformation and device therefor
MX2020006313A (es) 2017-12-15 2020-09-18 Lg Electronics Inc Metodo de codificacion de imagenes basado en transformacion secundaria no separable y dispositivo para el mismo.
CN115767086A (zh) 2017-12-21 2023-03-07 Lg电子株式会社 解码和编码设备、存储比特流的介质和数据发送设备
CN117834922A (zh) * 2018-01-17 2024-04-05 英迪股份有限公司 对视频进行解码或编码的方法和发送数据的方法
KR20190093172A (ko) * 2018-01-31 2019-08-08 가온미디어 주식회사 움직임 정보를 처리하는 영상 처리 방법, 그를 이용한 영상 복호화, 부호화 방법 및 그 장치
CN108416353B (zh) * 2018-02-03 2022-12-02 华中农业大学 基于深度全卷积神经网络的大田稻穗快速分割方法
US10567801B2 (en) * 2018-03-07 2020-02-18 Tencent America LLC Method and apparatus for video coding with primary and secondary transforms
JP2021519546A (ja) * 2018-03-29 2021-08-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 映像符号化のための候補変換セットの決定
US11665367B2 (en) * 2018-03-30 2023-05-30 Sony Corporation Image processing apparatus and method
WO2019194420A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 변환 인디케이터에 기반한 영상 코딩 방법 및 그 장치
US10999604B2 (en) * 2018-04-13 2021-05-04 Mediatek Inc. Adaptive implicit transform setting
US11297348B2 (en) * 2018-04-13 2022-04-05 Mediatek Inc. Implicit transform settings for coding a block of pixels
WO2019212230A1 (ko) * 2018-05-03 2019-11-07 엘지전자 주식회사 영상 코딩 시스템에서 블록 사이즈에 따른 변환을 사용하는 영상 디코딩 방법 및 그 장치
US10397603B1 (en) * 2018-05-08 2019-08-27 Tencent America LLC Method and apparatus for video coding
US10986340B2 (en) * 2018-06-01 2021-04-20 Qualcomm Incorporated Coding adaptive multiple transform information for video coding
ES2949998T3 (es) * 2018-06-03 2023-10-04 Lg Electronics Inc Método y dispositivo para procesar una señal de vídeo usando una transformada reducida
WO2019235891A1 (ko) 2018-06-08 2019-12-12 주식회사 케이티 비디오 신호 처리 방법 및 장치
KR102030384B1 (ko) 2018-06-19 2019-11-08 광운대학교 산학협력단 잔차 계수 부호화/복호화 방법 및 장치
KR101997681B1 (ko) * 2018-06-11 2019-07-08 광운대학교 산학협력단 양자화 파라미터 기반의 잔차 블록 부호화/복호화 방법 및 장치
US10638145B2 (en) * 2018-06-19 2020-04-28 Novatek Microelectronics Corp. Video encoding apparatus and operating method thereof
CN117499639A (zh) * 2018-06-27 2024-02-02 数字洞察力有限公司 图像编码/解码方法和用于发送图像信息的数据的方法
CN114845108A (zh) 2018-06-29 2022-08-02 抖音视界(北京)有限公司 查找表的更新:fifo、约束的fifo
CN110662059B (zh) 2018-06-29 2021-04-20 北京字节跳动网络技术有限公司 使用查找表存储先前编码的运动信息并用其编码后续块的方法和装置
WO2020003261A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Selection from multiple luts
WO2020003284A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and amvp
CN115134599A (zh) 2018-06-29 2022-09-30 抖音视界有限公司 更新查找表(lut)的条件
AU2018204775A1 (en) * 2018-06-29 2020-01-16 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
CN110662075B (zh) * 2018-06-29 2023-04-25 北京字节跳动网络技术有限公司 改进的时域运动矢量预测推导
KR20210024502A (ko) 2018-06-29 2021-03-05 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝
KR102646649B1 (ko) 2018-06-29 2024-03-13 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut에서의 모션 후보들의 검사 순서
WO2020003260A1 (en) * 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Boundary enhancement for sub-block
WO2020003270A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Number of motion candidates in a look up table to be checked according to mode
KR102496711B1 (ko) * 2018-07-02 2023-02-07 엘지전자 주식회사 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
JP7181395B2 (ja) 2018-07-02 2022-11-30 北京字節跳動網絡技術有限公司 イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測
KR20240133754A (ko) 2018-08-06 2024-09-04 엘지전자 주식회사 영상 코딩 시스템에서 컨스트럭티드 어파인 mvp 후보를 사용하는 어파인 움직임 예측에 기반한 영상 디코딩 방법 및 장치
CN112640460B (zh) * 2018-08-29 2024-05-03 华为技术有限公司 用于边界划分的装置及方法
KR102396112B1 (ko) * 2018-09-02 2022-05-10 엘지전자 주식회사 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치
CN115134592B (zh) * 2018-09-02 2024-04-26 Lg电子株式会社 用于编码或解码图像信号的设备及计算机可读记录介质
WO2020046091A1 (ko) * 2018-09-02 2020-03-05 엘지전자 주식회사 다중 변환 선택에 기반한 영상 코딩 방법 및 그 장치
CN114928745B (zh) * 2018-09-02 2024-04-19 Lg电子株式会社 信号编解码方法、计算机可读存储介质和数据传输方法
KR102432406B1 (ko) * 2018-09-05 2022-08-12 엘지전자 주식회사 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치
US10819979B2 (en) * 2018-09-06 2020-10-27 Tencent America LLC Coupled primary and secondary transform
CN117201786A (zh) 2018-09-11 2023-12-08 Lg电子株式会社 图像解码方法、图像编码方法和数据发送方法
TWI820211B (zh) 2018-09-12 2023-11-01 大陸商北京字節跳動網絡技術有限公司 取決於總數減去k的開始檢查hmvp候選的條件
US20210352326A1 (en) * 2018-09-19 2021-11-11 Electronics And Telecommunications Research Institute Method and device for encoding/decoding images, and recording medium for storing bitstream
MX2021003245A (es) * 2018-09-20 2021-05-12 Lg Electronics Inc Metodo de codificacion de nivel del factor de conversion y dispositivo del mismo.
WO2020071836A1 (ko) * 2018-10-05 2020-04-09 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
MX2021005504A (es) * 2018-11-08 2021-06-18 Guangdong Oppo Mobile Telecommunications Corp Ltd Metodo de codificacion/decodificacion de se?al de imagen y aparato para ello.
WO2020114291A1 (en) 2018-12-04 2020-06-11 Huawei Technologies Co., Ltd. Video encoder, video decoder, and corresponding method
CN111277840B (zh) * 2018-12-04 2022-02-08 华为技术有限公司 变换方法、反变换方法以及视频编码器和视频解码器
KR20230154085A (ko) 2018-12-17 2023-11-07 엘지전자 주식회사 고주파 제로잉을 기반으로 변환 계수 스캔 순서를 결정하는 방법 및 장치
US11323748B2 (en) * 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
CN113455001B (zh) 2018-12-27 2024-04-09 英迪股份有限公司 视频编码/解码方法和装置
WO2020143741A1 (en) 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Invoke of lut updating
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
CN109819250B (zh) * 2019-01-15 2020-09-25 北京大学 一种多核全组合方式的变换方法和系统
WO2020147772A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidates derivation
CN117793381A (zh) * 2019-02-01 2024-03-29 Lg电子株式会社 解码设备、编码设备和发送设备
WO2020171592A1 (ko) 2019-02-19 2020-08-27 엘지전자 주식회사 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치
CN113711593B (zh) * 2019-03-12 2024-08-23 弗劳恩霍夫应用研究促进协会 实现高效率的基于分区的帧内编码构思
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
WO2020198352A1 (en) * 2019-03-26 2020-10-01 Vid Scale, Inc. Content adaptive transform precision for video coding
US12113960B2 (en) 2019-04-15 2024-10-08 Lg Electronics Inc. Scaling list parameter-based video or image coding
AU2020258920B2 (en) * 2019-04-16 2023-06-29 Lg Electronics Inc. Transform in intra prediction-based image coding
CN117499641A (zh) * 2019-05-10 2024-02-02 北京字节跳动网络技术有限公司 用于视频处理的简化二次变换的有条件使用
CN113853791B (zh) 2019-05-19 2023-11-14 字节跳动有限公司 数字视频中的变换旁路编解码残差块
CA3141350A1 (en) * 2019-05-24 2020-12-03 Digitalinsights Inc. Video coding method and apparatus using adaptive parameter set
CN117336484A (zh) * 2019-06-06 2024-01-02 Lg电子株式会社 图像解码和编码设备及发送比特流的设备
CN117354521A (zh) 2019-06-07 2024-01-05 北京字节跳动网络技术有限公司 视频比特流中的简化二次变换的有条件信令
WO2020256389A1 (ko) * 2019-06-18 2020-12-24 엘지전자 주식회사 Bdpcm 기반 영상 디코딩 방법 및 그 장치
EP3989579A4 (en) * 2019-06-18 2023-06-21 Electronics and Telecommunications Research Institute PICTURE ENCODING/DECODING METHOD AND APPARATUS USING SECONDARY TRANSFORMATION AND RECORDING MEDIUM WITH BITSTREAM STORED THEREON
JP7280392B2 (ja) * 2019-06-19 2023-05-23 エルジー エレクトロニクス インコーポレイティド インター予測に基づく映像コーディング方法及び装置
US12010309B2 (en) * 2019-06-20 2024-06-11 Interdigital Ce Patent Holdings, Sas Lossless mode for versatile video coding
CN114375578A (zh) * 2019-07-10 2022-04-19 Lg电子株式会社 用于残差编码的图像解码方法及其设备
WO2021023151A1 (en) 2019-08-03 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Position based mode derivation in reduced secondary transforms for video
CN114450961A (zh) * 2019-08-08 2022-05-06 Lg 电子株式会社 基于变换的图像编译方法及设备
WO2021032045A1 (en) 2019-08-17 2021-02-25 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
EP4024860A4 (en) * 2019-08-31 2023-06-28 LG Electronics Inc. Method for decoding video using simplified residual data coding in video coding system and device therefor
CN114521326B (zh) * 2019-09-19 2024-07-26 数码士有限公司 使用缩放处理的视频信号处理方法及装置
CN114731434B (zh) 2019-09-21 2023-06-30 Lg电子株式会社 基于变换的图像编码方法及其装置
PL4017008T3 (pl) * 2019-09-21 2024-08-26 Lg Electronics Inc. Kodowanie obrazu oparte na przekształceniu
WO2021054783A1 (ko) * 2019-09-21 2021-03-25 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CN117459742A (zh) * 2019-09-21 2024-01-26 Lg电子株式会社 编码/解码设备及数据发送设备
KR20220045048A (ko) * 2019-09-21 2022-04-12 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CA3156071A1 (en) * 2019-09-25 2021-04-01 Lg Electronics Inc. METHOD AND APPARATUS FOR CODING/DECODING A SIGNALING IMAGE OF A RESIDUAL ENCODING METHOD USED TO ENCODE A BLOCK TO WHICH A BDPCM IS APPLIED, AND METHOD FOR TRANSMITTING BITSTREAM
JP7418561B2 (ja) * 2019-10-04 2024-01-19 エルジー エレクトロニクス インコーポレイティド 変換に基づく映像コーディング方法及びその装置
KR20220070024A (ko) * 2019-11-01 2022-05-27 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
WO2021096174A1 (ko) * 2019-11-11 2021-05-20 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US20210176468A1 (en) * 2019-12-06 2021-06-10 Qualcomm Incorporated Residual coding selection and low-level signaling based on quantization parameter
CN118540503A (zh) * 2020-02-27 2024-08-23 Lg电子株式会社 图像解码设备、图像编码设备和发送设备
CN113766225B (zh) * 2020-06-05 2023-02-28 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7656949B1 (en) * 2001-06-27 2010-02-02 Cisco Technology, Inc. Methods and apparatus for performing efficient inverse transform operations
KR100846769B1 (ko) * 2002-02-19 2008-07-16 삼성전자주식회사 고정 연산량을 갖는 동영상 부호화 방법 및 그 장치
KR100833228B1 (ko) * 2002-02-21 2008-05-28 삼성전자주식회사 고정 연산량을 갖는 동영상 부호화 방법 및 그 장치
US7760950B2 (en) 2002-09-26 2010-07-20 Ntt Docomo, Inc. Low complexity and unified transforms for video coding
JP3685780B2 (ja) * 2002-10-18 2005-08-24 三菱電機株式会社 ディジタル映像信号記録装置および記録方法並びに再生装置および再生方法
US7813574B2 (en) 2003-09-24 2010-10-12 Ntt Docomo, Inc. Low complexity and unified transforms for video coding
JP2005184042A (ja) * 2003-12-15 2005-07-07 Sony Corp 画像復号装置及び画像復号方法並びに画像復号プログラム
KR100621581B1 (ko) 2004-07-15 2006-09-13 삼성전자주식회사 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
KR20060007142A (ko) * 2004-07-19 2006-01-24 삼성전자주식회사 역변환 방법 및 그 장치
US20060104521A1 (en) 2004-11-15 2006-05-18 Shu-Wen Teng Image processing devices and methods
KR100794623B1 (ko) * 2005-06-20 2008-01-14 주식회사 픽스트리 가속화 프로세싱을 실시간으로 수행하는 디코더시스템의 작동방법
US7843995B2 (en) 2005-12-19 2010-11-30 Seiko Epson Corporation Temporal and spatial analysis of a video macroblock
KR100927733B1 (ko) * 2006-09-20 2009-11-18 한국전자통신연구원 잔여계수의 상관성에 따라 변환기를 선택적으로 이용한부호화/복호화 장치 및 그 방법
WO2008035842A1 (en) 2006-09-20 2008-03-27 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding using alternative converter according to the correlation of residual signal
US7957600B2 (en) * 2007-05-08 2011-06-07 Arris Group, Inc. Methods and systems for rate-distortion optimized quantization of transform blocks in block transform video coding
US8619853B2 (en) 2007-06-15 2013-12-31 Qualcomm Incorporated Separable directional transforms
JP2009111691A (ja) * 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US8576906B2 (en) * 2008-01-08 2013-11-05 Telefonaktiebolaget L M Ericsson (Publ) Adaptive filtering
KR101291196B1 (ko) 2008-01-25 2013-07-31 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP2009224854A (ja) 2008-03-13 2009-10-01 Toshiba Corp 画像符号化装置及び方法
EP2266318B1 (en) * 2008-03-19 2020-04-22 Nokia Technologies Oy Combined motion vector and reference index prediction for video coding
CN101252686B (zh) * 2008-03-20 2010-04-14 上海交通大学 基于交织预测的视频帧内无损编解码方法及系统
JP4748191B2 (ja) * 2008-07-30 2011-08-17 ソニー株式会社 動きベクトル検出装置、動きベクトル検出方法及びプログラム
KR20100020441A (ko) 2008-08-12 2010-02-22 엘지전자 주식회사 비디오 신호 처리 방법
KR101377660B1 (ko) * 2008-09-30 2014-03-26 에스케이텔레콤 주식회사 복수 개의 움직임 벡터 추정을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101458471B1 (ko) 2008-10-01 2014-11-10 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
KR101377527B1 (ko) * 2008-10-14 2014-03-25 에스케이 텔레콤주식회사 복수 개의 참조 픽처의 움직임 벡터 부호화/복호화 방법 및장치와 그를 이용한 영상 부호화/복호화 장치 및 방법
KR101567974B1 (ko) * 2009-01-05 2015-11-10 에스케이 텔레콤주식회사 블록 모드 부호화/복호화 방법 및 장치와 그를 이용한 영상부호화/복호화 방법 및 장치
EP2395755A4 (en) 2009-02-09 2015-01-07 Samsung Electronics Co Ltd VIDEO PROCESSING AND DEVICE WITH LOW-COMPLEX FREQUENCY CONVERSION AND VIDEO PROCESSING AND DEVICE
US8762441B2 (en) * 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9069713B2 (en) * 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US9635368B2 (en) 2009-06-07 2017-04-25 Lg Electronics Inc. Method and apparatus for decoding a video signal
US9100648B2 (en) 2009-06-07 2015-08-04 Lg Electronics Inc. Method and apparatus for decoding a video signal
CA2767617C (en) 2009-07-10 2018-03-20 British Broadcasting Corporation Hybrid open-loop/closed-loop compression of pictures
WO2011003480A1 (en) 2009-07-10 2011-01-13 British Broadcasting Corporation Hybrid open-loop/closed-loop compression of pictures
KR20110014000A (ko) 2009-08-04 2011-02-10 광운대학교 산학협력단 영상 데이터의 디블록킹 필터링 장치 및 방법과 이를 이용한 영상 복호화 장치 및 방법
KR101675116B1 (ko) 2009-08-06 2016-11-10 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US20110090954A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Video Codes with Directional Transforms
US8885714B2 (en) 2010-01-14 2014-11-11 Texas Instruments Incorporated Method and system for intracoding in video encoding
KR101768207B1 (ko) * 2010-01-19 2017-08-16 삼성전자주식회사 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치
RU2419246C1 (ru) * 2010-01-25 2011-05-20 Государственное образовательное учреждение высшего профессионального образования "Военная академия связи имени С.М. Буденного" Министерства обороны Российской Федерации Способ сжатия и восстановления неподвижных полутоновых видеоизображений
KR20120086232A (ko) 2011-01-25 2012-08-02 (주)휴맥스 율-왜곡 최적화를 위한 영상 부호화/복호화 방법 및 이를 수행하는 장치
EP2533539A2 (en) 2010-02-02 2012-12-12 Humax Co., Ltd. Image encoding/decoding method for rate-distortion optimization and apparatus for performing same
WO2011112239A1 (en) 2010-03-10 2011-09-15 Thomson Licensing Methods and apparatus for constrained transforms for video coding and decoding having transform selection
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
CN101867813B (zh) * 2010-04-23 2012-05-09 南京邮电大学 面向交互式应用的多视点视频编码方法
WO2011142279A1 (ja) * 2010-05-13 2011-11-17 シャープ株式会社 符号化装置、復号装置、およびデータ構造
US9510009B2 (en) 2010-05-20 2016-11-29 Thomson Licensing Methods and apparatus for adaptive motion vector candidate ordering for video encoding and decoding
US9172968B2 (en) * 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US9300970B2 (en) * 2010-07-09 2016-03-29 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding motion vector
AU2010357291B2 (en) 2010-07-15 2015-01-15 Kabushiki Kaisha Toshiba Image encoding method and image decoding method
EP3907999B1 (en) 2010-09-02 2023-11-22 LG Electronics, Inc. Inter prediction
US8885701B2 (en) 2010-09-08 2014-11-11 Samsung Electronics Co., Ltd. Low complexity transform coding using adaptive DCT/DST for intra-prediction
KR101719448B1 (ko) 2010-09-27 2017-03-23 엘지전자 주식회사 블록 분할 방법 및 복호화 장치
US9008175B2 (en) 2010-10-01 2015-04-14 Qualcomm Incorporated Intra smoothing filter for video coding
US9641846B2 (en) 2010-10-22 2017-05-02 Qualcomm Incorporated Adaptive scanning of transform coefficients for video coding
CN105847830B (zh) * 2010-11-23 2019-07-12 Lg电子株式会社 由编码装置和解码装置执行的间预测方法
US9288491B2 (en) 2010-12-13 2016-03-15 Electronics And Telecommunications Research Institute Method and device for determining reference unit
US9532066B2 (en) 2011-01-21 2016-12-27 Qualcomm Incorporated Motion vector prediction
JP5893570B2 (ja) 2011-01-28 2016-03-23 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像符号化方法および画像復号化方法
US20120218432A1 (en) * 2011-02-28 2012-08-30 Sony Corporation Recursive adaptive intra smoothing for video coding
US9288501B2 (en) 2011-03-08 2016-03-15 Qualcomm Incorporated Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
US10264276B2 (en) 2011-06-14 2019-04-16 Samsung Electronics Co., Ltd. Method and apparatus for encoding motion information and method and apparatus for decoding same
US9866859B2 (en) 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
JP5807402B2 (ja) 2011-06-15 2015-11-10 富士通株式会社 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム
US9693070B2 (en) 2011-06-24 2017-06-27 Texas Instruments Incorporated Luma-based chroma intra-prediction for video coding
GB2492333B (en) 2011-06-27 2018-12-12 British Broadcasting Corp Video encoding and decoding using transforms
US9756360B2 (en) * 2011-07-19 2017-09-05 Qualcomm Incorporated Coefficient scanning in video coding
US9338458B2 (en) * 2011-08-24 2016-05-10 Mediatek Inc. Video decoding apparatus and method for selectively bypassing processing of residual values and/or buffering of processed residual values
US9083983B2 (en) 2011-10-04 2015-07-14 Qualcomm Incorporated Motion vector predictor candidate clipping removal for video coding
JP5869681B2 (ja) * 2011-10-07 2016-02-24 パンテック カンパニー リミテッド 候補画面内予測モードを利用した画面内予測モードの符号化/復号化方法及び装置
CN107483930B (zh) * 2011-10-17 2020-03-06 株式会社Kt 利用解码装置解码视频信号的方法
GB2559062B (en) * 2011-10-17 2018-11-14 Kt Corp Video decoding method using transform method selected from a transform method set
RU2626014C1 (ru) * 2011-10-19 2017-07-21 Кт Корпорейшен Способ декодирования видеосигнала
US20130114717A1 (en) 2011-11-07 2013-05-09 Qualcomm Incorporated Generating additional merge candidates
US10390046B2 (en) * 2011-11-07 2019-08-20 Qualcomm Incorporated Coding significant coefficient information in transform skip mode
US20130170553A1 (en) 2012-01-04 2013-07-04 Qualcomm Incorporated Coding motion vector difference
US9503720B2 (en) * 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
US10200709B2 (en) 2012-03-16 2019-02-05 Qualcomm Incorporated High-level syntax extensions for high efficiency video coding
US9426466B2 (en) * 2012-06-22 2016-08-23 Qualcomm Incorporated Transform skip mode
US10257520B2 (en) * 2012-06-26 2019-04-09 Velos Media, Llc Modified coding for transform skipping
WO2014052775A1 (en) * 2012-09-29 2014-04-03 Motorola Mobility Llc Adaptive transform options for scalable extension

Also Published As

Publication number Publication date
RU2016126960A3 (pl) 2019-10-10
KR101828964B1 (ko) 2018-02-13
KR101762294B1 (ko) 2017-07-28
CN107835419A (zh) 2018-03-23
RU2016126942A (ru) 2018-12-06
KR20140110093A (ko) 2014-09-16
RU2719375C2 (ru) 2020-04-17
KR101539110B1 (ko) 2015-07-29
KR101539108B1 (ko) 2015-07-24
CN107835416B (zh) 2020-08-04
CN107835420A (zh) 2018-03-23
AU2012326819A2 (en) 2014-06-19
AU2016247092A1 (en) 2016-11-03
MX369192B (es) 2019-10-31
US20150131739A1 (en) 2015-05-14
GB2509670B (en) 2018-12-05
RU2016126955A (ru) 2018-12-05
CN107959857B (zh) 2022-03-01
BR112014009449B1 (pt) 2023-01-24
CN107835414B (zh) 2020-11-06
GB201407659D0 (en) 2014-06-18
WO2013058583A1 (ko) 2013-04-25
AU2016247090A1 (en) 2016-11-03
AU2016200532A1 (en) 2016-02-18
CN107835419B (zh) 2021-05-14
AU2016247091B2 (en) 2018-10-18
CN107835415A (zh) 2018-03-23
GB2554828A (en) 2018-04-11
CN107835415B (zh) 2020-06-19
KR20140119822A (ko) 2014-10-10
RU2016126941A (ru) 2018-12-06
CN104067622B (zh) 2018-01-02
KR20140126415A (ko) 2014-10-30
CN107835418B (zh) 2021-05-14
MX2014004851A (es) 2014-05-28
CN107820081B (zh) 2021-08-10
AU2016247092B2 (en) 2018-10-18
KR102030717B1 (ko) 2019-10-10
RU2715382C2 (ru) 2020-02-27
CN107835414A (zh) 2018-03-23
CN107835417A (zh) 2018-03-23
KR101539107B1 (ko) 2015-07-24
RU2719390C2 (ru) 2020-04-17
CN107835418A (zh) 2018-03-23
RU2719386C2 (ru) 2020-04-17
CA2853002C (en) 2017-07-25
RU2016126966A3 (pl) 2019-10-10
CA2946947A1 (en) 2013-04-25
AU2016200532B2 (en) 2017-08-03
AU2012326819B2 (en) 2015-12-10
CN107959853A (zh) 2018-04-24
CN107959857A (zh) 2018-04-24
RU2016126978A (ru) 2018-12-05
AU2012326819A1 (en) 2014-05-22
KR20140110095A (ko) 2014-09-16
CN107959858A (zh) 2018-04-24
CN107105244B (zh) 2020-11-10
CN107835417B (zh) 2021-05-14
KR20140110094A (ko) 2014-09-16
CN107820082B9 (zh) 2021-07-20
CN107820081A (zh) 2018-03-20
MX355346B (es) 2018-04-17
RU2016126982A (ru) 2018-12-05
GB201809879D0 (en) 2018-08-01
KR20140110092A (ko) 2014-09-16
AU2016247091A1 (en) 2016-11-03
RU2593991C2 (ru) 2016-08-10
GB2509670A (en) 2014-07-09
KR20170089035A (ko) 2017-08-02
CN107820079B9 (zh) 2021-09-21
US10575015B2 (en) 2020-02-25
CN107835416A (zh) 2018-03-23
CN107820082A (zh) 2018-03-20
CN107820078B (zh) 2021-08-10
US20150139308A1 (en) 2015-05-21
RU2719340C2 (ru) 2020-04-17
BR112014009449A2 (pt) 2017-04-25
CN107105244A (zh) 2017-08-29
CN105120272B (zh) 2018-11-23
CN104067622A (zh) 2014-09-24
CN104378637A (zh) 2015-02-25
RU2016126955A3 (pl) 2019-10-10
KR20170089036A (ko) 2017-08-02
CN107820079B (zh) 2021-08-17
US20140247866A1 (en) 2014-09-04
GB201719342D0 (en) 2018-01-03
CN107820080B (zh) 2021-05-14
KR102030718B1 (ko) 2019-10-10
MX336750B (es) 2016-01-29
RU2016126988A (ru) 2018-12-05
RU2016126942A3 (pl) 2019-10-09
KR101539109B1 (ko) 2015-07-24
CN107820078A (zh) 2018-03-20
KR20170089037A (ko) 2017-08-02
RU2016126945A3 (pl) 2019-10-09
CA2853002A1 (en) 2013-04-25
RU2719302C2 (ru) 2020-04-17
CN104378637B (zh) 2017-11-21
RU2719377C2 (ru) 2020-04-17
RU2719374C2 (ru) 2020-04-17
RU2016126982A3 (pl) 2019-10-10
KR101539111B1 (ko) 2015-07-29
RU2016126978A3 (pl) 2019-10-09
CN107820080A (zh) 2018-03-20
CN105120272A (zh) 2015-12-02
GB2554828B (en) 2018-10-24
RU2719379C2 (ru) 2020-04-17
RU2016126960A (ru) 2018-12-05
RU2016126941A3 (pl) 2019-10-09
US10264283B2 (en) 2019-04-16
RU2016126945A (ru) 2018-12-05
RU2014117489A (ru) 2015-11-27
CN107835420B (zh) 2021-05-14
GB2561487B (en) 2019-01-02
KR20140059837A (ko) 2014-05-16
PL408821A1 (pl) 2015-07-20
RU2016126988A3 (pl) 2019-10-09
RU2016126966A (ru) 2018-12-05
CN107820079A (zh) 2018-03-20
GB2561487A (en) 2018-10-17
CN107959853B (zh) 2021-05-14
KR102030719B1 (ko) 2019-10-10
CA2946947C (en) 2018-03-20
AU2016247090B2 (en) 2018-10-18
CN107820082B (zh) 2021-05-14
CN107959858B (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
PL231160B1 (pl) Sposób dekodowania sygnału wideo
PL231918B1 (pl) Sposoby dekodowania sygnału wideo
PL231161B1 (pl) Sposób dekodowania sygnału wideo
PL231162B1 (pl) Sposób dekodowania sygnału wideo