NO328295B1

NO328295B1 - VLC-fremgangsmate og -innretning

Info

Publication number: NO328295B1
Application number: NO20082612A
Authority: NO
Inventors: Gisle Bjontegaard; Arild Fuldseth
Original assignee: Tandberg Telecom As
Priority date: 2007-12-20
Filing date: 2008-06-11
Publication date: 2010-01-25
Also published as: US8306347B2; EP2235952A1; EP2235952A4; JP2011507450A; WO2009082239A1; NO20082612L; CN101904172A; CN101904172B; US20090161974A1

Abstract

Den foreliggende oppfinnelsen tilveiebringer en fremgangsmåte og en innretning for tapsfri koding av eventtabeller med dynamisk overensstemmende VLC-tabeller. Det mest sannsynlige event skal tilordnes den korteste koden, og de respektive eventer skal ha økende kodelengde idet den assosierte sannsynlighet for forekomst avtar. Den foreliggende oppfinnelsen tar i betraktning at sannsynlighetsfordelingen for denne tabellen ikke behøver være stabil gjennom de ulike deler av en videosekvens. Hver gang et event har forekommet, flyttes dette eventet en posisjon opp i tabellen. Den foreliggende oppfinnelsen resulterer i mer effektiv koding av digital komprimert video ved dynamisk å omordne eventtabeller for å oppnå en bedre overensstemmelse mellom eventsannsynligheter og VLCkodeord. Dette er særlig nyttig ved koding av video ved lys- og fargebetingelser som temporært eller konstant skiller seg fra de forventede betingelser som statiske VLC-er avledes fra.

Description

Område for oppfinnelsen

Oppfinnelsen vedrører variabellengdekoding (eng.: Variable Length Coding, VLC) av videodata i videokomprimeringssystemer.

Bakgrunn for oppfinnelsen

Transmisjon av bevegelige bilder i sanntid anvendes i flere applikasjoner som for eksempel videokonferanser, nettmøter, tv-kringkasting og videotelefoni.

Representasjon av bevegelige bilder krever imidlertid betydelig informasjon, idet digital video typisk beskrives ved å representere hver piksel i et bilde med 8 bits (1 byte). Slike ukomprimerte videodata resulterer i store bitvolumer, og kan ikke overføres over konvensjonelle kommunikasjonsnettverk og transmisjonslinjer i sanntid på grunn av begrenset båndbredde.

Således krever muliggjøring av sanntidsvideotransmisjon en stor grad av datakompresjon. Datakompresjon kan imidlertid gå på bekostning av bildekvalitet. Derfor har det blitt gjort stor innsats i å utvikle komprimeringsteknikker som tillater sanntids transmisjon av høykvalitetsvideo over båndbreddebegrensede dataforbindelser.

I videokomprimeringssystemer er hovedmålet å representere videoinformasjonen med så liten kapasitet som mulig. Kapasitet er definert ved bits, enten som en konstant verdi eller som bits per tidssenhet. I begge tilfeller er hovedmålet å redusere antallet bits.

Mange videokomprimeringsstandarder har blitt utviklet i løpet av de siste årene. Mange av disse fremgangsmåtene er standardiserte gjennom ISO (the International Standards Organization) eller ITO (the International Telecommunications Union). I tillegg er et antall andre proprietære fremgangsmåter blitt utviklet. De viktigste standardiseringsfremgangsmåtene er: ITU: H.261, H.262, H.263, H.264

ISO: MPEG1, MPEG2, MPEG4/AVC

Det første trinnet i kodingsprosessen, ifølge disse standardene, er å inndele bildet i kvadratiske pikselblokker, for eksempel 16x16 eller 8x8 piksler. Dette gjøres for luminansinformasjon, så vel som for krominansinformasjon.

Den følgende prediksjonsprosessen reduserer betraktelig mengden av bits som er nødvendig for hvert bilde i en videosekvens som skal overføres. Den tar fordel av likheten av deler i sekvensen med andre deler av sekvensen, og produserer en prediksjon for pikslene i blokken. Dette kan være basert på piksler i et allerede kodet/dekodet bilde (kalt interprediksjon) eller på allerede kodede/dekodede piksler i det samme bildet (kalt intraprediksjon). Reduksjonen er til det vesentligste basert på vektorer som representerer bevegelser.

Siden prediksjonsdelen er kjent for både koderen og dekoderen, behøver bare differansen overføres. Denne differansen krever typisk mye mindre kapasitet for sin representasjon. Differansen mellom pikslene som skal kodes og de predikterte piksler, omtales ofte som en residual.

Residualen representert som en blokk med data (for eksempel 4x4 piksler) inneholder fortsatt intern korrelasjon. En velkjent fremgangsmåte for å dra fordel av dette, er å utføre en todimensjonal blokktransform. I H.263 anvendes en 8x8 diskret cosinustransform (DCT), mens H.264 anvender en NxN (der N kan være 4 eller 8) heltallstype transform. Denne transformerer NxN piksler til NxN transformkoeffisienter, og disse kan vanligvis representeres med færre bits enn pikselrepresentasjonen. Transformasjon av en NxN-gruppe av piksler med intern korrelasjon vil sannsynligvis resultere i en 4x4 blokk av transformkoeffisienter med mye færre ikke-null-verdier enn den originale 4x4 pikselblokken.

Direkte representasjon av transformkoeffisientene er likevel for kostbar i mange applikasjoner. En kvantiseringsprosess utføres for en ytterligere reduksjon av datarepresentasjonen. Således undergår transformkoeffisientene kvantisering. En enkel versjon av kvantisering er å dele parameterverdiene med et tall - hvilket resulterer i et mindre antall som kan representeres med færre bits. Dette er det viktigste verktøy for å kontrollere bitproduksjonen og den rekonstruerte bildekvaliteten. Det skal nevnes at denne kvantiseringsprosessen har som resultat at den rekonstruerte videosekvensen er noe forskjellig fra den ukomprimerte sekvensen. Dette fenomenet omtales som tapsbeheftet koding (engelsk: "lossy coding"). Dette betyr at de rekonstruerte bildene typisk har en lavere kvalitet enn de originale bildene. Utgangen fra kvantiseringsprosessen er heltall, som ikke representerer de originale transformkoeffisientene korrekt. Disse heltallene, sammen med heltall som representerer sideinformasjonen, kodes på tapsfri måte og transmitteres til dekoderen.

Endelig utføres en såkalt skanning av de todimensjonale

transformkoefifsientdataene til et endimensjonalt sett av data, og det endimensjonale settet transformeres videre i samsvar med et entropikodingsskjema. Entropikoding medfører tapsfri representasjon av de kvantiserte transformkoeffisientene.

De ovenstående trinnene er listet i en naturlig rekkefølge for koderen. Dekoderen vil til en viss grad utføre operasjonene i motsatt rekkefølge og gjøre "inverse" operasjoner slik som invers transform i stedet for transform og dekvantisering i stedet for kvantisering.

Tapsfri koding anvendes konvensjonelt for entropikoding av kvantiserte transformkoeffisienter, og for å kode sideinformasjon som bevegelses vektor, kodingsmodus og Coded Block Pattern (CBP). Typisk defineres et sett av eventer i en eventtabell. Videre defineres en variabellengdekodings- (VLC-) kodetabell, og hvert event kobles til en kode i VLC-tabellen. Nedenfor er noen eksempler på eventtabeller som skal kodes.

Bevegelsesvektorkomponenter er typisk horisontale eller vertikale komponenter. Anta nå at bare én slik komponent betraktes, og verdien er et heltall som kan være positivt eller negativt. Den mest sannsynlige verdien er 0. Deretter følger ±1, ±2, ±3 osv. med avtagende sannsynlighet. En god kombinasjon av vektorverdier og kodeverdier viser seg å være:

For en optimal løsning bør det mest sannsynlige event ha den korteste kode. Mer spesifikt bør kodelengden i bits være lik entropien av eventet, eller:

Code_length = -log2(probability_of_event).

Derfor er VLC-en ovenfor optimal dersom sannsynlighetene for ..-3, -2, -1, 0, 1, 2, 3,.. er 1/32, 1/32, 1/8, 1/2, 1/8, 1/32, 1/32 osv.

En annen type sideinformasjon som typisk kodes med VLC-tabeller, er CBP. Det viser seg å være fordelaktig å signalere hvilke av 4 8x8 luminansblokker og 2 sammenstilte (eng.: collocated) 8x8 krominansblokker i en makroblokk som har ikke-null-koeffisienter eller ikke, ved VLC. Derfor defineres en eventtabell med de 2<6> = 64 mulige eventer. En korresponderende VLC-tabell er definert som motsvarer sannsynlighetene for de 64 eventene.

De kvantiserte transformkoeffisientene kodes også ved tapsfri VLC. Det er mange måter å kode transformkoeffisientene effektivt på. Dette kan lede til ulike evetnttabeller - og assosierte VLC-er. Konvensjonelt uttrykkes de kvantifiserte transformkoeffisientene i en blokk ved antallet ikke-null-transformkoeffisienter i en blokk, posisjonen for de siste ikke-null- transformkoeffisientene i en blokk, og den virkelige størrelsen av transformkoeffisienten. Kombinasjoner av denne informasjonen danner så eventer definert i VLC-tabeller. For eksempel kan et kombinert event kodes ved å angi både posisjonen for den siste ikke-null og hvorvidt størrelsen av den siste koeffisienten =1 eller >1. Andre kombinasjoner kan også anvendes, men det grunnleggende er fortsatt å velge kombinasjoner og korresponderende VLC-tabeller som minimaliserer antallet bits nødvendig basert på sannsynligheten for eventer.

Dette vil resultere i et lavt bitforbruk, så lenge dataene som skal kodes passer rimelig bra med den underliggende statistikk. I det motsatte tilfellet, når svært utypiske data skal kodes, kan bruken av bits bli for høy. I situasjonen der dataene som skal kodes, unnlater å passe med den "normale" statistikk, vil forekomster som er representert med et stort antall bits, bli hyppigere. Dette kan være situasjonen ved raske og vedvarende lysendringer i omgivelsene der videobildet er innhentet. Dette vil redusere kvaliteten på det kodede/dekodede bildet, idet kodingsprosessen automatisk vil innstille kvantiseringsintervallene for å overholde den hyppige forekomsten av lange kodeord.

US-2006/110059 vedrører en fremgangsmåte for å kode blokkparametere anvendt i rammebaserte og objektbaserte videkodingsformater. Blokkparameterne koder bildeblokker til makroblokker, og komprimeres ved å utnytte korrelasjonen mellom krominans- og luminansblokker i hver makroblokk.

Sammenfatning av oppfinnelsen

Det er en hensikt ved den foreliggende oppfinnelsen å tilveiebringe en fremgangsmåte og en innretning for å representere videodata relatert til en makroblokk for et videobilde i en kodingsprosedyre.

En annen hensikt er å tilveiebringe en fremgangsåte og en innretning for å tolke koder relatert til en makroblokk i et videobilde i en dekodingsprosedyre.

Fremgangsmåten og innretningen er fremsatt i de vedfølgende krav.

Kort beskrivelse av tegningene

For å gjøre oppfinnelsen enklere å forstå, vil den etterfølgende diskusjonen referere til de medfølgende tegninger. Figur 1 er et blokkdiagram som viser de ulike prosesseringstrinn i en konvensjonell kodingsprosedyre, Figur 2 er et skjematisk flytskjema som illustrerer prinsipper ved en fremgangsmåte for å representere videodata, Figur 3 er et skjematisk flytskjema som illustrerer prinsipper ved en fremgangsmåte for å tolke koder relatert til en makroblokk i et videobilde, Figur 4 er et skjematisk blokkdiagram som illustrerer prinsipper ved en kodingsinnretning, og Figur 5 er et skjematisk blokkdiagram som illustrerer prinsipper ved en dekodingsinnretning.

Detaljert beskrivelse av den foreliggende oppfinnelsen

Den foreliggende oppfinnelsen tilveiebringer tapsfri koding av eventtabeller med dynamisk overensstemmende VLC-tabeller. Som beskrevet i det ovenstående, bør det mest sannsynlige eventet tilordnes med kortest kode, og de respektive eventer bør ha økende kodelengde etter hvert som den assosierte sannsynlighet for forekomst avtar. Den foreliggende oppfinnelsen tar i betraktning at sannsynlighetsfordelingen for eventtabellen ikke behøver være stabil idet man beveger seg gjennom ulike deler av en videosekvens. Hver gang et event har opptrådt, flyttes dette eventet en posisjon opp i eventtabellen, det vil si at det nettopp forekommende eventet endrer posisjon med eventet assosiert med posisjonen rett ovenfor. Imidlertid forblir kodene tilordnet hver posisjon uendret, det er bare assosiasjonene av eventene med tabellposisjoner som rearrangeres.

Et event som forekommer mer ofte enn hva den originale eventtabellen angir vil så gradvis bli tilordnet kortere bitkoder. Derfor vil det tilveiebringes en effektiv koding selv i tilfeller av raskt endrede farge eller lys, eller andre sjeldent forekommende betingelser.

Figur 2 er et skjematisk flytskjema som illustrerer prinsipper ved en fremgangsmåte for å representere videodata.

Den illustrerte fremgangsmåten er en fremgangsmåte for å representere videodata relatert til en makroblokk i et videobilde i en kodingsprosedyre der bestemte videodata, eller kombinasjon av videodata, eller kombinasjoner av videodata, representeres i forhåndsdefinerte eventer assosiert med indekserte posisjoner i en variabel lengdekodings-(VLC-)tabell. VLC-tabellen innbefatter koder tilordnet hver indekserte posisjon.

Fremgangsmåten starter ved initieringstrinnet 200.

Forekomsten av et første event blant nevnte forhåndsdefinerte eventer under kodingsprosedyren detekteres i detekteringstrinnet 210. De etterfølgende trinn utføres forutsatt at det første event er detektert i trinn 210.

Videre, i tabelloppslagstrinnet 220, blir en posisjon x assosiert med det detekterte første event oppslått i VLC-tabellen.

Videre, i kodetilveiebringelsestrinnet 230, blir en kode tilordnet posisjonen x i VLC-tabellen tilveiebrakt.

Videre, i testtrinnet 240, blir det bestemt om posisjonen x>0. Det er tilfelle dersom eventet er assosiert med en posisjon forskjellig fra posisjonen ved toppen av VLC-

tabellen, siden posisjonen ved toppen har indeks=0. Dersom x>0, utføres VLC-rearrangeringstrinnet 250. Ellers avsluttes fremgangsmåten ved trinnet 260.

I VLC-tabellrearrangeringstrinnet 250 rearrangeres VLC-tabellen ved

• å assosiere et andre event, nåværende assosiert ved en posisjon x-1, med posisjonen x, og • å assosiere det første event blant nevnte forhåndsdefinerte eventer med posisjonen x-1.

Videodataene som anvendes i fremgangsmåten kan være en eller flere av de følgende:

• størrelse av kvantiserte transformkoeffisienter,

• antall ikke-null-kvantiserte transformkoeffisienter i en blokk,

• posisjon for en siste ikke-null-kvantisert transformkoeffisient i en blokk,

• størrelse av en blokk,

• kodingsmodus, og

• Coded Block Pattern.

Fremgangsmåten avsluttes ved termineringstrinnet 260.

Figur 3 er et skjematisk flytskjema som illustrerer prinsippene ved en fremgangsmåte for å produsere koder relatert til en makroblokk i et videobilde.

Den illustrerte fremgangsmåten er en fremgangsmåte for å tolke koder relatert til en makroblokk i et videobilde i en dekodingsprosedyre, hvor kodene tolkes som forhåndsdefinerte eventer som representerer dekodede videodata eller kombinasjoner av dekodede videodata assosiert med indekserte posisjoner i en variabel lengdekode-(VLC-)tabell som innbefatter koder tilordnet hver indekserte posisjon.

Fremgangsmåten starter ved initieringstrinnet 300.

Forekomsten av en kode under dekodingsprosedyren detekteres i detekteringstrinnet 310. De etterfølgende trinn utføres forutsatt at koden er detektert i trinn 310.

Videre, i tabelloppslagstrinnet 320, blir en posisjon x assosiert med den detekterte koden oppslått i VLC-tabellen.

Videre, i eventtilveiebringelsestrinnet 330, tilveiebringes et første event assosiert med en posisjon x i VLC-tabellen.

Videre, i testtrinnet 340, bestemmes om posisjonen x>0. Dette er tilfelle dersom den detekterte koden er assosiert med en posisjon forskjellig fra posisjonen ved toppen av VLC-tabellen, siden posisjonen ved toppen har indeks =0. Dersom x>0, utføres rearrangeringstrinnet 350. Ellers avsluttes fremgangsmåten ved trinn 360.

I VLC-tabellrearrangeringstrinnet 350 rearrangeres VLC-tabellen ved å utføre trinnene: • å assosiere et andre event, nåværende assosiert med en posisjon x-1, med posisjon x, og

• å assosiere det første event med posisjonen x-1.

Videodata benyttet i fremgangsmåten kan være en eller flere av følgende:

• størrelse av kvantiserte transformkoeffisienter,

• antall ikke-null-kvantiserte transformkoeffisienter i en blokk,

• posisjon av en siste ikke-null-kvantisert transformkoeffisient i en blokk,

• størrelse av en blokk,

• kodingsmodus, og

• Coded Block Pattern.

Fremgangsmåten avsluttes ved termineringstrinnet 360.

Figur 4 er et skjematisk blokkdiagram som illustrerer prinsipper ved en kodingsinnretning 400.

Kodingsinnretningen 400 er en innretning som representerer videodata relatert til en makroblokk i et videobilde i en kodingsprosedyre hvor visse videodata eller kombinasjoner av videodata er representert i forhåndsdefinerte eventer assosiert med indekserte posisjoner i en variabel lengdekodings-(VLC)tabell innbefattende koder tilordnet hver indekserte posisjon.

Kodingsinnretningen 400 omfatter en intern bus 420, som sammenbinder en prosesseringsinnretning slik som en mikroprosessor 410, en I/O-innretning 450 og et minne 420. Minnet 420 innbefatter en del 430 som inneholder prosesseringsinstruksjoner og en del 440 som inneholder VLC-tabelldata. I/O-innretningen 450 innbefatter en inngangsinnretning og en utgangsinnretning (ikke vist separat) som begge er forbundet til bussen 420. Videodata 460 mates som input til inngangsinnretningen innbefattet i I/O-innretningen 450, og er således tilgjengelig for prosessering av prosesseringsinnretningen 410. Utgangsinnretningen innbefattet i I/O-innretningen 470 er anordnet for å tilveiebringe VLC-data 470, generert av prosesseringsinnretningen 410, som output. Prosesseringsinstruksjonene som inneholdes i minnedelen 430 er konfigurert til å forårsake at prosesseringsinnretningen 410 utfører en fremgangsmåte for å representere videodata beskrevet i den foreliggende spesifikasjonen, slik som en fremgangsmåte beskrevet med henvisning til figur 2.

Figur 5 er et skjematisk blokkdiagram som illustrerer prinsipper ved en dekodingsinnretning 500.

Dekodingsinnretningen 500 er en innretning for å representere videodata relatert til en makroblokk i et videobilde i en kodingsprosedyre hvor visse videodata eller kombinasjoner av videodata er representert i forhåndsdefinerte eventer assosiert med indekserte posisjoner i en variabellengdekodings-(VLC-) tabell som innbefatter koder anordnet til hver indekserte posisjon.

Dekodingsinnretningen 500 omfatter en intern bus 520, som sammenbinder en prosesseringsinnretning slik som en mikroprosessor 510, en I/O-innretning 550 og et minne 520. Minnet 520 innbefatter en del 530 som inneholder prosesseringsinstruksjoner og en del 540 som inneholder VLC-tabelldata. I/O-innretningen 550 innbefatter en inngangsinnretning og utgangsinnretning (ikke vist separat) som begge er forbundet til bussen 520. VLC-data 570 mates som inngang til inngangsinnretningen innbefattet I/O-innretningen 550, og er således tilgjengelig for produsering av produseringsinnretningen 510. Utgangsinnretningen innbefattet i I/O-innretningen 550 er anordnet for å tilveiebringe videodata 560, generert av prosesseringsinnretningen 410, som output.

Prosesseringsinstruksjonene inneholdt i minnedelen 530 er konfigurert til å forårsake at prosesseringsinnretningen 510 utfører en fremgangsmåte for å tolke koder som forhåndsdefinerte eventer, som beskrevet i den foreliggende spesifikasjonen, slik som en fremgangsmåte som beskrevet med henvisning til figur 3.

Den foreliggende oppfinnelsen kan anvendes med et mangfold av, eller praktisk talt alle, VLC-implementeringer. Når for eksempel en del av en videosekvens dominert av blå farge forekommer, ville CBP-eventene som inneholder ikke-null-blåkomponenter ha relativ høy sannsynlighet, mens eventer som inneholder ikke-null-rødkomponenter ville være liten. Når fargen av sekvensen har endret til rød, ville sannsynligheten for eventene ha endret seg. VLC-tabellen ville, i samsvar med den foreliggende oppfinnelsen, da gradvis rearrangeres på grunn av endringen av farge.

Eventtabellene for kodingsmoduser angir typisk interprediksjon med 1, 2 eller 4 bevegelsesvektorer, intraprediksjon osv. Ved liten bevegelse i bildet fra ramme til ramme kan intermodus med en bevegelsesvektor typisk ha den største sannsynlighet. Ved overgang til en del av sekvensen med voldsom bevegelse - eller til og med sceneskifte - kan intramodus være mest sannsynlig modus.

Slik det allerede er angitt, anvender den foreliggende oppfinnelsen en adaptiv reordning av eventer i en eventtabell for dynamisk å oppnå en nærmere overensstemmelse mellom sannsynlighetsfordelingen av eventene og lengdene av VLC-kodene. Reordningen gjøres dynamisk og på samme måte med koderen og dekoderen, slik at det ikke er noe behov for signalering av noen sideinformasjon i relasjon til reordningen. Den eksakte dynamiske reordningen kan gjøres på ulike måter.

Ved en utførelsesform av den foreliggende oppfinnelsen betraktes kodingsmodus. Modus i denne sammenheng definerer måten en MB predikteres og kodes på. En typisk tabell kan være:

I tilfelle av CBP, finnes en 64 eventtabell som definerer hvilke av de 6 8x8 blokkene i en MB som har ikke-null-koeffisienter eller ikke. Det mest hyppige eventet kan variere, så en dynamisk VLC i samsvar med den foreliggende oppfinnelsen kan også være fordelaktig å anvende i tilfelle av CBP.

Koding av den siste posisjonen er som tidligere nevnt relatert til kodingen av NxN transformkoeffisienter. Statistisk er lavfrekvenskoeffisienten større en høyfrekvenskoeffisienten. Dette reflekteres i skanningen av koeffisienter som avbildet i figur 1. Det er derfor typisk at mange koeffisienter mot slutten av skanningen er lik 0. Derfor kan det være nyttig å signalere posisjonen for den siste ikke-null-koeffisienten i skanningen. Det er også fordelaktig å angi hvorvidt absoluttverdien av denne siste ikke-null-koeffisienten er lik 1 eller >1. Derfor ender vi opp med en eventtabell med 2N<2> eventer.

Det vil nå beskrives en måte for dynamisk tilpasning av ordningen av modus-eventtabellen ovenfor, i samsvar med den foreliggende oppfinnelse. Anta at prosessen starter med antakelsen at event_0 er det mest sannsynlige, event_l er nest mest sannsynlig, osv. Da starter rekkefølgen av eventer originalt med tabellen:

Posisjonen i strengen angir tallet for koden som skal anvendes. Anta at den første instansen event_2 skal kodes. Da skal kodetallet 2 benyttes. Samtidig bytter event_2 plass med eventet til venstre i strengen, hvilket resulterer i den nye rekkefølgen som skal anvendes til å kode det neste eventet:

Event_2 opptrer igjen, og er denne gangen kodet med kodetall 1. Da finner en ny reordning sted, med det følgende resultat: Det neste som skal kodes, er event_4, som bruker kodetallet 4. Etter koding flyttes event_4 en posisjon fremover, hvilket fører til den nye event-rekkefølgen

Denne prosessen fortsetter og endrer dynamisk rekkefølgen av tabellen til å overensstemme med rekkefølgen av sannsynlighet. Dersom reordningen reflekterer bare temporære betingelser, vil VLC-en gradvis konvertere tilbake til den originale rekkefølgen til VLC-en. Dersom de stabile lys- og fargeforhold ikke overensstemmer spesielt godt med statistikken som den originale rekkefølgen var avledet fra, så vil den dynamiske VLC-en tendere til å konvertere til en ulik statisk rekkefølge, mer tilpasset de aktuelle forholdene.

Denne dynamiske reordningen er ikke begrenset til modustabellen i eksempelet, men kan anvendes med en hvilken som helst tabell. Fremgangsmåten for dynamisk tilpasning er heller ikke begrenset til den enkle fremgangsmåten beskrevet ovenfor.

Fremgangsmåten og innretningene ifølge den foreliggende oppfinnelsen behøver ingen utveksling av data mellom koder og dekoder.

Fremgangsmåten og innretningene ifølge den foreliggende oppfinnelsen resulterer i mer effektiv koding/dekoding av digitalt komprimert video ved dynamisk å reordne eventtabellene og oppnå en bedre overensstemmelse mellom eventsannsynligheter og VLC-kodeord. Dette er særlig nyttig ved koding av video med lys- og fargebetingelser som temporært eller konstant skiller seg fra de forventede betingelser som de statiske VLC-er er avledet fra.

Claims

1. Fremgangsmåte for å representere videodata relatert til en makroblokk i et videobilde i en kodingsprosedyre hvor visse videodata eller kombinasjoner av videodata representeres i forhåndsdefinerte eventer assosiert med indekserte posisjoner i en variabellengdekodings- (VLC-) tabell innbefattende koder tilordnet hver indekserte posisjon, karakterisert ved at når et første event blant nevnte forhåndsdefinerte eventer under kodingsprosedyren forekommer, utføres trinnene å kode det første event med en kode tilordnet til en posisjon x i VLC-tabellen som er assosiert med det første event, og dersom x>0, å rearrangere VLC-tabellen ved å assosiere et andre event, nåværende assosiert med en posisjon x-1, med posisjon x, og å assosiere det første event med posisjonen x-1.

2. Fremgangsmåte i samsvar med krav 1, karakterisert ved at nevnte videodata er en eller flere av følgende: størrelse av kvantiserte transformkoeffisienter, antall ikke-null-kvantiserte transformkoeffisienter i en blokk, posisjon for en siste ikke-null-kvantisert transformkoeffisient i en blokk, størrelsen av en blokk, kodingsmodus og Coded Block Pattern.

3. Fremgangsmåte for å tolke koder vedrørende en makroblokk i et videobilde i en dekodingsprosedyre hvor kodene tolkes som forhåndsdefinerte eventer som representerer dekodede videodata eller kombinasjoner av dekodede videodata assosiert med indekserte posisjoner i en variabellengdekodings- (VLC-) tabell innbefattende koder anordnet hver indekserte posisjon, karakterisert ved at når en kode forekommer under dekodingsprosedyren, utføres trinnene å tolke koden som et første event blant nevnte forhåndsdefinerte eventer assosiert med en posisjon x i VLC-tabellen som koden er tilegnet til, og dersom x>0, å rearrangere VLC-tabellen ved å assosiere et andre event; nåværende assosiert med en posisjon x-1, med posisjon x, og å assosiere det første event med posisjonen x-1.

4. Fremgangsmåte i samsvar med krav 3, karakterisert ved at nevnte videodata er en eller flere av følgende, størrelse av kvantiserte transformkoeffisienter, antall ikke-null-kvantiserte transformkoeffisienter i en blokk, posisjon for en siste ikke-null-kvantisert transformkoeffisient i en blokk, størrelsen av en blokk, kodingsmodus og Coded Block Pattern.

5. Innretning for å representere videodata vedrørende en datablokk i et videobilde i en kodingsprosedyre hvor visse videodata etter kombinasjoner av videodata er representert i forhåndsdefinerte eventer assosiert med indekserte posisjoner i en variabellengdelodings- (VLC-) tabell innbefattende koder tilordnet til hver indekserte posisjon, omfattende en buss, som sammenbinder en inngangsinnretning anordnet for å lese nevnte videodata, en utgangsinnretning anordnet for å tilveiebringe VLC-data, en produseringsinnretning, og et minne, karakterisert ved at minnet omfatter prosesseringsinstruksjoner som bevirker at prosesseringsinnretningen utfører en fremgangsmåte som fremsatt i et av kravene 1 eller 2 når prosesseringsinstruksjonene eksekveres av prosesseringsinnretningen.

6. Innretning for å tolke koder vedrørende en makroblokk i et videobilde i en dekodingsprosedyre hvor kodene tolkes som forhåndsdefinerte eventer som representerer dekodede videodata eller kombinasjoner av dekodede videodata assosiert med indekserte posisjoner i en variabellengdekodings- (VLC-) tabell innbefattende koder tilordnet til hver indekserte posisjon, omfattende en bus, som sammenbinder en inngangsinnretning anordnet til å lese nevnte videodata, en utgangsinnretning anordnet til å tilveiebringe VLC-data, en produseringsinnretning, og et minne, karakterisert ved at minnet omfatter prosesseringsinstruksjoner som bevirker at prosesseringsinnretningen utfører en fremgangsmåte som fremsatt i et av kravene 3 eller 4 når prosesseringsinstruksjonene eksekveres av prosesseringsinnretningen.