HU228615B1

HU228615B1 - Method of coding of digital video pictures

Info

Publication number: HU228615B1
Application number: HU0500030A
Authority: HU
Inventors: Jani Lainema
Original assignee: Nokia Corp
Priority date: 2002-01-14
Filing date: 2003-01-14
Publication date: 2013-04-29
Also published as: WO2003058945A3; EP1466477B1; EP1466477A2; JP2005514872A; AU2003201069A1; EP1466477A4; RU2302707C2; US20030169931A1; JP4494789B2; KR20040075348A; CN100553321C; KR100945546B1; MXPA04006814A; WO2003058945A2; SG149694A1; RU2004124831A; HUP0500030A2; CN1615645A; US7379501B2; BR0304545A

Description

Eljárás oígitáus videó képsor képeinek kódolására

A találmány videó kódolás során alkalmazott mozgáskompenzáclóval kapcsolatos. Közelebbről, a találmány olyan eljárásra vonatkozik, amely mozgáskompenzálí videó kódolóban és dekódolókban a képek pixelértékelnek helyreállítására használt interpolációs szűrők együtthatóinak kódolására szolgák A találmány tárgya továbbá az eljárást Implementáló videó kódoló, videó dekódoló és videó átviteli rendszer.

n számos különböző videó kódolási szabvány létezik. Ezek közé tartozik a Nemzetközi Távközlési Társulás Távközlési Szabványosítás Szekciójának (ITÜ-T) H.263 ajánlása, a Nemzetközi Szabványügyi Szervezet (ISO) MPEG csoportjának MPEG-1, MPEG-2 és MPEG-4 szabványa. Az említett videó kódolási szabványok mozgáskompenzált predikcton és predikciós hibakódoláson alapulnak, A mozgáskompenzált predikciónál egy videó képsor egymást követő keretei közötti elmozdulást elemzik és kódolják, majd a mozgáslnformáció felhasználásával ttvreálitt’ állítását olyan m iacíos szűrők felhasználásával végzik, amelyek képesek a pixel és szubpixel pozíciót szükséges képpont-értékek előállítására. A továbbiakban a mozgáskompenzált predikció és az interpoláció szűrők alkalmazásával végzett képheiyreáilítás alapeivét ismertet) ük részlet esen.

A digitális videó képsorok, például a filmen rögzített szokásos mozgóképek állóképek, ún.. keretek sorozatából állnak. A mozgás látványát úgy Idézik elő, hogy a kereteket egymás után viszonylag nagy sebességgel tipikusan 15-30 keret/másodpere sebességgel jelenítik meg. A viszonylag nagy keretsebesség: miatt az egymást követő keretek képtartalma nagyon hasonló, Így az egymást követő keretek jelentős mennyiségű redundáns információt tartalmaznak.

A digitális videó képsor minden egyes kerete képpontok rendezett halmazát tartalmazza. Egy széles körben használt digitális videó formátumban, nevezetesen a QCiF (Quarter Common interehange Formát) formátumban, a keret 176 x 144 pixelt tartalmaz, így minden egyes keretben 25344 pixel található, A keret minden

1007S7-14402/HG/GL pixelét bizonyos számú bit reprezentálja, melyek a pixelnek megfelelő képterület fényerejére és/vagy színtanaiméra (krominanciájám) vonatkozó Információt hordoznak. Általában az ún. YüV színmódéit használják a képek fényerejének és színtartalmának ^prezentáláséra, A fényerő., vagyis az Y komponens a kép intenzitását, vagyis világosságát reprezentálja, míg a kép szlntartalmát két színkomponens, az ü és V komponens reprezentálja.

A képtartafom fényerejének és színtartalmának reprezentálásán alapuló színmodelíek bizonyos szempontból előnyösebbek az olyan színmodellekbez viszonyítva, melyek az elsődleges színek, vagyis a vörös, a zöld és a kék (RGB) ^prezentálásán alapulnak. Mivel az emberi látórendszer érzékenyebb az intenzitásváltozásokra, mint a színváltozásokra, az YUV színmodellek oly módon használják ki ezt a tulajdonságot hogy a. színkomponensek (ü, V) esetén .kisebb térbeli felbontást alkalmaznak, mint az intenzitáskomponens (Y) esetén, ily módon a képben található színinformáció kódolásához szükséges információ mennyisége lecsökkenthető, miközben a kép minősége alig csökken.

A krominanela komponensek kisebb térbeli felbontását általában térbeli aiülmintavéteíezéssel érik el. Egy 16x16 képpontot tartalmazó blokkot egy, az intenzitás információt reprezentáló, 16x16 értéket tartalmazó biokkal, valamint két olyan krominanoía komponenssel kódolják, amelyek agy-agy olyan 8x8 értéket tartalmazó blokkból állnak, amelyek mindegyike az Intenzitásértékeket tartalmazó 16x18~os blokkal ekvivalens képterületet reprezentál. A kromlnancía komponenseket ily módon térben kétszeresen aiuimintavéteiezik mind a vízszintes, mind a függőleges irányban. Az így kapott 16x18 intenzitásblokkot és a két 8xS~as krominanciabtokkot együttesen YUV makroblokknak vagy röviden makroblokknak nevezik.

Egy QCIF formátumú kép 11x8 makroblokkot tartalmaz. Ha az Intenzitásbiokkokat és a krominaneiablokkokat 8 bites felbontással ~~ vagyis a 0-255 közötti értékekkel - reprezentálják, az egy makrobiokkhoz szükséges bitek száma (16x16x8)-i-2x(8xSx8)~3ö72. Ebből adódóan egy QCIF formátumú videó keret reprezentálásához szükséges bitek száma komponensenként 8 bites felbontás alkalmazása esetén 99x3072-304128. Ez azt jelenti, hogy az ilyen QCIF formátumú kereteket tartalmazó videó képsor továbbításához, rögzítéséhez vaoy megjelenítéséhez szükséges adatmennyiség 30 keret/másodperc sebességet feltételezve több, mint 9 Mb/s. Ez az adatsebesség a gyakorlatban használhatatlan a videó képrögzítő, videó adatátviteli és videó képmegjelenítő alkalmazásokban, mivel rendkívül nagy tárolókapacitást, adatátviteli csatornakapacitást és hardverteljesítményt tesz szükségessé.. Emiatt olyan videó kódolási szabványokat, például a fent említett szabványokat fejlesztetek: ki, amelyek lecsökkentik a videó adatok reprezentálásához és átviteléhez szükséges információ mennyiségét, miközben a képminőséget elfogadható szinten tartják.

A korábban említett videó kódolási szabványok különböző tulajdonságú videó képrögzítő és videó adatátvitel rendszerekben történő felhasználásra készültek. Az ISO MPEG-1 szabványt például kifejezetten olyan esetekre fejlesztették ki, ahol a rendelkezésre álló sávszélesség legfeljebb körülbelül 1,5 Mb/s. Az MPEG-2 videó kódolási szabvány elsősorban olyan digitális tárolóközegek és videó műsorszóró és kommunikációs rendszerek esetén használható, amelyeknél a rendelkezésre álló sávszélesség legfeljebb körülbelül 10 Mb/s. Az ITÜ-T H.263 ajánlását olyan rendszerekben érdemes használni, amelyekben a rendelkezésre álló sávszélesség általában sokkal kisebb. Különösen az olyan esetekben előnyős a használata, ahol a videó adatokat valós időben kell továbbítani vezetékes hálózatban, például ISDN hálózatban vagy a hagyományos telefonhálózatban (PSTN), ahol a rendelkezésre álló adatátviteli sávszélesség tipikusan 64 kbit/s nagyságrendű. A mobil videotelefon alkalmazásokban, ahol az átvitel legalább részben rádiókommunikációs összeköttetésen zajlik, a rendelkezésre álló sávszélesség akár 26 kbií/s-.ra is lecsökkenhet.

Bár a jelenleg használatos különböző videó kódolási szabványokat különböző esetekre fejlesztették ki, a továbbítandó információ mennyiségének lecsökkentése céljából általuk alkalmazót mechanizmusoknak számos közös vonása van. Például mindegyik kódolás úgy működik, hogy a továbbítandó videó képsorban lévő redundáns és érzékelhetőség szempontjából: irreleváns információ mennyiségét lecsökkenti. Alapvetően háromféle redundancia létezik a videó képsorokban: térbeli, időbeli és spektrátis redundancia.. A térbeli redundanciát egy képsor egyetlen keretén belüli szomszédos pixelek közötti korreláció leírására használják. Az Időbeli redundancia azt a tényt fejezi ki, hogy egy képsor egyik keretében megjelenő objektumok valószínűleg megjelennek a következő keretekben is. A spektrálís redundancia egy kép különböző színkomponensei közötti korrelációt fejezi ki.

Kellően hatékony tömörítés általában nem érhető el az egy adott képsorban fellépő különböző típusú redundanciák egyszerű csökkentésével. így a legtöbb jelenleg használt videó kódoló a videó képsor azon részeinek minőségét is lecsökkenti, amelyek szubjektiven a legkevésbé fontosak. Ezenkívül a tömörített videó bitfolyam redundanciáját is íecsökkentík hatékony veszteségmentes kódolással, ami tipikusan entrópia kódolást jelent.

A mozgáskompenzált predíkcíó az időbeli redundancia csökkentésének egyik formája, ahol is egy képsorban lévő néhány vagy gyakran számos keret tartalmát a képsor más keretei alapján „megjósolják” oly módon, hogy nyomon követik egy kép bizonyos objektumjainak vagy területeinek mozgását a keretekben. A mozgáskompenzált predíkcíó felhasználásával tömörített kereteket általában 1NTERkódoiású kereteknek vagy P-kereteknek nevezik, míg a mozgáskompenzált predíkcíó alkalmazása nélkül tömörített kereteket INTRA-kódolású kereteknek vagy l-kereteknek nevezik. Egy megjósolt - vagyis mozgáskompenzált, INTER-kődolású kép legtöbbször nem elegendően pontos ahhoz, hogy a kép tartalmát kellő minőséggé! reprezentálja, ezért az egyes INTER-kódolású keretekhez egy térbeli tömörítésű predlkclós hiba (RE) keretet is társítanak. Számos videó tömörítési eljárás kétírányban jósok kereteket használ, melyeket gyakran B-képeknek vagy B-kereteknek neveznek, A B-képeket referencia képpárok - I vagy P keretek - között helyezik el, és jóslásukat az egyik vagy mindkét referencia kép alapján végzik el.

Egy tipikus tömörített videó képsorban szereplő, különböző típusú keretek a 3. ábrán láthatók. Amint a 3. ábrán látható, a képsor egy INTRA-kódolású 30 í-keretteí kezdődik. A 3. ábrán 33 nyilakkal jelöltük az előre irányuló jóslás! folyamatot, amelynek segítségévei a 34 P-keretekef létrehozzák. A kétirányú jóslás! folyamatot., melynek segítségével a 36 B-kereteket hozzák létre, a 3. ábrán 31a, illetve 31b nyilakkal jelöltük.

Az 1. és 2. ábrán egy mozgáskompenzált predikciőt használó, általánosított videó kódoló rendszer blokkvázlata látható. Az 1. ábra olyan 10 kódolót szemléltet, amely mozgáskompenzáit predikciőt .alkalmaz, míg a 2. ábra a 10 kódolóhoz tartozó 20 dekódolót mutat be. Az 1. ábrán látható 10 kódoló 11 mozgásmezö-becsiö egységet, 12 mozgásmezö-ködolö egységet, 13 mozgáskompenzált predikclós egységet, 14 predikclőshiba-ködoló egységet, 15 predikcíöshíba-dekódoió egységet, 13 muftlplexelő egységet, 17 keretmemóuáf. és 19 összeadót tartalmaz. A 20 dekódoló 21 mozgáskompenzált predlkcíós egységet, 22 predlkcíoshiba-dekodoló egységet, 23 demultlplexeiő egységet és 24 keretmemóriát tartalmaz.

A mozgáskompenzált predikciot alkalmazó videó kódolók működési elve az, hogy minimalizálják az E«(x,y> predikciósblba-keretben lévő információ mennyiségét, ahol az E_n(x.,y) predikcióshiba-keret a kódolás alatt álló aktuális l_n(x,y) keret és egy P_n(x,y) predikclós keret különbsége. A predikcióshiba-keret így az alábbi módon definiálható:

- 4(x,.y> - /«(^χ, j). (i)

A P_n(x,y) predikclós keretet egy R_n(x,y) referenciákéról pixeiértékeinek felhasználásával állítják elő, ahol az R«(x,y) referenciákéról általában egy korábban kódolt és továbbított keret, például az aktuális keretet közvetlenül megelőző keret, és amely a 10 kódoló 17 keretrnemórlálábői olvasható ki. A P_n(x,y) predikclós keretet úgy állítják elő, hogy az K_R(x,y) referenciakeretben olyan predikclós pixeleket keresnek, amelyek lényegében megfelelnek az aktuális keretben lévő pixeleknek. Az aktuális keretben lévő pixelek és a referenciakeretben azoknak megfelelő predikclós pixelek közötti viszonyt - például relatív elhelyezkedést, elfordulást, arányt, stb. leiró mozgásinformáciö meghatározása után a predikclós keretet úgy állítják ele, hogy a predikclós pixeleket a mozgásinformáciö felhasználásával mozgatják. így a referenciakeret pixeiértékeinek felhasználásával olyan predikclós keretet állítanak elő, amely az aktuális keret közelítő reprezentációját adja. A fent említett predikcióshiba-keret az aktuális keretnek a predikclós keret által biztosított közelítő reprezentációja és magánaK az aktuális keretnek a különbségét adja meg. A mozgáskompenzált predíkelóf alkalmazó videó kódolók egyik alapvető előnye abból adódik, hogy az aktuális keret jóslásához szükséges mozgásinformáciö és a predikcióshiba-keret által megadott predíkciőshiba-inforrnáciő segítségével az aktuális keret viszonylag tömören írható le.

A keretben lévő pixelek nagy száma miatt általában nem hatékony az egyes pixelekhez tartozó mozgásinformáciö külon-külön történő továbbítása a dekódernek.

Ehelyett a legtöbb videó kódolási eljárásnál az aktuális keretet nagyobb S* képszegmensekre osztják és az Sk képszegmensekhez tartozó- mozgásínfo-rmációí továbbítják a dekődernek. A mozgásinformáció tipikusan minden keret minden egyes makrobiokkja esetén, adott és a makrobíokkon beiül az összes pixelhez ugyanaz a mozgásinformáciő tartozik. Bizonyos, videó kódolási szabványoknál, például az 1TU-T jelenleg fejlesztés alatt álló H.28L ajánlásában, a makroblokk felosztható kisebb blokkokra, és minden egyes kisebb blokkhoz saját mozgásinformáció tartozik.

A mözgásinformációt általában (Ax(x.,y)4y-(x,y)l mozgásvektorok Írják le. A Áx(x,y) és Ay(x,y) számpárok az aktuális b(x,y} keretben lévő (x,y) pixelnek az Rf,(x,y) referenciakeretben lévő pixelhez viszonyított vízszintes és függőleges elmozdulását adja meg. A {Ax{x,y>,Ay(x,y)j mozgásvektorokat a 11 mozgásmezőbecslő egység számítja ki és az aktuális keret (Ax(-),Áy( )1 mozgásvektorainak halmazát mozgásvektortérnek nevezik.

Az aktuális videokeret makrobtokkjának helyét tipikusan a bal felső sarok (x,y) koordinátája határozza meg. így az olyan videó kódolási eljárásoknál, ahol egy keret minden egyes rnakrobiokkjához tartozik mozgásinformáció, az egyes mozgásvektorok az Wx,y> aktuális keretben lévő makroblokk bal felső sarkát reprezentáló pixelnek az R_n(x,y) referenciakeretben lévő jósolt pixelekből álló, lényegében megfelelő blokk bal felső sarkának pixeléhez viszonyított vízszintes irányú Ax(x,y) és függőleges Irányú Ay(x,y) elmozdulását Írják le, ahogy ez a 4b ábrán is látható.

A mozgásbecslés számítástechnikai szempontból rendkívül Intenzív feladat. A 4a ábrán látható R_n(x,y) referenciakeret és például az aktuális keretben lévő NxH pixelt tartalmazó négyzet alakú makroblokk esetén a mozgásbecslés célja olyan MxN~es pixelblokk megkeresése a referenciakeretben, amely bizonyos feltételek alapján illeszkedik az aktuális keretben lévő makroblokk tulajdonságaihoz, Ilyen feltétel lehet például az aktuális keretben lévő makroblokk pixelei és az azzal összehasonlított referencia keretben lévő, pixelekből álló blokk közötti abszolút eltérések összege. Ezt a folyamatot általában biokkiileszfésnek nevezik. Szükségesnek tartjuk megjegyezni, hogy az illesztendő blokk geometriája és a referenciakeretben lévő blokk geometriája általában nem egyezik meg, mivel a valós objektumok méretváltozáson eshetnek át, elfordulhatnak vagy torzulhatnak. A *

'♦'Φ jelenlegi nemzetközi videó kódolási szabványoknál, például a fent említett szabványoknál, csak eltolási mozgásmodellt használnak, igy a rögzített derékszögű geometria alkalmazása elegendő.

Annak érdekében, hogy a legjobb eséllyel megtaláljuk az illeszkedő blokkot, Ideális esetben a teljes referenciakeretet végig kell nézni. Ez. azonban nem praktikus, mivel a videó kódolóval szemben túlságosan nagy számítási igényt támaszt. A keresési területet ezért általában a pillanatnyi keret makrobfokkjának eredeti helye körüli hP,Pl területre korlátozzák, ahogy ez a 4c ábrán látható.

A 10 kódolóból a 2.Ö deködolóba továbbítandó mozgásinformáció mennyiségének további csökkentése érdekében a mozgásvekíorteret egy mozgásmodeií alkalmazásával a 10 kódoló 12 mozgásmező-kódoió egységével kódolják. E folyamat során a képszegmensek mozgásvektorait bizonyos előre meghatározott függvények felhasználásával újból kifejezik, vagyis modellezik a mozgás vektorteret. Szinte az összes jelenleg használt mozgásvektortér-modell olyan additív mozgásmodeií, amelyet az alábbi általános képletek írnak le;

.V-)

>v-s ahol a? és bj a mozgásegyütthatók. A mozgásegyütthatókat az 1. és 2. ábrán látható 2 információfolyamban továbbítják a 20 dekodölönak. Az ή és g, függvények a mozgásvektortér bázisfüggvényei; Az említett függvények ismertek mind a 10 kódoló, mind a 20 dekódoló számára. Az együtthatók és a bázisfüggvények felhasználásával előállítható egy fAz(r_;y)_;Áv(

?)) közelítő mozgásvektortér. Mivel a bázisfüggvények mind a 10 kódoló, mind a 20 dekódoló számára Ismertek (mivel azokban vannak eltárolva), a 10 kódolónak csak a mozgásegyütthatókat kell továbbítania, ezáltal lecsökkenthető a keret mozgásinformációjának reprezentálásához szükséges információ mennyisége,

A legegyszerűbb mozgásmodeií az eltolási mozgásmodeií, amely csak két együtthatót tesz szükségessé az egyes szegmensek mozgásvektoraínak leírására. A mozgásvektorok értékeit az alábbi kifejezések adják meg;

* Λ X »

-8Δχ(Χ,>^!} ~ ί?β:

<W„y) = V ⁽⁴⁾

Ezt a modellt használják az ITU-T H.2S3 ajánlásban és az ISO MPEG-1, MPEG-2, MPEG-4 szabványokban a 16x16-os és 8x8-as pixelblokkok mozgásának leírására. Az eltolási mozgásmodellt alkalmazó rendszerek tipikusan teljes píxeiíelbontás vagy a teljes pixelfelbontás egész számú törtrésze, például fél pixel vagy negyed pixel felbontás mellett végzik a mozgásbecslést.

A P_n(x,y) predikciós keretet a 10 kódoló 13 mozgáskompenzált predikciós egysége az alábbi képlet alapján állítja elő:

A 14 predikciősblba-kődoló egységben az E_v(x_;y} predikciőshibs-keretet tipikusan úgy tömörítik össze, hogy azt bizonyos kétdimenziós függvények véges sorával reprezentálják. Erre a célra például kétdimenziós diszkrét koszinusz transzformáció (DCT) használható. A transzformáció együtthatóit kvantálják, majd például Huffman-kódoiássaí enfrópíakódoiást végeznek az 1. és 2. ábrán látható 1 információfolyamban a 20 dekódolónak történő továbbításuk előtt. A kvantáláskor fellépő hiba miatt ez a művelet általában az E_n(x,y) predikcióshiba-keret minőségromlásával, vagyis információvesztéssel jár. A minőségromlás kompenzálása céljából a 10 kódoló tartalmaz egy 15 predikcióshiba-deködoló egységet ís, amely a transzformáció együtthatóinak felhasználásával egy £.,(x,v) dekódolt predikcíóshlba-keretet állít elő. A 19 összeadó összeadja a lokálisan dekódolt .£j_!(x,j) predikcióshiba--keretet és a P«(x,y) hibakerefef, és az így kapott 4 (*>>') dekódolt aktuális keretet eltárolják a 17 keretmemőrlában a következő Rn₊i(x,y) reíerenciakeretkénf történő további felhasználás céljából.

A mo2gásvektorokkal kapcsolatos információt továbbító 2 információfolyarnof a 16 multiplexerben egyesítik a predikciós hibával kapcsolatos információval és a tipikusan legalább az említett kétféle információt tartalmazó 3 információfolyamot a 20 dekódolónak továbbítják.

9A továbbiakban a 10 kódolónak megfelelő 20 videó dekódoló működését ismertetjük.

Az előzőleg helyreállított R_n(x,y)' referenciakeretet a 20 dekódoló 24 keretmernónája tatralmazzs. A P_n(x,..y> predikciós keretet a 20 dekódoló 21 mozgáskompenzált predikelós egysége állítja elő az (5) egyenlet alapján a kapott mozgásegyütthatókra vonatkozó Információ és az előzőleg helyreállított R_n(x,y) referenciakeret pixelértékei felhasználásával. Az. E_n(x,y) predikcióshiba-keret elküldött transzformációs együtthatóit a 22 predikcióshiba-dekódoiő egységben a dekódolt A„(r,y) dekódolt predikcióshiba-keret előállítására használják fel. Az

Z_ft.(x,/) dekódolt aktuális keret pixeleit a P_R(x,y) predikelós keret és az

Ad·*'? >9 dekódolt predikcióshiba-keret összeadásával állítják elő:

iA,y) -· 4 (-u y) ·^;· ·&« í u y) ~ 4, h ·*· Ax(x> y)> y * 4v(%, y4, (x, AA

Ezt az 4(x,y) dekódolt aktuális keretet következő R_fí^(x,y) referenciakeretként a 24 keretmemóriában tárolják el.

A digitális videó mozgáskompenzált kódolásának és dekódolásának fenti leírásában az aktuális keretben lévő makrobfokknak az R_n(x,y> referenciakerethez viszonyított elmozdulását leíró [áx(x,y),Ay(x,y)j mozgásvektor bármely pixelre rámutathat a referenciakeretben. Ez azt jelenti, hogy a digitális videó képsor keretei közötti elmozdulás csak a keretben lévő képpontok által meghatározott felbontással., ún, teljes pixeles felbontással reprezentálható. A valóságos mozgás azonban tetszőleges pontosságú lehet, így a fent bemutatott: rendszer a digitális videó képsor egymást követő keretei közötti elmozdulásnak csak közelítő modelljét adhatja. A videó keretek elmozdulásának teljes pixeles felbontással történő modellezése tipikusan nem elegendően pontos ahhoz, hogy lehetővé fegye az egyes makroblokkokhoz vagy keretekhez tartozó predikciós hiba (PE) információ hatékony minimalizálását, A valóságos mozgás még pontosabb modellezéséhez és a kódolótól a dekódolöba továbbítandó predikelós hiba információ mennyisé: lecsökkentésére egyes videó kódolási szabványok lehetővé teszik, ásvekterok képpontok közé mutassanak. Magyarán, a mozgásvektorok

V « <

4> « £ #«* x<

* «ί 4 * * * »#** » *«·♦·* ♦ -»* ** szubpixel felbontással Is rendelkezhetnek. A mozgásvektorok szubpixel pontosságú felbontásának lehetővé tétele ugyanakkor tovább növeli a végrehajtandó kódolási és dekődolásl műveletek komplexitását, emiatt továbbra Is előnyös korlátozni a mozgásvektor térbeli felbontásának mértékét. Ennek következtében a videó kódolási szabványok, például a korábban említett szabványok a mozgásvektorok számára tipikusan csak a teljes, fél vagy negyed pixeles felbontást teszik lehetővé.

A legtöbb szubpixel felbontású becslés megvalósítható kéílépéses folyamattal, ahogy ez az 5. ábrán bemutatott példában látható, ahol az általánosított videó kódolási eljárásban a mozgásvektorok teljes pixel vagy fél pixel felbonfásúak. Első lépésben egy megfelelő mozgásbecsiő eljárással, például a korábban említett blókkifleszfési eljárással meghatároznak egy teljes pixel felbontású mozgásvekfort. Az igy kapott, teljes pixel felbontású mozgásvektor az 5, ábrán látható.

A második lépésben az első lépés során meghatározott mozgásvekfort a kívánt fél pixel felbontás elérése céljából tovább finomítják. Az 5. ábrán látható példánál ezt úgy végzik el, hogy létrehoznak nyolc új 18x18 pixelből álló keresöblokkot, ahol minden egyes blokk bal felső sarkának helyét X-szel jelölik meg, ahogy ez az 5. ábrán látható. Ezeket a helyeket a [Ax+m/2,áy+n/2j kifejezés Írja le, ahol m és n a -1, 0 és +1 értéket veheti tét, azonban a két paraméter értéke egyidejűleg nem lehet Ö. Mivel csak az eredeti képpontok pixelértékei Ismertek, a fél pixel távolságra elhelyezkedő szuhpixetek értékeit, például az intenzitás és/vagy kromínaneia értékeket, mind a nyolc új keresési blokk esetén megjósolják valamilyen interpolációs eljárás alkalmazásával.

A szubpixeiek értékeinek fél pixel felbontással történő interpolálását követően mind a nyolc keresési blokkot összehasonlítják azzal a makrohlokkal, amelynek mozgásvektoráf keresik. Akárcsak a teljes pixel felbontású mozgásvekfor meghatározása céljából végrehajtott blokkillesztési folyamat során, a makroblokkoí ezúttal is összehasonlítják mind a nyolc keresési blokkal valamilyen feltételrendszer, például az abszolút eltérések összege (SAD) módszer alapján. Az összehasonlítás eredményeként általában egy minimum SAD értéket határoznak meg. A videó képsorban megvalósuló mozgás jellegétől függően ez a minimum érték megfelelhet az eredeti, teljes pixel felbontású mozgásvektor által specifikált helynek vagy egy fél pixel felbontású helynek. Ily módon lehetővé válik annak meghatározása, hogy egy *« *-♦«·> XX ***« *4 * 4 8 * ν a 8 <

« » 8 »κ« ♦>

* 8 * Λ * *

4*>« * vt* ^Λ* mozgásvektornak teljes pixel vagy fél pixel helyre kell mutatnia, és amennyiben a szubpixel-íethöntás megfelelő, lehetővé válik a helyes szobplxekfelbontású mozgás vektor meghatározása is.

A gyakorlatban a referencíakerethen lévő szubpixel érték becslését a környező pixelértékekből történő interpolálással végzik. Egy nem egész értékű (x,y}={n+Ax,m+Ay) helyen elhelyezkedő F(x,y) szubpixel érték interpolálása elvégezhető egy kétdimenziós művelettel, amely matematikailag az alábbi módon írható le:

Tx

V /(k + Á'J 4· £)F'(« -r k, ??; + Z), ahol f(k,1) szűröegyütthatók, n és m pedig az x és y értékek csonkolásával nyert egész számok. A szűröegyütthatók értéke általában függ az x és y értékétől, továbbá az interpolációs szűrők általában ún. szétválasztható szűrők, vagyis Is a F(x,y) szubpixel értékek az alábbi módon számíthatók:

F(x, y)

A-.·- λ;

(8)

A mozgásvektorokat a kódoló számítja ki. Miután a megfelelő mozgásegyütthatókat továbbították a dekodölónak, elöreesatolt módon történik a kívánt szubpixetek interpolálása olyan interpolációs eljárás alkalmazásával, amely megegyezik a kódolóban használt eljárással. Ily módon a 24 keretmemóriában a referenciakeretet követő keret előállítható a referenciakeretből és a továbbított mozgásvektorökhót,

A videó kódolókban és dekódolókban használt Interpolációs szűrök szokás szerint rögzített szöroegyüttható-értékeket használnak és a kódolás alatt álló videó képsor összes keretéhez ugyanazt a szűrőt, vagyis azonos típusé szűrőket megegyező szűrőegyütthatö-értékekkel használják. Ugyanazt a szűrőt használják a későbbiekben is az összes videó képsorhoz, függetlenül azok természetétől és attól, hogy hogyan lettek rögzítve. Wedi („Adaptlve Interpolálton Filter fór Mollon Ccmpensated Hybrld Videó Coding”. Pioture Coding Symposium (PGS 2001}·, Szöul, • X »♦ * ν * <β

--12 ♦ * «· ν - »·♦.

Korea, 2001. április) az interpolációs szűrök adaptív szüröegyütthatő-értékekke! történő felhasználását javasolja a videó kódolási folyamat bizonyos egyszerűsítésének kompenzálása érdekében Az említett tanulmányban Wedi bemutatja, hogyan idéz elő járulékos predikeíós hibákat a képgyűjtési folyamat során végzett felbontás-csökkentés, a mozgásvektorok véges megengedett felbontása és az elmozdulási mozgásmodell korlátozott érvényessége. Egy videó képben a felbontás csökkenése a képrögzítés! folyamat során használt nem-ideális aluláteresztő szűrök alkalmazásából és következésképpen a Nyqujst-féte mintavételezési elv figyelmen kívül hagyásából adódik. A felbontás csökkenése zavarja a mozgáskompenzáll predikelől a videó képsorban és- további predikeíós hibakomponenst állít elő. A mozgásvektorok véges megengedett pontossága, például a teljes pixel, fél pixel vagy negyed pixel felbontása, továbbá az egymást követő videó keretek között csak vízszintes és függőleges elmozdulást reprezentáló eltolási mozgásmodell korlátái további predikeíós hibákat okoznak. Wedi -szerint a kódolás hatékonysága tovább javítható egy interpolációs szűrő szürőegyűtthatőértékeinek oly módon történő módosításával, hogy az kompenzálja a felbontás csökkenéséből , a mozgásvektorok véges pontosságából és az eltolási mozgásmodell korlátozott érvényességéből adódó további predikeíós hibákat.

A problémát általánosabban megközelítve, tisztában kell lenni azzal, hogy mivel egy videó képsorban a mozgás természete és· Jellemzői változnak, az optimális Interpolációs szűrő az idő és a kép helyének függvényében változik. Az említett tanulmányban Wedi bemutat egy olyan példát, amelynél dinamikus adaptív szűrőegyütthafó-értékeket tartalmazó interpolációs szüret integrálnak a H.2SL videó kódolóba, pontosabban a kódoló 4. tesztmodel! (TMl-4) által meghatározott változatába. A H.26L videó kódoló TML-4 változata negyed pixel felbontású mozgásvektort és Wiener-íéle interpolációs szűrőt használt, amely szűrő hat szimmetrikus szürőegyütthatót tartalmazott, vagyis a szűrő egy S-fokozatú szűrő volt. A Wedi által bemutatott példa az. Interpolációs szűrő szörőegyütthatöinak keretenként! módosítását, a szörőegyüffoatök differenciális kódolását, továbbá azoknak a dekődolóba a fő videó adatok meilékinformáclójaként történő továbbítását javasolja, Ezen az elven alapulva olyan javaslat is született, hogy a H.26L videó kódoló 8, tesztmodelljében alkalmazott dinamikusan adaptív szőlőegyüttható” & *·' * X * * · < \ JÍ

V - X * * < V < « f « * » * ?.»'V .·. \ · értékeket tartalmazó .interpolációs szűrőket használjanak. Ezt. a megoldást mutatja be az ITU „Adaptive Interpolálton Filter for H28LF clmö Irata (Study Group· 16, Guesíion 6, Videó Codlng Experts Group (VCEG), VCEG-N23, 2001, szeptember), valamint a „More Results on Adaptive Interpolálton Filter for H.28L” című irata (Study Group 16, Qeesíion 6, Videó Codlng Experts Group (VCEG), VCEG-O16r1, 2001. november).

A dinamikusan adaptív interpolációs szűrők felhasználása fontos szerepet játszik a kódolt videó adatfolyam kódolási hatékonysága szempontjából, továbbá hatással van a kódolt videó adatok hibatűrésére Is. A kódolási hatékonyságot eiórecsatolt módon kell érteni. Egy olyan videó kódoló rendszerben, amely rögzített szürőegyütthatö-értékekkel rendelkező interpolációs szűrőt használ, szükségtelen olyan információi előállítani, amely a kódolt videó bitfolyamban lévő szüroegyütthatoértékekre vonatkozik. A szűrőegyüfthatő-értékek egyszerűen rögzíthetők a videó kódolóban és a videó dekódolóban. Magyarán, egy konkrét videó kódolási szabványt implementáló videó kódoló rendszer, amely rögzített interpolációs szűrőket használ, az együttható értékeket a szabvány előírásainak megfelelően előre beprogramozzák mind a kódolóba, mind pedig a dekódolóba. Ha azonban a dinamikusan adaptív szöröegyütthatók alkalmazása megengedett, szükségessé válik az együtthatóértékekre vonatkozó információ továbbítása is. Mivel a szűrőegyütthatókat periodikusan -- például keretenként - módosítják, megnövekszik a videó kódolóból a videó dekódolóba továbbítandó információ mennyisége, és ez hátrányosan befolyásolja a kódolás hatékonyságát, A kis bitsebességű videó kódolási alkalmazásoknál a továbbítandó információ mennyiségének bármilyen növelése álta iá ba n nem k ívánatos,

A fentiek miatt a mozgás optimális modellezéséhez és kompenzálásához a dinamikus Interpolációs szűrök hatékony reprezentálása szükséges.

A hibatűrés kapcsán meg kell jegyeznünk, hogy a dinamikusan változtatható interpolációs szűrő vonatkozó információnak a kódolóból a történő továbbítási módja befolyásolhatja a videó adatoknak az átviteli hibákra való érzékenységét, nevezetesen, egy videó kódoló rendszerben, amely dinamikusan adaptív Interpolációs szűrőket használ, egy videó képsor kereteinek a dekódolóban történő megfelelő helyreállítása a szűrőegyüttható-értékek hibátlan vételén és dekódolásán alapúi. Amennyiben az ό vonatkozó információban entrópiaködolása.

hiba keletkezik a kódolóból dekódolöba történő továbbítás során, valószínűleg sérült lesz a helyreállított videó adat is, A szűrőegyütthatók kódolásának három ismert létezik. Az első a szűróegyöttható-értékek kölön-küiön történő . második módszer a szűrőegyötthatö-értékek differenciált entrópiakódolása a már kódot szűrők szőröegyütthatőínak ismeretében (Wedi által javasolt kódolási eljárás), míg a harmadik eljárás szőrök egy csoportjának definiálásából, majd a kiválasztott szűrő indexének kódolásából áll.

Az interpolációs szűrők szőröegyütthatőínak kódolására használható, fent említett, ismert megoldások közös problémája az eltérő felhasználási forgatókönyvekben rejlik. Az első eljárás, amelynél az interpolációs szürőegyütthatók külon-külön vannak kódolva, gyenge minőségű kódolást eredményez, mivel nem basznál fel semmilyen a priori információt, vagyis a korábban kódolt interpolációs szűrőegyöttbatő-értékekre vonatkozó információt, következésképpen ennél az eljárásnál túlzottan nagy mennyiségű információt kell a kódolt videó bitfolyamhoz hozzáadni az interpolációs szürőegyütthafö-értékek leírásához. Az együtthatók differenciális kódolása, melyet Wedi is javasol, hatékony ugyan, de nem használható olyan környezetben, ahol átviteli hibák előfordulhatnak, mivel a szörőegyütthatók értékei a korábbi szürőegyütthatók hibátlan dekódolásától függenek. Mint korábban említettük, amennyiben a kódolt videó bitfolyam sérül a kódolóból dekódolöba történő továbbítás során, a dekódolóhan helyreáilitoti videó adatok valószínűleg szintén hibásak lesznek. A harmadik ismert megoldásnál a szűrők előre meghatározott csoportja korlátozott felhasználást tesz lehetővé, ezáltal lecsökkenti a kódolás hatékonyságát. Magyarán, ez az eljárás nem bírja teljesen kihasználni a dinamikusan adaptív szűröegyüttható-értékekkel rendelkező- interpolációs szűrők felhasználásából adódó előnyöket.

Szükségesnek látszik tehát egy olyan, adaptív interpolációs szűrők együtthaíőértékeínek kódolására szolgáié eljárás kidolgozása, amely egyrészt hatékony, másrészt nem csökkenti a kódolt videó bitfolyam hibatűrését.

A találmány egyesíti a díflerendakódolás jó kódolási hatékonyságát és a hibatűrő képességet, Igy lehetővé válik a találmány szinte bármilyen környezetben történő felhasználása. A találmány különösen alkalmas olyan videó kódoló rendszerekben történő implementálásra, melyek hiba előidézésére alkalmas »♦* * környezetben működnek, például ott, ahol kódolt videó bitfolyamét kell továbbítani zajos rád iókornmuníkációs összeköttetésen.

A kitűzött célokat egyrészt olyan eljárással érjük el, amely digitális videó képsor képeinek kódolására szolgái kódolt videó adatok előállítása céljából; A digitális videó képsor pixelértékekböl álló videó keretek sorozatából áll. A digitális videó képsor kereteiben lévő pixelértékeknek a kódolt videó adatokból történő heíyreáilitására együílhaíöértékek által reprezentált együtthatókkal rendelkező interpolációs szűröt használunk. Az interpolációs szűrő együtthatóértékest előre meghatározott alapszörö alapján különbségi kódolással kódoljuk, ezáltal különbségi értékek csoportját állítjuk elő, majd átalakítjuk a kódolt videó adatok között továbbítandó különbségi értékek csoportját oly módon, hogy lehetővé váljon a pixelértékek helyreállítása a különbségi értékek csoportja alapján,

A videó kódolóból a videó dekodolóba továbbított, kódolt videó adatokban célszerűen olyan kódolt értékeket továbbítunk, amelyekből a különbségi értékek csoportjára lehet következtetni, és a különbségi értékek csoportját a videó kódolóból a videó dekódolóba történő továbbítás előtt célszerűen entrópíaködolássai kódoljuk.

Célszerűen olyan előre megbatározott alapszűrőt használunk, amelynek olyan további együtthatói vannak, amelyek statisztikailag hasonlóak, az interpolációs szűrő egyötthatóértékeíhez.

Egy kiválasztott képszegmens pixelértékeinek interpolálásához célszerűen az interpolációs szűrő együtthatóit használjuk.

Az előre meghatározott alapszínében célszerűen rögzített együtthatóértékeket használunk.

Az előre meghatározott alapszGrőben célszerűen olyan együtthatókat használunk, amelyek illeszkednek a videó képsor statisztikai jellemzőihez.

Célszerűen szimmetrikus interpolációs szűrőt használunk és ez esetben a szííröegyütthatöknak csak a felét kódoljuk.

Az interpolációs szűrő együtthatóértékeit célszerűen meghatározott sorrendben, előnyösen az első együttható értéktől az utolsó együttható értékig kódoljuk.

* 4

Az együtthatőértékeket azok térbeli sorrendjétől eltérő sorrendben is kódolhatjuk.

Előnyös, ha az interpolációs szűrő együtthsiőértékeinek összegét rögzítjük. Az előre meghatározott alapszűrő további együtthatóértékeihez célszerűen hozzáadunk egy konstans értéket, ezáltal lecsökkentjük az interpolációs szűrő együtfhatőértékei és az előre meghatározott alapszőrő további együíthatőértékei közötti eltérések nagyságát.

A kitűzött célokat másrészt olyan videó kódoló megvalósításával érjük el, amely videó keretek sorozatából álló digitális videó képsorban lévő képeket a videó képsort leíró kódolt videó adatok előállítása céljából kódoló eszközt tartalmaz, ahol a videó képsor minden egyes kerete plxeiértékekbői áll, továbbá amely videó kódoló a dekódolás! folyamat során a digitális videó képsor kereteiben lévő pixelértékeket helyreállító interpolációs szűrőt meghatározó eszközt tartalmaz, ahol az interpolációs szűrőnek együtthatóértékek által reprezentált együtthatói vannak. A videó kódoló tartalmaz még az interpolációs szűrő kimenete alapján az interpolációs szűrő együtthatóértékel és az előre meghatározott alap-szűrő együtthatóértékei közötti eltérést kiszámító és különbségi értékek csoportját előállító eszközt, valamint a kódolt videó adatok között továbbítandó különbségi értékek csoportját a pixeiértékeknek a dekődolási folyamat során történő helyreállítását lehetővé tevő módon átalakító eszközt.

A videó móddá célszerűen tartalmaz egy, a kódolt videó adatokban szereplő különbségi értékek csoportjának átalakítása előtt a különbségi értékek csoportján entrópiakódolást végző eszközt is.

A videó kódoló előnyösen szimmetrikus interpolációs szűrőt tartalmaz, és ez esetben az entróplakódolást végző eszköz a különbségi értékek csoportjának csak a télét kódoló eszközként van megvalósítva.

A kitűzött célokat továbbá olyan, eljárással érjük el, amely videó keretek sorozatából álló digitális videó képsort leíró videó adatok dekódolására szolgái, ahol a videó képsor minden egyes kerete pixelértékekből áll, továbbá ahol egyűfthatőértékek által reprezentált együtthatókat tartalmazó interpolációs szűrőt használunk a digitális videó képsor kereteiben lévő pixelértékek helyreállítására. Az eljárás során a videó adatokból kinyerjük különbségi értékek egy csoportját, * .<· <· 9 ΛΛ * A «

amely különbségi értékek az interpolációs szűrő és egy előre meghatározott aíapszürö együtthatőértékei közötti eltéréseket adják meg, majd a különbségi értékek -csoportja és az előre meghatározott alapszóra alapján előállítunk egy további szűrőt, végül a további szűrő segítségével helyreállítjuk a pixelértékeket.

Az előre meghatározott alapszörőt célszerűen további együtthatóértékek által reprezentált további együtthatókkal látjuk el, és a további szűrőt úgy állítjuk elő, hogy összeadjuk a különbségi értékeket és az előre meghatározott aíapszürö további együtthaíóértékeit.

A különbségi értékek csoportját célszerűen entrapiadeköóoíással nyerjük ki a videó adatokból.

A kitűzött célokat továbbá olyan videó dekódoló megvalósításával érjük el, amely egy bitfolyamban továbbított videó adatokat fogadó eszközt tartalmaz, ahol a fogadott videó adatok olyan digitális videó képsort írnak te, amely videó keretek sorozatából áll, ahol a videó képsor minden egyes kerete píxeíértékekboí áll. A videó dekódoló a bitfolyamból különbségi értékek egy csoportját kinyerő eszközt, egy előre meghatározott aíapszürö és a különbségi értékek alapján Interpolációs szűrőt előállító eszközt, valamint az interpolációs szűrő és a fogadott videó adatok alapján a videó képsor bármely keretében lévő pixelértékeket helyreállító eszközt

Az előre meghatározott alapszűrőnek célszerűen további együtthatőértékek által reprezentált további együtthatói vannak, és a videó dekódoló célszerűen tartalmaz egy, a különbségi értékek csoportját az előre meghatározott aíapszürö további együtthatóértékeivel összeadó, ezáltal interpolációs szűröt előállító eszközt.

A videó dekódoló célszerűen tartalmaz egy, a bitfolyamból kinyert különbségi értékek csoportján enfrópiadekódoíásí végző eszközt.

A kitűzött célokat végül olyan videó kódoló rendszer megvalósításával érjük el, amely videó keretek sorozatából álló digitális videó képsorban lévő képeket kódoló és a videó képsort leíró bitfolyamban továbbítandó kódolt videó adatokat előállító kódolót tartalmaz, ahol a videó képsor minden egyes kerete pixelértékekböl áll, továbbá amely kódoló a digitális videó képsor bármely keretében lévő pixelértékeknek a dekódoíási folyamat során történő helyreállítására szolgáló interpolációs szűrőt meghatározó eszközt tartalmaz, ahol az interpolációs szűrőnek együtthaíöértékek által reprezentált szö-rőegyütthatől vannak. A videó kódoló rendszer a videó képsor bármely keretében lévő pixelértékeknek a dekódolást folyamat során történő helyreállítása céljából továbbított hiíoíyamban lévő kódolt videó adatokat fogadó dekódoló! is tartalmaz.

A videó kódoló rendszerben lévő dekódoló tartalmaz továbbá az interpolációs szűrő és egy előre meghatározott aíapszűrö közötti eltérést kiszámító és különbségi értékek egy csoportját előállító eszközt, valamint a bitfolyamban továbbítandó különbségi értékek csoportját átalakító eszközt is. A videó kódoló rendszerben lévő dekódoló tartalmaz még a bitfolyamból a különbségi értékek csoportját kinyerő eszközt és az előre meghatározott alapszöró és a kinyert különbségi értékek csoportja alapján egy további szűrőt előállító eszközt, ahol a pixelértékeknek a dekódolás! folyamat során történő helyreállítása a további szűrő alapján történik.

A találmányt a továbbiakban a rajz alapján ismertetjük részletesen. Szükségesnek tartjuk ugyanakkor megjegyezni, hogy a rajzok csak illusztrációként szolgálnak és nem jelentik a találmány korlátozását, A rajzon:

- az 1. ábra egy szokásos videó kódoló általánosított blokkvázlatát mutatja;

- a 2. ábra egy szokásos videó dekódoló általánosított blokkvázlatát mutatja;

- a 3. ábra a videó kódolás során használt keretek típusait szemlélteti vázlatosan;

- a 4a ábra egy aktuális keretben lévő makroblokkot szemléltet vázlatosan;

- a 4b ábra a blokkillesztéshez használt referenciakeretet szemléltet vázlatosan;

- a 4c ábra egy, az aktuális keretberr lévő makrohlokk eredeti helye körüli keresési területet szemlélteti vázlatosan;

- az 5, ábra egy korábban alkalmazott, szubpixei felbontással történő mozgásbecslési eljárást szemlélteti vázlatosan;

- a 6a ábra egy optimális interpolációs szűrő vázlatrajza;

- a 6 b ábra az alapszó rőre és különbségi együtthatókra szétválasztott optimális Interpolációt szemlélteti vázlatosan:

~ 1ö~

XX

- a 6c ábra a kódolandó és a dekódolónak továbbítandó- különbségi együtthatókat szemlélteti vázlatosan;

- a 7, ábra a találmány szerinti, videó kódoló és videó dekódoló berendezést tartalmazó végberendezés blokkvázlata;

» a 8a ábra a találmány szerinti videó kódoló egyik lehetséges változatának blokkvázlata;

- a 8b ábra a találmány szerinti videó kódoló egy másik lehetséges változaté nak blokkvázlata;

- a 8c ábra a találmány szerinti videó kódoló egy harmadik lehetséges vá itozatán a k blokkvázlata;

- a 9a ábra a találmány szerinti videó dekódoló egyik lehetséges változatának blokkvázlata;

- a Sb ábra a találmány szerinti videó dekódoló egy másik lehetséges változatának blokkvázlata; és

- a 9c ábra a találmány szerinti videó dekódoló egy harmadik lehetséges változatának blokkvázlata.

A találmány szerinti kódoló a szűröegyütíhatókaí különbségi kódolással kódolja előre megbatározott bázis szürőegyütthatók alapján. A 8a-6c ábrák a találmány szerinti eljárást szemléltetik. A 6a ábrán látható oszlopdiagram az interpolációs szürőegyütthatók értékeit szemlélteti, ahol az egyes oszlopok megfelelnek az egyes szörőegyüíthatóknak. Az oszlopok magassága az adott szüróegyüttható értékét szemlélteti, vagyis a vízszintes tengely fölé nyúló oszlopok pozitív együtthatőértékeket, a vízszintes tengely alá nyúló oszlopok pedig negatív együtthatőértékeket reprezentálnak. Amint a 8a és 6b ábrán látható, a 118 oszlopdiagram olyan szűrőt reprezentál, amelyet a kódoló egy kiválasztott képszegmens rnozgásínterpoiációja számára legjobbnak talál, míg a 140 oszlopdiagram az aíapszűrőt reprezentálja. A 8a ábrán látható példánál a szűrő olyan 8-fokozatú szimmetrikus szűrő, melynek hat szűrőegyütthatója van. A szüröegyütíhatők puszta elküldése helyett csak a kiválasztott 11 ö szűrő és a 140 afapszürő együtthatóértékei közötti 138 eltérést kódoljuk és továbbítjuk. A különbségi 120 együtthatók elküldött értékelt a 6c ábra szemlélteti.

A találmány révén hatékony kódolás érhető el, mivel a kis értékű különbségek hatékonyan kódolhatók: entrópiakódotással. Amikor ezeket a különbségi értékeket beszúrjuk egy videó kódoló által előállított, kódolt videó bitfolyamba és a videó bitfolyamat a kódolóból a megfelelő dekődölőnak továbbítjuk, az interpolációs szűrő együtthatói a dekódolóban visszaállíthatok oly módon, hogy a különbségi értékeket kiolvassuk a kódolt bitfolyamból és hozzáadjuk azokat az alapszürőnek a dekódolóban eltárolt, előre meghatározott megfelelő együtthatóértékeihez.

Szükségesnek tartjuk megjegyezni,, hogy az alapszörő adaptálható a videó képsor statisztikai jellemzőihez és a beérkező szűrőegyütthatókhoz, ezáltal tovább javítható a kódolás hatékonysága. Lehetőség nyílik arra is, hogy az alapszüröt a teljes ködolő-dekódoló egység számára előre meghatározzuk. Magyarán, ugyanaz az előre meghatározott alapszörő használható az összes kódolandó videó képsorhoz, függetlenül azok tulajdonságaitól vagy azok rögzítési módjától. Lehetőség van arra is, hogy az alapszűrőt a videó adatokhoz adaptáljuk, vagyis különböző alapszüröket használjunk különböző videó képsorokhoz vagy az alapszüröt bizonyos előre meghatározott szabályok szerint egy adott videó képsor kódolása közben módosítsuk.

Ha a szűrő szimmetrikus, ahogy ez a 8a~8c ábrákon látható, a szűrőegyütthatóknak csak a felét kell kódolni A többi szürőegyüttható meghatározható egyszerű: másolással. A 8c ábrán látható példánál az adaptív Interpolációs szűrőnek a kódolt videó bitfolyamban továbbított együtthatóértékeinek reprezentáíásához szükséges információ mennyisége tovább csökkenthető annak felismerésével, hogy a 4,, 5. és 8. szürőegyüttható értéke megegyezik a 3., 2., illetve 1. szürőegyüttható értékével. így ebben az esetben az interpolációs szűrő hat együtthatóját valójában három értékkel lehet kódolni, vagyis az első együttható az első interpolációs szürőegyüttható és az előre meghatározott alapszörő első együtthatója közötti különbséget, a második együttható a második interpolációs szürőegyüttható és az előre meghatározott alapszűrő második együtthatója közötti különbséget, míg a harmadik együttható a harmadik interpolációs szürőegyüttható és az. előre meghatározott alapszörő harmadik együtthatója közötti különbséget reprezentálja. Ily módon csak ezt a három különbségértéket kell elhelyezni a kódolóból a dekődolőba továbbítandó kódolt videó bitfolyamban, mivel a dekódoló a *

*χ ♦ másik három interpolációs szűrőegyütfhaiöt az első három visszaállított szűröegyüöhafó-srték megfelelő másolásával elő tudja állítani. Hasonló megközelítés alkalmazható abban az esetben ís, amikor az alapszűrő és az interpolációs szűrő nem páros, hanem páratlan számú együtthatót tartalmaz, és az együtthatóérfékek szimmetrikusak. Ebben az esetben nyilvánvaló, hogy a kódolandó különbségértékek száma (nZ2)+1, ahol n az .alapszűrő» Iliéivé az interpolációs szűrő együtthatóinak a száma.

A találmány szerinti eljárás kombinálható más együtthatókódolási eljárásokkal is. Például a leggyakrabban használt szűrökből létrehozható egy szürőcsoport és a szűröcsoport a benne szereplő szűrök Indexeivel kódolható. A ritkábban használt szűröket viszont érdemes a találmány szerinti eljárással kódolni, ami lehetővé teszi a rendelkezésre áltó szűrők maximális variálását és ezáltal kiküszöböli a harmadikként említett, ismert együttható-kódolási eljárás hátrányait.

A szűrőágyűithatök kódolási sorrendjének nem szükséges követnie a térbeli sorrendet. Az interpolációs szűrőegyötthafó-értékeket reprezentáló különbségi értékeket nem szükséges ugyanabban a sorrendben továbbítani a kódolt videó bitfolyamban, mint ahogy az együtthatók a szűrőben követik egymást. Ebben az esetben előre meg kell adni egy olyan szabályt, amely meghatározza azt a sorrendet, amely szerint a különbségi értékek egymást követik a bitfolyamban, és ezt a sorrendet Ismernie kell mind a kódolónak, mind pedig a dekódolónak.

Lehetőség van arra, hogy az alapszürőt ugyanannak a szűrőnek a beérkező szőrőegyütthatölhoz illesszük. Ha például az elsőként továbbított szűröegyüftható nagyobb, mint az alapszűrő együtthatója, a második alapszűrő együtthatója lecsökkenthető. Ez különösen igaz abban az esetben, ha ismert a szűröegyütthafók összege.

A szürőegyütthatók összege tipikusan egy rögzített érték. Ilyenkor szükségtelen az utolsó szőröegyüttható kódolása, mivel az kiszámítható oly módon, hogy az előző együtthatók összegét kivonjuk a teljes összegből. Amennyiben a szűröegyütthafók összege nem rögzített érték, külön továbbított konstans vagy konstansok adhatók az alapszűrö együtthatóihoz vagy a szűrő kimenetéhez az együttható-különbségek abszolút értékének csökkentése céljából.

A 7. ábrán olyan., videó kódolót és videó dekodolót tartalmazó végberendezés látható, amely alkalmas a találmány szerinti eljárás végrehajtására. A 7. ábrán látható 60 multimédia terminál az ÍFU-Ϊ H.324 ajánlás alapján van implementálva. A 80 multimédia terminál multimédiás adóvevő eszköznek tekinthető és olyan egységeket tartalmaz., amelyek rögzítik, kódolják és m ultiplexei ik a kommunikációs hálózaton keresztül továbbítandó multimédia adatfolyamokat továbbá olyan egységeket tartalmaz, amelyek fogadják, demultlplexelik, dekódolják és megjelenítik a fogadott multimédia tartalmat Az ITÜ-T H.324 ajánlás rögzíti a terminál egészének működését és utal más olyan ajánlásokra, amelyek a terminál különböző részegységeinek működését írják le, Az ilyen multimédia terminál felhasználható valós idejű alkalmazásokban, például videotelefon rendszerekben vagy nem valós idejű alkalmazásokban, például videó klipeknek például egy Interneten elérhető multimédiás tartalomszolgáltató szerverről történő lehívására vagy letöltésére.

A jelen találmány ismertetése során nyilvánvaló, hogy a 7. ábrán látható H.324 ajánlás szerinti terminál csak egy a számos lehetséges multimédia terminál közül, amely alkalmas a találmány szerinti eljárás implementálására. Szükségesnek tartjuk továbbá megjegyezni, hogy számos más megoldás is létezik a terminál elhelyezésére és implementálására. Amint a 7. ábrán látható, a multimédia terminál elhelyezhető egy vezetékes telefonhálózathoz, például egy analóg PSTN hálózathoz csatlakozó kommunikációs berendezésben, Ebben az esetben a multimédia terminál olyan 71 modemmel van ellátva, amely az ITÜ-T V.8, V.34, esetleg V.Sbis ajánlás szerint működik.. A multimédia terminál külső modemhez is csatlakoztatható. A modem lehetővé teszi a multimédia terminál által előállított multiplexeit digitális adatok és vezérlőjelek analóg jelekké történő átalakítását a PSTN hálózaton keresztül történő továbbítás céljából. Lehetővé teszi továbbá, hogy a multimédia terminál analóg adatokat és vezérlőjeleket fogadjon a PSTN hálózattól és azokat olyan digitális adatfolyammá alakítsa át, amelyet a terminál megfelelő módon képes demultiplexefol és feldolgozni.

Egy H.324 ajánlás szerinti multimédia terminál implementálható oly módon Is, hogy közvetlenül egy digitális vezetékes hálózathoz, például egy ISDN hálózathoz csatlakozzon. Ebben az esetben a 71 modemet, a 7. ábrán szaggatott vonallal jelölt

7.2 ISDN felhasználó-hálózat interfész helyettesíti.

A H.324 ajánlás szerinti multimédia terminálok kialakíthatok úgy is, hogy alkalmasak legyenek mobil kommunikációs alkalmazásokban történő felhasználásra. Vezeték nélküli kommunikációs összeköttetés alkalmazása esetén a 71 modem úlyen megfelelő vezeték .nélküli interfésszei, például a 7. ábrán szaggatott vonallal jelzett 73 rádió adóvevővel helyettesíthető. A H.324/M .ajánlás szerinti multimédia terminál tartalmazhat például olyan rádió adóvevőt, amely lehetővé teszi a 2. generációs GSM mobil telefonhálózathoz vagy a 3. generációs UMTS (öniversal Mobile Telephoné System) hálózathoz történő csatlakoztatását.

Szükségesnek tartjuk megjegyezni, hogy a kétirányú kommunikációra alkalmasan kialakított, vagyis videó adatok továbbítására és vételére egyaránt alkalmas multimédia terminálokban célszerűen mind a videó kódoló, mind pedig a videó dekódoló a találmány szerinti módon van kialakítva. Az Ilyen kódolóból és dekódolóból álló egységet gyakran egyetlen kombinált funkcionális egységként egy ún. kódoló-dekódoló formájában valósítják meg.

A továbbiakban a 7. ábra segítségévei egy tipikus H.324 ajánlás szerinti multimédia terminált ismertetünk részletesen. A 80 multimédia terminál számos különböző eszköz, ún, végberendezést tartalmazhat, igy például 81 videó eszközt, 82 audio eszközt vagy 83 telematikai eszközt. A 81 videó eszköz lehet például videoképeket rögzítő videokamera, a beérkező videó tartalmat megjelenítő monitor vagy szükség esetén videó feldolgozó egység. A 82 audio eszköz tipikusan mikrofon, például beszédüzenetek rögzítésére szolgáló mikrofon vagy a fogadott audio tartalmat reprodukáló hangszóró. Az audio eszköz lehet továbbá audio feldolgozó egység. A 63 telematikai eszköz többek között adatterminál, billentyűzet, elektronikus jegyzettömb, állóképeket továbbító és fogadó egység, például faxkészülék lehet.

A 81 videó eszköz egy 85 videó kődöló--dekódolóhoz kapcsolódik. A 86 videó kódoló-dekódoló a találmány szerinti videó kódolót és ahhoz tartozó videó dekódolót tartalmaz. A továbbiakban ilyen összetett, kódolót és dekódolót tartalmazó egységet mutatunk be. A 85 videó kódoló-dekódoló a rögzített videó adatok megfelelő formában történő kódolását végzi egy kommunikációs összeköttetésen történő későbbi továbbítás céljából, és dekódolja a kommunikációs hálózattól kapott, tömörített videó tartalmat. A 7, ábrán látható példánál azt feltételezzük, hogy az ily módon megvalósított videó kódoló-dekódoló dinamikusan adaptív interpolációs szűrőket használ Feltételezzük továbbá, hogy a videó ködoló-dekődolő kódoló része úgy van kialakítva, hogy kódolja az interpolációs szürőegyütthatókaf majd azokat a megfelelő dekódolónak továbbítja a találmány szerinti eljárás alapján, a korábban ismertetett módon. A videó kődoló-dekódoló dekódoló része szintén ügy van kialakítva, hogy fogadja és dekódolja azokat szűrőegyüttható-értékeket, amelyek a találmány ugyanazon változata alapján: vannak kódolva .

A multimédia terminál 82 audio eszköze egy, a 7 ábrán látható 66 audio ködoiő-deködolöboz kapcsolódik. Akárcsak a 65 videó kódoló-dekódolö, a 68 audio kődoló-dekódoló is tartalmaz egy kódoló és egy dekódold egységet, amely a multimédia terminál 62 audio eszköze által rögzített audio adatokat a kommunikációs összeköttetésen történő továbbításra alkalmas formátumra alakítja át, és a hálózaton keresztül érkező kódolt audio adatokat átalakítja olyan formátumra, amely lehetővé teszi a reprodukálás, például a terminál hangszóróján történő megszólaltatást. A 88 audio kódoló-dekodolö kimenetét egy 87 késleltető egységnek továbbítjuk. A 87 késleltető egység kompenzálja a videó kódolási folyamat során fellépő késleltetéseket, ezáltal szinkronba hozza az audio és a videó tartalmat.

A multimédia terminál 84 rendszervezérlő egysége a végpont és a hálózat közötti jelzést vezérli egy 68 jelzési egység által felügyelt, megfelelő vezérlöprotokoil alapján, ezáltal közös üzemmódot létesít az adó és a vevő terminál között. A 88 jelzési egység információkat továbbít az adó és a vevő terminál kódolási, illetve dekódolás! lehetőségeire vonatkozóan, és lehetővé teszi különböző kódolási módok alkalmazását a videó kódolóban, A 64 rendszervezérlő egység az adaftitkositás használatát is vezérli. Az: adatátvitel' során alkalmazandó titkosítás típusára vonatkozó információt a 89 titkosító egység egy 70 multiplexer/demultiplexer egységnek továbbítja.

A multimédia terminálból történő adattovábbítás alatt a 70 multipiexeddemultlpiexer egység egyesíti a kódolt és szinkronizált videó és audio adatfolyamokat a 63 telematikai eszköztől érkező adathemenettei és az esetleges vezérlési adatokkal, és azokból egyetlen bltfolyamot állít elő. A bitfolyamon végrehajtandó esetleges adaltifkosítás típusára vonatkozó információt, melyet a 89 titkosító egység állít elő, a titkosítási mód kiválasztására használjuk. így amikor egy multiplexeit és esetleg titkosított multimédiás adatfolyam érkezik, a 79 ** * X multípiexer/demulöplexer egység gondoskodik a bitfolyam visszafejtéséről, a két média komponens szétválasztásáról, majd az egyes komponenseknek a megfelelő kódoló-dekódolóhoz és/vagy végberendezéshez a dekódolás és reprodukálás céljából történő továbbításáról.

A 8a ábrán a találmány szerinti videó kódoló egyik célszerű kiviteli alakjának blokkvázlata látható. A 8a ábrán látható 700 videó kódoló felépítése sok szempontból hasonlít az 1. ábrán bemutatott, korábban használt videó kódoló felépítéséhez. A kódolónak csak azon részeit módosítottuk, amelyek a szubpixel értékek interpolálását és a kódolt videó bitfolyam előállításával kapcsolatos műveleteket végzik. A 780 videó kódoló legtöbb egysége hasonló módon működik az 1, ábrán korábban bemutatott, eddig használt 1Ö videó kódoló megfelelő egységeinek működéséhez. Az egyszerűség kedvéért ezeknek az egységeknek az ismertetésétől eltekintünk. A 700 videó kódoló 711 mozgásmezö-becslö egységet, 712 mozgásmezö-ködolö egységet, 713 mozgáskompenzáíl predikciós egységet, 714 predíkciősbiba-ködolö egységet, 715 predíkoiöshíba-dekódoió egységet, 718 muitiplexelő egységet, 717 kerefmemóriát és 719 összeadói tartalmaz. Amint a 8a ábrán látható, a 711 mozgásmezo-becslő egység olyan 710 különbségi együtthatószámító egységet tartalmaz, amelyet a kiválasztott szűrő és egy 709 alapszürő közötti eltérés kiszámítására használunk.

A továbbiakban a 7ÖŐ videó kódoló működését ismertetjük részletesen. Az Ismert videó kódolókhoz hasonlóan a találmány szerinti 700 videó kódoló mozgáskompenzált predikciót alkalmaz egy R_n(x,y} referenciákéról alapján, és így állít elő INTER-kódotásű videó keretet reprezentáló bitfolyamof. A mozgáskompenzált predikciót. szubpíxel felbontással végzi és olyan interpolációs szűrőt alkalmaz, amelynek dinamikusan változtatható szöröegyütthafó-értékei vannak annak érdekében, hogy a mozgásbecslő folyamat során elő tudja állítani a

A 700 videó kódoló blokkonként történő mozgáskompenzált predikciót bajt végre, továbbá minden egyes blokkra kétlépéses folyamatban szubpixel-felbontás mellett Implementálja a mozgáskompenzációt, Az első lépésben teljes pixel felbontású mozgásvektort határoz meg blokklllesztéssel, vagyis olyan pixeiértékeket tartalmazó blokkot keres az R_fi.(x,y) referencíakeretben, amely a legjobban Illeszkedik a kódolandó, aktuális képblokk pixelértékeíhez. A blokki liesztésí műveletet a 711 mozgásmező-beoslö egység a 717 kerettárolóval együttműködve hajtja végre, ahol az R,,(x,y) referenciakeret pixelértékeit a 717 kerettárolóból olvassak ki. A mozgáskompenzált predikciő második lépésében az első lépésben meghatározott mozgásvekfort tovább finomítjuk a kívánt mértékű szubpixeles felbontásra. Ennek végrehajtásához a 711 mozgásmező-becsiő egység a korábban azonosított, az aktuálisan kódolandó képblokkhoz legjobban illeszkedő területen található R_n(x,y) referencia-keret pixelértékeinek interpolálásával éj, szubpixet felbontású keresési blokkokat állít elő. A folyamat részeként a 711 mozgásmező-becsiő egység meghatároz egy optimális interpolációs szűrőt a szubpixel értékek interpolálására. Az interpolációs szúrd együttható értékeit megfelelően mődositjuk az egyes ké kódolása során. A találmány egyik lehetséges változatánál az interpolációs szűrő együtthatóit ritkábban, például keretenként egy alkalommal vagy egy kódolandó új videó képsor kezdetén mődositjuk.

A szükséges szubpixel értékek Interpolálását és az új keresőblokkok előállítását követően a 711 mozgásmező-becsiő egység további keresést bajt végre annak meghatározása érdekében, hogy az új keresőblokkok valamelyike jobban illeszkedik-e az aktuális képbíokkhoz, mint az eredetileg azonosított, teljes pixel felbontású, legjobban illeszkedő blokk. Ily módon a 711 mozgásmező-becsiő egység meghatározza, hogy az éppen kódolt képblokkra jellemző mozgásvektornak teljes pixel felbontású helyre vagy szubpixel felbontású helyre kell-e mutatnia.

A 711 mozgásmező-becsiő egység a meghatározott mozgás vektort a 712 mozgásmezö-kődolü egységnek továbbítja, amely egy mozgásmodell alapján a korábban ismertetett módon közelítést ad a mozgásvektorra. Ezt követően a 713 mozgáskompenzált predikciős egység az aktuális képblokkhoz a közelített mozgásvektor és a predikciős hifeainforroscíó felhasználásával becslést végez, A jóslás eredménye és annak kódolt adatai a 714 predikciós hibakódoló egységben találhatók. Az aktuális képblokkhoz tartozó, kódolt predikciős hibainformációt ezután a 714 predikelőshiba-ködolö egységből a 716 multiplexer egységnek továbbítjuk. A 716 multiplexer egység egyrészt a közelített mozgásvektorra vonatkozó információt fogad mozgásegyüttbatók formájában a 712 mozgásmező-kődoió egységtől, másrészt az aktuális kéoblokk mozgáskompenzáif becslése során használt optimális interpolációs szűrőre vonatkozó Információt fogad a 711 mozgásmezö-becslő egységtől A szóban forgó kiviteli alaknál a 711 mozgásmezö-becslő egység a 710 különbségi együtthatókat kiszámító egység számítási eredményei alapján az aktuális blokkhoz tartozó optimális Interpolációs szűrő szűrőegyütthatól és a 700 kódolóban eltárolt, előre meghatározott 709 alapszörö együtthatói közötti különbséget megadó 705 különbségi értékek csoportját továbbiba. A 715 multiplexer egység ezt kővetően olyan kódolt 703 bitfoíyamot állít elő, amely a mozgásinformáció (mozgási együtthatók), a predikciós hibaadafok, a szürőegyütthatók különbségi értékei és más lehetséges vezérlési információk egyesítésével az aktuális képbiokkra jellemző. Szükség esetén a különböző típusú információk mindegyikét entrőplakódoissssl kódoljuk a bitfolyamba történő beszúrást, majd a megfelelő· dekódolőnak történő

A találmány egyik lehetséges változatánál a 711 mozgásmezö-becslő egység az optimális interpolációs szűrő szűrőegyütthatölra jellemző 704 értékek csoportját küldi el a 718 különbségi együtthatókat kiszámító egységnek, amely - a 8b ábrán látható módon - a 711 mozgásmezö-becslő egység és a 715 multiplexer egység között helyezkedik el. A 710 különbségi együtthatókat kiszámító egység a 709 alapszörö alapján kiszámítja a 705 különbségi értékeket és azokat a 715 multiplexer egységnek továbbítja.

A találmány egy másik lehetséges változatánál a 710 különbségi együtthatókat kiszámító egység a 716 multiplexer egységen belül helyezkedik el. Ebben az esetben az optimális interpolációs szűrő 704 szürőegyütlhatci közvetlenül továbbíthatók -a. 711 mozgásmezö-becslő egységből a 718 multiplexer egységnek, ahogy ez a 8c ábrán látható.

A 9a ábra a 8a ábrán látható 700 videó kódolóhoz tartozó 8Ö0 videó dekódoló egyik célszerű kiviteli alakjának blokkvázlatát szemlélteti. A 800 videó dekódoló 721 mozgáskompenzált predikciós egységet, 722 predikclóshiba-dekódolé egységet, 723 demultiplexeiő egységet és 824 keretmemöriát tartalmaz. A 800 videó dekódoló legtöbb egysége a 2. ábrán látható, szokásos 20 dekódoló megfelelő egységeihez hasonló funkciókkal rendelkezik, illetve azokkal hasonló módon működik. A 9a ábrán látható, találmány szerinti 8ÖÖ videó dekódoló azonban tartalmaz egy olyan 810 szűröheiyreállitó egységet is, amely a 6 b és 8o ábrán látható 130 különbségi értékek *

X és az előre meghatározott 809 alapszöré alapján helyreállítja a 8a ábrán látható 110 optimális Interpolációs szűrőt Az előre meghatározott. 809 afapszüro· célszerűen azonos a 8a-8c ábrákon látható 709 alapszürovel.

A továbbiakban a 800 videó dekódoló működését ismertetjük részletesen, A 823 demultiplexer egység kódolt 883 bitfolyamét fogad, szétválasztja a 803 bitfolyamot komponenseire, vagyis a mozgásegyütthatókra. predlkciős hibainformációra, szűrőegyütthatók különbségi értékeire és esetleges vezérlési információkra, majd a különböző adattípusokra vonatkozóan elvégzi az esetleg szükséges enfrőpiadekódolást. A 803 demultiplexer egység a beérkező 803 bitfolyamból kinyert predlkclós hiba információt a 822 predikclósblba-deködoló egységnek továbbítja. A 883 bitfolyamból kinyert: mozgásinformációt a 823 demultiplexer egység a 821 mozgáskompenzálf predikoíős blokknak továbbítja. A találmánynak ennél a kiviteli alakjánál a 823 demultiplexer egység a fogadott és entrópíadekódolt különbségi értékeket egy 802 jellel a 821 mozgáskompenzált pretíikciős blokknak továbbítja oly módon, hogy lehetővé tegye a 818 szürőhelyreáHíló egység számára a Ss ábrán látható 110 optimális interpolációs szűrő helyreállítását oly módon, hogy a 803 bitfolyamból kinyert különbségi értékeket hozzáadja a 880 dekódolóban eltárolt, előre meghatározott 809 alapszűrő együtthatóihoz, A 821 mozgáskompenzált predlkciős egység ezt követően a helyreállított együtthatóértékek által meghatározott optimális interpolációs szűrő felhasználásával predikcíót hajt végre az: éppen dekódolás alatt álló képblokkra vonatkozóan. Közelebbről ez azt jelenti, hogy a 821 mozgáskompenzáit predlkciős egység a 824 keretmemőriában eltárolt R_fí(x,Y) referenciakeret pixelértékeinek kiolvasásával és szükség esetén azoknak a kinyert mozgásinformáció alapján tetszőleges szubpixel értékekre történő interpolálásával megjósolja az aktuális képblokkot. Az aktuális képblokk predíkclóját ezután egyesíti a megfelelő predlkclós hibaadatokkal és helyreállítja a szobán forgó képbfokkot,

A találmány egyik lehetséges változatánál a 818 szűröhelyreállifő egység a. 821 mozgáskompenzáit predlkclós egységen kívül helyezkedik el, ahogy ez a 9b ábrán látható. A 823 demultiplexer egységtől érkező 802 jelben lévő különbségi értékekből a 810 szurőhelyreáliitó egység: előállítja az optimális interpolációs szűröket és a helyreállított 805 szűröegyütthatokat a 821 mozgáskompenzálf * *1 ·** **

♦ * * * « * J<wt predikciós egységnek továbbítja. Egy másik lehetséges kiviteli alaknál a 810 szörőhelyreállító egység a 823 demuitiplexer egységen belöl helyezkedik el. Ez esetben a 823 demuitiplexer egység továbbítja az optimális Interpolációs szűrő helyreállított együtthatóit a 821 mozgáskompenzált predikciós egységnek.

A találmány szerinti kódoló a szűröegyütthatőkat az előre meghatározott alapszűrő együtthatóitól függően differenciáltan kódolja, ezáltal lehetővé teszi a dekódoló számára az optimális interpolációs szűrő helyreállítását a különbségi értékek alapján. Az alapszűrő együtthatóit ismernie keli mind a kódolónak, mind pedig a dekódolónak, és azoknak statisztikailag ésszerű határok között a videó képsorban használt tényleges szűrők együtthatóihoz közeli értéknek kell lenniük a jő kódolási hatékonyság elérése érdekében. Magyarán, a találmány szerinti eljárásnál konkrét együtthatóértékekkel rendelkező alapszörőt határozunk meg és az alapszürő együtthatói, valamint a ténylegesen felhasznált interpolációs szűrő együtthatói közötti különbséget kódoljuk és továbbítjuk a videó bitfolyamban. Ily módon az adaptív interpolációs szűrőnek a kódolt videó bitfolyamban továbbított együtthatóinak reprezentá lásához szükséges Információ mennyisége lecsökken ahhoz az eljáráshoz viszonyítva, amelynél az adaptív szűrő összes együtthatóját külön kódolják. Amennyiben az alapszürő együtthatói nagyon hasonlóak a ténylegesen felhasznált interpolációs szűrő együtthatóihoz, a kódolandó különbségi értékek kicsik lesznek, nymodon előnyös, ha az előre meghatározott alapszürő statisztikailag hasonló a ténylegesen felhasznált interpolációs szűrőhöz, mivel ebben az esetben a különbségi értékek lecsökkennek, ami tovább javítja a kódolás hatékonyságát.

Szemben a VVedi által javasolt differenciális kódolási eljárással, a találmány szerinti eljárás viszonylag jó hibatűréssel rendelkezik. Amennyiben hiba következik be a kódolt videó bitfolyamnak a kódolóból dekódolóba történő továbbítása során, a keletkező hiba csak az alapszürő és a ténylegesen alkalmazott interpolációs szűrő közötti különbséget érinti.

Szükségesnek tartjuk megjegyezni, hogy a találmány szerinti multimédia terminál, videó kódoló, videó dekódoló és videó ködolő-dekődoíö funkcionális rdver formájában, illetve és dekódolás! eljárások formájában történő egységei egyaránt megvalósíthatok szoftver vagy dedikált ha a kettő kombinációjaként. A találmány szerinti videó kódolási különösen alkalmasak olyan számítógépi program

- 30 ♦ λ k «» χ ♦ «Λ + * * X « « «r * «ί e χ 4 «» > χ· # « φ « φ * «η»44 * *4W «*>

meg valósításra, amely a találmány szerinti eljárás funkcionális lépéseit végrehajtó, számítógép által olvasható utasításokat tartalmaz. Ily módon a találmány szerinti kódoló, dekódoló és videó kódolő-dekódolö szintén implementálható olyan számítógépi programkód formájában, amely egy tárolóközegen van eltárolva és amelyet egy számítógép, például személyi számítógép hajt végre, ezáltal az adott számítógép videó kódolási és/vagy dekódoíási funkcióval látható el.

Bár a találmányt konkrét kiviteli alakokon keresztül mutattuk be, a szakmában jártas szakemberek számára nyilvánvaló, hogy a találmány tetszőlegesen módosítható az igénypontok által meghatározott oltalmi körön belül.

Claims

SZABADALMI IGÉNYPONTOK

1. Eljárás videó képsorban lévő kép kódolására, ahol egy referencia keretben lévő szubpixel értékeket egy több együttható értékkel rendelkező interpolációs szűrő segítségévei rekonstruáljuk, és egy kódolandó blokk predlkciójáí a rekonstruált szubpixel értékek alapján végezzük, azzal jellemezve, hogy az interpolációs szűrő (110) együttható értékeit egy alapszőrő (140, 709) együttható értékeire vonatkozóan differenciálisán kódoljuk, ezáltal különbségi értékek (130, 705) egy csoportját állítjuk elő, ahol az alapszűrő (140, 709) együttható értékei közül legalább egynek nullától eltérő értéke van; és a különbségi értékek (130, 705) csoportját elhelyezzük a kódolt videó adatokban.
2. Az 1. igénypont szerinti eljárás, azzal jellemezve, hogy a képet blokkokra osztjuk fel, és az interpolációs szűrő (110) együttható értékeit az egyes képblokkok kódolásakor módosítjuk,
3. Az 1, igénypont szerinti eljárás, azzal jellemezve, hogy az alapszőrő (140, 709) együttható értékei előre meghatározott együttható- értékeket tartalmaznak.
4. Az 1, igénypont szerinti eljárás, azzal jellemezve, hogy további lépésként az alapszűrő (140, 709) együttható értékeit a videó képsor statisztikai adati alapján módosítjuk.
5. Az 1. igénypont szerinti eljárás, azzal jellemezve, hogy szimmetrikus interpolációs szűrőt (110) használunk és az interpolációs szűrő (110) együttható értékeinek csak a felét kódoljuk.
6. Az 1. igénypont szerinti eljárás, azzal jellemezve, hogy az alapszó rönek (140, 709) további együttható értékel vannak, ahol az alapszűrő (140, 709) további együttható értékeihez konstans értéket adunk hozzá, ezáltal lecsökkentjük az interpolációs szűrő (110) együttható értékei és az alapszűrő (140, 709) további együttható értékei közötti eltérések nagyságát.

» * ·♦
7.. Berendezés videó képsor kódoláséra, amely berendezés tartalmaz: egy referencia keretben lévő szubpixei értékek rekonstruálására szolgáló interpolációs szűrőt (11Ö) meghatározó eszközt, ahol az interpolációs szűrőnek (110) több együttható értéke van; és a rekonstruált szubpixei értékek alapján egy kódolandó blokk predikcióját azzal jellemezve, hogy a berendezés tartalmaz továbbá az interpolációs szűrő (110) együttható értékei és az alapszűrő (140, 709} együttható értéket közötti különbségeket kiszámító és különbségi értékek (130, 705) egy csoportját előállító eszközt, ahol az aíapszűrö (140, 709) együttható értékei közűi legalább egynek nullától eltérő értéke van; és a különbségi értékek (130, 705) csoportját kódolt videó adatokban elhelyező eszközt.
8. A 7. igénypont szerinti berendezés, azzal jellemezve, hogy tartalmaz továbbá egy, a különbségi értékek (130, 705) csoportjának a kódolt videó adatokban történő elhelyezése előtt a különbségi értékek (130, 705) csoportján enfrőpiakődolást végző eszközt,
9. A 8. igénypont szerinti berendezés, azzal jellemezve, hogy szimmetrikus interpolációs szűrőt (110) tartalmaz és az entrópiakódolást végző eszköz a különbségi értékek (130,. 705) csoportjának csak a felét kódoló eszközként van kialakítva lö. Eljárás kódolt videó adatok dekódolására, ahol egy referencia keretben lévő szubpixei értékeket egy interpolációs szűrő (110) és a kódolt videó adatok alapján rekonstruáljuk, és elvégezzük egy kódolandó blokk predikcióját a rekonstruált szubpixei értékek alapján, azzal jellemezve, hogy további lépésként a kódolt videó adatokból kinyerjük különbségi értékek (802) egy csoportját, ahol a különbségi értékek (302) csoportja az interpolációs szűrő (110) és egy aíapszűrö (809) együttható értékel közötti eltéréseket adja meg, ahol az alapszűrő (809) együttható értékei közül legalább egynek nullától elférő értéke van ; és a különbségi értékek (802) csoportja és az aíapszűrö (809) alapján előállítjuk az interpolációs szűrőt (110).
11. A íö. igénypont szerinti eljárás, azzal jellemezve, hogy sz alapszűrőt (889) további együttható értékek által reprezentált további együtthatókkal látjuk el; és az interpolációs szűrőt (110) úgy állítjuk elő, hogy összeadjuk a különbségi értékeket (802) és az alapszűrő (809) további együttható értékeit.
12. A 11, Igénypont szerinti eljárás, azzal jellemezve, hogy a különbségi értékek (802) csoportját entrőpladekődoíással nyerjük ki a kódolt videó adatokból.
13. Berendezés kódolt videó adatok dekódolására, amely berendezés egy referencia keretben tévő szubpixel értékeket egy interpolációs szűrő (110) és a kódolt videó adatok alapján rekonstruáló eszközt és egv kódolandó blokk predikcióját a rekonstruált szubpixel értékek alapján elvégző eszközt tartalmaz, azzal jellemezve, hogy tartalmaz továbbá különbségi értékek egy csoportját a kódolt videó adatokból kinyerő eszközt., ahol a különbségi értékek csoportja az interpolációs szűrő (110) és egy alapszűrő (809) együttható értékei közötti eltéréseket adja meg, és ahol az alapszűrő (889) együttható értékei közül legalább egynek nullától elférő értéke van; és egy, az eiapszürő (809) és a különbségi értékek csoportja alapján az interpolációs szűrőt (110) előállító eszközt.
14. A 13, igénypont szerinti berendezés, azzal jellemezve, hogy az alapszűrőnek (809) további együttható értékek által reprezentált további együtthatói vannak; és a berendezés tartalmaz továbbá egy, a különbségi értékek csoportját az alapszűrő (809) további együttható értékeivel összeadó, ezáltal az interpolációs szűrőt 8110) előállító eszközt.
15. A 13. igénypont szerinti berendezés, azzal jellemezve, hogy a bitfolyamból kinyert különbségi értékek csoportján entrőpiadekódolást végző eszközt tartalmaz.

18. Videó kódoló rendszer, amely tartalmaz kódoló egységet (708) a videó képsor kódolására, amely kódoló egység (700) egy referencia keretben lévő szubpixei értékek rekonstruálására szolgáló Interpolációs szűrőt határoz meg, ahol az interpolációs szűrő több együttható értéket tartalmaz:

dekódoló egységet (800) a kódolt videó adatok dekódolására, amely dekódoló egység (800) tartalmaz egy, a referencia keretben lévő szubpixei értékek rekonstruálását az interpolációs szűrő és a kódolt videó adatok alapján végző interpoláló eszközt; és predikeíós eszközt (820) egy dekódolandó blokkon a rekonstruált szubpixei értékek alapján történő predikeíőt végrehajtására, azzal jellemezve, hogy a kódoló egység (700) tartalmaz továbbá az interpolációs szűrő (110) együttható értékei és egy alapszűrö (140, 709) együttható értékei közötti eltéréseket kiszámító és különbségi értékek (130, 705) egy csoportját előállító eszközt (71ÖJ, ahol az alapszüro (140, 709) együttható értékel közül legalább egynek nullától eltérő értéke van; és a különbségi értékek (130, 703) csoportját a kódolt videó adatokban elhelyező multiplexek) eszközt (820); továbbá a dekódoló egység (800) tartalmaz a kódolt videó adatokból a különbségi értékek csoportját kinyerő demultiplexeié eszközt; és az alapszörő (800) és a különbségi értékek csoportja alapján az interpolációs szűrőt (110) előállító számító eszközt (810).
17. Videó kódoló berendezés videó képsorban lévő kép kódolására, amely berendezés egy referencia keretben lévő szubpixei értékek rekonstruálására szolgáló interpolációs szűrőt mégháfámzóan van kialakítva, ahol az Interpolációs szűrő több együttható értéket tartalmaz, és amely berendezés tartalmaz egy, a rekonstruált szubpixei értékek alapján egy kódolandó blokkon predikeíőt végrehajtó predikeíós eszközt, azzal jellemezve, hogy a berendezés tartalmaz továbbá egy, az interpolációs szűrő (110) együttható értékei és egy alápszűrő (140, 709) együttható értékel közötti különbségeket kiszámító és különbségi értékek (130, 708) egy csoportját előállító számító eszközt, ahol az alapszűrő (140, 709) együttható értékes közül legalább egynek nullától eltérő értéke van, és a különbségi értékek (130, 705) csoportját kódolt videó adatokban elhelyező multiplexek) eszközt (820).
18. A 17. igénypont szerinti berendezés, azzal jellemezve, hogy tartalmaz továbbá egy, a különbségi értékek (130, 705) csoportjának a kódolt videó adatokban történő elhelyezése előtt a különbségi értékeken (130, 705) entrópiakódolást végző kódoló eszközt.
19, Berendezés kódolt videó adatok dekódolására, amely berendezés tartalmaz egy referencia keretben lévő szubpixei értékeket egy interpolációs szűrő és a kódolt videó adatok alapján rekonstruáló interpolációs eszközt, és a rekonstruált szubpixei értékek alapján egy dekódolandó blokkon predikciót végrehajtó predikciős eszközt, azzal jellemezve, hogy a berendezés tartalmaz továbbá különbségi értékek egy csoportját a kódolt videó adatokból kinyerő demultiplexelő eszközt; és egy alapszűrő (809) és a különbségi értékek csoportja alapján az interpolációs szűrőt előállító szűrőképző eszközt, ahol az alapszürő (809) több együttható értéket tartalmaz, ahol az együttható értékek közül legalább egynek nullától eltérő értéke van.
20. A 19, Igénypont szerinti berendezés, azzal jellemezve, hogy az alapszűrőnek (809) további együttható értékek által reprezentált további együtthatói vannak; és a videó dekódoló berendezés tartalmaz továbbá egy, az interpolációs szűrő előállítása céljából a különbségi értékek csoportját és az alapszürő (809) további együttható értékeit összeadó eszközt.
21. Számítógép által olvasható közeg, amelyen olyan számítógépi program van eltárolva, amely egy videó képsorban lévő képek kódolási eljárását végrehajtó programkódokat tartalmaz, ahol az eljárás az alábbi lépéseket tartalmazza;

egy referenciakeretben lévő szubpixel értékek rekonstruálása egy több együttható értékkel rendelkező interpolációs szűrővel; és a rekonstruált szubpixel értékek alapján egy kódolandó blokkon predikoió végrehajtása, ahol az eljárás további jellemzője, hogy kiszámítjuk az interpolációs szűrő (110) együttható értékei és egy alapszűrő (140, 907) együttható értékei közötti különbséget és előállítjuk a különbségi értékek (130, 705) egy csoportját, ahol az siapszürő (140, 709) együttható értékei közül legalább egynek nullától eltérő értéke van; és a különbségi értékek (130, 705) csoportját elhelyezzük kódolt videó adatokban.
22. A 21, igénypont szerinti számítógép által olvasható közeg, azzal jellemezve, hogy az eljárás további lépéseként a különbségi értékek (130, 705) csoportjának a kódolt videó adatokban történő elhelyezését megelőzően a különbségi értékek csoportján entrópiakódoiást végzünk.
23. Számítógép által olvasható közeg, amelyen olyan számítógépi program van eltárolva, amely kódolt videó adatok dekódolására szolgáló eljárást megvalósító programkódokat tartalmaz, ahol az eljárás az alábbi lépéseket tartalmazza:

egy referenciakeretben lévő szubpixel értékek rekonstruálása a rekonstruált interpolációs szűrő és a kódolt videó adatok alapján, valamint predikoió végrehajtása egy dekódolandó blokkon a rekonstruált szubpixel értékek alapján, ahol az eljárás további jellemzője, hogy kinyerjük a kódolt videó adatokból a különbségi értékek egy csoportját; és az alapszűrő (809) együttható értékei és a különbségi értékek csoportja alapján rekonstruálunk egy interpolációs szűrőt, ahol az alapszűrő (809) együttható értékei közül legalább egynek nullától elférő értéke van.
24. A 23, igénypont szerinti számítógép által olvasható közeg, azzal jellemezve, hogy az eljárás további lépéseként entrópiadekódolásf végzünk a különbségi értékek csoportján.
25. Az 1. igénypont szerinti eljárás, ezzel jellemezve, hogy további lépésként az. interpolációs szűrő együttható értékeit a videó képsorban lévő minden egyes kép kódolásakor módosítjuk,
26. A 17. igénypont szerinti berendezés, azzal jellemezve, hogy az interpolációs szűrő együttható értékei a videó képsorban lévő minden egyes kép kódolásakor módosítva vannak.
27. A 17. igénypont szerinti berendezés, azzal jellemezve, hogy a kép több blokkra van felosztva és az interpolációs szűrő (110) együttható értékei az egyes képblokkok kódolásakor módosítva vannak.
28. A 17. igénypont szerinti berendezés, azzal jellemezem, hogy az alapszűrő (140, 709) együttható értékei a videó képsor kódolásához használandó, előre definiált együttható értékeket tartalmaznak.
29. A 17. igénypont szerinti berendezés, azzal jellemezve, hogy az alapszörő {140, 709) együttható értékel a videó képsor statisztikai adatai alapján vannak módosítva.
30. A 10. Igénypont szerinti eljárás, azzal jellemezve, hogy az alapszörő (809) együttható értékei a videó képsor dekódolásához használandó, előre definiált együttható értékeket tartalmaznak.
31. A 10. igénypont szerinti eljárás, azzal jellemezve, hogy az interpolációs szűrő (110) együttható értékeit a videó képsorban lévő minden egyes kép dekódolásakor módosítjuk.
32. A 10. igénypont szerinti eljárás, azzal jellemezve, hogy a képet több blokkra osztjuk fel, és a különbségi értékek kinyerését minden egyes blokkra elvégezzük,
33. A 10. igénypont szerinti eljárás, azzal jellemezve, hogy további lépésként az aíapszűrő (809) együttható értékeit a videó képsor statisztikai adatai alapján módosítjuk.
34. A 19, igénypont szerinti berendezés, azzal jellemezve, hogy ez alapszűrő (809) együttható értékei s videó képsor dekódolásához használandó, előre definiált együttható értékeket tartalmaznak.
35. A 19. igénypont szerinti berendezés, azzal jellemezve, hogy az interpolációs szűrő (110) együttható értékei a videó képsorban lévő minden egyes kép dekódolásakor módosítva vannak.
36. A 19. igénypont szerinti berendezés, azzal jellemezve, hogy a videó kép több blokkra van felosztva és a különbségi értékek kinyerése minden egyes blokkhoz
37, A 19. igénypont szerinti berendezés, azzal jellemezve, hogy az alapszörő (809) együttható értékei a videó képsor statisztikai adatai alapján vannak módosítva.