HU230597B1

HU230597B1 - Eljárás, kóder és dekóder videójel kódolására, dekódolására, továbbá kódolt videójel, valamint számítógép program termék

Info

Publication number: HU230597B1
Application number: HU0302055A
Authority: HU
Inventors: Miska Hannuksela; Kerem Caglar
Original assignee: Nokia Corporation
Priority date: 2000-05-15
Filing date: 2001-05-14
Publication date: 2017-02-28
Also published as: US7711052B2; CN100394802C; BRPI0110770B1; CA2409027C; HUP0302055A2; WO2001089223A2; HUP0302055A3; JP4362259B2; CN1193622C; CN1440623A; KR20080083030A; HK1079938A1; GB2362532B; KR100892119B1; GB0011606D0; AU2001272409A1; ATE522086T1; EE05652B1; EE200200642A; BR0110770A

Description

Eljárás, kódé? és dekóder videójel kódolására, dekódolására, továbbá kódolt videóiéi, valamint számítógép program termékek

A találmány tárgya egy 3? 1. igénypont tárgyi kőre szerint? eljárás valamint egy a 7, igénypont tárgyi köre szerinti dekőder egy képszékve nelát képviselő kódolt videojel dekódolására, továb5 bá egy a 8, igénypont: tárgyi köre szerinti eljárás valamint egy a 13. igénypont tárgyi köre szerinti kóder egy kódolt videójel kódolására, továbbá egy a 14. igénypont tárgyi köre szerinti, képszekveociát képviselő kódolt videojel, továbbá egy a 15. Igénypont tárgyi köre szerinti számítógép program termék egy videojel kódolására, valamint egy a ló, Igénypont tárgyi köre szerinti számítógép program termék egy képszekvendát képviselő kódolt videojel dekódolására, .10 £gy videószekveneia állóképek vagy képkockák somsaiéból áll, A képtönwítsí eljárások a videószekvenciák redundáns és az észlelés szempontjából lényegtelen részeinek a csökkentésen alapulnak, A videöszekvenclákban a redundanciát spektrális, térbeli és Időbeli redundancia kategóriákra oszthatjuk. A spektrális redundancia egy adott kép eltérő szinösszetevöí közötti hasonlóságra vonatkozik. A térbeli redundancia egy adott kép egymással szomszédos képpont15 jai közötti hasonlóságból ered. Az időbeli redundancia úgy jön létre, hogy egy megelőző képen megjelent tárgyak valószínűleg megjelennek a jelenlegi képen is, A tömörítést ennek az időbeli redundanciából fakadó előnynek a kihasználásával, és 3 jelenlegi képnek egy másik, horgony vagy referencia képnek nevezett képből történő előre kiszámításával érhetjük el. További tömörítés érhető el olyan mozgáskompenzádós adatok létrehozása révén, amelyek a jelenlegi kép és a referencia kép közötti mozgást írják le.

A vídeőszekvencíához tartozó redundancia kizárólagos csökkentésével azonban rendszerint nem tudunk elegendő mértékű tömörítést megvalósítani. Ezért a videó kóderek a videószekvencia szubjektív megítélés szériré kevésbé lényeges részeinek a minőségét igyekeznek csökkenteni. Ezen túlmenően a kódolt adatfolyam redundanciáját a tömörítési paraméte25 rék és együtthatő k hatékony vesztesége entes kódolásával is csökkenten í lehet. Ennek fő technikája a változtatható hosszúságú kódok alkalmazása.

A videó tömörítő eljárások jellemzően megkülönböztetik azokat a képeket amelyek időleges redundancia csökkentést alkalmaznak, azoktól a képektől, amelyek nem élnek ilyen módszerrel, Azokat á tömörített képekét, amelyek nem alkalmaznak: időbeli redundancia csökkentő el30 járásokat, általában 1NTRA vagy l képkockáknak vagy I képeknek nevezik. Az időben előre megjósolt képeket szokásosan egy olyan kép alapján határozzák meg előre, amely a jelenlegi képét megelőzően volt látható, és az ilyen képeket ihl W vagy p képkockáknak vagy P képeknek nevelik, Az ?MT£R képkockák esetében az előre megjósolt, kíszámítőtt mozgáskom pénzéit kép ritkán kellően pontos, és ezért minden egyes WTER képkockával egy térben tömörített jőslási bibe keret Is társul. Az IhlTER képkockák 11MTRA kődolt területeket tartalmazhatnak.

Sok videó tömörítő eljárás időbeli kétirányú jósolt képkockákat is használ; amelyeket általában 8 képeknek vagy 8 képkockáknak hívnak. Ezek a 8 képkockák az I képkockák és/vagy 8 képkocS kák referencia képkocka párjai közé vannak beillesztve, és vagy mindkét, vagy valamelyik referencia képkockából számítják ki élőre, A B képkockák általános esetben nagyobb tömörítést eredményeznek. mint az élőre jósolt képkockák esetében tapasztalható. A B képkockákat nem használják referencia képkockaként, ami azt jelenti, hogy ezekből nem számítanak ki előre másik képkockákat. Ezért:ezeket figyelmen kívül hagyhatjuk (szándékosan vagy véleflenül; anélkül, hogy ezzel a jövőbeli képkockák képminőségét hátrányosan befolyásolnánk. Jóllehet a B képkockák a P képkockákkal összehasonlítva megnövelik a tömörítés hatásfokát, előállításuk nagyobb számítási bonyolultsággal és memória haszná lattal jár, és járulékos késéseket vezetnek be. Ez nem valósidejű kódolásoknál, például videó s t reá ming esetén nem feltétlenül gond, de valósidejű alkalmazásoknál, mint amilyen a videó konferencia, gondokat okozhat.

f 5 Egy tömörített videó klip általában olyan képkockák szekvenciájából áll, amelyeket durván időben független ItOUA képkockákra és Időben differenciálisán kódolt iNTER képkockákra oszthatunk fel. Mivel az IKfTRA képkockákban a tömörítés hatásfoka általában kisebb, mint az ÍNTER képkockákba, az INTRA képkockákat különösen alacsony bitsebességű alkalmazásokban takarékosan alkalmazzuk.

2S Egy videöszekventía több jelenetből vágy képből áll össze. Az egyes képkockák tartalma jóié* netről jelenetre jelentősen eltérhet egymástól, ezért egy jelenet első képkockája jellemzően mindig IblTRA kódolt képkocka, A televíziós és filmes anyagokban gyakoriak a jeleneivélíások, míg más alkalmazásoknál, például videó konferenciánál a íeíenetváifások viszonylag ritkák. Ezen túlmenően az INTRA képkockákat általában azért Is használják, hogy a helyreállított videojelben az átviteli hibák időbeli terjedését megállítsák, és hogy a videó adatfolyamhoz véletlen hozzáférési pontokat biztosítsanak.

A tömörített videojelet az átviteli hibák könnyen tönkreteszik, különösen két okból. Először,, az időben predíktív differenciális kódolás alkalmazása következtében (INTER képkockák) a hiba mind térben, mind időben terjed. Ez a gyakorlatban azt jelenti, hogy ha egy hiba lép fel, azt az emberi szem viszonylag bosszú időn át könnyen észleli. Különösen sérülékenyek azok a kis bitsebességű átvitelek, amelyekben csupán néhány, kisszámú INTRA kódolt képkocka található. Így az Időbeli hiba terjedése bizonyos Ideig nem gátolt. Másodszor, a változó hosszúságú kódok használata megnöveli a hibák Iránti fogékonyságot. Ha egy bithiba megváltoztatja a kódszőt, a

-3dekőder elveszt; a kődsző sziukronizalasí, és az azt követő (néhány bitből álló; hibamentes kóászavakaf is helytelenül dekódolja a következő szinkronizáló (vagy kezdő; kódig, ggy szinkronizáló kód egy olyan bítminta, amely a többi kódszó legális kombinációjaként nem állAható elő, és az ilyen kódszavakat adott írhervaliumokban hozzáadják a adatfolyamhoz, hogy lehetővé te5 gyek ez «aszlokronizálást. Ezen túlmenően hiba lép tel akkor is, ha az átvitel során adat vész el, Például IP hálózatokban a megbízhatatlan UTP szállítási protokollt használó videó alkalmazásokban az egyes hálózati elemek figyelmen kívül hagyhatják a kódolt videó adatfolyam egyes részeit,

A vevőkészülék számára számos módi van, hogy a jelátviteli úton bekerült hibát kezelni tudja,

Általánosságban egy jel vételekor az átviteli hibákat előbb észlelik, majd sav írják vagy elnyomják, és ezt a feladatot a vevőkészülék látja el. A hibajavítás azt az eljárást jelenti, amelynek során a hibás adatokat tökéletesen helyreállítják, ügy, mintha semmilyen hiba nem lepett: volna fel a továbbítás során, A inba elnyomás olyan eljárást jelent, amellyel az átviteli hibák hatását tudják kiküszöbölni úgy, hogy a hibák a helyreállított vsdeószekvenciában nem, vagy csupán

IS nehezen észlelhetők. Rendszerint bizonyos mértékű redundanciát a forrásnál vágy a szállítási kódolásnál be szoktak vinni a jelbe, hogy ezzel Is elősegítsék a hiba észlelését, javítását vagy elnyomását

Számos ismert eltüntető algoritmus létezik, melyek áttekintése elolvasható például Ύ. Wang és

Q.F.Zhu: 'terror Control and Concealment for Videó Cemmunicatlen: A Review című cikkében, '20 amely a Pröceedings of the IEEE folyólratSS, évfolyamának 5. számában jelent meg, májusban, a 974-997, oldalon, továbbá P. Salama, N.B. Shroff es EJ. Qeip: 'terror Concealment in Eneoding Videó'' című cikkében, amely az IEEE Journal on Selected Areas In Communications elme kiadványban jelent meg.

A jelenlegi videó kódoló szabványok egy önmagában: elegendő videó adatfolyamra vonatkozó szintaxist definiálnék. Jelen szabadalmi leírás készítésének időpontjában a legnépszerűbb szabványok közé tartozik az I7U-T K.263 száma szabványa Videó coding fór iov? bit rate commonicatlon, 1998 február, kíadványSzáma ISÖ/IEC 14A9S-2, továbbá az MPES-A-ként is ismert Generie Coding of Audio-Visual Ofejeets, Part 2; Visual című 1999-es cikk, valamint az IteU-T H.262 számú, íW£G~2~ként ismert szabványa (kladványszáma ISO/lEC 1381fo2j. Ezek a

30' szabványok megfelelő hierarchiát definiálnak az adatfolyamok és ezen keresztül a képszekvenciák: és képek számá ra.

A H.2Ő3 számú szabvány szerint a szintaxis négy réteget tartalmazó hierarchikus struktúrája van: kép, képszegmens, makroblokk és blokk réteg, A kép réteg adatok a teljes képterületet va-4iamínt a képadatok dekódolását befolyásoló paramétereket tartalmaznak, A legtöbb ilyen adat egy úgynevezett kép fejlécben helyezkedik el,

A képszegmens réteg vagy egy blokk réteg csoport, vagy egy szelet réteg lehet. Alapesetben minden egyes kép bíokkesoportokra v-a« felosztva, Egy biokkcsoport általában 16 egymást kö5 vető keppontsort tartalmaz. Az egyes bíokkesoportokra vonatkozó adatok egy opcionális felokkesoport fejlécet tartalmaznak, amelyet a makroölokkok adata követ, Ha az opcionális szelet szerkezetű üzemmódot alkalmazzuk, akkor minden egyes képet szeletekre osztunk fel blokkesoportok helyett Egy szelet letapogatási sorrendben egymást követő makrobíofckokal tartalmaz. Az egyes szeletekre vonatkozó adatok egy szelet fejlécből, valamint a makroblokkokra vonatkozó adatokból állnak,

Minden egyes biokkcsoport vagy szelet makroblokkokra van felosztva. Egy makroblokk 16x16 képpont (vagy 2x2 blokk) lumínancíára és a krominsncla Összetevők térben megfelelő: g_xg képpontjára (vagy blokkiára} vonatkozik. Egy blokk 8x8 luminanda vagy kromlnancia képpontra vonatkozik,

A blokkreteg adatok egyenlő módon kvantáít. diszkrét koszinusz transzformációs együtthatókból állnak, amelyeket zegzugos sorrendben letapogatnak, egy RLE (run-length encoding) kódértéi feldolgoznak, majd változó kódhosszüságokkal kódolnak. Az TvtPES-2 és MPES-A réteg hierarchiák: hasonlítanak arra, amelyet a H.2Ö3 számú szabványban alkalmaznak, kiindulási esetben ezek a szabványok általánosságban az időbeli megelőző referencia képkoc.20 kát (I, El, P vagy EF képkockát}, amelyet viszonyítási képkockának is neveznek, használják referendakent a mozgáskompenzáláshoz. Ez az információ rész nem: kerül továbbításra, vagyis a adatfolyam nem tartalmaz a referencia képkockát azonosító Információt Ennek következtében a dekódereknek semmilyen eszközük nincs arra, hogy észleljék, ha egy referencia képkocka elvesz. jóllehet számos adattovábbító káder a videó adatokat csomagokba álBja össze, és egy25: egy sorszámot rendel ezekhez a csomagokhoz, a sorszámok mégsem: a videó adatfolyamra vonatkoznak. Például egy videó adatfolyam részlet tartalmazhat Pl P képkockát, S2 8 képkockát, F3 P képkockát és FA P képkockát, a feltüntetett sorrendben felvéve (valamint a fenti sorrendben megjelenffendően}. Azonban ezt a részt az alábbi sorrendben tömöritenénk, továbbítanánk és dekódolnánk: Pl, P3, S2, P4 - mivel a 82 képkockánál szükség van arra, hogy mind a

FI képkockát, mind pedig a P3 képkockát még őslötte kódolhassuk: vagy dekódolhassuk, Kiindulva adboí, hogy csomagonként egyetlen képkocka van, továbbá hogy minden egyes csomag: tartalmaz egy sorszámot, és hogy a .82 képkockát tartalmazó csomag vész el, egy vevő ennek a. csomagnak az elveszését a csomag sorszámok alapján tudja észlelni. A vevőnek azonban nincs semmiben eszköze árrá,, hogy észlelje, ha a P4 képkockához tartozó mozgáskompenzálási referencia képkocka vész el, vagy egy olyan 6 képkocka vesz el, mely esetben a dekódolást szokásos módon tudná folytatni.

A dekóder ezért általában egy ÍRTRA kérelmet bocsát ki a küldőnek, és a képkockát kimerevlíi a kijelzőn. Az adó azonban nem biztos, hogy válaszolni tud erre a kérelemre. Például egy nem valósidejű vldeójei áramoltatásos jstreamingj alkalmazás esetén a küldő oldal nem képes válaszolni az egy dekódertől eredő ÍRTRA kérelemre. Ezért a dekóder a képkockát ki merevíti, amíg megkapja a következő ÍRTRA képkockát. Válösíöéjö alkalmazásban, például videó konferencia esetén Is előfordulhat, hogy a köidő/adö nem képes válaszolni egy ilyen kérelemre. Egy több résztvevős konferencia esetén például az kóder nem tud az egyedi kérelmekre válaszolni. A dekóder ebben az esetben sem tehet mást, minthogy kimerevíti a képkockát mmdaddig, amíg az adó egy következő IRTSA képkockát nem bocsát ki.

Az US 5,706,053 számú szabadalmi dokumentum egy tömörített mozgókép kód feldolgozó egységet és eljárást ismertet. Az egység processzoré egy bitfolyamot mozgókép adatszekvend15 ává dekódol, és minden egyes képet egy külső áramkörhöz továbbít az eredeti vldeószskveridának megfelelően. Ha a bitfolyamban hiba lép fel, 3 hibás rész adatait egy már dekódolt és tárolt korrekciós kép megfelelő vonatkozó részének dekódolt adataival helyettesítik, A dokumentum nem biztosítja az_; aktuális kép vagy képrész megjelölheíőségét abból a célból, hogy beazonosítható legyen a szekvencia egy olyan másik képe, amely alternatív referen20 óla képként felhasználható az aktuális képhez vagy képrészhez a kódolt videojel dekódolása során.

A kitűzött feladatot egyrészt egy ez 1, igénypont jellemzői szerinti eljárással és egy a 7. igénypont jellemzői szerinti dekóderrel oldottuk meg egy képszekvenoíáf képviselő kódolt videojel dekódolására, másrészt egy a 8, igénypont jellemzői szerinti eljárással és a 13. igénypont jelző lemzől szerinti kóderrel oldottuk meg egy kódolt videojel kódolására, harmadrészt egy a 14. igénypont jellemzői szerinti, képszekvenciát képviselő kódolt videojellel, negyedrészt egy a .15.

Igénypont jellemzői szerinti, egy videójeiet kódoló számítógép program termékkel, és ötödrészt egy a 16. igénypont tárgyi köre szerinti., egy képszekvenciát képviselő kódolt videójeiet dekódoló számítógép program termékkel oldottuk meg,

3ö A bejelentésbe foglalt talá lmányok főbb előnyős kiviteli alakjait, illetve foganatosítás! módjait az aligénypontokhao fogalmaztok meg.

A találmányt az alábbiakban a csatolt rajz segítségével ismertetjük részletesebben, amelyen a

-Q javasolt eí§aras példaként megvalósítását tüntettük fel. A rajzon az

1. ábra egy multimédiás mobil kommunlkádős rendszer felépítését mutatja be vázlatosan, 3

2. ábrán egy multimédiás terminál multimédiás osszetevőidek péidakéntí összeállítása lát5 ható., a

3. áórán egy videó: kodek példaként! felépítését muta tjük de, a

3a. ábra a találmány szerinti videó kóder példakend felépítését mutatja be még részletesebben, a

4.. ábrán á taiáimány szerinti videó kóder egy első lehetséges kiviteli: alakjának mőködésl vázlatát tüntettük fel, az

5. ábrán a találmány szerinti videó kóder egy második lehetséges kivitel! alakjának működési vázlatát tüntettük fel, a

6. ábra egy adatfolyam szintaxisát mutatja a H.263 számú ajánlásnak megfelelően, a

7. ábra egy találmány szerinti videó kőderrel létrehozott adatfolyam felépítésének első példája, a

8.. ábra egy találmány szerinti videó kódértéi létrehozott adatfolyam felépítésének második példája, a

9. ábra egy találmány szerinti videó kőderrel létrehozott adatfolyam felépítésének harmadik példája, a

2Ö 10, ábra a videó kódolás során: a: skálázhatóság érdekében használt bővítő rétegeket matat: be, és a ll, ábra a videó kódolásnál a térbeli skálázhatóság érdekében használt bővítő rétegeket mutat be.

•Az 1. ábrán egy multimédiás mobil kommunikációs rendszer tipikus felépítésének a vázlata látás ható. ggy első multimédiás mobil 1 terminál: egy második multimédiás: mobil 2 terminállá! 3 rádióösszeköífetés útján, mobil: kommunikációs 4 hálózaton keresztül kommünikéik Az 1, 2 terminálok között multimédiás adatok valamint vezérlő adatok kerülnek továbbításra.

A 2. ábrán az í terminál jellemző multimédiás összetevőit mutatjuk be. Az 1 terminál 10 videó ko dé kel 20 audio kodeket 30 adatprofcokol l kezelőt, 40 vezér iéskezelőt, Sö m ulti plexert és demultlplexert, valamint - amennyiben szükséges ~ &0 modemet tartalmaz. A lö videó kodek az ϊ terminál: rajzon nem látható videó felvevő eszközétől, pl:, kamerájától származó jeleket: fogadja kódolás céljából, valamint a távoli 2 termináltól: egy 7Q kijelzője segítségével megjelenítendő jeleket fogad dekódolás céljából. A 20 audio kodek az 1 terminál rajzon nem látható mikrofonjától származó jeleket fogadja kódolás céljából, valamint a távolt 2 termináltól a rajzon ugyancsak. nem látható hangszórója segítségével visszaadandó jeleket fogad: dekódolás céljából. .Az 1 terminál valamilyen hordozható ratims kommunikációs eszköz, például mobil telefon lehet.

A 40 vezérléskezelö vezérli a 10 videó kodek, a 20 audió kodek és a 30 adatpratokoll kezelő működését Mivel találmányunk elsősorban a 10 videó kodek működésére irányul,, leírásunkban a 20 audio kodek és a 50 adatprotokoli kezelő felépítésével és működésével tovább nem foglalkozunk,

A 3. ábrán a találmány szerint megvalósított 10 videó kodek felépítését mutatjuk be.

A 10 videó kodeknek 100 kódere és 200 dekódere van. A 10 videó kodek 100 ködere az X terminál ábrán nem látható kamerájától vagy más videó forrástól származó: videojelet fogadó löl bemenettel rendelkezik. A10 videó kodek 100 kóderében lévő 102 kapcsoló kapcsolja át a 100 kódért egy INTRA üzemmód és egy s ΝΪΕ R üzemmód között. A10 videó kodek 100 kódere egy 103 DCT átalakítót, egy 104 kvanfálót, egy inverz 108 kvardálót, egy inverz 109 DCT átalakitől,

IS egy 110 összegző fokozatot, több 107 képtárolöt (lásd a 3a. ábrát), eló'rejelzési hibát kiszámító 106 kivonó fokozatot, 113 kapcsolót valamint 105 kódolésvezérlö kezelőt tartalmaz. A10 videó kodek 2Ö0 dekódere Inverz 120 kvanfálót, egy inverz 121 DCT átalakítót, egy 122 mozgáskompenzáíort, 123 képtá rolót valamint 124 vezérlőt tartalmaz, A 124 vezérlő a kódolt multimédiás adatfolyamból az Sö moitiplexer/demoltipisxerrel demultipsexelt videó kodek ve^ zérlójeleket fogadja. A gyakorlatban a 100 kóder 105 vezérlője és a 200 dekóder 124 vezérlője ugyanaz a processzor lehet,

A következőkben a találmány szerinti kóder működését mutatjuk be. A 10 videó kodek megkapja a kódolandó videójelet A10 videó kodek 100 kódere a videójelet DCT átalakítás, kvantálás és mozgáskompenzació végzésével kódolja. Ez a kódolt videó adat ezután az S0 muitlple2b xer/demultipiexer kimenetére jut. Az 50 multipiexer/demuhiplexer multiplexen a 10 videó kodektől kapott videó adatot és a 40 vezérlő fokozattól kapott vazériöadatot (valamint adott esetben más jeleket), és multimédiás jelet állít elő: azokból. Az 1 terminál az így előállított multimédiás jelet (amennyiben szükséges) a 00 modemen keresztül küldi el a vevő 2 termi nálnak.

INT8A üzemmódban a löl bemeneten megkapott videójelet egy 103 DCT átalakító ÖCT együtthatókká alakítja át. Az átalakított DCT együtthatók ezt követően 104 kvántálöba jutnak, amely az együtthatókat kvantálja. A102 kapcsolót és a 104 kvaetaiót a lö videó; kodeknek az a TÖS kődűiásvezérlő kezelője vezérli, amely a 40 vezérléskezelö révén a második 2 termináléi

-8származó visszacsatolási vezérlést is megkapja, A dekódolt képet úgy á 1 h'tjuk elő, hogy a 104 kvantálö áltat kibocsátott adatokat átvezetjük az inverz 108 kvantáión, és az inverz kvantált adatokat az inverz i0§ DCT átalakítóval feldolgozzuk. Az ennek eredményeképpen kapott adatokat Levisszük a 110 összegző fokozatba. 1NTRA üzemmódban a 113 kapcsolóit úgy állítjuk Le, hogy a tőle a 110 összegző fokozatba bevitt adatok értéke nulla legyen, A110 összegző fokozat a két bemenetére vezetett adatokat összegzi, és az eredményt továbbítja a 107 képtároióba.

sNTER üzemmódban a 102 kapcsoló úgy működik, hogy egy 106 kivonó fokozattól megkapja a 101 bemenetre érkezett videojel valamint egy, egy 107 képtárolÖLan tárolt korábbi kép közötti különbséget. A 106 kivonó fokozat által kibocsátott különbségi adat képviseli a jelenlegi kép és a 10? képtároioban tárolt korábbi kép közötti predikciös hibát. A18? képtárofóbss lévő adatokat úgy állítjuk elő, hogy a 104 kvantáió által kibocsátott adatokat átvezetjük egy inverz 108 kvantáión, majd az Inverz módon kvantált adatokat egy inverz 180 ©CT átalakítóban átalakífjók. Az eredményül kapott adatokat hozzáadjuk 110 összegző fokozat segítségével a 107 képtároiö tartalmához, £gy 111 mozgásbacslö fokozat s 107 képtáraidban lévő adatokból bagyomá15 nyes módon műzgáskompenzálási adatokat (mozgásvéktorokát) állíthat elő.

A 105 kódoiásvezérlö kezelő határozza meg, hogy 1NTRA kódolást vagy ShlTER kódolást kell-e alkalmazni, vagy hogy a képkockát egyáltalán a 106 kivonó fokozat kimeneti jele alapján, vagy a vevő dekőőer által fogadott visszacsatolási vezérlő alapok függvényében kell-e kódolni. A 105 kódoiásvezérlö kezelő olyan döntést is hozhat, hogy egy kapott képkockát egyáltalán nem kell kódolni, ha az éppen kapott képkocka és a referencia képkocka közötti hasonlóság elér egy meghatározott mértéket, vagy ha nincs Idő a kapott képkocka kódolására. A 105 kódoiásvezérlö kezelő a 102 kapcsolót megfelelő módon képes működtetni.

Ha nem vesszük figyelembe a visszacsatolási vezérlési adatot akkor az káder jellemző módon egy képkockát egy IMTRA képkockaként kódol, vagy csupán a kódolás kezdetekor (és az összes többi képkocka P képkocka lesz), vagy szabályos időközönként, például üt másodpercenként, vagy ha a 1Ö5 kivonó fokozat kimeneti jele meghalad egy előre beállított küszöbértéket, vagyis ba azt aktuális képkocka és a 10? képtároioban tárolt képkocka túlságosan eltér egymástól, A kódért úgy is ptögmmozhatjpk, hogy a képkockákat egy meghatározott szabályos szekvencia szerint kódolja, példáni )8LWBP£fo?88P88íb8P stb.

A 10 videó kodsk a kvantált 112a DCT együtthatókat a 112b kvantálási indexet (vagyis az alkalmazott kvantálásra vonatkozó részleteket), továbbá egy IIMTRA/INTER 112c flag-et bocsát ki, hogy jelezze ezáltal a végrehajtott kódolás fajtájat (I vagy R/8j, valamint egy 112d továbbítási flag-et bocsát ki, hogy jelezze a kódolt képkockák számát, valamint s kódolás alatt álló képhez

- 3 · tartozó 112« mozgásvektorokat sója meg, Ezeket, az egyes multimédiás jelekkel együtt az 50 múlt I plexer/demniti plexe r mu jtipléxell,

A továbbiakban a 3a ábra segítségével a 100 kóder lehetséges felépítését es működését mutatjuk be részletesebben. A 10ö kódét több XQ7a-187g képtáraiét foglal magában, és jóllehet pél5 dáokbun bét Ilyen 10? feéptárolőt tüntettünk fel, a 107 képtárolók szama a taláímány értelmében akar kettő vagy azt meghaladó számú is lehet.

A bemutatás során Induljunk ki abból a feltételezésből, hogy a 100 ködet úgy van kialakítva, hogy például ΐ8δΡδδΡΒ8Ρ8δΡδ8Ρ8ΒΡδδ1, stb. formátumú bemenő jelet kódoljon. Az egyszerűség érdekében feltételezzük azt is, hogy a ISO kóder a bemenő jel minden egyes képkockáját kódolja, vagyis egyetlen képkocka sem marad kí a kódolás műveletéből. Ezt a 4, ábrán mutatjuk, be.

Mint mát korábban említettük, a képkockákat valamilyen videó felvevő eszköztől kapjuk, 0,X, 2, 3,4, 5, 6 stb. sorrendben, és ugyanebben a sorrendben jelezzük kí, azaz a dekódolt képkockákat 18, 81» 82, P3,84,85, Pb, stb. sorrendben jelenítjük meg. így tehát a videó blífolyamot az alábbi 18, 23, 81, 82, 86, 84, 85, stb. sörre nd ben tömörít.lük, továbbítjuk és de kódol juk. Ez azért van Így, mert minden egyes 8 képkocka öt megelőző valamint őt kővető referencia képkockákat Igényei, mielőtt kódolhatnánk vagy dekódolhatnánk, vagyis a 81 képkocka kódolásához vagy de kódolásához előbb az 10 és 83 képkockákat kelt kódolnunk vagy dekódolnunk

Amikar fogadjuk az első képkockát,, az összes 107 képtároló üres, és a 102 kapcsolót 1NTBA üzemmódba kapcsoljuk át a 1Θ5 kódolásvezértő kezelő segítségével, úgy, bogy a bemenő' jelet 1NTRA formátumúra kódoljuk, A bemenő jelel ezt követően DCT átalakításnak vetjük alá és kvantáljuk. Ezt rnakrohbkkonkenb alapon bájtjuk végre. Az eredményül kapott, jelet ezután: az Inverz 108 kvantálővai és az inverz 109 OCT átalakítóval dekódoljuk, Mivel a képkocka INTRA kódolású, a 113 kapcsoló nyitott,álfásban van, A110 összegző fokozat kimenetén megjelenő je25 let az első 107a képtárolóba töltjük. Ebhez a 114a kapcsolót zárjuk, miközben a 114b - XX4g kapcsolók nyitott állapotúak, Így a 107a képtároló: az iO referencia képkocka dekódolt változatát. alkalmazza.

A következő kódolandó képkocka a 3 képkocka, amelyet az 18 referencia képkockából előrementesen jelzünk előre. Ebhez, ba a 3 képkockát a löl bemenetre vezetjük, a 102 kapcsoló lót. 1fiTE8 üzemmódra állít jók: át, és a legaktuálisabb referencia képkocka tárolóhoz tartozó kimeneti 115 kapcsolót (például a 115a kapcsolót) zárjuk, és a lű?a képiároió mozgáskompenzált tartalmat kivonjuk a bemenő jelből, ahol: a mozgáskompenzáciős adatokat a szakterületén szokásos módon számoltuk korábban kt Az előrejelzési hibát ezt követően a 103 PCT átalakítóval és a 104 kvantálóval; kódoljuk, majd az Inverz 108 kvantálóval és az inverz 109 DCT átala kítóval dekódoljuk, A 113 kapcsolót zárjuk, a 115a kapcsoló és a 114b kapcsoló Is zárt (míg a többi 114 és 115 kapcsoló nyitott állású j. így a 110 összegző fokozat a dekódolt képkockát hoz5 záadja a 107a; képtároióban tárolt képkockához, és az eredményt a 1Θ7& kégtároíöhan tároljuk

A soron következő kódolandó képkocka a 7 képkocka, amelyet 8 képkockaként kell kódolnunk.

Ehhez mind a 187a képtároló, mind a 107 képtároiő tartalmát hozzáférhetővé tesszük a szokásos módon a 106 kivonó fokozat részére. Mivel a 8 képkockák nem szolgának más képkocka számára referencia képkockaként, a kódolt 8 képkockát nem dekódoljuk és tároljuk valamilyen referencia képkocka tárolóban.

A fent leírt esetheti 19 képkocka után a 187a· - 187g képtároíók az 10, P3, PS, P9, P12, P15, P18 képkockák dekódolt változatait tartalmazzák.

Találmányunk értelmében, ba a 100 ködet egy képkockát predikíív módon, elő re mentesen kó15 dől, a 105 kódolásvezério kezelővel a képkockához egy már említett tartalék referencia képkocka számot jSRPM) társíthatunk. Például egy videojel P képkockáihoz és 8 képkockáihoz társithatuuk SRPN paramétert, de az indikátor képkockáihoz nem, A kódersk ezt az üzenetei felhasználhatják arra, hogy utasítást adjanak a dekóderek részére, hogy mely referencia képkocka vagy képkockák hasonlítanak leginkább az aktuális referencia képkockához,, ügy, hogy ezek kőid zül valamelyiket a dekóder tartalék referencia képkockaként képes hasznosítani, ha az aktuális referencia képkocka valamilyen okból elvesz vagy megsérül a továbbítás során.

Ha a 3 képkockát a 0 képkockához viszonyítva kódoljuk, a 107a - 10?g képtároióban semmilyen más referencia képkocka nincs eltárolva. Ezért a 3 képkockához nem is társítunk SkPN paramétert. Hasonlóképpen, ha az 1 és 2 képkockákat kétírányúan kódoljuk a 8 és 3 képkockákra vo25 natkozóan, akkor a referencia képkockákat tartalmazó 107a - 107g képtárolőkban semmilyen egyéb képkockát, nem társiünk, így a jelzett képkockák egyikével sem társítunk SSPIM paramétert.

Ha azonban a 6 képkockát a 3 képkockából eiőrementesen előre jelezzük (melynek dekódolt változatát a 107 képtároióban taroltuk el)> a 107a képtárolóban az 10 képkocka dekódolt raáso38 tata is megtalálható. A löd káder ilyen esetben; kiszámolja a hasonlóságot az aktuális, soron kővetkező képkockához tartozó alapértelmezett referencia képkocka (azaz a 6 képkockához tartozó 3 képkocka) és más képtároíók, például a 187a képtároló tartalma között. Ha két referencía képkocka kellően hasonló egymáshoz jvagyis a ló7a képtároló és a 107 b képtáraié tartalma közötti egyezés egy előre meghatározott küszöbértéket meghaladj, a 100 kódértéi egy SRPN paramétert társítunk az adatokhoz a S képkockára vonatkozóan, Az SRPN paraméter a 0 képkockát mint egy tartalék referencia képkockát azonosítja. Ha a hasonlóság azonban nem elegendő mérteké., a 6 képkockához nem társítunk SRPIM paramétert. Maga az a a: mód, ahogy a. hasonlóság mértékét kiszámítjuk, nem tárgya találmányunknak, és bármely megfeleld eredményt biztosító hasonlóság meghatározási eljárást alkalmazhatunk. Például az abszolút különbségek összegének módszerét {Sum of Absolute Öifferences, SAO) használhatjuk a hasonlóság mértékeként. Egy Ilyen SAS értéket előnyösen úgy számítunk ki, hogy a soron következő képkockához tartozó alapértelmezett referencia képkockának térben megfelelő képpontjai közötti és más potenciális referencia képkocka, például valamelyik 10? képtáraiéban tárolt képkocka térben megfelelő képpontjai közötti értékkülönbséget vesszők. Minden egyes különbség abszolút értékét: meghatározzuk, majd az abszolút különbségi értékeket összegezzük, hogy megkapjuk az abszolút különbségek összegét. Ily módon az SAD érték jellemző lesz az alapértelmezett referencia képkocka és a másik potenciális referencia képkocka közötti hasonlóság mértékére. Vagyis két képkockát kellően hasonlónak ítélhetünk meg, ha a közöttük lévő abszolút különbségek összege egy meghatározott küszöbérték alatt húzódik. Alternatív módon az alapértelmezett referencia képkocka valamint a soron kővetkező képkockához tartozó más potenciális referencia képkocka közötti hasonlóságot képkocka hisztogramok segítségével is

2ö meghatározhatjuk. Egy képkocka hisztogram egy adott képen belül lévő képpont értekek megjelenési szamának $ mértéke, és két képkockát abban az esetben nyilváníthatunk ki hasonlónak, ha képkocka hisztogramjuk jelentős mértékben megegyezik egymással..

A találmány egy alternatív megvalósítása esetében ahelyett, hogy megvizsgálnánk a hasonlóságot a soron kővetkező képkockához tartozó alapértelmezett referencia képkocka és egy mais sík potenciális referencia képkocka között, a IDD kóderrel megvizsgáljuk a hasonlóságot az egyik 107 képtárolőban rendelkezésre álló másik potenciális referencia képkocka, valamint maga a soron következő képkocka között. Ennél az alternatív kiviteli alaknál egy olyan küszöbértéket állítunk be, amellyel: megadjuk a soron következő képkocka és a potenciális referencia képkocka közötti különbség legnagyobb elfogadható értékét. így minden olyan eltárolt kép30 kockát, amely kielégítően: nagy hasonlóságot mutat fel jkis eltérést mutat félj a soron következő képkockával, felhasználhatunk tartalék referencia képkockaként a soron kővetkező képkockához, Itt ugyancsak használhatjuk az abszolút különbségek összegének a módszerét, a kép hisztogramot, vagy bármilyen más módszert arra, hogy megáilapitsuk a hasonlóság vagy kS· 12 lönbság mérteikét a soron következő képkocka, valamint a másik potenciális referencia képkocka vagy képkockák között

Nyslvánvalóan, ha a IS képkockát kell kódolnunk (P képkockaként)., a 0, 3, 6, 9 és 12 képkockák dekódolt változatait eltároljuk a 114a - 114a képtárolpban. .Alapértelmezett módon a 15 kép5 kockát a 1074 képtárolóhan tarolt 12. képkockához viszonyítva kódoljuk. A 10Ö kőderrei ezen túlmenően kiszámítjuk a 10?e képtáromban tárolt adatok és a többi lö?a ~ löld képtárolóhan tárolt adatok közötti korrelációt. A100 kődet ennek alapján be tudja azonosítani szí a 10? képtárolót (és azzal együtt a referencia képkockát), amely a leginkább egybeesik a 10? képtároiő tartalmával,: vagyis a kódolandó soron következő képkockához tartozó alapértelmezett refe10 rencla képkockával, A 10Ö kóder ezt követően egy SRPM paramétert ad a kódolt adató kb oz, amely jelzi az azonosított referencia képkockát, Ez az SRPI4 paraméter megegyezhet a referencia képkocka időleges referenciájával is, mint azt leírásunk későbbi részében még bemutatjuk.

Egy képkockával egynél több SRPI4 paramétert is társíthatunk. Ilyen esetben az SRPM paramétereket a képkocka élőfejében sorba rendezzük, mégpedig a hasonlóság sorrendjében., ahol a leginkább hasonló referencia képkockát vesszük előre, nem pedig az alapédelmerett referencia képkockát.

A 205 kódolásvezérlő kezelő ezt az SRM paramétert vagy kódszót a 122f kimenetén jeleníti meg, amely a kódolt képkockához társított tartalék referencia képkocka számot jelzi. Ezt egy multiplexer segítségével építjük be a videó bitfolyamba.

2Ö A 4. ábrán a találmány szerinti 100 kóder egy első tehetséges kiviteli alakjának működését vázoljuk, Λ 4, Ábra első sorában a képfelvevő vagy beviteli eszköztől érkező adat képkockák láthatók, amelyek a 102 hemeneten keresztül a videó 2Ö0 káderbe kerülnek. A 4, ábra második sors a bemenő jelnek azokat a képkockáit tünteti fel, amelyeket a 100 kóder kódolni választott ki, és egyben· feltünteti az egyes képkockák kódolására használt kódolási módot is. Mint azt korábban jeleztük, a bemutatott példában a löö köder úgy van kialakítva, hogy minden egyes képkockát kódoljon, és ennek során az BSP kódolási formátumot használja.

A 0 képkockát IfáTRA módon kódoljuk; az 1 képkockát 8 képkockaként kódoljuk, a Ö és/vagy 3 képkockához viszonyítva; a 2 képkockát 8 képkockaként kódoljuk a O és/vagy 3 képkockához viszonyítva; a 3 képkockát P képkockaként kódoljuk a O képkockához viszonyítva; a 4 képkockát

8 képkockaként kódoljuk a 3 és/vagy 6 képkockához képest; az 5 képkockát B képkockaként kódoljuk a 3 és/vagy S képkockához képest; a 6 képkockát P képkockaként kódoljuk a : kockához képest, stb.

·

A 4. ábra harmadik sora a kódolt jel képkockáival társított SRPH mezőt ábrázok A bemutatott kivitek' alak esetében egy SŰPN paramétert s P képkockákkal és S képkockákkal társítunk, a 4, ábra harmadik sorában látható módon. A kődoit képkockák P és 8 képkockáit időlegesen előle jelzett módon kódoljuk, mig azI képkockákat nem.

A 4. ábra negyedik sorában a kódolt, képkocka TR időbeli referenciáját tüntettük fel. Ezt a mezőt a H.2S3 ajánlás tartalmazza, és a TP időbeli referencia értékét az időlegesen megelőző referencia képkocka élőiéiben lévő értékének eggyel plusz az előzőleg továbbított referencia képkocka óta a kihagyott vagy nem referencia képkockák számával történő megnövelése révén alakítjuk ki. így tehát a 4, ábrán bemutatott példában az egyes képkockákhoz tartozó TR időbeli

1Ö referencia megegyezik a löí bemenetre vezetett eredeti jel képkockáinak eredeti időbeli sorrendjével.

Az ábrán feltüntettük az SRPM paraméter lehetséges értékeit is. Ezek az értékek a tartalék referencia képkocka TR időbeli referenciáját jelzik, ahogy azt a 100 kőderrel a fent leírt módon azonosítottuk, jóllehet a példa csupán egyetlen SRPN paramétert mutat miden egyes predíktív módon kódolt képkocka vonatkozásában, miden egyes preöiktív módon kódolt képkockához eggyel több SRPN paramétert is társíthatunk, mint arról korábban már szó esett,

Az 5. ábra a találmány szerinti 100 kóder egy további, második lehetséges kiviteli alakjának a működését mutatja be. Enné! a kiviteli alaknál a .100 kádert úgy alakítottuk ki, hogy a képkockákat szabványos i8BP8ÜP8SPB8IB8P88P szekvenciának megfelelően kódolja. Ennél a kiviteli alaknál azonban csupán elő re mentesen előre jelzett. képkockákkal f vagyis P képkockákkal) társítottunk csupán egyregy SRPbl paramétert.

Az 5, ábra első sora a bemeneti képkockákat mutatja, második sora pedig a kódolt képkockákat, valamint azok kódolási módját mutatják, vagyis 1, P vagy 8 képkockákat,

Az 5, ábra harmadik sora a P képkockákkal társított SRPH paramétereket mutatja. Ezeket ügy állíthatjuk élő, ahogy azt már korábban á 3s ábra kapcsán ismertettük.

Az 5. ábra negyedik sora a kódolt képkocka Tp időbeli referenciáját mutatja. Mint a 4. ábra kapcsán látható volt, a minden egyes képkockához feltűntetett Tű Időbeli referencia megegyezik azzal, mint a 101 bemenetre juttatott eredeti vídeójelben az egyes képkockák megjelenésének a sorrendje.

3Ö Ha kiindulunk egy olyan esetből, amikor az 1 terminál vevő terminálként kódolt videó adatot fogad a 2 termináltól, a 10 videó kodek működését a 10 videó kodek dekódoló feladatára vonatkoztatva mutatjuk be részletesebben. Az 1 terminál az adó 2 íermméiíöi kap egy multimé-14 · dlás jelet Az 50 demoftipiexer demultlplexelí ezt a multimédiás jelet, és a videó adatot továbbítja a 10 videó kodekhez, a wzédő adatot pedig a 40 vezérléskezelőhöz. A10 videó bódék 200 dekődere inverz kvantálással inverz OCT transzformációval és mozgáskompenzálással dekódolja a kódolt videó adatot. A 200 dekóder 124 vezérlője megvizsgálja a kapott adat integritását, és ha ebben a. vonatkozásban hibát észlet megkísérli a hibát eltüntetni egy, az alábbiakban részletesebben is bemutatásra kerüld módon. A dekódolt, kijavított és hibáktól mentesített videó adat ezt kővetően az 1 terminál 7S kijelzőjéhez: kerül, amely azt megjeleníti,

A videó adatban a hibák jelentkezhetnek kép szinten, blökkcsoport szinten vagy makröbiokk szinten, A hibaellenőrzés bármely említett szinten elvégezhető,

1Ö Ha a 4. ábrán bemutatott jelből Indulunk ki, úgy ha a találmány szerinti dekóder fogadja ezt a jelet, akkor a jelben tévő minden egyes képkockát hagyományos módon dekódol, majd a 70 kijelzőn megjelenít. A dekódolt képkocka ugyancsak hagyományos módon hifosjavított vagy hibáéit öntetett képkocka lehet. Minden alkalommal, amikor egy képkocka dekódolása megtörténik, a dekóder megvizsgálja a TR időbeli referencia mezőt, hogy megállapítsa, hogy az adott képkockát meg keli-e jeleníteni.

A 4. ábrán bemutatott esetben a dekóder megkapja a 0 képkockát, és annak képkocka élőfejéből megállapítja, hogy a képkocka 1NTRA kódolásé. A dekóder a 0 képkockát égy dekódolja, hogy ehhez semmilyen más képkockához nem nyúl vissza, és a dekódolt képkockát a 123a képtárolóban tárolja el. A dekóder ezt követően a 3- képkockát fogadja, es annak képkocka élőfejé20 bői megállapítja, hogy a képkocka P képkockaként IN7ER módon lett kódolva. A dekóder ezért a 3 képkockát az azt megelőző referencia Ö képkocka alapján dekódolja, és eltárolja a soron következő 123b képtárolőban, A dekóder ezt követően az 1 es 2 képkockákat dekódolja, a ö és 3- képkockákhoz viszonyítva, és így tovább. Ezeket a képkockákat azonban nem tárolja el a 123 képtárolőban, mivel ezeket mint S képkockákat nem használjuk fel referencia: képkockaként más képkocka k vona t kóró sába n.

Tételezzük fel, hogy a dekóder nem képes dekódolni {és így helyreállítani) a 9 képkockát {ez előfordulhat azért, mert a 9 képkockára vonatkozó adatok nagyrészt megsérültek, vagy egyszerűen elvesztek a jelátvitel során). A dekóder által fogadott következő képkocka a 7 képkocka, TR - 7 időleges referenciával, és SRPH - 0 paraméter értékkel. Mivel a 9 képkockát (vagyis a 7 képkocka vonatkozáséban az egyik alapértelmezett referencia képkockát) a dekóder nem tudta dekódolni, Így a kapott vagy fogadott képkocka élőfejében egy SRPhl paramétert próbál felkutatni, hogy hátramentes előrejelzést hajthasson végre. A 7 képkocka azonban hátrafelé egyáltalán nem tartalmaz SftPál paramétert. Ezért a dekóder nem képes dekódolni a 7 képkockát, és · 15 · ugyanez vonatkozik: a S képkockám Is.

A soron kővetkező fogadott képkocka a 12. képkocka, amelyet a 9 képkocka vonatkozásában kódoltunk,, és SSHH = 8 paraméter értéket tartalmaz. Mivel a 9 képkockát nem dekódoltok, a dekóder az ShPM paraméter által jelzett referencia képkockát használja fel (vagyis a 123c kép5 tárolóban tárolt S képkockát) a 12 képkocka dekódolásához- A. dekóder ezt kővetően fogadja a 10 képkockát, amelyet a 9 és 12 képkockákhoz viszonyítva kódoltunk. A 9 képkockát a dekóder nem dekódolta. A10 képkocka azonban tartalmaz egy S9PN: ~ 6 paraméter értéket, így a dskóder a már dekódolt referencia § képkockát használja fel, amely a 123c kép táró lóban került eltárolásra, arra, hogy a 20 képkockát előre mentesen dekódolja, nem pedig a 7 képkockát, 8z ugyanígy Igaz a 11 képkocka esetében is,

A dekóder egy referencia: képkocka hiányát számos módon észlelheti, például vizsgálhatja azt az Információt, amely az egyes kódolt képkockák időleges sorrendjére vonatkozik. Alternatív módon egy kódolt jel referencia képkockái egy egy meghatározott számú helyet foglalhatnak el szekvenciális sorrendben, ahogy azt a jelen bejelentés napján benyújtott massk hasonló tár15 gyű szabadalmi bejelentésünkben taglaljuk.

Ha a dekóder képes arra, hogy visszacsatolási adatokat küldjön a jeltovábbítást végző videó kóderhez, ügy a: dekóder egy olyan értelmű kérelmet is küldhet a továbbítási végző videó kódernek, hogy az egy képkockát ÍNTHA képkockaként kódoljon, és így megállítsa azt az időbeli hiba továbbterjedést, amely abból fakadna, hogy a 10 és 11 képkockákat a 6 képkockára vo23 natkoztatva kellene dekódolni. A dekóder a jel dekódolását ilyen esetben hagyományos módon tudja folytatni.

Ha a dekóder megkapja a 21 képkockát, amely egy IhiTítA képkocka, akkor a 2.1. képkockát más képkockára történő vonatkoztatás, hivatkozás nélkül dekódolja, és a dekódolt képkockát eltárolja a. 123 képtárolóban:, a dekóder ezt kővetően a 13 és 20 képkockákat a 18 és 21 képkoe25 .Rákra visszahlvatkozva dekódolja- jóllehet bizonyos nagyságú hibát bevezethetünk a 18 kép' kockába azáltal, hogy -a 12 képkockát a 8 képkockához viszonyítva dekódoljuk, nem pedig a 9 képkockához viszonyítva, az eredményül kapott kép elfogadható lesz, és a kljeizett, megjelenített képet sem keli befagyasztani, amíg újra egy INTRA képkockát kapunk. Ez a: néző számára sokkal inkább elfogadható megoldás.

3G Tételezzük fel, hogy az 5, ábrán látható módon egy találmány szerinti dekőderroí egy jelet fogadunk, és az ebben a jelben lévő minden egyes képkockát hagyományos módon dekódolunk, majd jelenítünk meg valamilyen megfelelő kijelzőeszközön. A dekódolt képkockák hlbajavítá lő són és hiba kihagyáson eshetnék át ismert és hagyományos módon, Minden egyes alkalommal amikor egy képkockát dekódolunk, a dekóder megvizsgálja a TR időleges referencia mezőt, hogy megtudja, mikor keli s képkockát megjelenítenie.

A dekóder fogadja -a 0 képkockát, amely egy 1NTRA képkocka, és annak megfelelően dekódolja 5 majd eltárolja a 123a képtarolóhan. Most tételezzük fel, hogy a dekóder nem képes heiyreáiiitani a 3 képkockát (például azért, mert az ehhez tartozó adatok nagymértékben megsérültek vagy az átvitel során elvesztek), így a következő, fogadott és dekódolandó képkocka az 1 képkocka fesz. Az 1 képkocka egy olyan kétirányú képkocka, amelyet a 0 és 3 képkockák alapján kódolta. Mivel a 3 képkocka elveszett, .a dekóder nem képes helyreállítani az 1 képkockát, és tö hasonlóképpen a 2 képkockát sem. Az a tény, hogy a 8 képkocka 1 és 2 képkockák elvesztek, semmilyen következménnyel nem jár a dekóderre nézve, mivel mint tudjuk a S· képkockák nem alkotnak referencia képkockát semmilyen más képkocka számára sem, így ezek elvesztése semmilyen időbeli hibát és hibaterjedést nem idéz elő. A dekóder így a jel dekódolását hagyományos és szokásos módon tudja folytatni.

A deköderrei fogadott és dekódolandó következő képkocka a 6 képkocka, A dekóder tudja, hogy a megelőző P3 referencia képkocka elveszett (mivel nem lehetett dekódolni az I vagy 2 képkockát). A dekóder ezért megvizsgálja a kapott képkocka élőfejét, hogy az tartalmaz-e esetleg SfW paramétert, A dekóder megállapítja, hogy a 6 képkocka éiőfejében 5RPN = 0 paraméter érték található, Így a 0 képkockát használja fel a 123a képtarolóból arra, hogy a 6 képkockát

2Ö dekódolja.

Ha a dekóder alkalmas arra, hogy vezérlő visszacsatolási adatokat küldjön a jeltovábbítást vég ző videó kóder felé, úgy a jeltovábbítást végző videó kódérnek egy olyan értelmű kérelmet küldhet el, hogy az egy soron következő képkockát 1HTRA képkockaként kódokon, hogy ezáltal megakassza azt az időbeli hiba terjedést, amely abból adódnak, hogy a soron következő kép25 kockákat annak a 6 képkockának az alapján kellene dekódolnia, amelyet a 0 képkocka alapján dekódolt, nem pedig a ténylegesen alapértelmezett 3 képkocka alapján. Ennek köszönhetően a dekóder folytatni tudja a dekódolást, és nem kelta kijelzett képkockát kimereviteni, miközben egy IHTRA kódolású képkockára vár.

Arra példát, miképpen lehet a tartalék referencia képkocka számot beilleszteni a kódolt videóiéi szintaxisba, a H.263 videó kódolási szabvány alapján mutatjuk be a továbbiakban.

A &, ábra egy adatfolyamnak a H.263 számú ajánlás szerinti szintaxisát mutatja, A következő bemutatások kivétel nélkül blokkcsoport formátumot irhák le, de szakember számára nyilvám wlőj hogy a .találmány hasonlóan megvalósítható szelet formátum esetén Is.

Mint azt már említettük, az adatfolyam négy réteget foglal magában: a kép réteget, a képszegmens réteget, a makroblokk réteget és a blokk réteget. A kép réteg egy kép fejlécet foglal magában, amelyet s blokkcsoportra vonsfeoző adatok követnek, amelyeket adott esetben bármely opcionális szekvencia-vége köd és kiíöltőbit követhet.

A kiindulási alapként tekinthető R.2S3 számú ajánlás szerinti adatfolyam felépítése a 4. ábrán látható. Az. egyes rövidítések jelentése az alábbi:

PSC A kép kezdd köd a kép kezdetét felöli.

7R Az időbeli referenciát úgy képezzük, hogy az időbeli megelőző referencia kép fejlécben lévő értéket megnöveljük eggyel plusz az előzőleg továbbított referencia óta kihagyott vagy nem referenciaként szolgáló képek számával.

FTYPE Egyebek mellett részleteket tartalmaz a kép kódolás típusáról, például ÍRTRA vagy ífeT£g típusról van-e szó.

PQUART Ez a kódsző azt a kvantálöt jelzi, amelyet a képhez használni kell mindaddig, amíg bármely rákövetkező kvantáló információ fel nem frissíti.

CPM Ez a· kődszó opcionális folyamatos jelenlétő többpontos és videó multiplex üzemmód alkalmazását jelzi.

FSBt A kép aibit-adatfoiyam jelző csak abban az esetben van jelen, ha az előző kódszó be van állítva.

TR_S Abban az esetben van jelen, ha a képkocka egy két irányban előre jelzett képkocka (PB képkockaként ;s ismert),

BBQIPAMT Abban az esetben van jelen, ha kétirányú képkockáról van; szó.

PB E.z extra beillesztési információra vonatkozik, és értéke akkor 1, ha a további opcionális PSURR és PB adatmezők jelenlétét jelezzük. A PEl és PSUPP információt együttesen a már említett kiegészítő bővítő információként Ismerjük, amelyet a R.2S3 számú ajánlás L melléklete még tovább definiál, üOSS AZ adott kepre vonatkozó blokkcsoport adata,

E5TF egy kitöltő kőősző, amely még az adafszekvencía vége előtt gondoskodik a bájt-kiigazításról.

EÖS A ké pre vonat kozó adstszekverscia vegét jelző kód sző.

-18PSTUf Egy további kitöltő kódszó, amely lehetővé teszi a bájt-kiigazítást a következő kép start, köd vonatkozásában,

A 6. ábrán bemutatott adatfolyam szerkezet nem tartalmazza az opcionális PkÜSTYPE adatmezőt. PSBI csupán abban az esetben van jelen, ha ezt CPM jelzi. TR_g és DBQUART csupán akkor van jelen, ha PT?V£ egy úgynevezett PS képkocka üzemmód használatát jelzi (mindaddig,, míg a PÖUSTW mező jelen van, és DBQUART alkalmazása abban fel van tüntetve). Ezek® kérdések részletesebben megismerhetők a ki,253 .számú ajánlásból.

Leírásunk további részében az egy találmány szerinti kóderrel előállított és kibocsátott adatfolyamokra mutatunk be; néhány lehetséges példát,

A tartalék referencia képkocka szám egy H.263 számó ajánlás szerinti adatfolyamba a következőképpen illeszthető be. A 7, ábra egy olyan adatfolyam felépítését mutatja, amelyet egy kóderrel a találmány szerinti eljárás egy első lehetséges változata szerint állítottunk elő. Mint a

7. ábrán látható, az adatfolyam egy további SRBR kódszót tartalmaz, amely a tartalék referencia; képkocka számot jelenti. Ezt a találmány értelmében egy kóderrel iliesztjük be a bit-áramba.

Alternatívaként az 5RPR kódszót a PSUPP kiegészítő bővítő információba is beépíthetjük (lásd; a d. ábrát és a H.263 számú ajánlás L mellékletét). A kiegészítő Információ jelen lehet a adatfolyamban abban az esetben; is, ha a dekóder nem rendelkezik olyan többlet képességekkel, hogy azt hasznosítsa, vagy hogy egyáltalán megfelelően értelmezze, A kiegészítő információ egyszerű ügyeimen kívül hagyass a dekóőerek számára járható ót, mindaddig, amíg külső eszközök,

20; azaz az adó és a vevő nem igénylik a kért képesség; meglétét és kihasználását.

Ha ;P£l értéke “Γ, úgy 9 bit következik, amelyből 8 bit adatbit ÍPSüPP), valamint egy további PEl bit jelzi, hogy következik-e további 9 bit adat és így tovább, ,A PSUPP adat egy -4- bites függvény típusú FTYPE mutatóból áll, amelyet egy 4 bites 0SI2E paraméter adat. nagyság specifikáció követ, amelyet függvényparaméter adatok DSIZE oktetjeí követnek, és azokat opcionálisan egy másik PTYPE mutató követi, és így tovább. Ennek a P5UPP kódszónak ismert alkalmazása, hogy különböző állapotokat jelezzünk ki vele, mint például egy teljes- kép vagy részleges kép leáilltási vagy leállítás megszüntetési kérelem; jelzése, átméretezéssel vagy anélkül, a vldeójei adatfolyamon belül mégha táró zott képek vagy képszekvenciák kijelölése külső használatra, vagy szmteiitettségl kulcs információ megadása videó összeálíitas30 hoz.

A. találmánynak a; kiegészítő bővítő információ felhasználásával történő megvalósítása céljából egy további FTYPE mutatót definiálunk SRPR paraméterként.

-13A 8. ábrán olyan példa; látható, ahol az SitPM paraméter é kép fejléc S£l blokkjába van beillesztve, Az ΕΊΎΡΕ paramétert 5RPM jelenetazonosítóként definiáltuk, A D5IZE a paraméter nagyságát adja meg, az azt követő oktat pedig maga a paraméter adat,, vagyis az SRPN értéke. Ebből az értékből egy vevő dekóder meg tudja állapítani, hogy van-e olyan tartalék referencia kép5 kocka, amelyet a fő referencia képkocka elveszése vagy megsérülése esetén fel lehet használni.

Alternatív megoldásként az információt a járulékos kiegészítő bővítő információban is elhelyezhetjük, amint azt például P. hüng és S. Wenger; Draft of new Aneex W: Adőítionaf Supplemeotary Enhancement Information Speciffcaííoo” című munkája specifikálja (IW-T Study Group 18, Üuestion 18, Oocument Q15-1-58,1999. Movemberj,

Ebben a szabvány tervezetben az ETVFE 14 paramétert képuzenetkénk’ definiálják. Ha ezt az ETYPE paramétert beállítják, akkor a képüzenet funkció jelzi üzenetadaíoí jelentő egy vagy több oktet jelenlétét Az üzenetadat első oktatja egy üzenet fejléc, amelynek szerkezeti felépítését a 7. ábrán vázoltuk, vagyis tartalmaz töhíT, EBIT és MTYPE blokkokat, A 0SIZE azonos az egy képüzenet fynkdénak megfelelő üzenet, adatokban lévő oktetek számával, beleértve az el15 ső üzenet fejléc oktetet Is,

A CÖHT folytatás mező, ha értéke 1, azt jelzi, hogy a képüzenethez tartozó üzenetadat ugyanannak a logikai üzenetnek a része, mint a kővetkező képüzenet funkcióval társított üzénetadáí. Az EBIT lezáróbit pozíció mező meghatározza azoknak a legkevésbé lényeges biteknek a számát, amelyeket az utolsó üzenet ektetben figyelmen kívül kell hagyni. Ezeknek a mezőknek to20 vábbl tulajdonságai, ismertetése megtalálható a, korábban már hivatkozott W melléklet vázlatában:.

Az MTYPt mező az üzenet típusát jelzi. A W melléklet tervezete különböző üzenettípusokat javasok A találmány szerint egy ilyen típust, például az MTYEE 13-at tartalék referencia képkocka számként definiálunk. Az Μ7ΎΡΕ 13 paraméter értéke az üzenet fejlécet követő okiéiban talál25 ható meg. Az üzenet adátbájt a tartalék referencia képkockák képkocka számait kitüntetett sorrendben tartalmazza, vagyis a leginkább kitüntetett jelenik meg legelőször. A képkocka számok azokra az értékekre vonatkoznak, amelyeket az U melléklet vagy W melléklet W.ó.3,12 szakaszának megfelelően továbbítunk, A W melléklet szerinti üzenet formátumot használhatjuk P, B, PB javított PB valamint EP képkocka típusokhoz. Ha azonban az N mellékletet vagy II mellékletet alkalmazzuk, és ha a képkocka több referencia képkockával van társítva, akkor célszerűen nem használjuk a W melléklet szerinti üzenet formátumot EP képkockák esetében az üzenetet célszerűen kizárólag előrementes előrejelzéshez használjuk, míg a felfelé Irányuló előrejelzést mindig elvégezhetjük az időben megfelelő referencia réteg képkocka alapján. A 8,

- 2ÖPB es javított PB képkocka típusok esetébe;’! az üzenet egy képkockát határoz meg, amelyet előrementes mozgás előrejelzés referenciaként használónk. Ezt az üzenetet nem célszerű hasznaim, ha a képkocka egy 1 vagy E.í képkocka.

Egy olyan példa esetében, amelyben egyetlen tartalék referencia képkockát jelzünk, és az SBPts 5 paraméter 10 bites paraméter, ez az. Szenet egy adatbájtot tartalmaz, azaz ŐSIZE értéke 3,

CONT érteke Ö és E&iT értéke 6. Az eddig leírtak alapján nyilvánvaló, hogy D5I2E, CONT és EBIT paraméterek értékel a jelzett tartalék referencia képkockák számának megfelelően fog változni, valamint attól a pontosságtői jbitszámfólj függően, amellyel a tartalék referencia: képkocka számokat feltüntetjük. Ha egynél több tartalék referencia; képkocka számot jelzünk, ügy elölő nyösen az üzenet adatbájtok a tartalék referencia képkockák számát, vagyis az SRPN paramétert kitünteteti sorrendben tartalmazzák fából a leginkább kitüntetett tartalék referencia képkocka száma található a legelső helyen).

Fenti: íeirásoszkban olyan kódolt videó adatfolyamokra hivatkoztunk, amelyekben két irányban előre jelzett képkockákat |B képkockákat) kódoltak, Mint már korábban jeleztük, a 8 képkockáig kát sohasem használjuk referencia képkockaként. Mivel ezeket a B képkockákat anélkül hanyagolhatjuk, hogy hiányuk károsan befolyásolná az elkövetkezendő képkockák képminőségét, időbeli skálázhatóságot biztosit na k. A skálázhatóság lehetővé teszi, hogy egy tömörített videojel sorozatot egynél több minőségi szinten dekódoljunk. Ez más szavakkal annyit jelent, hogy egy skálázható multimédiás klipet ágy tudunk tömöríteni:, hogy különböző adatsebességű csatornákon keresztül lehet áramoltatni, átküldeni, és ezzel együtt is lehetőség van valósidejű dekódolásokra és lejátszásukra, így a vidaó^: adatfolyamot különböző dekőderek különböző módon képesek dekódolni, Például egy dekőder dekódolhatja csupán egy jel 1 képkockáit és b képkockáit, ha ez annak a dekódolásnak a maximális sebessége, amelyet a dekőder biztosítani képes. Ha azonban a dekódernek kellő kapacitása van, dekódolhatja a 8 képkockákat is, és ezzel megnövelheti a megjelenített képkockák számát és a képkocka kijelzési sebességet. Ily módon a megjelenített kép képminősége jelentősen nőhet: egy olyan dekódethez képest, amely csak az I képkockákat és a P képkockákat képes dekódolni.

A skálázható multimédiás jellemző: módon úgy van kialakítva, hogy különböző hierarchikus adatrétegek találhatók, A multimédiás klip alapvető megjelenítését egy alapréteg tartalmazza, míg az egy vagy több bővítési réteg csupán az alatta húzódó részekhez képest finomított adatokat tartalmaz. Ennek megfelelően ezek a bővítési rétegek megnövelik a multimédiás klip minőségét.

-21 A skálázhatóság kívánatos tulajdonság heterogén és hibákkal terheit környezetekben. Ez a tulajdonság célszerű, hogy számot lehessen vetni az olyan korlátozásokkal, mint például a bitsebesség határok, a kijelzési felbontások, a hálózat sebessége, és a dekóder összetettsége.

A skálázhatóságot felhasználhatjuk egy olyan szállító rendszerben a híbatőró'ség javítására, 5 ahol a rétegeit kódolást szállítási sorrendbe állítással kombinálják. A szállítási sorrendbe állítás kifejezés alatt itt különböző megoldásokra gondolunk, amelyek különböző szolgáltatási minőségeket biztosítanak a szállítás vonatkozásában, ide értve ez egyenlőtlen hibavédelmet, vagy különböző, eltérő hibaarányd vagy veszteségarányú csatornák biztosítását, természetüktől függően az adatokat különböző módon rendelhetjük hozz. Például az alapréteget egy igen nagy

IS hibavédelem fokozatú csatornán keresztül tölthetjük fel, mig a bővítési réteget nagyobb feíbahajiamú csatornákon keresztül láthatjuk el.

Általánosságban a skálázható multimédiás kódolás egy rosszabb tömörítési hatásfokkal jelie^ mezbetö, mint a nem skálázható kódolás. Ez más szavakkal annyit jelent, hogy egy skálázható multimédiás klipként kődolt multimédiás klip, amely bővítési rétegeket is tartalmaz, nagyobb sávszélességet igényel, mintha egy nem skálázható, egyrétegű klip volna, amelynek egyetlen, folyamatos minősége van. Azonban ennek a szabálynak vannak kivételei, például a videó tömörítés területén használt, időlegesen: skálázható 8 képkockák.

A találmány egyéb skálázható videó tömörítő rendszerekben is alkalmazható. így például a H.263 számú ajánlás Ö melléklete két további skálázhatósági formát definiál: az egyik a jel/zaj skálázhatóság, a másik a térbeli skálázhatóság.

A terheli skálázhatóság és a jel/zaj skálázhatóság igen közel áll egymáshoz, közöttük az egyedüli különbség a térbeli skálázhatóság által biztosított nagyobb térbeli felbontás. A 10. ábrán jel/zaj skálázható képekre mutattunk példát. A jel/zaj skálázhatóság megában foglalja többse-bességü adatfolyamok létrehozását. Lehetővé teszi a kódolási hibák helyreállítását, vagy egy eredeti kép és az az alapján helyreállított kép közötti különbségeket. Ezt úgy éri el, hogy finomabb kvaotálő fokozatot basznál az egy bővítési rétegben lévő differencia képkocka kódolásához. Ez a járulékos információ a teljes helyreállított képkocka jel/zaj értékét megnöveli.

A térbeli skálázhatóság lehetővé teszi a többszörös felbontású adatfolyamok létrehozásához, hogy különböző kijelző követelményekhez és/vagy megszorításokhoz igazodjunk. Egy térben

3S skálázható szerkezetet a 11. ábrán vázoltunk fel. Ez a szerkezet lényegében ugyanolyan, mint a 10, ábrán bemutatott jej/zaj skálázhatóság, azzal az eltéréssel, hogy egy térbeli bővítési réteg kísérli meg a kódolási veszteséget visszanyerni a helyreállított referencia réteg képkocka min- 22 tavéteiezett változata és az eredeti képkocka nagyobb felbontású változata között. Például, ha a referencia réteg egy negyed közős átmeneti formátumú felbontású (Ö£iF felbontású), és a bővítési réteg közös közbenső formátum jÖFj felbontású, akkor a referencia réteg képkockát úgy kell megfelelő módon skáláznunk, hogy a bővítési réteg képkockát belőle előre meg tudjuk jósolni, A QCIE szabvány lehetővé teszi, hogy a felbontást függőleges irányban legfeljebb kétszeresére növeljük, vagy legfeljebb vízszintes Irányba növeljük, vagy mind vízszintes, mind: peóig függőleges irányban egy egyetlen bővítési réteg eseten. Egymás mellett létezhet több bővítési réteg is, amelyek mindegyike meg tudja növelni a képkocka felbontását az előző réteg által biztosított felbontáshoz képest, A referencia réteg képkocka mintavételezéséhez használt intő ferpoiáiő szűrőket a H,2ú3 számú ajánlás kifejezetten definiálja. Eltekintve a referencia rétegtől a bővítési rétegbe irányuló mintavételezési eljárástól, egy térben skálázott képkocka feldolgozása és szintaxisa azonos egy jel/zaj skálázott képkocka feldolgozásává! és szintaxisával.

Akár a jel/zaj skálázhatóság, akár a térbeli skálázhatóság esetén a bővítési réteg képkockáit Elvagy EP képkockáknak tekintjük. Ha a bővítési réteg képkockát a referencia rétegben lévő kép1S kockából felfelé előre jelezzük, akkor a bővítési réteg képkockáját egy bővítési-! <EQ képkockának nevezzük, ilyen skáiszási típus esetén a referencia réteg az aktuális bővítési réteg alatti” réteget jelenti. Egyes esetekben, ha a referencia réteg képkockái rosszul vagy szegényesen lettek előre jelezve, a bővítési rétegben végbemehet a képkockák statikus részének tüífcódolása, ami feleslegesen nagy bitrátát eredményez. Ennek a problémának az elkerülése érdekében a bővítési rétegben engedélyezett az ólommentes előrejelzés, ilyen esetben egy képkockát az előre Irányban jelezhetünk előre egy megelőző bővítési réteg képkockából, vagy alternatív megoldásként felfelé jósolhatjuk meg egy, egy bővítési P (EPj-képpontnak Is nevezett referencia réteg képkockából. Felhívjuk a figyelmet arra, hogy a felfelé és előremonteseo előre jelzett képkockák átlagának a kiszámítása EP képkockák vonatkozásában kétirányú előrejelzést okoz25 hat. Mind az El képkockák, mind az EP képkockák esetében a referencia réteg képkockából történő felfelé előrejelzés biztosítja, hogy nincs szükség mozgásvektorokra:. Az EP képkockák eiőrementes előrejelzése esetében: azonban a mozgásvektorokra szükség van.

Az SitPIM paraméter mezőt P, PB,, javított PS és bővítési réteg (EP) képkockákkal társifhatjok. A PB és javított PS képkockák jellemzői megtalálhatók a H.263 számú ajánlás 8 és tv! mellékleteiül ben.

Ha azonban az H vagy U mellékletet alkalmazzuk, és a képkocka több referencia képkockával van társítva, nem használjuk az 5RPN paramétert, PS és javított PB képkockák esetében az üzenet jellemző módon csupán a :P részt tartalmazza, EP képkockák esetében az üzenetet az

-23előremenfes előjelzéshez használjuk, ahol a felfelé történő előjelzést az időleges megfelelő referencia réteg képkocka alapjáé hajtjuk végre. Ezt az üzenetet előnyösen nem használjak, ha a képkocka I, El vagy B képkocka.

A találmány érteimében, ha az kóder alkalmas többrétegű kódolásra {például a H.263 számú 5 ajánlás 0 mellékletében taglalt módon), akkor az egyes rétegekhez egymást követő tartalék referencia képkocka számok tartoznak. Ezeket az aktuális képkocka bővítés! réteg számával is társíthatjuk. .A tartalék referencia képkocka számot az ugyanabban a bővítési rétegben lévő, előzőleg kódolt referencia képkocka megfelelő számából kiindulva egyesével növeljük meg. Ha azonban az ugyanazon bővítési rétegben lévő szomszédos képkockák azonos időbeli referenci20 ájúak és ha a R.2S3 számú ajánlás ;R vagy ó melléklete szerint járunk el, akkor a dekóder előnyösen ezt a jelenséget annak a jelzéseként tekinti és kezeli, hogy megközelítőleg azonos képtartalmú jelenetek redundáns másolata! lettek elküldve, és az összes ilyen képkocka; ugyanazon a referencia képkocka sorszámon osztozik.

Megjegyezzük, hogy az egyik találmány szerinti megvalósítás esetében az üzenet ezen túlme15 nőén jelezheti azt a tartalék referencia képkocka számot is, amelyet az aktuális kép meghatározott, kiválasztott négyszögletes területei vonatkozásában kell alkalmazni. Egy képhez több üzenet létezhet, melyek mindegyike meghatározza az alkalmazandó tartalék referencia képkocka számot egy egymást nem átlapoló négyszögletes terület vonatkozásában. Ha az üzenetek nem tartalmaznak Ilyen tartalék referencia képkocka számot a kép bizonyos területei vo20 natkozásában, úgy a dekóder előnyösen bármilyen hlbáeitüntetésl módszert alkalmazhat ezeknek a területeknek a vonatkozásában, ha nem dekódolható az a megfelelő referencia képkocka (vagy a n nak egy területe), ama ívből a hiányzó rész előjelezheío lenne. Előnyös módon a dekóder azt a blbaelfüntetési típust alkalmazza, amely a képíípusboz illik, vagyis egy időbeli predlktív hihaeitüntetesi eljárást egy IblTER képkocka esetén, és egy nem-időbeli prediktiv hl25 baelínntetási eljárást egy képkocka esetén.

Az; alábbiakban egy további, konkrétabb példát mutatunk be olyan esetre, amikor a kapott képkocka különböző területeihez hozunk létre 5RPM paraméter értékeket. Minden egyes tartalék referencia képkocka szám üzenet egy 58RH oktetet és négy PSíW oktetet tartalmaz, amely annak a képen belüli meghatározott négyszögletes tartomány bal felső sarkinak a vízszintes és függő leges pozícióját tartalmazza, amelyre vonatkozóan a tartalék referencia képkocka számot fel kell használni, valamint tartalmazza természetszerűen a négyszögletes tartomány szélességét és magasságát, mindegyik paraméterhez 8-8 bitet felhasználva, és IS képpontos egységekben; kifejezve {a kép iumlnanelajár® vonatkoztatva). Például sgy teljes QCíí- képet {Quarter

-24Comrnon Intermedlate Formai|, amely 176x144 képpontos luminanda képpel rendelkezik, a 0, Ö, 11, 9 paraméterek határoznak meg.

Olyan képformátumok esetében, amelyek szélességi és magassági mérete akkora, hogy nem osztható maradók nélkül iS-tai, a meghatározóit területet kiterjeszthetjük a legközelebbi na5 gyobb terület értékre, amely már osztható 15-íaL Például egy 160x120 képpont mérető teljes képet a 9, 9,19, 8 paraméterek határoznak meg. Előnyösen a meghatározott terület nem keresztezi a kép határokat, és előnyösen nem Is lapol át ugyanabban a képben más meghatározott, hlbaelíüntetett területeket sem.

A tartalék referencia képkocka számotbeépíthetjük más videó kódold protokollokba is. Például :1O az MPEG-4 protokoll úgynevezett felhasználós adatokat: definiál, amelyek bármilyen bináris adatot tartalmazhatnak, és nem kötődnek fehétfenűl a képhez. A járulékos mező például ezekhez a mezőkhöz adható hozzá.

Találmányunk nem korlátozódik a fent tárgyait vagy bemutatott videó kódoló protokollokra, azokat csupán példaképpen, a megoldás jobb megértése érdekében mutattuk be, Talál má15 nysmk bármely, időleges előrejelzést használó videó kódoló protokollal használható. A fent vázolt módon történő információ kiegészítéssel egy vevő dekédet saját maga képes meghatározni, hogy melyik az alkalmazandó, legjobb eredményt biztosító eljárás, ha egy képkocka elveszett.

Claims

1. Eljárás egy kápszekvencíat képviselő kódólt videojel dekódolására.,

- egy aktuális képkocka egy kiválasztott területe vonatkozásába n meghatározzuk, hogy az aktuális képkockához tartozó alapértelmezett referencia képkocka megfelelő területe megsérült

S vagy elveszett-e, ahol az alapértelmezett referencia képkockát az aktuális képkocka meghatározott területére vonatkozó mozgáskompenzált előrebecslés létrehozása során használjuk;

- a kódolt videojelben rendelkezésre bocsátott jelzőt megvizsgáljuk, hogy egy alternatív referencia képkockát azonosítsunk az aktuális képkockához, ahol az alternatív referencia képkocka egy olyan területet tartalmaz, amely kielégítő módon hasonlít az alapértelmezett referencia iö képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez; és

- az aktuális képkocka kiválasztott területe számára létrehozunk egy otozgáskompénzáit előrebecslést az azonosított alternatív referencia képkocka kielégítő módon hasonló területének felhasználásával.

2, Az .1, igénypont szerinti eljárás, ozzsí/e/femazve, hogy

15 — megvizsgáljuk a kódolt videojelben rendelkezésre bocsátott egynél több jelző rangsorrendjét, hogy egynél több olyan alternatív referencia képkockát azonosítsunk, amely olyan területet tartalmaz, amely kielégítő módon hasonlít az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez;

- a rangsorrend alapján kiválasztunk egy indikátort, és

28 ~áz aktuális képkocka kiválasztott területe számára egy mozgáskompenzált előrebecslést állítunk elő a kiválasztott jelző révén azonosított aiternatiy referencia képkocka kielégítő módon hasonló területének a felhasználásával.

3, Az 1. igénypont szerinti eljárás, ozzeí/eítemezve, hogy az Indikátort a kódolt videójei kiegészítő bővítmény információjából kapjuk meg·

25

4, Az 1. igénypont szerinti eljárás, őzzel jellemezve, hogy az indikátort az alternatív referencia képkocka: egy Időbeli referenciájának vagy az alternatív referencia képkocka egy képkocka számának azonosítására használjuk.

5, Az 1. Igénypont szerinti eljárás, ezzel jellemezve, hogy külön-kníon indikátorokat használunk 8 képkockák és ? képkockák számára a megfelelő alternatív referencia képkockák azonosé

-26tásához, vagy kizárólag P képkockák számára a megfelelő alternatív referencia képkockák azonosításához,

S. AZ 1. igénypont szerinti eljárás,, ozzol/e/lemezve, hogy az aktuális képkocka kiválasztott területe az egész aktuális képkocka vagy annak egy része, és az alapértelmezett referencia· kép5 kocka sérült vagy elveszett megfelelő területe pedig az egész alapértelmezett referencia képkocka vagy annak egy vonatkozó része.

7, Dekóder egy képszekvenciát képviselő kódolt videojel dekódolására, ózza/fe/femezve, hogy a dekóder alkalmassá van téve arra, hogy:

— egy aktoáiis képkocka egy kiválasztott területe vonatkozásában meghatározza, hogy az aktualö iis képkockához tartozó alapértelmezett referencia képkocka megfelelő területe megsérült vagy elveszett-e, ahol az alapértelmezett referencia képkocka az aktuális képkocka meghatározod területére vonatkozó mozgáskompenzáit előrebecslés előállítása során kerül felhasználás- a kódolt videojelben rendelkezésre bocsátott jelzőt megvizsgálja egy alternatív referencia IS képkockának az aktuális képkockához történő azonosításához, ahol az alternatív referencia képkocka egy olyan területet tartalmaz, amely kielégítő módon hasonlít az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez; és

-az aktuális képkocka kiválasztott területe számára egy mozgáskompenzáit előrebecslést állítson elő a? azonosított alternatív referencia képkocka kielégítő módon hasonló területének lei20 használásával,

8, Eljárás egy videojel kódoláséra egy képszekvenciát képviselő kódolt videóiéi létrehozásához, amelynek során —egy alapértelmezett referencia képkockát szerzünk meg a képszekvencia egy képkockájának kódolása és dekódolása révén,

25 - egy mozgásfcompénzált előrebecslést állítunk elő a képszekvencia egy aktuális képkockájának egy kiválasztott területe számára ez alapértelmezett referencia képkocka egy' megfelelő területérsek felhasználásával;

- az aktuális képkocka kiválasztott területe számára egy mozgáskompenzált előrebecslés eiőal3ö íitass során történő használat céljára előállítunk egy indikátort, amely agy olyan alternatív referencia képkockát azonosít, amely az alapértelmezett referencia képkocka megfelelő teröle-27téhez vagy az aktuális képkocka kiválasztott területéhez kielégítő módon hasonlító területet tartalmaz, és

- az Indikátort a kódolt videojelben bocsátjuk rendelkezésre,

9. A 8. igénypont szerinti eljárás, ozzof/elemezve, hogy az alternatív referencia képkockái úgy

5 azonosítjuk, hogy az alapértelmezett referencia képkocka megfelelő területét vagy az aktuális képkocka kiválasztott területét összehasonlítjuk egy tóvá hói referencia képkockával, hogy kiszámítsuk a kettő közötti hasonlóság mértékét;

-· a hasonlóság mértékét összevetjük egy előre meghatározott hasonlóság feltételiéi; és ~ az Indikátort az összehasonlíts s alapján hozzuk létre.

10 10. A 9. igénypont szerinti eljárás, oz2»/>/femexve, hogy egynél több olyan alternatív referencia képkockát azonosítunk, amely az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez kielégítő módon hasonló területet tartalmaz, úgy, hogy az alapértelmezett referencia képkocka megfelelő területét vagy az aktuális képkocka kiválasztott területét összehasonlítjuk több további referencia képkockával több ha3. 5 son ló sági mérték kiszá rostásá hoz; és

-egy-egy indikátort hozunk létre minden egyes további referencia képkockához, amely kieiégiii az előre meghatározott hasonlóság feltételt

XX. A 3.8. igénypont szerinti eljárás, ozzof ye/femezve, hogy a további referencia képkockákat rangsoroljuk az említett Össze hasonlítás alapján, és a kódolt videojelben egynél több indikátort

28 bocsátunk rendelkezésre a rangsorrendnek megfelelően, ahol a további referencia képkockával társított indikátor egy olyan területet tartalmaz, amely a leginkább hasonlít az alapértelmezett referencia képkocka megfeleld területéhez vagy az aktuális képkocka kiválasztott területéhez, amely a rangsorrendfeen első helyén áll,

12. A S, Igénypont szerinti eljárás, ozzcd/e/femezve, hogy áz indikátort a ködölt videojel kiegé25 szitő bővítmény Információjában bocsátjuk rendelkezésre.

13. KÖder egy vsdeójel kódolására, egy képszekvenciát képviselő kódolt videojel létrehozásához, ahol a kódé r arra alkalmasan van kialakítva, hogy

- a képszekvencia egy képkockájának kódolása és dekódolása útján megszerezzen egy alapértelmezett referencia képkockát;

- egy mozgáskompenzátt előrebecslést állítson elő a képszekvencia egy aktüális képkockájának egy kiválasztott területére vonatkozóan az alapértelmezett referencia képkocka egy megfelelő területének felhasználásával;

ozzoffefenezve, hogy a káder alkalmassá van téve továbbá arra, hogy

5 ~ egy indikátort állítson elő, amely az aktuális képkocka kiválasztott területe számára egy mozgáskompenzált előrebecslés kialakítása során történő használathoz egy alternatív referencia képkockát azonosít, amely az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez kielégítő mértékben hasonlító területet tartalmaz; és lő - az Indikátort rendelkezésre bocsássa a kódolt vldeójeiben..

14, Kepszekvenelat képviselő kódolt videojel, ozzo//elemezve, hogy egy alternatív referencia képkockát azonosító indikátort tartalmaz, ahol az alternatív referencia képkocka egy olyan területet tartalmaz, amely kielégítő mértékben hasonlít egy alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka egy kiválasztott területéhez, és az alternatív'

IS referencia képkocka az aktuális képkocka kiválasztott területe számára egy alternatív mozgáskompenzált előrebecslés előállítása során kerül felhasználásra,

15, Számítógép program termék egy videojel kódolására, egy képszekvenciát képviselő kódolt videojel létrehozásához, amely adathordozón olyan kódot tartalmaz, amely végrehajtása esetén egy processzort arra késztet, hogy

2Ö - a képszekvenoía egy képkockájának kódolása és dekódolása utján megszerezzen egy alapértelmezett referencia képkockát;

- a képszekvencia egy aktuális képkockájának egy kiválasztott területére vonatkozó mozgáskompenzált előrebecslést állítson elő az alapértelmezett referencia képkocka megfelelő területének a f elhasználásává 1;

25 ozzrd/efenezve, hogy végrehajtása esetén egy processzort arra késztet továbbá, hogy

- egy olyan: Indikátort hozzon létre, amely az aktuális képkocka kiválaszt ott területe számára egy mozgáskompenzált előrebecslés létrehozása során történő használatra egy olyan alternatív referencia képkockát azonosít, amely egy olyan területet tartalmaz, amely kielégítő mértékben hasehlit az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális kép30 kocka kiválasztott területéhez; és az indikátort a kódolt videojelben bocsássa rendelkezésre.

• 29 38. Számítógép program· termék egy képszekvenciat képviselő kódolt videojel dekódolására, őzről Jd/emezve, hogy adathordozón olyan kódot tartalmaz, amely végrehajtása esetén egy processzort arra késztet, hogy

-egy aktuális képkocka egy kiválasztott területe vonatkozásában meghatározza, hogy az aktuá5 lis képkockához tartozó alapértelmezett referencia képkocka egy megfelelő területe sérült vagy elveszett-e, ahol az alapértelmezett referencia képkocka az aktuális képkocka kiválasztott területére vonatkozó mozgáskompeozált előrebecslés létrehozása során kerül felhasználásra;

- a kódolt videójeiben rendelkezésre bocsátott indikátort megvizsgálja az aktuális képkocka számára egy alternatív referencia képkocka azonosítása céljából, ahol az alternatív referencia l'ö képkocka egy olyan területet: tartalmaz, amely kielégítő mértékben hasonlít az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez; és

- az aktuális képkocka kiválasztott területére vonatkozó mozgáskompeozált előrebecslést hozzon létre az azonosított alternatív referencia képkocka kielégítő mértékben hasonló területé15 nek a felhasználásával.

3,7. A igénypont szerinti dekóder, omrf/effemezve, hogy a 2-6. Igénypontok bármelyike szerinti dekódoló eljárás végrehajtására van kialakítva,

18, A 13. igénypont szerinti kóder, ózza//elemezve., hogy a 9-12. Igénypontok bármelyike szerinti eljárás végrehajtására van kialakítva.

28 3$. A 36. igénypont szerinti számítógép program termék, hogy a 2-6. Igénypontok bármelyike szerinti dekódoló eljárás végrehajtására van kialakítva,

20, A 15. Igénypont szerinti számítógép program kódolásra, ozzo/je/femezve, hogy a 3-12, igénypontok bármelyike szerinti kódoló eljárás végrehajtására van kialakítva.