HU230597B1 - Eljárás, kóder és dekóder videójel kódolására, dekódolására, továbbá kódolt videójel, valamint számítógép program termék - Google Patents

Eljárás, kóder és dekóder videójel kódolására, dekódolására, továbbá kódolt videójel, valamint számítógép program termék Download PDF

Info

Publication number
HU230597B1
HU230597B1 HU0302055A HUP0302055A HU230597B1 HU 230597 B1 HU230597 B1 HU 230597B1 HU 0302055 A HU0302055 A HU 0302055A HU P0302055 A HUP0302055 A HU P0302055A HU 230597 B1 HU230597 B1 HU 230597B1
Authority
HU
Hungary
Prior art keywords
frame
area
reference frame
frames
video signal
Prior art date
Application number
HU0302055A
Other languages
English (en)
Inventor
Miska Hannuksela
Kerem Caglar
Original Assignee
Nokia Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corporation filed Critical Nokia Corporation
Publication of HUP0302055A2 publication Critical patent/HUP0302055A2/hu
Publication of HUP0302055A3 publication Critical patent/HUP0302055A3/hu
Publication of HU230597B1 publication Critical patent/HU230597B1/hu

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Systems (AREA)
  • Error Detection And Correction (AREA)
  • Glass Compositions (AREA)
  • Color Television Systems (AREA)
  • Analogue/Digital Conversion (AREA)

Description

Eljárás, kódé? és dekóder videójel kódolására, dekódolására, továbbá kódolt videóiéi, valamint számítógép program termékek
A találmány tárgya egy 3? 1. igénypont tárgyi kőre szerint? eljárás valamint egy a 7, igénypont tárgyi köre szerinti dekőder egy képszékve nelát képviselő kódolt videojel dekódolására, továb5 bá egy a 8, igénypont: tárgyi köre szerinti eljárás valamint egy a 13. igénypont tárgyi köre szerinti kóder egy kódolt videójel kódolására, továbbá egy a 14. igénypont tárgyi köre szerinti, képszekveociát képviselő kódolt videojel, továbbá egy a 15. Igénypont tárgyi köre szerinti számítógép program termék egy videojel kódolására, valamint egy a ló, Igénypont tárgyi köre szerinti számítógép program termék egy képszekvendát képviselő kódolt videojel dekódolására, .10 £gy videószekveneia állóképek vagy képkockák somsaiéból áll, A képtönwítsí eljárások a videószekvenciák redundáns és az észlelés szempontjából lényegtelen részeinek a csökkentésen alapulnak, A videöszekvenclákban a redundanciát spektrális, térbeli és Időbeli redundancia kategóriákra oszthatjuk. A spektrális redundancia egy adott kép eltérő szinösszetevöí közötti hasonlóságra vonatkozik. A térbeli redundancia egy adott kép egymással szomszédos képpont15 jai közötti hasonlóságból ered. Az időbeli redundancia úgy jön létre, hogy egy megelőző képen megjelent tárgyak valószínűleg megjelennek a jelenlegi képen is, A tömörítést ennek az időbeli redundanciából fakadó előnynek a kihasználásával, és 3 jelenlegi képnek egy másik, horgony vagy referencia képnek nevezett képből történő előre kiszámításával érhetjük el. További tömörítés érhető el olyan mozgáskompenzádós adatok létrehozása révén, amelyek a jelenlegi kép és a referencia kép közötti mozgást írják le.
A vídeőszekvencíához tartozó redundancia kizárólagos csökkentésével azonban rendszerint nem tudunk elegendő mértékű tömörítést megvalósítani. Ezért a videó kóderek a videószekvencia szubjektív megítélés szériré kevésbé lényeges részeinek a minőségét igyekeznek csökkenteni. Ezen túlmenően a kódolt adatfolyam redundanciáját a tömörítési paraméte25 rék és együtthatő k hatékony vesztesége entes kódolásával is csökkenten í lehet. Ennek fő technikája a változtatható hosszúságú kódok alkalmazása.
A videó tömörítő eljárások jellemzően megkülönböztetik azokat a képeket amelyek időleges redundancia csökkentést alkalmaznak, azoktól a képektől, amelyek nem élnek ilyen módszerrel, Azokat á tömörített képekét, amelyek nem alkalmaznak: időbeli redundancia csökkentő el30 járásokat, általában 1NTRA vagy l képkockáknak vagy I képeknek nevezik. Az időben előre megjósolt képeket szokásosan egy olyan kép alapján határozzák meg előre, amely a jelenlegi képét megelőzően volt látható, és az ilyen képeket ihl W vagy p képkockáknak vagy P képeknek nevelik, Az ?MT£R képkockák esetében az előre megjósolt, kíszámítőtt mozgáskom pénzéit kép ritkán kellően pontos, és ezért minden egyes WTER képkockával egy térben tömörített jőslási bibe keret Is társul. Az IhlTER képkockák 11MTRA kődolt területeket tartalmazhatnak.
Sok videó tömörítő eljárás időbeli kétirányú jósolt képkockákat is használ; amelyeket általában 8 képeknek vagy 8 képkockáknak hívnak. Ezek a 8 képkockák az I képkockák és/vagy 8 képkocS kák referencia képkocka párjai közé vannak beillesztve, és vagy mindkét, vagy valamelyik referencia képkockából számítják ki élőre, A B képkockák általános esetben nagyobb tömörítést eredményeznek. mint az élőre jósolt képkockák esetében tapasztalható. A B képkockákat nem használják referencia képkockaként, ami azt jelenti, hogy ezekből nem számítanak ki előre másik képkockákat. Ezért:ezeket figyelmen kívül hagyhatjuk (szándékosan vagy véleflenül; anélkül, hogy ezzel a jövőbeli képkockák képminőségét hátrányosan befolyásolnánk. Jóllehet a B képkockák a P képkockákkal összehasonlítva megnövelik a tömörítés hatásfokát, előállításuk nagyobb számítási bonyolultsággal és memória haszná lattal jár, és járulékos késéseket vezetnek be. Ez nem valósidejű kódolásoknál, például videó s t reá ming esetén nem feltétlenül gond, de valósidejű alkalmazásoknál, mint amilyen a videó konferencia, gondokat okozhat.
f 5 Egy tömörített videó klip általában olyan képkockák szekvenciájából áll, amelyeket durván időben független ItOUA képkockákra és Időben differenciálisán kódolt iNTER képkockákra oszthatunk fel. Mivel az IKfTRA képkockákban a tömörítés hatásfoka általában kisebb, mint az ÍNTER képkockákba, az INTRA képkockákat különösen alacsony bitsebességű alkalmazásokban takarékosan alkalmazzuk.
2S Egy videöszekventía több jelenetből vágy képből áll össze. Az egyes képkockák tartalma jóié* netről jelenetre jelentősen eltérhet egymástól, ezért egy jelenet első képkockája jellemzően mindig IblTRA kódolt képkocka, A televíziós és filmes anyagokban gyakoriak a jeleneivélíások, míg más alkalmazásoknál, például videó konferenciánál a íeíenetváifások viszonylag ritkák. Ezen túlmenően az INTRA képkockákat általában azért Is használják, hogy a helyreállított videojelben az átviteli hibák időbeli terjedését megállítsák, és hogy a videó adatfolyamhoz véletlen hozzáférési pontokat biztosítsanak.
A tömörített videojelet az átviteli hibák könnyen tönkreteszik, különösen két okból. Először,, az időben predíktív differenciális kódolás alkalmazása következtében (INTER képkockák) a hiba mind térben, mind időben terjed. Ez a gyakorlatban azt jelenti, hogy ha egy hiba lép fel, azt az emberi szem viszonylag bosszú időn át könnyen észleli. Különösen sérülékenyek azok a kis bitsebességű átvitelek, amelyekben csupán néhány, kisszámú INTRA kódolt képkocka található. Így az Időbeli hiba terjedése bizonyos Ideig nem gátolt. Másodszor, a változó hosszúságú kódok használata megnöveli a hibák Iránti fogékonyságot. Ha egy bithiba megváltoztatja a kódszőt, a
-3dekőder elveszt; a kődsző sziukronizalasí, és az azt követő (néhány bitből álló; hibamentes kóászavakaf is helytelenül dekódolja a következő szinkronizáló (vagy kezdő; kódig, ggy szinkronizáló kód egy olyan bítminta, amely a többi kódszó legális kombinációjaként nem állAható elő, és az ilyen kódszavakat adott írhervaliumokban hozzáadják a adatfolyamhoz, hogy lehetővé te5 gyek ez «aszlokronizálást. Ezen túlmenően hiba lép tel akkor is, ha az átvitel során adat vész el, Például IP hálózatokban a megbízhatatlan UTP szállítási protokollt használó videó alkalmazásokban az egyes hálózati elemek figyelmen kívül hagyhatják a kódolt videó adatfolyam egyes részeit,
A vevőkészülék számára számos módi van, hogy a jelátviteli úton bekerült hibát kezelni tudja,
Általánosságban egy jel vételekor az átviteli hibákat előbb észlelik, majd sav írják vagy elnyomják, és ezt a feladatot a vevőkészülék látja el. A hibajavítás azt az eljárást jelenti, amelynek során a hibás adatokat tökéletesen helyreállítják, ügy, mintha semmilyen hiba nem lepett: volna fel a továbbítás során, A inba elnyomás olyan eljárást jelent, amellyel az átviteli hibák hatását tudják kiküszöbölni úgy, hogy a hibák a helyreállított vsdeószekvenciában nem, vagy csupán
IS nehezen észlelhetők. Rendszerint bizonyos mértékű redundanciát a forrásnál vágy a szállítási kódolásnál be szoktak vinni a jelbe, hogy ezzel Is elősegítsék a hiba észlelését, javítását vagy elnyomását
Számos ismert eltüntető algoritmus létezik, melyek áttekintése elolvasható például Ύ. Wang és
Q.F.Zhu: 'terror Control and Concealment for Videó Cemmunicatlen: A Review című cikkében, '20 amely a Pröceedings of the IEEE folyólratSS, évfolyamának 5. számában jelent meg, májusban, a 974-997, oldalon, továbbá P. Salama, N.B. Shroff es EJ. Qeip: 'terror Concealment in Eneoding Videó'' című cikkében, amely az IEEE Journal on Selected Areas In Communications elme kiadványban jelent meg.
A jelenlegi videó kódoló szabványok egy önmagában: elegendő videó adatfolyamra vonatkozó szintaxist definiálnék. Jelen szabadalmi leírás készítésének időpontjában a legnépszerűbb szabványok közé tartozik az I7U-T K.263 száma szabványa Videó coding fór iov? bit rate commonicatlon, 1998 február, kíadványSzáma ISÖ/IEC 14A9S-2, továbbá az MPES-A-ként is ismert Generie Coding of Audio-Visual Ofejeets, Part 2; Visual című 1999-es cikk, valamint az IteU-T H.262 számú, íW£G~2~ként ismert szabványa (kladványszáma ISO/lEC 1381fo2j. Ezek a
30' szabványok megfelelő hierarchiát definiálnak az adatfolyamok és ezen keresztül a képszekvenciák: és képek számá ra.
A H.2Ő3 számú szabvány szerint a szintaxis négy réteget tartalmazó hierarchikus struktúrája van: kép, képszegmens, makroblokk és blokk réteg, A kép réteg adatok a teljes képterületet va-4iamínt a képadatok dekódolását befolyásoló paramétereket tartalmaznak, A legtöbb ilyen adat egy úgynevezett kép fejlécben helyezkedik el,
A képszegmens réteg vagy egy blokk réteg csoport, vagy egy szelet réteg lehet. Alapesetben minden egyes kép bíokkesoportokra v-a« felosztva, Egy biokkcsoport általában 16 egymást kö5 vető keppontsort tartalmaz. Az egyes bíokkesoportokra vonatkozó adatok egy opcionális felokkesoport fejlécet tartalmaznak, amelyet a makroölokkok adata követ, Ha az opcionális szelet szerkezetű üzemmódot alkalmazzuk, akkor minden egyes képet szeletekre osztunk fel blokkesoportok helyett Egy szelet letapogatási sorrendben egymást követő makrobíofckokal tartalmaz. Az egyes szeletekre vonatkozó adatok egy szelet fejlécből, valamint a makroblokkokra vonatkozó adatokból állnak,
Minden egyes biokkcsoport vagy szelet makroblokkokra van felosztva. Egy makroblokk 16x16 képpont (vagy 2x2 blokk) lumínancíára és a krominsncla Összetevők térben megfelelő: gxg képpontjára (vagy blokkiára} vonatkozik. Egy blokk 8x8 luminanda vagy kromlnancia képpontra vonatkozik,
A blokkreteg adatok egyenlő módon kvantáít. diszkrét koszinusz transzformációs együtthatókból állnak, amelyeket zegzugos sorrendben letapogatnak, egy RLE (run-length encoding) kódértéi feldolgoznak, majd változó kódhosszüságokkal kódolnak. Az TvtPES-2 és MPES-A réteg hierarchiák: hasonlítanak arra, amelyet a H.2Ö3 számú szabványban alkalmaznak, kiindulási esetben ezek a szabványok általánosságban az időbeli megelőző referencia képkoc.20 kát (I, El, P vagy EF képkockát}, amelyet viszonyítási képkockának is neveznek, használják referendakent a mozgáskompenzáláshoz. Ez az információ rész nem: kerül továbbításra, vagyis a adatfolyam nem tartalmaz a referencia képkockát azonosító Információt Ennek következtében a dekódereknek semmilyen eszközük nincs arra, hogy észleljék, ha egy referencia képkocka elvesz. jóllehet számos adattovábbító káder a videó adatokat csomagokba álBja össze, és egy25: egy sorszámot rendel ezekhez a csomagokhoz, a sorszámok mégsem: a videó adatfolyamra vonatkoznak. Például egy videó adatfolyam részlet tartalmazhat Pl P képkockát, S2 8 képkockát, F3 P képkockát és FA P képkockát, a feltüntetett sorrendben felvéve (valamint a fenti sorrendben megjelenffendően}. Azonban ezt a részt az alábbi sorrendben tömöritenénk, továbbítanánk és dekódolnánk: Pl, P3, S2, P4 - mivel a 82 képkockánál szükség van arra, hogy mind a
FI képkockát, mind pedig a P3 képkockát még őslötte kódolhassuk: vagy dekódolhassuk, Kiindulva adboí, hogy csomagonként egyetlen képkocka van, továbbá hogy minden egyes csomag: tartalmaz egy sorszámot, és hogy a .82 képkockát tartalmazó csomag vész el, egy vevő ennek a. csomagnak az elveszését a csomag sorszámok alapján tudja észlelni. A vevőnek azonban nincs semmiben eszköze árrá,, hogy észlelje, ha a P4 képkockához tartozó mozgáskompenzálási referencia képkocka vész el, vagy egy olyan 6 képkocka vesz el, mely esetben a dekódolást szokásos módon tudná folytatni.
A dekóder ezért általában egy ÍRTRA kérelmet bocsát ki a küldőnek, és a képkockát kimerevlíi a kijelzőn. Az adó azonban nem biztos, hogy válaszolni tud erre a kérelemre. Például egy nem valósidejű vldeójei áramoltatásos jstreamingj alkalmazás esetén a küldő oldal nem képes válaszolni az egy dekódertől eredő ÍRTRA kérelemre. Ezért a dekóder a képkockát ki merevíti, amíg megkapja a következő ÍRTRA képkockát. Válösíöéjö alkalmazásban, például videó konferencia esetén Is előfordulhat, hogy a köidő/adö nem képes válaszolni egy ilyen kérelemre. Egy több résztvevős konferencia esetén például az kóder nem tud az egyedi kérelmekre válaszolni. A dekóder ebben az esetben sem tehet mást, minthogy kimerevíti a képkockát mmdaddig, amíg az adó egy következő IRTSA képkockát nem bocsát ki.
Az US 5,706,053 számú szabadalmi dokumentum egy tömörített mozgókép kód feldolgozó egységet és eljárást ismertet. Az egység processzoré egy bitfolyamot mozgókép adatszekvend15 ává dekódol, és minden egyes képet egy külső áramkörhöz továbbít az eredeti vldeószskveridának megfelelően. Ha a bitfolyamban hiba lép fel, 3 hibás rész adatait egy már dekódolt és tárolt korrekciós kép megfelelő vonatkozó részének dekódolt adataival helyettesítik, A dokumentum nem biztosítja az; aktuális kép vagy képrész megjelölheíőségét abból a célból, hogy beazonosítható legyen a szekvencia egy olyan másik képe, amely alternatív referen20 óla képként felhasználható az aktuális képhez vagy képrészhez a kódolt videojel dekódolása során.
A kitűzött feladatot egyrészt egy ez 1, igénypont jellemzői szerinti eljárással és egy a 7. igénypont jellemzői szerinti dekóderrel oldottuk meg egy képszekvenoíáf képviselő kódolt videojel dekódolására, másrészt egy a 8, igénypont jellemzői szerinti eljárással és a 13. igénypont jelző lemzől szerinti kóderrel oldottuk meg egy kódolt videojel kódolására, harmadrészt egy a 14. igénypont jellemzői szerinti, képszekvenciát képviselő kódolt videojellel, negyedrészt egy a .15.
Igénypont jellemzői szerinti, egy videójeiet kódoló számítógép program termékkel, és ötödrészt egy a 16. igénypont tárgyi köre szerinti., egy képszekvenciát képviselő kódolt videójeiet dekódoló számítógép program termékkel oldottuk meg,
3ö A bejelentésbe foglalt talá lmányok főbb előnyős kiviteli alakjait, illetve foganatosítás! módjait az aligénypontokhao fogalmaztok meg.
A találmányt az alábbiakban a csatolt rajz segítségével ismertetjük részletesebben, amelyen a
-Q javasolt eí§aras példaként megvalósítását tüntettük fel. A rajzon az
1. ábra egy multimédiás mobil kommunlkádős rendszer felépítését mutatja be vázlatosan, 3
2. ábrán egy multimédiás terminál multimédiás osszetevőidek péidakéntí összeállítása lát5 ható., a
3. áórán egy videó: kodek példaként! felépítését muta tjük de, a
3a. ábra a találmány szerinti videó kóder példakend felépítését mutatja be még részletesebben, a
4.. ábrán á taiáimány szerinti videó kóder egy első lehetséges kiviteli: alakjának mőködésl vázlatát tüntettük fel, az
5. ábrán a találmány szerinti videó kóder egy második lehetséges kivitel! alakjának működési vázlatát tüntettük fel, a
6. ábra egy adatfolyam szintaxisát mutatja a H.263 számú ajánlásnak megfelelően, a
7. ábra egy találmány szerinti videó kőderrel létrehozott adatfolyam felépítésének első példája, a
8.. ábra egy találmány szerinti videó kódértéi létrehozott adatfolyam felépítésének második példája, a
9. ábra egy találmány szerinti videó kőderrel létrehozott adatfolyam felépítésének harmadik példája, a
2Ö 10, ábra a videó kódolás során: a: skálázhatóság érdekében használt bővítő rétegeket matat: be, és a ll, ábra a videó kódolásnál a térbeli skálázhatóság érdekében használt bővítő rétegeket mutat be.
•Az 1. ábrán egy multimédiás mobil kommunikációs rendszer tipikus felépítésének a vázlata látás ható. ggy első multimédiás mobil 1 terminál: egy második multimédiás: mobil 2 terminállá! 3 rádióösszeköífetés útján, mobil: kommunikációs 4 hálózaton keresztül kommünikéik Az 1, 2 terminálok között multimédiás adatok valamint vezérlő adatok kerülnek továbbításra.
A 2. ábrán az í terminál jellemző multimédiás összetevőit mutatjuk be. Az 1 terminál 10 videó ko dé kel 20 audio kodeket 30 adatprofcokol l kezelőt, 40 vezér iéskezelőt, Sö m ulti plexert és demultlplexert, valamint - amennyiben szükséges ~ &0 modemet tartalmaz. A lö videó kodek az ϊ terminál: rajzon nem látható videó felvevő eszközétől, pl:, kamerájától származó jeleket: fogadja kódolás céljából, valamint a távoli 2 termináltól: egy 7Q kijelzője segítségével megjelenítendő jeleket fogad dekódolás céljából. A 20 audio kodek az 1 terminál rajzon nem látható mikrofonjától származó jeleket fogadja kódolás céljából, valamint a távolt 2 termináltól a rajzon ugyancsak. nem látható hangszórója segítségével visszaadandó jeleket fogad: dekódolás céljából. .Az 1 terminál valamilyen hordozható ratims kommunikációs eszköz, például mobil telefon lehet.
A 40 vezérléskezelö vezérli a 10 videó kodek, a 20 audió kodek és a 30 adatpratokoll kezelő működését Mivel találmányunk elsősorban a 10 videó kodek működésére irányul,, leírásunkban a 20 audio kodek és a 50 adatprotokoli kezelő felépítésével és működésével tovább nem foglalkozunk,
A 3. ábrán a találmány szerint megvalósított 10 videó kodek felépítését mutatjuk be.
A 10 videó kodeknek 100 kódere és 200 dekódere van. A 10 videó kodek 100 ködere az X terminál ábrán nem látható kamerájától vagy más videó forrástól származó: videojelet fogadó löl bemenettel rendelkezik. A10 videó kodek 100 kóderében lévő 102 kapcsoló kapcsolja át a 100 kódért egy INTRA üzemmód és egy s ΝΪΕ R üzemmód között. A10 videó kodek 100 kódere egy 103 DCT átalakítót, egy 104 kvanfálót, egy inverz 108 kvardálót, egy inverz 109 DCT átalakitől,
IS egy 110 összegző fokozatot, több 107 képtárolöt (lásd a 3a. ábrát), eló'rejelzési hibát kiszámító 106 kivonó fokozatot, 113 kapcsolót valamint 105 kódolésvezérlö kezelőt tartalmaz. A10 videó kodek 2Ö0 dekódere Inverz 120 kvanfálót, egy inverz 121 DCT átalakítót, egy 122 mozgáskompenzáíort, 123 képtá rolót valamint 124 vezérlőt tartalmaz, A 124 vezérlő a kódolt multimédiás adatfolyamból az Sö moitiplexer/demoltipisxerrel demultipsexelt videó kodek ve^ zérlójeleket fogadja. A gyakorlatban a 100 kóder 105 vezérlője és a 200 dekóder 124 vezérlője ugyanaz a processzor lehet,
A következőkben a találmány szerinti kóder működését mutatjuk be. A 10 videó kodek megkapja a kódolandó videójelet A10 videó kodek 100 kódere a videójelet DCT átalakítás, kvantálás és mozgáskompenzació végzésével kódolja. Ez a kódolt videó adat ezután az S0 muitlple2b xer/demultipiexer kimenetére jut. Az 50 multipiexer/demuhiplexer multiplexen a 10 videó kodektől kapott videó adatot és a 40 vezérlő fokozattól kapott vazériöadatot (valamint adott esetben más jeleket), és multimédiás jelet állít elő: azokból. Az 1 terminál az így előállított multimédiás jelet (amennyiben szükséges) a 00 modemen keresztül küldi el a vevő 2 termi nálnak.
INT8A üzemmódban a löl bemeneten megkapott videójelet egy 103 DCT átalakító ÖCT együtthatókká alakítja át. Az átalakított DCT együtthatók ezt követően 104 kvántálöba jutnak, amely az együtthatókat kvantálja. A102 kapcsolót és a 104 kvaetaiót a lö videó; kodeknek az a TÖS kődűiásvezérlő kezelője vezérli, amely a 40 vezérléskezelö révén a második 2 termináléi
-8származó visszacsatolási vezérlést is megkapja, A dekódolt képet úgy á 1 h'tjuk elő, hogy a 104 kvantálö áltat kibocsátott adatokat átvezetjük az inverz 108 kvantáión, és az inverz kvantált adatokat az inverz i0§ DCT átalakítóval feldolgozzuk. Az ennek eredményeképpen kapott adatokat Levisszük a 110 összegző fokozatba. 1NTRA üzemmódban a 113 kapcsolóit úgy állítjuk Le, hogy a tőle a 110 összegző fokozatba bevitt adatok értéke nulla legyen, A110 összegző fokozat a két bemenetére vezetett adatokat összegzi, és az eredményt továbbítja a 107 képtároióba.
sNTER üzemmódban a 102 kapcsoló úgy működik, hogy egy 106 kivonó fokozattól megkapja a 101 bemenetre érkezett videojel valamint egy, egy 107 képtárolÖLan tárolt korábbi kép közötti különbséget. A 106 kivonó fokozat által kibocsátott különbségi adat képviseli a jelenlegi kép és a 10? képtároioban tárolt korábbi kép közötti predikciös hibát. A18? képtárofóbss lévő adatokat úgy állítjuk elő, hogy a 104 kvantáió által kibocsátott adatokat átvezetjük egy inverz 108 kvantáión, majd az Inverz módon kvantált adatokat egy inverz 180 ©CT átalakítóban átalakífjók. Az eredményül kapott adatokat hozzáadjuk 110 összegző fokozat segítségével a 107 képtároiö tartalmához, £gy 111 mozgásbacslö fokozat s 107 képtáraidban lévő adatokból bagyomá15 nyes módon műzgáskompenzálási adatokat (mozgásvéktorokát) állíthat elő.
A 105 kódoiásvezérlö kezelő határozza meg, hogy 1NTRA kódolást vagy ShlTER kódolást kell-e alkalmazni, vagy hogy a képkockát egyáltalán a 106 kivonó fokozat kimeneti jele alapján, vagy a vevő dekőőer által fogadott visszacsatolási vezérlő alapok függvényében kell-e kódolni. A 105 kódoiásvezérlö kezelő olyan döntést is hozhat, hogy egy kapott képkockát egyáltalán nem kell kódolni, ha az éppen kapott képkocka és a referencia képkocka közötti hasonlóság elér egy meghatározott mértéket, vagy ha nincs Idő a kapott képkocka kódolására. A 105 kódoiásvezérlö kezelő a 102 kapcsolót megfelelő módon képes működtetni.
Ha nem vesszük figyelembe a visszacsatolási vezérlési adatot akkor az káder jellemző módon egy képkockát egy IMTRA képkockaként kódol, vagy csupán a kódolás kezdetekor (és az összes többi képkocka P képkocka lesz), vagy szabályos időközönként, például üt másodpercenként, vagy ha a 1Ö5 kivonó fokozat kimeneti jele meghalad egy előre beállított küszöbértéket, vagyis ba azt aktuális képkocka és a 10? képtároioban tárolt képkocka túlságosan eltér egymástól, A kódért úgy is ptögmmozhatjpk, hogy a képkockákat egy meghatározott szabályos szekvencia szerint kódolja, példáni )8LWBP£fo?88P88íb8P stb.
A 10 videó kodsk a kvantált 112a DCT együtthatókat a 112b kvantálási indexet (vagyis az alkalmazott kvantálásra vonatkozó részleteket), továbbá egy IIMTRA/INTER 112c flag-et bocsát ki, hogy jelezze ezáltal a végrehajtott kódolás fajtájat (I vagy R/8j, valamint egy 112d továbbítási flag-et bocsát ki, hogy jelezze a kódolt képkockák számát, valamint s kódolás alatt álló képhez
- 3 · tartozó 112« mozgásvektorokat sója meg, Ezeket, az egyes multimédiás jelekkel együtt az 50 múlt I plexer/demniti plexe r mu jtipléxell,
A továbbiakban a 3a ábra segítségével a 100 kóder lehetséges felépítését es működését mutatjuk be részletesebben. A 10ö kódét több XQ7a-187g képtáraiét foglal magában, és jóllehet pél5 dáokbun bét Ilyen 10? feéptárolőt tüntettünk fel, a 107 képtárolók szama a taláímány értelmében akar kettő vagy azt meghaladó számú is lehet.
A bemutatás során Induljunk ki abból a feltételezésből, hogy a 100 ködet úgy van kialakítva, hogy például ΐ8δΡδδΡΒ8Ρ8δΡδ8Ρ8ΒΡδδ1, stb. formátumú bemenő jelet kódoljon. Az egyszerűség érdekében feltételezzük azt is, hogy a ISO kóder a bemenő jel minden egyes képkockáját kódolja, vagyis egyetlen képkocka sem marad kí a kódolás műveletéből. Ezt a 4, ábrán mutatjuk, be.
Mint mát korábban említettük, a képkockákat valamilyen videó felvevő eszköztől kapjuk, 0,X, 2, 3,4, 5, 6 stb. sorrendben, és ugyanebben a sorrendben jelezzük kí, azaz a dekódolt képkockákat 18, 81» 82, P3,84,85, Pb, stb. sorrendben jelenítjük meg. így tehát a videó blífolyamot az alábbi 18, 23, 81, 82, 86, 84, 85, stb. sörre nd ben tömörít.lük, továbbítjuk és de kódol juk. Ez azért van Így, mert minden egyes 8 képkocka öt megelőző valamint őt kővető referencia képkockákat Igényei, mielőtt kódolhatnánk vagy dekódolhatnánk, vagyis a 81 képkocka kódolásához vagy de kódolásához előbb az 10 és 83 képkockákat kelt kódolnunk vagy dekódolnunk
Amikar fogadjuk az első képkockát,, az összes 107 képtároló üres, és a 102 kapcsolót 1NTBA üzemmódba kapcsoljuk át a 1Θ5 kódolásvezértő kezelő segítségével, úgy, bogy a bemenő' jelet 1NTRA formátumúra kódoljuk, A bemenő jelel ezt követően DCT átalakításnak vetjük alá és kvantáljuk. Ezt rnakrohbkkonkenb alapon bájtjuk végre. Az eredményül kapott, jelet ezután: az Inverz 108 kvantálővai és az inverz 109 OCT átalakítóval dekódoljuk, Mivel a képkocka INTRA kódolású, a 113 kapcsoló nyitott,álfásban van, A110 összegző fokozat kimenetén megjelenő je25 let az első 107a képtárolóba töltjük. Ebhez a 114a kapcsolót zárjuk, miközben a 114b - XX4g kapcsolók nyitott állapotúak, Így a 107a képtároló: az iO referencia képkocka dekódolt változatát. alkalmazza.
A következő kódolandó képkocka a 3 képkocka, amelyet az 18 referencia képkockából előrementesen jelzünk előre. Ebhez, ba a 3 képkockát a löl bemenetre vezetjük, a 102 kapcsoló lót. 1fiTE8 üzemmódra állít jók: át, és a legaktuálisabb referencia képkocka tárolóhoz tartozó kimeneti 115 kapcsolót (például a 115a kapcsolót) zárjuk, és a lű?a képiároió mozgáskompenzált tartalmat kivonjuk a bemenő jelből, ahol: a mozgáskompenzáciős adatokat a szakterületén szokásos módon számoltuk korábban kt Az előrejelzési hibát ezt követően a 103 PCT átalakítóval és a 104 kvantálóval; kódoljuk, majd az Inverz 108 kvantálóval és az inverz 109 DCT átala kítóval dekódoljuk, A 113 kapcsolót zárjuk, a 115a kapcsoló és a 114b kapcsoló Is zárt (míg a többi 114 és 115 kapcsoló nyitott állású j. így a 110 összegző fokozat a dekódolt képkockát hoz5 záadja a 107a; képtároióban tárolt képkockához, és az eredményt a 1Θ7& kégtároíöhan tároljuk
A soron következő kódolandó képkocka a 7 képkocka, amelyet 8 képkockaként kell kódolnunk.
Ehhez mind a 187a képtároló, mind a 107 képtároiő tartalmát hozzáférhetővé tesszük a szokásos módon a 106 kivonó fokozat részére. Mivel a 8 képkockák nem szolgának más képkocka számára referencia képkockaként, a kódolt 8 képkockát nem dekódoljuk és tároljuk valamilyen referencia képkocka tárolóban.
A fent leírt esetheti 19 képkocka után a 187a· - 187g képtároíók az 10, P3, PS, P9, P12, P15, P18 képkockák dekódolt változatait tartalmazzák.
Találmányunk értelmében, ba a 100 ködet egy képkockát predikíív módon, elő re mentesen kó15 dől, a 105 kódolásvezério kezelővel a képkockához egy már említett tartalék referencia képkocka számot jSRPM) társíthatunk. Például egy videojel P képkockáihoz és 8 képkockáihoz társithatuuk SRPN paramétert, de az indikátor képkockáihoz nem, A kódersk ezt az üzenetei felhasználhatják arra, hogy utasítást adjanak a dekóderek részére, hogy mely referencia képkocka vagy képkockák hasonlítanak leginkább az aktuális referencia képkockához,, ügy, hogy ezek kőid zül valamelyiket a dekóder tartalék referencia képkockaként képes hasznosítani, ha az aktuális referencia képkocka valamilyen okból elvesz vagy megsérül a továbbítás során.
Ha a 3 képkockát a 0 képkockához viszonyítva kódoljuk, a 107a - 10?g képtároióban semmilyen más referencia képkocka nincs eltárolva. Ezért a 3 képkockához nem is társítunk SkPN paramétert. Hasonlóképpen, ha az 1 és 2 képkockákat kétírányúan kódoljuk a 8 és 3 képkockákra vo25 natkozóan, akkor a referencia képkockákat tartalmazó 107a - 107g képtárolőkban semmilyen egyéb képkockát, nem társiünk, így a jelzett képkockák egyikével sem társítunk SSPIM paramétert.
Ha azonban a 6 képkockát a 3 képkockából eiőrementesen előre jelezzük (melynek dekódolt változatát a 107 képtároióban taroltuk el)> a 107a képtárolóban az 10 képkocka dekódolt raáso38 tata is megtalálható. A löd káder ilyen esetben; kiszámolja a hasonlóságot az aktuális, soron kővetkező képkockához tartozó alapértelmezett referencia képkocka (azaz a 6 képkockához tartozó 3 képkocka) és más képtároíók, például a 187a képtároló tartalma között. Ha két referencía képkocka kellően hasonló egymáshoz jvagyis a ló7a képtároló és a 107 b képtáraié tartalma közötti egyezés egy előre meghatározott küszöbértéket meghaladj, a 100 kódértéi egy SRPN paramétert társítunk az adatokhoz a S képkockára vonatkozóan, Az SRPN paraméter a 0 képkockát mint egy tartalék referencia képkockát azonosítja. Ha a hasonlóság azonban nem elegendő mérteké., a 6 képkockához nem társítunk SRPIM paramétert. Maga az a a: mód, ahogy a. hasonlóság mértékét kiszámítjuk, nem tárgya találmányunknak, és bármely megfeleld eredményt biztosító hasonlóság meghatározási eljárást alkalmazhatunk. Például az abszolút különbségek összegének módszerét {Sum of Absolute Öifferences, SAO) használhatjuk a hasonlóság mértékeként. Egy Ilyen SAS értéket előnyösen úgy számítunk ki, hogy a soron következő képkockához tartozó alapértelmezett referencia képkockának térben megfelelő képpontjai közötti és más potenciális referencia képkocka, például valamelyik 10? képtáraiéban tárolt képkocka térben megfelelő képpontjai közötti értékkülönbséget vesszők. Minden egyes különbség abszolút értékét: meghatározzuk, majd az abszolút különbségi értékeket összegezzük, hogy megkapjuk az abszolút különbségek összegét. Ily módon az SAD érték jellemző lesz az alapértelmezett referencia képkocka és a másik potenciális referencia képkocka közötti hasonlóság mértékére. Vagyis két képkockát kellően hasonlónak ítélhetünk meg, ha a közöttük lévő abszolút különbségek összege egy meghatározott küszöbérték alatt húzódik. Alternatív módon az alapértelmezett referencia képkocka valamint a soron kővetkező képkockához tartozó más potenciális referencia képkocka közötti hasonlóságot képkocka hisztogramok segítségével is
2ö meghatározhatjuk. Egy képkocka hisztogram egy adott képen belül lévő képpont értekek megjelenési szamának $ mértéke, és két képkockát abban az esetben nyilváníthatunk ki hasonlónak, ha képkocka hisztogramjuk jelentős mértékben megegyezik egymással..
A találmány egy alternatív megvalósítása esetében ahelyett, hogy megvizsgálnánk a hasonlóságot a soron kővetkező képkockához tartozó alapértelmezett referencia képkocka és egy mais sík potenciális referencia képkocka között, a IDD kóderrel megvizsgáljuk a hasonlóságot az egyik 107 képtárolőban rendelkezésre álló másik potenciális referencia képkocka, valamint maga a soron következő képkocka között. Ennél az alternatív kiviteli alaknál egy olyan küszöbértéket állítunk be, amellyel: megadjuk a soron következő képkocka és a potenciális referencia képkocka közötti különbség legnagyobb elfogadható értékét. így minden olyan eltárolt kép30 kockát, amely kielégítően: nagy hasonlóságot mutat fel jkis eltérést mutat félj a soron következő képkockával, felhasználhatunk tartalék referencia képkockaként a soron kővetkező képkockához, Itt ugyancsak használhatjuk az abszolút különbségek összegének a módszerét, a kép hisztogramot, vagy bármilyen más módszert arra, hogy megáilapitsuk a hasonlóság vagy kS· 12 lönbság mérteikét a soron következő képkocka, valamint a másik potenciális referencia képkocka vagy képkockák között
Nyslvánvalóan, ha a IS képkockát kell kódolnunk (P képkockaként)., a 0, 3, 6, 9 és 12 képkockák dekódolt változatait eltároljuk a 114a - 114a képtárolpban. .Alapértelmezett módon a 15 kép5 kockát a 1074 képtárolóhan tarolt 12. képkockához viszonyítva kódoljuk. A 10Ö kőderrei ezen túlmenően kiszámítjuk a 10?e képtáromban tárolt adatok és a többi lö?a ~ löld képtárolóhan tárolt adatok közötti korrelációt. A100 kődet ennek alapján be tudja azonosítani szí a 10? képtárolót (és azzal együtt a referencia képkockát), amely a leginkább egybeesik a 10? képtároiő tartalmával,: vagyis a kódolandó soron következő képkockához tartozó alapértelmezett refe10 rencla képkockával, A 10Ö kóder ezt követően egy SRPM paramétert ad a kódolt adató kb oz, amely jelzi az azonosított referencia képkockát, Ez az SRPI4 paraméter megegyezhet a referencia képkocka időleges referenciájával is, mint azt leírásunk későbbi részében még bemutatjuk.
Egy képkockával egynél több SRPI4 paramétert is társíthatunk. Ilyen esetben az SRPM paramétereket a képkocka élőfejében sorba rendezzük, mégpedig a hasonlóság sorrendjében., ahol a leginkább hasonló referencia képkockát vesszük előre, nem pedig az alapédelmerett referencia képkockát.
A 205 kódolásvezérlő kezelő ezt az SRM paramétert vagy kódszót a 122f kimenetén jeleníti meg, amely a kódolt képkockához társított tartalék referencia képkocka számot jelzi. Ezt egy multiplexer segítségével építjük be a videó bitfolyamba.
2Ö A 4. ábrán a találmány szerinti 100 kóder egy első tehetséges kiviteli alakjának működését vázoljuk, Λ 4, Ábra első sorában a képfelvevő vagy beviteli eszköztől érkező adat képkockák láthatók, amelyek a 102 hemeneten keresztül a videó 2Ö0 káderbe kerülnek. A 4, ábra második sors a bemenő jelnek azokat a képkockáit tünteti fel, amelyeket a 100 kóder kódolni választott ki, és egyben· feltünteti az egyes képkockák kódolására használt kódolási módot is. Mint azt korábban jeleztük, a bemutatott példában a löö köder úgy van kialakítva, hogy minden egyes képkockát kódoljon, és ennek során az BSP kódolási formátumot használja.
A 0 képkockát IfáTRA módon kódoljuk; az 1 képkockát 8 képkockaként kódoljuk, a Ö és/vagy 3 képkockához viszonyítva; a 2 képkockát 8 képkockaként kódoljuk a O és/vagy 3 képkockához viszonyítva; a 3 képkockát P képkockaként kódoljuk a O képkockához viszonyítva; a 4 képkockát
8 képkockaként kódoljuk a 3 és/vagy 6 képkockához képest; az 5 képkockát B képkockaként kódoljuk a 3 és/vagy S képkockához képest; a 6 képkockát P képkockaként kódoljuk a : kockához képest, stb.
·
A 4. ábra harmadik sora a kódolt jel képkockáival társított SRPH mezőt ábrázok A bemutatott kivitek' alak esetében egy SŰPN paramétert s P képkockákkal és S képkockákkal társítunk, a 4, ábra harmadik sorában látható módon. A kődoit képkockák P és 8 képkockáit időlegesen előle jelzett módon kódoljuk, mig azI képkockákat nem.
A 4. ábra negyedik sorában a kódolt, képkocka TR időbeli referenciáját tüntettük fel. Ezt a mezőt a H.2S3 ajánlás tartalmazza, és a TP időbeli referencia értékét az időlegesen megelőző referencia képkocka élőiéiben lévő értékének eggyel plusz az előzőleg továbbított referencia képkocka óta a kihagyott vagy nem referencia képkockák számával történő megnövelése révén alakítjuk ki. így tehát a 4, ábrán bemutatott példában az egyes képkockákhoz tartozó TR időbeli
1Ö referencia megegyezik a löí bemenetre vezetett eredeti jel képkockáinak eredeti időbeli sorrendjével.
Az ábrán feltüntettük az SRPM paraméter lehetséges értékeit is. Ezek az értékek a tartalék referencia képkocka TR időbeli referenciáját jelzik, ahogy azt a 100 kőderrel a fent leírt módon azonosítottuk, jóllehet a példa csupán egyetlen SRPN paramétert mutat miden egyes predíktív módon kódolt képkocka vonatkozásában, miden egyes preöiktív módon kódolt képkockához eggyel több SRPN paramétert is társíthatunk, mint arról korábban már szó esett,
Az 5. ábra a találmány szerinti 100 kóder egy további, második lehetséges kiviteli alakjának a működését mutatja be. Enné! a kiviteli alaknál a .100 kádert úgy alakítottuk ki, hogy a képkockákat szabványos i8BP8ÜP8SPB8IB8P88P szekvenciának megfelelően kódolja. Ennél a kiviteli alaknál azonban csupán elő re mentesen előre jelzett. képkockákkal f vagyis P képkockákkal) társítottunk csupán egyregy SRPbl paramétert.
Az 5, ábra első sora a bemeneti képkockákat mutatja, második sora pedig a kódolt képkockákat, valamint azok kódolási módját mutatják, vagyis 1, P vagy 8 képkockákat,
Az 5, ábra harmadik sora a P képkockákkal társított SRPH paramétereket mutatja. Ezeket ügy állíthatjuk élő, ahogy azt már korábban á 3s ábra kapcsán ismertettük.
Az 5. ábra negyedik sora a kódolt képkocka Tp időbeli referenciáját mutatja. Mint a 4. ábra kapcsán látható volt, a minden egyes képkockához feltűntetett Tű Időbeli referencia megegyezik azzal, mint a 101 bemenetre juttatott eredeti vídeójelben az egyes képkockák megjelenésének a sorrendje.
3Ö Ha kiindulunk egy olyan esetből, amikor az 1 terminál vevő terminálként kódolt videó adatot fogad a 2 termináltól, a 10 videó kodek működését a 10 videó kodek dekódoló feladatára vonatkoztatva mutatjuk be részletesebben. Az 1 terminál az adó 2 íermméiíöi kap egy multimé-14 · dlás jelet Az 50 demoftipiexer demultlplexelí ezt a multimédiás jelet, és a videó adatot továbbítja a 10 videó kodekhez, a wzédő adatot pedig a 40 vezérléskezelőhöz. A10 videó bódék 200 dekődere inverz kvantálással inverz OCT transzformációval és mozgáskompenzálással dekódolja a kódolt videó adatot. A 200 dekóder 124 vezérlője megvizsgálja a kapott adat integritását, és ha ebben a. vonatkozásban hibát észlet megkísérli a hibát eltüntetni egy, az alábbiakban részletesebben is bemutatásra kerüld módon. A dekódolt, kijavított és hibáktól mentesített videó adat ezt kővetően az 1 terminál 7S kijelzőjéhez: kerül, amely azt megjeleníti,
A videó adatban a hibák jelentkezhetnek kép szinten, blökkcsoport szinten vagy makröbiokk szinten, A hibaellenőrzés bármely említett szinten elvégezhető,
1Ö Ha a 4. ábrán bemutatott jelből Indulunk ki, úgy ha a találmány szerinti dekóder fogadja ezt a jelet, akkor a jelben tévő minden egyes képkockát hagyományos módon dekódol, majd a 70 kijelzőn megjelenít. A dekódolt képkocka ugyancsak hagyományos módon hifosjavított vagy hibáéit öntetett képkocka lehet. Minden alkalommal, amikor egy képkocka dekódolása megtörténik, a dekóder megvizsgálja a TR időbeli referencia mezőt, hogy megállapítsa, hogy az adott képkockát meg keli-e jeleníteni.
A 4. ábrán bemutatott esetben a dekóder megkapja a 0 képkockát, és annak képkocka élőfejéből megállapítja, hogy a képkocka 1NTRA kódolásé. A dekóder a 0 képkockát égy dekódolja, hogy ehhez semmilyen más képkockához nem nyúl vissza, és a dekódolt képkockát a 123a képtárolóban tárolja el. A dekóder ezt követően a 3- képkockát fogadja, es annak képkocka élőfejé20 bői megállapítja, hogy a képkocka P képkockaként IN7ER módon lett kódolva. A dekóder ezért a 3 képkockát az azt megelőző referencia Ö képkocka alapján dekódolja, és eltárolja a soron következő 123b képtárolőban, A dekóder ezt követően az 1 es 2 képkockákat dekódolja, a ö és 3- képkockákhoz viszonyítva, és így tovább. Ezeket a képkockákat azonban nem tárolja el a 123 képtárolőban, mivel ezeket mint S képkockákat nem használjuk fel referencia: képkockaként más képkocka k vona t kóró sába n.
Tételezzük fel, hogy a dekóder nem képes dekódolni {és így helyreállítani) a 9 képkockát {ez előfordulhat azért, mert a 9 képkockára vonatkozó adatok nagyrészt megsérültek, vagy egyszerűen elvesztek a jelátvitel során). A dekóder által fogadott következő képkocka a 7 képkocka, TR - 7 időleges referenciával, és SRPH - 0 paraméter értékkel. Mivel a 9 képkockát (vagyis a 7 képkocka vonatkozáséban az egyik alapértelmezett referencia képkockát) a dekóder nem tudta dekódolni, Így a kapott vagy fogadott képkocka élőfejében egy SRPhl paramétert próbál felkutatni, hogy hátramentes előrejelzést hajthasson végre. A 7 képkocka azonban hátrafelé egyáltalán nem tartalmaz SftPál paramétert. Ezért a dekóder nem képes dekódolni a 7 képkockát, és · 15 · ugyanez vonatkozik: a S képkockám Is.
A soron kővetkező fogadott képkocka a 12. képkocka, amelyet a 9 képkocka vonatkozásában kódoltunk,, és SSHH = 8 paraméter értéket tartalmaz. Mivel a 9 képkockát nem dekódoltok, a dekóder az ShPM paraméter által jelzett referencia képkockát használja fel (vagyis a 123c kép5 tárolóban tárolt S képkockát) a 12 képkocka dekódolásához- A. dekóder ezt kővetően fogadja a 10 képkockát, amelyet a 9 és 12 képkockákhoz viszonyítva kódoltunk. A 9 képkockát a dekóder nem dekódolta. A10 képkocka azonban tartalmaz egy S9PN: ~ 6 paraméter értéket, így a dskóder a már dekódolt referencia § képkockát használja fel, amely a 123c kép táró lóban került eltárolásra, arra, hogy a 20 képkockát előre mentesen dekódolja, nem pedig a 7 képkockát, 8z ugyanígy Igaz a 11 képkocka esetében is,
A dekóder egy referencia: képkocka hiányát számos módon észlelheti, például vizsgálhatja azt az Információt, amely az egyes kódolt képkockák időleges sorrendjére vonatkozik. Alternatív módon egy kódolt jel referencia képkockái egy egy meghatározott számú helyet foglalhatnak el szekvenciális sorrendben, ahogy azt a jelen bejelentés napján benyújtott massk hasonló tár15 gyű szabadalmi bejelentésünkben taglaljuk.
Ha a dekóder képes arra, hogy visszacsatolási adatokat küldjön a jeltovábbítást végző videó kóderhez, ügy a: dekóder egy olyan értelmű kérelmet is küldhet a továbbítási végző videó kódernek, hogy az egy képkockát ÍNTHA képkockaként kódoljon, és így megállítsa azt az időbeli hiba továbbterjedést, amely abból fakadna, hogy a 10 és 11 képkockákat a 6 képkockára vo23 natkoztatva kellene dekódolni. A dekóder a jel dekódolását ilyen esetben hagyományos módon tudja folytatni.
Ha a dekóder megkapja a 21 képkockát, amely egy IhiTítA képkocka, akkor a 2.1. képkockát más képkockára történő vonatkoztatás, hivatkozás nélkül dekódolja, és a dekódolt képkockát eltárolja a. 123 képtárolóban:, a dekóder ezt kővetően a 13 és 20 képkockákat a 18 és 21 képkoe25 .Rákra visszahlvatkozva dekódolja- jóllehet bizonyos nagyságú hibát bevezethetünk a 18 kép' kockába azáltal, hogy -a 12 képkockát a 8 képkockához viszonyítva dekódoljuk, nem pedig a 9 képkockához viszonyítva, az eredményül kapott kép elfogadható lesz, és a kljeizett, megjelenített képet sem keli befagyasztani, amíg újra egy INTRA képkockát kapunk. Ez a: néző számára sokkal inkább elfogadható megoldás.
3G Tételezzük fel, hogy az 5, ábrán látható módon egy találmány szerinti dekőderroí egy jelet fogadunk, és az ebben a jelben lévő minden egyes képkockát hagyományos módon dekódolunk, majd jelenítünk meg valamilyen megfelelő kijelzőeszközön. A dekódolt képkockák hlbajavítá lő són és hiba kihagyáson eshetnék át ismert és hagyományos módon, Minden egyes alkalommal amikor egy képkockát dekódolunk, a dekóder megvizsgálja a TR időleges referencia mezőt, hogy megtudja, mikor keli s képkockát megjelenítenie.
A dekóder fogadja -a 0 képkockát, amely egy 1NTRA képkocka, és annak megfelelően dekódolja 5 majd eltárolja a 123a képtarolóhan. Most tételezzük fel, hogy a dekóder nem képes heiyreáiiitani a 3 képkockát (például azért, mert az ehhez tartozó adatok nagymértékben megsérültek vagy az átvitel során elvesztek), így a következő, fogadott és dekódolandó képkocka az 1 képkocka fesz. Az 1 képkocka egy olyan kétirányú képkocka, amelyet a 0 és 3 képkockák alapján kódolta. Mivel a 3 képkocka elveszett, .a dekóder nem képes helyreállítani az 1 képkockát, és tö hasonlóképpen a 2 képkockát sem. Az a tény, hogy a 8 képkocka 1 és 2 képkockák elvesztek, semmilyen következménnyel nem jár a dekóderre nézve, mivel mint tudjuk a S· képkockák nem alkotnak referencia képkockát semmilyen más képkocka számára sem, így ezek elvesztése semmilyen időbeli hibát és hibaterjedést nem idéz elő. A dekóder így a jel dekódolását hagyományos és szokásos módon tudja folytatni.
A deköderrei fogadott és dekódolandó következő képkocka a 6 képkocka, A dekóder tudja, hogy a megelőző P3 referencia képkocka elveszett (mivel nem lehetett dekódolni az I vagy 2 képkockát). A dekóder ezért megvizsgálja a kapott képkocka élőfejét, hogy az tartalmaz-e esetleg SfW paramétert, A dekóder megállapítja, hogy a 6 képkocka éiőfejében 5RPN = 0 paraméter érték található, Így a 0 képkockát használja fel a 123a képtarolóból arra, hogy a 6 képkockát
2Ö dekódolja.
Ha a dekóder alkalmas arra, hogy vezérlő visszacsatolási adatokat küldjön a jeltovábbítást vég ző videó kóder felé, úgy a jeltovábbítást végző videó kódérnek egy olyan értelmű kérelmet küldhet el, hogy az egy soron következő képkockát 1HTRA képkockaként kódokon, hogy ezáltal megakassza azt az időbeli hiba terjedést, amely abból adódnak, hogy a soron következő kép25 kockákat annak a 6 képkockának az alapján kellene dekódolnia, amelyet a 0 képkocka alapján dekódolt, nem pedig a ténylegesen alapértelmezett 3 képkocka alapján. Ennek köszönhetően a dekóder folytatni tudja a dekódolást, és nem kelta kijelzett képkockát kimereviteni, miközben egy IHTRA kódolású képkockára vár.
Arra példát, miképpen lehet a tartalék referencia képkocka számot beilleszteni a kódolt videóiéi szintaxisba, a H.263 videó kódolási szabvány alapján mutatjuk be a továbbiakban.
A &, ábra egy adatfolyamnak a H.263 számú ajánlás szerinti szintaxisát mutatja, A következő bemutatások kivétel nélkül blokkcsoport formátumot irhák le, de szakember számára nyilvám wlőj hogy a .találmány hasonlóan megvalósítható szelet formátum esetén Is.
Mint azt már említettük, az adatfolyam négy réteget foglal magában: a kép réteget, a képszegmens réteget, a makroblokk réteget és a blokk réteget. A kép réteg egy kép fejlécet foglal magában, amelyet s blokkcsoportra vonsfeoző adatok követnek, amelyeket adott esetben bármely opcionális szekvencia-vége köd és kiíöltőbit követhet.
A kiindulási alapként tekinthető R.2S3 számú ajánlás szerinti adatfolyam felépítése a 4. ábrán látható. Az. egyes rövidítések jelentése az alábbi:
PSC A kép kezdd köd a kép kezdetét felöli.
7R Az időbeli referenciát úgy képezzük, hogy az időbeli megelőző referencia kép fejlécben lévő értéket megnöveljük eggyel plusz az előzőleg továbbított referencia óta kihagyott vagy nem referenciaként szolgáló képek számával.
FTYPE Egyebek mellett részleteket tartalmaz a kép kódolás típusáról, például ÍRTRA vagy ífeT£g típusról van-e szó.
PQUART Ez a kódsző azt a kvantálöt jelzi, amelyet a képhez használni kell mindaddig, amíg bármely rákövetkező kvantáló információ fel nem frissíti.
CPM Ez a· kődszó opcionális folyamatos jelenlétő többpontos és videó multiplex üzemmód alkalmazását jelzi.
FSBt A kép aibit-adatfoiyam jelző csak abban az esetben van jelen, ha az előző kódszó be van állítva.
TRS Abban az esetben van jelen, ha a képkocka egy két irányban előre jelzett képkocka (PB képkockaként ;s ismert),
BBQIPAMT Abban az esetben van jelen, ha kétirányú képkockáról van; szó.
PB E.z extra beillesztési információra vonatkozik, és értéke akkor 1, ha a további opcionális PSURR és PB adatmezők jelenlétét jelezzük. A PEl és PSUPP információt együttesen a már említett kiegészítő bővítő információként Ismerjük, amelyet a R.2S3 számú ajánlás L melléklete még tovább definiál, üOSS AZ adott kepre vonatkozó blokkcsoport adata,
E5TF egy kitöltő kőősző, amely még az adafszekvencía vége előtt gondoskodik a bájt-kiigazításról.
EÖS A ké pre vonat kozó adstszekverscia vegét jelző kód sző.
-18PSTUf Egy további kitöltő kódszó, amely lehetővé teszi a bájt-kiigazítást a következő kép start, köd vonatkozásában,
A 6. ábrán bemutatott adatfolyam szerkezet nem tartalmazza az opcionális PkÜSTYPE adatmezőt. PSBI csupán abban az esetben van jelen, ha ezt CPM jelzi. TRg és DBQUART csupán akkor van jelen, ha PT?V£ egy úgynevezett PS képkocka üzemmód használatát jelzi (mindaddig,, míg a PÖUSTW mező jelen van, és DBQUART alkalmazása abban fel van tüntetve). Ezek® kérdések részletesebben megismerhetők a ki,253 .számú ajánlásból.
Leírásunk további részében az egy találmány szerinti kóderrel előállított és kibocsátott adatfolyamokra mutatunk be; néhány lehetséges példát,
A tartalék referencia képkocka szám egy H.263 számó ajánlás szerinti adatfolyamba a következőképpen illeszthető be. A 7, ábra egy olyan adatfolyam felépítését mutatja, amelyet egy kóderrel a találmány szerinti eljárás egy első lehetséges változata szerint állítottunk elő. Mint a
7. ábrán látható, az adatfolyam egy további SRBR kódszót tartalmaz, amely a tartalék referencia; képkocka számot jelenti. Ezt a találmány értelmében egy kóderrel iliesztjük be a bit-áramba.
Alternatívaként az 5RPR kódszót a PSUPP kiegészítő bővítő információba is beépíthetjük (lásd; a d. ábrát és a H.263 számú ajánlás L mellékletét). A kiegészítő Információ jelen lehet a adatfolyamban abban az esetben; is, ha a dekóder nem rendelkezik olyan többlet képességekkel, hogy azt hasznosítsa, vagy hogy egyáltalán megfelelően értelmezze, A kiegészítő információ egyszerű ügyeimen kívül hagyass a dekóőerek számára járható ót, mindaddig, amíg külső eszközök,
20; azaz az adó és a vevő nem igénylik a kért képesség; meglétét és kihasználását.
Ha ;P£l értéke “Γ, úgy 9 bit következik, amelyből 8 bit adatbit ÍPSüPP), valamint egy további PEl bit jelzi, hogy következik-e további 9 bit adat és így tovább, ,A PSUPP adat egy -4- bites függvény típusú FTYPE mutatóból áll, amelyet egy 4 bites 0SI2E paraméter adat. nagyság specifikáció követ, amelyet függvényparaméter adatok DSIZE oktetjeí követnek, és azokat opcionálisan egy másik PTYPE mutató követi, és így tovább. Ennek a P5UPP kódszónak ismert alkalmazása, hogy különböző állapotokat jelezzünk ki vele, mint például egy teljes- kép vagy részleges kép leáilltási vagy leállítás megszüntetési kérelem; jelzése, átméretezéssel vagy anélkül, a vldeójei adatfolyamon belül mégha táró zott képek vagy képszekvenciák kijelölése külső használatra, vagy szmteiitettségl kulcs információ megadása videó összeálíitas30 hoz.
A. találmánynak a; kiegészítő bővítő információ felhasználásával történő megvalósítása céljából egy további FTYPE mutatót definiálunk SRPR paraméterként.
-13A 8. ábrán olyan példa; látható, ahol az SitPM paraméter é kép fejléc S£l blokkjába van beillesztve, Az ΕΊΎΡΕ paramétert 5RPM jelenetazonosítóként definiáltuk, A D5IZE a paraméter nagyságát adja meg, az azt követő oktat pedig maga a paraméter adat,, vagyis az SRPN értéke. Ebből az értékből egy vevő dekóder meg tudja állapítani, hogy van-e olyan tartalék referencia kép5 kocka, amelyet a fő referencia képkocka elveszése vagy megsérülése esetén fel lehet használni.
Alternatív megoldásként az információt a járulékos kiegészítő bővítő információban is elhelyezhetjük, amint azt például P. hüng és S. Wenger; Draft of new Aneex W: Adőítionaf Supplemeotary Enhancement Information Speciffcaííoo” című munkája specifikálja (IW-T Study Group 18, Üuestion 18, Oocument Q15-1-58,1999. Movemberj,
Ebben a szabvány tervezetben az ETVFE 14 paramétert képuzenetkénk’ definiálják. Ha ezt az ETYPE paramétert beállítják, akkor a képüzenet funkció jelzi üzenetadaíoí jelentő egy vagy több oktet jelenlétét Az üzenetadat első oktatja egy üzenet fejléc, amelynek szerkezeti felépítését a 7. ábrán vázoltuk, vagyis tartalmaz töhíT, EBIT és MTYPE blokkokat, A 0SIZE azonos az egy képüzenet fynkdénak megfelelő üzenet, adatokban lévő oktetek számával, beleértve az el15 ső üzenet fejléc oktetet Is,
A CÖHT folytatás mező, ha értéke 1, azt jelzi, hogy a képüzenethez tartozó üzenetadat ugyanannak a logikai üzenetnek a része, mint a kővetkező képüzenet funkcióval társított üzénetadáí. Az EBIT lezáróbit pozíció mező meghatározza azoknak a legkevésbé lényeges biteknek a számát, amelyeket az utolsó üzenet ektetben figyelmen kívül kell hagyni. Ezeknek a mezőknek to20 vábbl tulajdonságai, ismertetése megtalálható a, korábban már hivatkozott W melléklet vázlatában:.
Az MTYPt mező az üzenet típusát jelzi. A W melléklet tervezete különböző üzenettípusokat javasok A találmány szerint egy ilyen típust, például az MTYEE 13-at tartalék referencia képkocka számként definiálunk. Az Μ7ΎΡΕ 13 paraméter értéke az üzenet fejlécet követő okiéiban talál25 ható meg. Az üzenet adátbájt a tartalék referencia képkockák képkocka számait kitüntetett sorrendben tartalmazza, vagyis a leginkább kitüntetett jelenik meg legelőször. A képkocka számok azokra az értékekre vonatkoznak, amelyeket az U melléklet vagy W melléklet W.ó.3,12 szakaszának megfelelően továbbítunk, A W melléklet szerinti üzenet formátumot használhatjuk P, B, PB javított PB valamint EP képkocka típusokhoz. Ha azonban az N mellékletet vagy II mellékletet alkalmazzuk, és ha a képkocka több referencia képkockával van társítva, akkor célszerűen nem használjuk a W melléklet szerinti üzenet formátumot EP képkockák esetében az üzenetet célszerűen kizárólag előrementes előrejelzéshez használjuk, míg a felfelé Irányuló előrejelzést mindig elvégezhetjük az időben megfelelő referencia réteg képkocka alapján. A 8,
- 2ÖPB es javított PB képkocka típusok esetébe;’! az üzenet egy képkockát határoz meg, amelyet előrementes mozgás előrejelzés referenciaként használónk. Ezt az üzenetet nem célszerű hasznaim, ha a képkocka egy 1 vagy E.í képkocka.
Egy olyan példa esetében, amelyben egyetlen tartalék referencia képkockát jelzünk, és az SBPts 5 paraméter 10 bites paraméter, ez az. Szenet egy adatbájtot tartalmaz, azaz ŐSIZE értéke 3,
CONT érteke Ö és E&iT értéke 6. Az eddig leírtak alapján nyilvánvaló, hogy D5I2E, CONT és EBIT paraméterek értékel a jelzett tartalék referencia képkockák számának megfelelően fog változni, valamint attól a pontosságtői jbitszámfólj függően, amellyel a tartalék referencia: képkocka számokat feltüntetjük. Ha egynél több tartalék referencia; képkocka számot jelzünk, ügy elölő nyösen az üzenet adatbájtok a tartalék referencia képkockák számát, vagyis az SRPN paramétert kitünteteti sorrendben tartalmazzák fából a leginkább kitüntetett tartalék referencia képkocka száma található a legelső helyen).
Fenti: íeirásoszkban olyan kódolt videó adatfolyamokra hivatkoztunk, amelyekben két irányban előre jelzett képkockákat |B képkockákat) kódoltak, Mint már korábban jeleztük, a 8 képkockáig kát sohasem használjuk referencia képkockaként. Mivel ezeket a B képkockákat anélkül hanyagolhatjuk, hogy hiányuk károsan befolyásolná az elkövetkezendő képkockák képminőségét, időbeli skálázhatóságot biztosit na k. A skálázhatóság lehetővé teszi, hogy egy tömörített videojel sorozatot egynél több minőségi szinten dekódoljunk. Ez más szavakkal annyit jelent, hogy egy skálázható multimédiás klipet ágy tudunk tömöríteni:, hogy különböző adatsebességű csatornákon keresztül lehet áramoltatni, átküldeni, és ezzel együtt is lehetőség van valósidejű dekódolásokra és lejátszásukra, így a vidaó: adatfolyamot különböző dekőderek különböző módon képesek dekódolni, Például egy dekőder dekódolhatja csupán egy jel 1 képkockáit és b képkockáit, ha ez annak a dekódolásnak a maximális sebessége, amelyet a dekőder biztosítani képes. Ha azonban a dekódernek kellő kapacitása van, dekódolhatja a 8 képkockákat is, és ezzel megnövelheti a megjelenített képkockák számát és a képkocka kijelzési sebességet. Ily módon a megjelenített kép képminősége jelentősen nőhet: egy olyan dekódethez képest, amely csak az I képkockákat és a P képkockákat képes dekódolni.
A skálázható multimédiás jellemző: módon úgy van kialakítva, hogy különböző hierarchikus adatrétegek találhatók, A multimédiás klip alapvető megjelenítését egy alapréteg tartalmazza, míg az egy vagy több bővítési réteg csupán az alatta húzódó részekhez képest finomított adatokat tartalmaz. Ennek megfelelően ezek a bővítési rétegek megnövelik a multimédiás klip minőségét.
-21 A skálázhatóság kívánatos tulajdonság heterogén és hibákkal terheit környezetekben. Ez a tulajdonság célszerű, hogy számot lehessen vetni az olyan korlátozásokkal, mint például a bitsebesség határok, a kijelzési felbontások, a hálózat sebessége, és a dekóder összetettsége.
A skálázhatóságot felhasználhatjuk egy olyan szállító rendszerben a híbatőró'ség javítására, 5 ahol a rétegeit kódolást szállítási sorrendbe állítással kombinálják. A szállítási sorrendbe állítás kifejezés alatt itt különböző megoldásokra gondolunk, amelyek különböző szolgáltatási minőségeket biztosítanak a szállítás vonatkozásában, ide értve ez egyenlőtlen hibavédelmet, vagy különböző, eltérő hibaarányd vagy veszteségarányú csatornák biztosítását, természetüktől függően az adatokat különböző módon rendelhetjük hozz. Például az alapréteget egy igen nagy
IS hibavédelem fokozatú csatornán keresztül tölthetjük fel, mig a bővítési réteget nagyobb feíbahajiamú csatornákon keresztül láthatjuk el.
Általánosságban a skálázható multimédiás kódolás egy rosszabb tömörítési hatásfokkal jelie^ mezbetö, mint a nem skálázható kódolás. Ez más szavakkal annyit jelent, hogy egy skálázható multimédiás klipként kődolt multimédiás klip, amely bővítési rétegeket is tartalmaz, nagyobb sávszélességet igényel, mintha egy nem skálázható, egyrétegű klip volna, amelynek egyetlen, folyamatos minősége van. Azonban ennek a szabálynak vannak kivételei, például a videó tömörítés területén használt, időlegesen: skálázható 8 képkockák.
A találmány egyéb skálázható videó tömörítő rendszerekben is alkalmazható. így például a H.263 számú ajánlás Ö melléklete két további skálázhatósági formát definiál: az egyik a jel/zaj skálázhatóság, a másik a térbeli skálázhatóság.
A terheli skálázhatóság és a jel/zaj skálázhatóság igen közel áll egymáshoz, közöttük az egyedüli különbség a térbeli skálázhatóság által biztosított nagyobb térbeli felbontás. A 10. ábrán jel/zaj skálázható képekre mutattunk példát. A jel/zaj skálázhatóság megában foglalja többse-bességü adatfolyamok létrehozását. Lehetővé teszi a kódolási hibák helyreállítását, vagy egy eredeti kép és az az alapján helyreállított kép közötti különbségeket. Ezt úgy éri el, hogy finomabb kvaotálő fokozatot basznál az egy bővítési rétegben lévő differencia képkocka kódolásához. Ez a járulékos információ a teljes helyreállított képkocka jel/zaj értékét megnöveli.
A térbeli skálázhatóság lehetővé teszi a többszörös felbontású adatfolyamok létrehozásához, hogy különböző kijelző követelményekhez és/vagy megszorításokhoz igazodjunk. Egy térben
3S skálázható szerkezetet a 11. ábrán vázoltunk fel. Ez a szerkezet lényegében ugyanolyan, mint a 10, ábrán bemutatott jej/zaj skálázhatóság, azzal az eltéréssel, hogy egy térbeli bővítési réteg kísérli meg a kódolási veszteséget visszanyerni a helyreállított referencia réteg képkocka min- 22 tavéteiezett változata és az eredeti képkocka nagyobb felbontású változata között. Például, ha a referencia réteg egy negyed közős átmeneti formátumú felbontású (Ö£iF felbontású), és a bővítési réteg közös közbenső formátum jÖFj felbontású, akkor a referencia réteg képkockát úgy kell megfelelő módon skáláznunk, hogy a bővítési réteg képkockát belőle előre meg tudjuk jósolni, A QCIE szabvány lehetővé teszi, hogy a felbontást függőleges irányban legfeljebb kétszeresére növeljük, vagy legfeljebb vízszintes Irányba növeljük, vagy mind vízszintes, mind: peóig függőleges irányban egy egyetlen bővítési réteg eseten. Egymás mellett létezhet több bővítési réteg is, amelyek mindegyike meg tudja növelni a képkocka felbontását az előző réteg által biztosított felbontáshoz képest, A referencia réteg képkocka mintavételezéséhez használt intő ferpoiáiő szűrőket a H,2ú3 számú ajánlás kifejezetten definiálja. Eltekintve a referencia rétegtől a bővítési rétegbe irányuló mintavételezési eljárástól, egy térben skálázott képkocka feldolgozása és szintaxisa azonos egy jel/zaj skálázott képkocka feldolgozásává! és szintaxisával.
Akár a jel/zaj skálázhatóság, akár a térbeli skálázhatóság esetén a bővítési réteg képkockáit Elvagy EP képkockáknak tekintjük. Ha a bővítési réteg képkockát a referencia rétegben lévő kép1S kockából felfelé előre jelezzük, akkor a bővítési réteg képkockáját egy bővítési-! <EQ képkockának nevezzük, ilyen skáiszási típus esetén a referencia réteg az aktuális bővítési réteg alatti” réteget jelenti. Egyes esetekben, ha a referencia réteg képkockái rosszul vagy szegényesen lettek előre jelezve, a bővítési rétegben végbemehet a képkockák statikus részének tüífcódolása, ami feleslegesen nagy bitrátát eredményez. Ennek a problémának az elkerülése érdekében a bővítési rétegben engedélyezett az ólommentes előrejelzés, ilyen esetben egy képkockát az előre Irányban jelezhetünk előre egy megelőző bővítési réteg képkockából, vagy alternatív megoldásként felfelé jósolhatjuk meg egy, egy bővítési P (EPj-képpontnak Is nevezett referencia réteg képkockából. Felhívjuk a figyelmet arra, hogy a felfelé és előremonteseo előre jelzett képkockák átlagának a kiszámítása EP képkockák vonatkozásában kétirányú előrejelzést okoz25 hat. Mind az El képkockák, mind az EP képkockák esetében a referencia réteg képkockából történő felfelé előrejelzés biztosítja, hogy nincs szükség mozgásvektorokra:. Az EP képkockák eiőrementes előrejelzése esetében: azonban a mozgásvektorokra szükség van.
Az SitPIM paraméter mezőt P, PB,, javított PS és bővítési réteg (EP) képkockákkal társifhatjok. A PB és javított PS képkockák jellemzői megtalálhatók a H.263 számú ajánlás 8 és tv! mellékleteiül ben.
Ha azonban az H vagy U mellékletet alkalmazzuk, és a képkocka több referencia képkockával van társítva, nem használjuk az 5RPN paramétert, PS és javított PB képkockák esetében az üzenet jellemző módon csupán a :P részt tartalmazza, EP képkockák esetében az üzenetet az
-23előremenfes előjelzéshez használjuk, ahol a felfelé történő előjelzést az időleges megfelelő referencia réteg képkocka alapjáé hajtjuk végre. Ezt az üzenetet előnyösen nem használjak, ha a képkocka I, El vagy B képkocka.
A találmány érteimében, ha az kóder alkalmas többrétegű kódolásra {például a H.263 számú 5 ajánlás 0 mellékletében taglalt módon), akkor az egyes rétegekhez egymást követő tartalék referencia képkocka számok tartoznak. Ezeket az aktuális képkocka bővítés! réteg számával is társíthatjuk. .A tartalék referencia képkocka számot az ugyanabban a bővítési rétegben lévő, előzőleg kódolt referencia képkocka megfelelő számából kiindulva egyesével növeljük meg. Ha azonban az ugyanazon bővítési rétegben lévő szomszédos képkockák azonos időbeli referenci20 ájúak és ha a R.2S3 számú ajánlás ;R vagy ó melléklete szerint járunk el, akkor a dekóder előnyösen ezt a jelenséget annak a jelzéseként tekinti és kezeli, hogy megközelítőleg azonos képtartalmú jelenetek redundáns másolata! lettek elküldve, és az összes ilyen képkocka; ugyanazon a referencia képkocka sorszámon osztozik.
Megjegyezzük, hogy az egyik találmány szerinti megvalósítás esetében az üzenet ezen túlme15 nőén jelezheti azt a tartalék referencia képkocka számot is, amelyet az aktuális kép meghatározott, kiválasztott négyszögletes területei vonatkozásában kell alkalmazni. Egy képhez több üzenet létezhet, melyek mindegyike meghatározza az alkalmazandó tartalék referencia képkocka számot egy egymást nem átlapoló négyszögletes terület vonatkozásában. Ha az üzenetek nem tartalmaznak Ilyen tartalék referencia képkocka számot a kép bizonyos területei vo20 natkozásában, úgy a dekóder előnyösen bármilyen hlbáeitüntetésl módszert alkalmazhat ezeknek a területeknek a vonatkozásában, ha nem dekódolható az a megfelelő referencia képkocka (vagy a n nak egy területe), ama ívből a hiányzó rész előjelezheío lenne. Előnyös módon a dekóder azt a blbaelfüntetési típust alkalmazza, amely a képíípusboz illik, vagyis egy időbeli predlktív hihaeitüntetesi eljárást egy IblTER képkocka esetén, és egy nem-időbeli prediktiv hl25 baelínntetási eljárást egy képkocka esetén.
Az; alábbiakban egy további, konkrétabb példát mutatunk be olyan esetre, amikor a kapott képkocka különböző területeihez hozunk létre 5RPM paraméter értékeket. Minden egyes tartalék referencia képkocka szám üzenet egy 58RH oktetet és négy PSíW oktetet tartalmaz, amely annak a képen belüli meghatározott négyszögletes tartomány bal felső sarkinak a vízszintes és függő leges pozícióját tartalmazza, amelyre vonatkozóan a tartalék referencia képkocka számot fel kell használni, valamint tartalmazza természetszerűen a négyszögletes tartomány szélességét és magasságát, mindegyik paraméterhez 8-8 bitet felhasználva, és IS képpontos egységekben; kifejezve {a kép iumlnanelajár® vonatkoztatva). Például sgy teljes QCíí- képet {Quarter
-24Comrnon Intermedlate Formai|, amely 176x144 képpontos luminanda képpel rendelkezik, a 0, Ö, 11, 9 paraméterek határoznak meg.
Olyan képformátumok esetében, amelyek szélességi és magassági mérete akkora, hogy nem osztható maradók nélkül iS-tai, a meghatározóit területet kiterjeszthetjük a legközelebbi na5 gyobb terület értékre, amely már osztható 15-íaL Például egy 160x120 képpont mérető teljes képet a 9, 9,19, 8 paraméterek határoznak meg. Előnyösen a meghatározott terület nem keresztezi a kép határokat, és előnyösen nem Is lapol át ugyanabban a képben más meghatározott, hlbaelíüntetett területeket sem.
A tartalék referencia képkocka számotbeépíthetjük más videó kódold protokollokba is. Például :1O az MPEG-4 protokoll úgynevezett felhasználós adatokat: definiál, amelyek bármilyen bináris adatot tartalmazhatnak, és nem kötődnek fehétfenűl a képhez. A járulékos mező például ezekhez a mezőkhöz adható hozzá.
Találmányunk nem korlátozódik a fent tárgyait vagy bemutatott videó kódoló protokollokra, azokat csupán példaképpen, a megoldás jobb megértése érdekében mutattuk be, Talál má15 nysmk bármely, időleges előrejelzést használó videó kódoló protokollal használható. A fent vázolt módon történő információ kiegészítéssel egy vevő dekédet saját maga képes meghatározni, hogy melyik az alkalmazandó, legjobb eredményt biztosító eljárás, ha egy képkocka elveszett.

Claims (15)

1. Eljárás egy kápszekvencíat képviselő kódólt videojel dekódolására.,
- egy aktuális képkocka egy kiválasztott területe vonatkozásába n meghatározzuk, hogy az aktuális képkockához tartozó alapértelmezett referencia képkocka megfelelő területe megsérült
S vagy elveszett-e, ahol az alapértelmezett referencia képkockát az aktuális képkocka meghatározott területére vonatkozó mozgáskompenzált előrebecslés létrehozása során használjuk;
- a kódolt videojelben rendelkezésre bocsátott jelzőt megvizsgáljuk, hogy egy alternatív referencia képkockát azonosítsunk az aktuális képkockához, ahol az alternatív referencia képkocka egy olyan területet tartalmaz, amely kielégítő módon hasonlít az alapértelmezett referencia iö képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez; és
- az aktuális képkocka kiválasztott területe számára létrehozunk egy otozgáskompénzáit előrebecslést az azonosított alternatív referencia képkocka kielégítő módon hasonló területének felhasználásával.
2, Az .1, igénypont szerinti eljárás, ozzsí/e/femazve, hogy
15 — megvizsgáljuk a kódolt videojelben rendelkezésre bocsátott egynél több jelző rangsorrendjét, hogy egynél több olyan alternatív referencia képkockát azonosítsunk, amely olyan területet tartalmaz, amely kielégítő módon hasonlít az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez;
- a rangsorrend alapján kiválasztunk egy indikátort, és
28 ~áz aktuális képkocka kiválasztott területe számára egy mozgáskompenzált előrebecslést állítunk elő a kiválasztott jelző révén azonosított aiternatiy referencia képkocka kielégítő módon hasonló területének a felhasználásával.
3, Az 1. igénypont szerinti eljárás, ozzeí/eítemezve, hogy az Indikátort a kódolt videójei kiegészítő bővítmény információjából kapjuk meg·
25
4, Az 1. igénypont szerinti eljárás, őzzel jellemezve, hogy az indikátort az alternatív referencia képkocka: egy Időbeli referenciájának vagy az alternatív referencia képkocka egy képkocka számának azonosítására használjuk.
5, Az 1. Igénypont szerinti eljárás, ezzel jellemezve, hogy külön-kníon indikátorokat használunk 8 képkockák és ? képkockák számára a megfelelő alternatív referencia képkockák azonosé
-26tásához, vagy kizárólag P képkockák számára a megfelelő alternatív referencia képkockák azonosításához,
S. AZ 1. igénypont szerinti eljárás,, ozzol/e/lemezve, hogy az aktuális képkocka kiválasztott területe az egész aktuális képkocka vagy annak egy része, és az alapértelmezett referencia· kép5 kocka sérült vagy elveszett megfelelő területe pedig az egész alapértelmezett referencia képkocka vagy annak egy vonatkozó része.
7, Dekóder egy képszekvenciát képviselő kódolt videojel dekódolására, ózza/fe/femezve, hogy a dekóder alkalmassá van téve arra, hogy:
— egy aktoáiis képkocka egy kiválasztott területe vonatkozásában meghatározza, hogy az aktualö iis képkockához tartozó alapértelmezett referencia képkocka megfelelő területe megsérült vagy elveszett-e, ahol az alapértelmezett referencia képkocka az aktuális képkocka meghatározod területére vonatkozó mozgáskompenzáit előrebecslés előállítása során kerül felhasználás- a kódolt videojelben rendelkezésre bocsátott jelzőt megvizsgálja egy alternatív referencia IS képkockának az aktuális képkockához történő azonosításához, ahol az alternatív referencia képkocka egy olyan területet tartalmaz, amely kielégítő módon hasonlít az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez; és
-az aktuális képkocka kiválasztott területe számára egy mozgáskompenzáit előrebecslést állítson elő a? azonosított alternatív referencia képkocka kielégítő módon hasonló területének lei20 használásával,
8, Eljárás egy videojel kódoláséra egy képszekvenciát képviselő kódolt videóiéi létrehozásához, amelynek során —egy alapértelmezett referencia képkockát szerzünk meg a képszekvencia egy képkockájának kódolása és dekódolása révén,
25 - egy mozgásfcompénzált előrebecslést állítunk elő a képszekvencia egy aktuális képkockájának egy kiválasztott területe számára ez alapértelmezett referencia képkocka egy' megfelelő területérsek felhasználásával;
- az aktuális képkocka kiválasztott területe számára egy mozgáskompenzált előrebecslés eiőal3ö íitass során történő használat céljára előállítunk egy indikátort, amely agy olyan alternatív referencia képkockát azonosít, amely az alapértelmezett referencia képkocka megfelelő teröle-27téhez vagy az aktuális képkocka kiválasztott területéhez kielégítő módon hasonlító területet tartalmaz, és
- az Indikátort a kódolt videojelben bocsátjuk rendelkezésre,
9. A 8. igénypont szerinti eljárás, ozzof/elemezve, hogy az alternatív referencia képkockái úgy
5 azonosítjuk, hogy az alapértelmezett referencia képkocka megfelelő területét vagy az aktuális képkocka kiválasztott területét összehasonlítjuk egy tóvá hói referencia képkockával, hogy kiszámítsuk a kettő közötti hasonlóság mértékét;
-· a hasonlóság mértékét összevetjük egy előre meghatározott hasonlóság feltételiéi; és ~ az Indikátort az összehasonlíts s alapján hozzuk létre.
10 10. A 9. igénypont szerinti eljárás, oz2»/>/femexve, hogy egynél több olyan alternatív referencia képkockát azonosítunk, amely az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez kielégítő módon hasonló területet tartalmaz, úgy, hogy az alapértelmezett referencia képkocka megfelelő területét vagy az aktuális képkocka kiválasztott területét összehasonlítjuk több további referencia képkockával több ha3. 5 son ló sági mérték kiszá rostásá hoz; és
-egy-egy indikátort hozunk létre minden egyes további referencia képkockához, amely kieiégiii az előre meghatározott hasonlóság feltételt
XX. A 3.8. igénypont szerinti eljárás, ozzof ye/femezve, hogy a további referencia képkockákat rangsoroljuk az említett Össze hasonlítás alapján, és a kódolt videojelben egynél több indikátort
28 bocsátunk rendelkezésre a rangsorrendnek megfelelően, ahol a további referencia képkockával társított indikátor egy olyan területet tartalmaz, amely a leginkább hasonlít az alapértelmezett referencia képkocka megfeleld területéhez vagy az aktuális képkocka kiválasztott területéhez, amely a rangsorrendfeen első helyén áll,
12. A S, Igénypont szerinti eljárás, ozzcd/e/femezve, hogy áz indikátort a ködölt videojel kiegé25 szitő bővítmény Információjában bocsátjuk rendelkezésre.
13. KÖder egy vsdeójel kódolására, egy képszekvenciát képviselő kódolt videojel létrehozásához, ahol a kódé r arra alkalmasan van kialakítva, hogy
- a képszekvencia egy képkockájának kódolása és dekódolása útján megszerezzen egy alapértelmezett referencia képkockát;
- egy mozgáskompenzátt előrebecslést állítson elő a képszekvencia egy aktüális képkockájának egy kiválasztott területére vonatkozóan az alapértelmezett referencia képkocka egy megfelelő területének felhasználásával;
ozzoffefenezve, hogy a káder alkalmassá van téve továbbá arra, hogy
5 ~ egy indikátort állítson elő, amely az aktuális képkocka kiválasztott területe számára egy mozgáskompenzált előrebecslés kialakítása során történő használathoz egy alternatív referencia képkockát azonosít, amely az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez kielégítő mértékben hasonlító területet tartalmaz; és lő - az Indikátort rendelkezésre bocsássa a kódolt vldeójeiben..
14, Kepszekvenelat képviselő kódolt videojel, ozzo//elemezve, hogy egy alternatív referencia képkockát azonosító indikátort tartalmaz, ahol az alternatív referencia képkocka egy olyan területet tartalmaz, amely kielégítő mértékben hasonlít egy alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka egy kiválasztott területéhez, és az alternatív'
IS referencia képkocka az aktuális képkocka kiválasztott területe számára egy alternatív mozgáskompenzált előrebecslés előállítása során kerül felhasználásra,
15, Számítógép program termék egy videojel kódolására, egy képszekvenciát képviselő kódolt videojel létrehozásához, amely adathordozón olyan kódot tartalmaz, amely végrehajtása esetén egy processzort arra késztet, hogy
2Ö - a képszekvenoía egy képkockájának kódolása és dekódolása utján megszerezzen egy alapértelmezett referencia képkockát;
- a képszekvencia egy aktuális képkockájának egy kiválasztott területére vonatkozó mozgáskompenzált előrebecslést állítson elő az alapértelmezett referencia képkocka megfelelő területének a f elhasználásává 1;
25 ozzrd/efenezve, hogy végrehajtása esetén egy processzort arra késztet továbbá, hogy
- egy olyan: Indikátort hozzon létre, amely az aktuális képkocka kiválaszt ott területe számára egy mozgáskompenzált előrebecslés létrehozása során történő használatra egy olyan alternatív referencia képkockát azonosít, amely egy olyan területet tartalmaz, amely kielégítő mértékben hasehlit az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális kép30 kocka kiválasztott területéhez; és az indikátort a kódolt videojelben bocsássa rendelkezésre.
• 29 38. Számítógép program· termék egy képszekvenciat képviselő kódolt videojel dekódolására, őzről Jd/emezve, hogy adathordozón olyan kódot tartalmaz, amely végrehajtása esetén egy processzort arra késztet, hogy
-egy aktuális képkocka egy kiválasztott területe vonatkozásában meghatározza, hogy az aktuá5 lis képkockához tartozó alapértelmezett referencia képkocka egy megfelelő területe sérült vagy elveszett-e, ahol az alapértelmezett referencia képkocka az aktuális képkocka kiválasztott területére vonatkozó mozgáskompeozált előrebecslés létrehozása során kerül felhasználásra;
- a kódolt videójeiben rendelkezésre bocsátott indikátort megvizsgálja az aktuális képkocka számára egy alternatív referencia képkocka azonosítása céljából, ahol az alternatív referencia l'ö képkocka egy olyan területet: tartalmaz, amely kielégítő mértékben hasonlít az alapértelmezett referencia képkocka megfelelő területéhez vagy az aktuális képkocka kiválasztott területéhez; és
- az aktuális képkocka kiválasztott területére vonatkozó mozgáskompeozált előrebecslést hozzon létre az azonosított alternatív referencia képkocka kielégítő mértékben hasonló területé15 nek a felhasználásával.
3,7. A igénypont szerinti dekóder, omrf/effemezve, hogy a 2-6. Igénypontok bármelyike szerinti dekódoló eljárás végrehajtására van kialakítva,
18, A 13. igénypont szerinti kóder, ózza//elemezve., hogy a 9-12. Igénypontok bármelyike szerinti eljárás végrehajtására van kialakítva.
28 3$. A 36. igénypont szerinti számítógép program termék, hogy a 2-6. Igénypontok bármelyike szerinti dekódoló eljárás végrehajtására van kialakítva,
20, A 15. Igénypont szerinti számítógép program kódolásra, ozzo/je/femezve, hogy a 3-12, igénypontok bármelyike szerinti kódoló eljárás végrehajtására van kialakítva.
HU0302055A 2000-05-15 2001-05-14 Eljárás, kóder és dekóder videójel kódolására, dekódolására, továbbá kódolt videójel, valamint számítógép program termék HU230597B1 (hu)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0011606.1 2000-05-15
GB0011606A GB2362532B (en) 2000-05-15 2000-05-15 Video coding
PCT/EP2001/005453 WO2001089223A2 (en) 2000-05-15 2001-05-14 Video coding

Publications (3)

Publication Number Publication Date
HUP0302055A2 HUP0302055A2 (hu) 2003-09-29
HUP0302055A3 HUP0302055A3 (en) 2005-11-28
HU230597B1 true HU230597B1 (hu) 2017-02-28

Family

ID=9891561

Family Applications (1)

Application Number Title Priority Date Filing Date
HU0302055A HU230597B1 (hu) 2000-05-15 2001-05-14 Eljárás, kóder és dekóder videójel kódolására, dekódolására, továbbá kódolt videójel, valamint számítógép program termék

Country Status (16)

Country Link
US (1) US7711052B2 (hu)
EP (2) EP2148513B1 (hu)
JP (1) JP4362259B2 (hu)
KR (2) KR100892119B1 (hu)
CN (2) CN1193622C (hu)
AT (1) ATE522086T1 (hu)
AU (1) AU2001272409A1 (hu)
BR (1) BRPI0110770B1 (hu)
CA (1) CA2409027C (hu)
EE (1) EE05652B1 (hu)
GB (1) GB2362532B (hu)
HK (1) HK1079938A1 (hu)
HU (1) HU230597B1 (hu)
MX (1) MXPA02011201A (hu)
WO (1) WO2001089223A2 (hu)
ZA (1) ZA200208744B (hu)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2428325C (en) 2000-11-29 2011-08-30 Matthew David Walker Transmitting and receiving real-time data
US20030219232A1 (en) * 2001-10-01 2003-11-27 Shu Lin System and method for identifying data on a storage medium
US7610358B2 (en) * 2001-11-26 2009-10-27 Time Warner Cable System and method for effectively presenting multimedia information materials
FR2834852B1 (fr) * 2002-01-16 2004-06-18 Canon Kk Procede et dispositif de segmentation temporelle d'une sequence video
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
EP1670260A3 (en) * 2002-01-23 2010-03-03 Nokia Corporation Grouping of image frames in video coding
JP4150951B2 (ja) * 2002-02-19 2008-09-17 ソニー株式会社 動画配信システム、動画配信装置および方法、並びにプログラム
JP2004088722A (ja) 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
US20060133514A1 (en) * 2002-03-27 2006-06-22 Walker Matthew D Video coding and transmission
EP1359722A1 (en) 2002-03-27 2003-11-05 BRITISH TELECOMMUNICATIONS public limited company Data streaming system and method
EP3324625B1 (en) * 2002-04-19 2019-06-12 Panasonic Intellectual Property Corporation of America Motion vector calculating method
PT3525464T (pt) 2002-04-19 2021-04-06 Panasonic Ip Corp America Método e sistema de codificação e descodificação de imagem
KR20040011903A (ko) * 2002-07-31 2004-02-11 최두현 대본 혹은 영상의 유사성과 사람의 인지 능력을 고려한동영상 파일 인코딩 방법
KR20040035005A (ko) * 2002-10-18 2004-04-29 (주) 임펙링크제너레이션 비디오 압축을 위한 결정선택방법을 이용한모션정보예측보간
AU2003261923C1 (en) 2002-11-20 2009-07-16 Godo Kaisha Ip Bridge 1 Moving image predicting method, moving image encoding method and device, and moving image decoding method and device
GB0306296D0 (en) 2003-03-19 2003-04-23 British Telecomm Data transmission
JP2004350263A (ja) * 2003-04-28 2004-12-09 Canon Inc 画像処理装置及び画像処理方法
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
US9560367B2 (en) * 2004-09-03 2017-01-31 Nokia Technologies Oy Parameter set and picture header in video coding
US20060083298A1 (en) * 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
US7417632B2 (en) * 2004-12-02 2008-08-26 Sap Ag Automatic testing of graphics programs
US9049449B2 (en) * 2005-04-13 2015-06-02 Nokia Corporation Coding of frame number in scalable video coding
US7817180B2 (en) * 2005-04-28 2010-10-19 Apple Inc. Video processing in a multi-participant video conference
KR100878811B1 (ko) * 2005-05-26 2009-01-14 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 이의 장치
EP1793581A1 (en) * 2005-12-05 2007-06-06 Microsoft Corporation Automatic selection of images for transfer depending on connection characteristics
EP1999883A4 (en) 2006-03-14 2013-03-06 Divx Llc FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS
US8253752B2 (en) * 2006-07-20 2012-08-28 Qualcomm Incorporated Method and apparatus for encoder assisted pre-processing
EP4213033A1 (en) 2007-01-05 2023-07-19 DivX, LLC Video distribution system including progressive playback
EP1944978A1 (en) * 2007-01-12 2008-07-16 Koninklijke Philips Electronics N.V. Method and system for encoding a video signal. encoded video signal, method and system for decoding a video signal
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
KR20100106327A (ko) 2007-11-16 2010-10-01 디브이엑스, 인크. 멀티미디어 파일을 위한 계층적 및 감소된 인덱스 구조
US8638844B2 (en) * 2008-07-01 2014-01-28 Mediatek Inc. Method and apparatus for storing decoded moving pictures with a reduced memory requirement
FR2934453B1 (fr) * 2008-07-22 2010-10-15 Canon Kk Procede et dispositif de masquage d'erreurs
KR101631270B1 (ko) * 2009-06-19 2016-06-16 삼성전자주식회사 의사 난수 필터를 이용한 영상 필터링 방법 및 장치
EP2507995A4 (en) 2009-12-04 2014-07-09 Sonic Ip Inc SYSTEMS AND METHODS FOR TRANSPORTING ELEMENTARY BIT TRAIN CRYPTOGRAPHIC MATERIAL
KR101681589B1 (ko) * 2010-07-27 2016-12-01 엘지전자 주식회사 영상 처리 장치 및 그 방법
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US8914534B2 (en) 2011-01-05 2014-12-16 Sonic Ip, Inc. Systems and methods for adaptive bitrate streaming of media stored in matroska container files using hypertext transfer protocol
US8989256B2 (en) * 2011-05-25 2015-03-24 Google Inc. Method and apparatus for using segmentation-based coding of prediction information
US8812662B2 (en) 2011-06-29 2014-08-19 Sonic Ip, Inc. Systems and methods for estimating available bandwidth and performing initial stream selection when streaming content
US9635374B2 (en) * 2011-08-01 2017-04-25 Apple Inc. Systems and methods for coding video data using switchable encoders and decoders
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
KR101928910B1 (ko) 2011-08-30 2018-12-14 쏘닉 아이피, 아이엔씨. 복수의 최대 비트레이트 레벨들을 사용하여 인코딩된 비디오를 인코딩하고 스트리밍하기 위한 시스템들 및 방법들
US8787570B2 (en) 2011-08-31 2014-07-22 Sonic Ip, Inc. Systems and methods for automatically genenrating top level index files
US8799647B2 (en) 2011-08-31 2014-08-05 Sonic Ip, Inc. Systems and methods for application identification
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
JP5698644B2 (ja) * 2011-10-18 2015-04-08 株式会社Nttドコモ 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
US8918908B2 (en) 2012-01-06 2014-12-23 Sonic Ip, Inc. Systems and methods for accessing digital content using electronic tickets and ticket tokens
US20130208992A1 (en) * 2012-02-13 2013-08-15 Shu Lin System and method for difference frame threshold encoding and decoding
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US20130287109A1 (en) * 2012-04-29 2013-10-31 Qualcomm Incorporated Inter-layer prediction through texture segmentation for video coding
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9936267B2 (en) 2012-08-31 2018-04-03 Divx Cf Holdings Llc System and method for decreasing an initial buffering period of an adaptive streaming system
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9380099B2 (en) 2013-05-31 2016-06-28 Sonic Ip, Inc. Synchronizing multiple over the top streaming clients
US9100687B2 (en) 2013-05-31 2015-08-04 Sonic Ip, Inc. Playback synchronization across playback devices
KR101502145B1 (ko) * 2013-06-21 2015-03-12 주식회사 에스원 영상 부호화/복호화 방법 및 장치
US9386067B2 (en) 2013-12-30 2016-07-05 Sonic Ip, Inc. Systems and methods for playing adaptive bitrate streaming content by multicast
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
KR102548789B1 (ko) 2014-08-07 2023-06-29 디빅스, 엘엘씨 독립적으로 인코딩된 타일을 포함한 기본 비트스트림을 보호하는 시스템 및 방법
JP2016092837A (ja) * 2014-10-30 2016-05-23 株式会社東芝 映像圧縮装置、映像再生装置および映像配信システム
KR102012682B1 (ko) 2015-01-06 2019-08-22 디브이엑스, 엘엘씨 디바이스들간에 콘텐트를 인코딩 및 공유하기 위한 시스템들 및 방법들
CN107251008B (zh) 2015-02-27 2020-11-13 帝威视有限公司 在实况视频编码和流传输中进行帧复制和帧扩展的系统和方法
EP3200456A1 (en) * 2016-01-28 2017-08-02 Axis AB Video encoding method and video encoder system for temporal noise reduction
US10075292B2 (en) 2016-03-30 2018-09-11 Divx, Llc Systems and methods for quick start-up of playback
US10129574B2 (en) 2016-05-24 2018-11-13 Divx, Llc Systems and methods for providing variable speeds in a trick-play mode
US10231001B2 (en) 2016-05-24 2019-03-12 Divx, Llc Systems and methods for providing audio content during trick-play playback
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming
ES2971545T3 (es) * 2018-04-03 2024-06-05 Huawei Tech Co Ltd Señalización de formato de archivo de mitigación de errores en una codificación de vídeo dependiente del área de visualización basada en flujos de bits de subimágenes
US11825142B2 (en) 2019-03-21 2023-11-21 Divx, Llc Systems and methods for multimedia swarms

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4972261A (en) * 1987-08-28 1990-11-20 The General Electric Company, P.L.C. Motion compensation image signal encoding system
US5150210A (en) * 1988-12-26 1992-09-22 Canon Kabushiki Kaisha Image signal restoring apparatus
US5455629A (en) * 1991-02-27 1995-10-03 Rca Thomson Licensing Corporation Apparatus for concealing errors in a digital video processing system
US5198901A (en) * 1991-09-23 1993-03-30 Matsushita Electric Corporation Of America Derivation and use of motion vectors in a differential pulse code modulation system
FR2696026B1 (fr) * 1992-09-18 1994-12-30 Sgs Thomson Microelectronics Procédé de masquage d'erreurs de transmission d'image compressée en MPEG.
US5515388A (en) * 1993-03-19 1996-05-07 Sony Corporation Apparatus and method for preventing repetitive random errors in transform coefficients representing a motion picture signal
CA2114052A1 (en) 1993-07-29 1995-01-30 Monica Medina-Puri Method of detecting scene cuts
GB2293293B (en) * 1994-09-15 1998-10-21 Northern Telecom Ltd Interactive video system
JPH08154247A (ja) * 1994-09-29 1996-06-11 Sanyo Electric Co Ltd 圧縮画像データ処理装置及び方法
US5751377A (en) * 1994-11-04 1998-05-12 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and decoding apparatus
DE69619002T2 (de) * 1995-03-10 2002-11-21 Toshiba Kawasaki Kk Bildkodierungs-/-dekodierungsvorrichtung
JP3068002B2 (ja) * 1995-09-18 2000-07-24 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
JP3788823B2 (ja) * 1995-10-27 2006-06-21 株式会社東芝 動画像符号化装置および動画像復号化装置
JP3347954B2 (ja) * 1995-11-02 2002-11-20 三菱電機株式会社 動画像符号化装置及び動画像復号化装置
TW351903B (en) * 1996-07-03 1999-02-01 Matsushita Electric Ind Co Ltd Encoding method, encoding apparatus, decoding and compositing method, decoding and composition appratus, and record medium recorded with the aforesaid methods for multiple images
JPH10191356A (ja) * 1996-12-27 1998-07-21 Oki Electric Ind Co Ltd 画像符号化装置
US5880688A (en) * 1997-04-09 1999-03-09 Hewlett-Packard Company Arithmetic coding context model that adapts to the amount of data
US6438165B2 (en) * 1998-03-09 2002-08-20 Lg Electronics Method and apparatus for advanced encoder system
US6188728B1 (en) * 1998-09-29 2001-02-13 Sarnoff Corporation Block motion video coding and decoding
JP3606306B2 (ja) * 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6700933B1 (en) 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding

Also Published As

Publication number Publication date
US7711052B2 (en) 2010-05-04
CN100394802C (zh) 2008-06-11
BRPI0110770B1 (pt) 2016-03-08
CA2409027C (en) 2011-11-01
HUP0302055A2 (hu) 2003-09-29
WO2001089223A2 (en) 2001-11-22
HUP0302055A3 (en) 2005-11-28
JP4362259B2 (ja) 2009-11-11
CN1193622C (zh) 2005-03-16
CN1440623A (zh) 2003-09-03
KR20080083030A (ko) 2008-09-12
HK1079938A1 (en) 2006-04-13
GB2362532B (en) 2004-05-05
KR100892119B1 (ko) 2009-04-09
GB0011606D0 (en) 2000-07-05
AU2001272409A1 (en) 2001-11-26
ATE522086T1 (de) 2011-09-15
EE05652B1 (et) 2013-04-15
EE200200642A (et) 2004-04-15
BR0110770A (pt) 2003-03-11
US20010040700A1 (en) 2001-11-15
WO2001089223A3 (en) 2002-04-04
GB2362532A (en) 2001-11-21
CA2409027A1 (en) 2001-11-22
JP2003533950A (ja) 2003-11-11
EP2148513B1 (en) 2012-10-31
EP2148513A3 (en) 2010-08-04
EP1287699A2 (en) 2003-03-05
CN1633185A (zh) 2005-06-29
EP2148513A2 (en) 2010-01-27
MXPA02011201A (es) 2003-03-10
KR100929558B1 (ko) 2009-12-03
KR20030005348A (ko) 2003-01-17
ZA200208744B (en) 2004-02-24
EP1287699B1 (en) 2011-08-24

Similar Documents

Publication Publication Date Title
HU230597B1 (hu) Eljárás, kóder és dekóder videójel kódolására, dekódolására, továbbá kódolt videójel, valamint számítógép program termék
US8144764B2 (en) Video coding
US7116714B2 (en) Video coding
JP5007012B2 (ja) ビデオ符号化方法
US7751473B2 (en) Video coding
US8014451B2 (en) Video encoder/decoder with macroblock arrangement of significant item
US6356661B1 (en) Method and device for robust decoding of header information in macroblock-based compressed video data
Jackson Low-bit rate motion JPEG using differential encoding
Schaar et al. MPEG-4 Beyond Conventional Video Coding
Sohel et al. Video coding for mobile communications

Legal Events

Date Code Title Description
GB9A Succession in title

Owner name: NOKIA TECHNOLOGIES OY, FI

Free format text: FORMER OWNER(S): NOKIA CORPORATION, FI