DE112004002564T5 - Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codier-Modus mit fester Referenzvollbildanzahl - Google Patents

Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codier-Modus mit fester Referenzvollbildanzahl Download PDF

Info

Publication number
DE112004002564T5
DE112004002564T5 DE200411002564 DE112004002564T DE112004002564T5 DE 112004002564 T5 DE112004002564 T5 DE 112004002564T5 DE 200411002564 DE200411002564 DE 200411002564 DE 112004002564 T DE112004002564 T DE 112004002564T DE 112004002564 T5 DE112004002564 T5 DE 112004002564T5
Authority
DE
Germany
Prior art keywords
motion vector
picture
image
reference frame
backward
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE200411002564
Other languages
English (en)
Other versions
DE112004002564B4 (de
Inventor
Wen Gao
Xiangyang Ji
Siwei Ma
Debin Zhao
Yan Lu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Publication of DE112004002564T5 publication Critical patent/DE112004002564T5/de
Application granted granted Critical
Publication of DE112004002564B4 publication Critical patent/DE112004002564B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codiermodus mit fester Referenzvollbildanzahl, das die folgenden Schritte aufweist:
(a) Durchführen einer Bewegungsschätzung für jeden Block eines aktuellen B-Bildes und Ermitteln eines Bewegungsvektors MV eines entsprechenden Blocks eines Rückwärts-Referenzvollbildes;
(b) Entscheiden, ob der Bewegungsvektor jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild zeigen kann, falls nicht, dann Fortfahren mit Schritt (c); ansonsten mit Schritt (d);
(c) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines Makroblocks sich durch die folgenden Formeln berechnen lassen:
unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines aktuellen Blocks gelten,
Figure 00000002
wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, und td ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild sind;
(d) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor des Makroblocks sich durch die nachfolgenden Formeln berechnen lassen:
unter der Annahme, dass...

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft ein Verfahren zum Ermitteln eines Referenzblocks bei der Bildcodierung/-decodierung auf dem Gebiet der digitalen Videokompression, und insbesondere ein Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codier-Modus mit fester Referenzvollbildanzahl, das zum Gebiet der Bildkompressionstechnologie gehört.
  • Hintergrund der Erfindung
  • Eine sehr effiziente Videocodierung/-decodierungstechnologie ist entscheiden beim Durchführen der Speicherung und Übertragung von Multimediadaten in hoher Qualität und mit niedrigen Kosten. Die vorliegenden beliebten internationalen Standards zur Bildcodierung basieren auf dieser Codierungstheorie, die ein Codierverfahren anwendet, das Bewegungskorrektur basierend auf Block-Matching, diskreter Kosinustransformation und Quantisierung kombiniert. Typischerweise schlägt das erste gemeinsame Technologiekomitee der Internationalen Standardisierungsorganisation/Internationalen Elektrotechnischen Kommission (ISO/IEC JTC1) MPEG(motion picture experts group)-1, MPEG-2 und MPEG-4 und derartige internationale Standards vor; und die ITU-T (International Telecom Union) schlägt die H.26x-Reihe vor. Diese Videocodierungsstandards sind in den Industrien weit verbreitet.
  • All diese Standards zur Videocodierung wenden eine hybride Videocodierungsstrategie an, die normalerweise vier Hauptmodule wie Prädiktion (Vorhersage), Transformation, Quantisierung, Informationsentropiecodierung etc. umfasst, wobei die Hauptfunktion des Prädiktionsmoduls ist, das aktuell zu codierende Bild durch Verwendung des codierten und rekonstruierten Bildes vorherzusagen, genannt Inter-Prädiktion, oder den aktuellen Bildblock (Makroblock), der zu codieren ist, durch Verwendung des codierten und rekonstruierten Bildblocks (oder Makroblocks) in den Bildern vorherzusagen, genannt Intra-Prädiktion; die Funktion des Transformationsmoduls ist es, den eingegebenen Bildblock in einen anderen Raum zu konvertieren, um so die Energie der eingegebenen Signale bei dem Transformationskoeffizienten niedriger Frequenz zum Absenken der Relativität innerhalb der Elemente des Bildblocks zu konvergieren, und der für die Komprimierung nützlich ist; die Hauptfunktion des Quantisierungsmoduls ist es, die transformierten Koeffizienten zu einer begrenzten Elementanhäufung zuzuordnen, die für die Codierung vorteilhaft ist; und die Hauptfunktion des Informationsentropie-Codierungsmoduls ist es, den quantisierten Transformationskoeffizienten mit variabler Längencodierung gemäß der statistischen Regel darzustellen. Das Videodecodierungssystem weist ähnliche Module auf, hauptsächlich um das decodierte Bild des eingegebenen Codestroms mittels der Prozeduren der Entropiedecodierung, der inversen Quantisierung, der inversen Transformation usw. zu rekonstruieren.
  • Die Hauptfunktion der Prädiktion (Vorhersage) basierend auf der Bewegungskorrektur ist es, Redundanz der zeitlichen Videobildserie zu reduzieren. Die meiste Codiereffizienz kommt von dem Prädiktionsmodul her. Das Verfahren der Videocodierung ist, jedes Vollbild der Videobildserie zu codieren. Das herkömmliche Videocodierungssystem, das jedes Vollbild codiert, basiert auf einem Makroblock als Grundeinheit. Wenn der aktuelle Makroblock codiert wird, ist der Bewegungsvektor damit befasst, den aktuellen Makroblock mit dem Referenzblock zu verbinden. Wenn jedes Vollbild codiert wird, gibt es Situationen, die aufgeteilt werden können in Intra-Codierung (I-Bild), Prädiktionscodierung (P-Bild), bidirektionale Prädiktionscodierung (B-Bild) usw. Im Allgemeinen sind bei der Codierung codierte I-Bilder, P-Bilder und B-Bilder miteinander verschachtelt, z. B. basierend auf einer IBBPBBP-Abfolge.
  • Der Codierungskompressionseffizienz kann mittels B-Bild-Codierung größer als eine 200:1-Bitrate werden. Wenn der Makroblock des B-Bildes codiert wird, sind die vier Modi der direkten, Vorwärts-, Rückwärts- und bidirektionalen Prädiktion beteiligt. Die B-Bild-Technologie erfordert die Verarbeitung der Vorwärts- und Rückwärtsbewegungsschätzung gemeinsam, sodass eine hohe Berechnungskomplexität benötigt wird und die zusätzliche Identifikationsinformation eingeführt werden sollte, um den Vorwärts- und Rückwärtsbewegungsvektor zu unterscheiden.
  • Bei herkömmlichen Videocodierungsstandards (wie z. B. den MPEG-x und H-26x Serien) weist das Referenzvollbild des B-Bildes nur ein Vorwärts-Referenzvollbild und ein Rückwärts-Referenzvollbild auf, wohingegen das P-Bild lediglich ein Vorwärts-Referenzvollbild aufweist. Um in ausreichender Weise die Relativität der Zeitbereiche zwischen den Bildern auszunutzen, wurde erlaubt, dass das P-Bild und das B-Bild mehrere Vorwärts-Referenzvollbilder aufweisen. Der Verbrauch von Raum und Zeit jedoch wird ebenfalls in großem Maße verbessert, damit gibt es ein Ausgleichsmittel, das eine feste Referenzvollbildanzahl verwendet, um einen größeren Raum- und Zeitverbrauch zu begrenzen. In der Tat gilt, dass je größer der Abstand, desto schwächer ist die Relativität zwischen den Bildern im Zeitbereich, sodass eine derartige Begrenzung vernünftig ist.
  • Der direkte Modus ist ein Codier-Modus, der sowohl Vorwärtsprädiktion als auch Rückwärtsprädiktion verarbeitet. Die Vorwärts- und Rückwärtsbewegungsvektoren des B-Bildes werden von dem Bewegungsvektor des Rückwärtsreferenzbildes abgeleitet, und es ist möglicherweise nicht notwendig, die Bewegungsvektorinformationen zu codieren, so dass die Bits, die durch das Codieren der Bewegungsvektorinformation belegt sind, reduziert werden können und auf effiziente Weise die Codiereffizienz verbessern. Deshalb ist der direkte Modus weit verbreitet.
  • Wenn man das P-Bild und das B-Bild unter Verwendung der festen Referenzvollbildanzahl codiert, unter Berücksichtigung, dass die Vorwärts-Referenzvollbildanzahl des P-Bildes größer als die Vorwärts-Referenzvollbildanzahl des B-Bildes ist (das B-Bild muss ein Rückwärts-Referenzvollbild beinhalten, während das P-Bild es nicht umfasst), wird das in dem Problem resultieren, dass der Bewegungsvektor nicht übereinstimmt, d. h. wenn man den Bewegungsvektor für das B-Bild herleitet, werden die Bewegungsvektoren jedes Blocks in dem Rückwärts-Referenzvollbild verwendet. Das Rückwärts-Referenzvollbild ist ein P-Bild, sodass es auftreten kann, dass das Referenzvollbild, auf das der Bewegungsvektor zeigt, jenseits des maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild möglicherweise zeigt. Z. B. ist, wie in 1 dargestellt, wenn die Anzahl der festen Referenzvollbilder 2 ist, das Referenzvollbild, auf das das B-Bild möglicherweise zeigt, seine zwei angrenzenden P-Bilder, wohingegen das Referenzbild des P-Bildes, das da das Rückwärts-Referenzvollbild des B-Bildes zwei P-Bilder vor diesem P-Bild liegt, nämlich P_REF_1 und P_REF_0 ist. Wenn der Bewegungsvektor des P-Bildes auf das vordere P-Bild P_REF_1 zeigt, so liegt ein derartiges P-Bild jenseits des maximalen Vorwärts-Referenzvollbildes, auf das das B-Bild möglicherweise zeigt, und der berechnete Bewegungsvektor, der auf das B-Bild zeigt, kann P_REF_1 nicht erreichen. Dadurch kann das B-Bild den tatsächlichen Referenzblock zum Codieren nicht ermitteln, sodass eine Codierabweichung auftreten kann und in einer beträchtlichen Bildverzerrung resultieren wird.
  • Zusammenfassung der Erfindung
  • Das durch die vorliegende Erfindung gelöste technische Problem konzentriert sich auf: Bereitstellen eines Verfahrens zum Ermitteln eines tatsächlichen Bildreferenzblocks in einem direkten Modus einer festen Referenzvollbildanzahl.
  • Die Lösung der vorliegenden Erfindung umfasst die folgenden Schritte:
    • (a) Durchführen einer Bewegungsschätzung für jeden Block eines aktuellen B-Bildes und Ermitteln eines Bewegungsvektors MV eines entsprechenden Blocks eines Rückwärts-Referenzvollbildes;
    • (b) Entscheiden, ob der Bewegungsvektor jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild möglicherweise zeigen kann, falls nicht, Fortfahren mit Schritt (c); ansonsten mit Schritt (d);
    • (c) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines Makroblocks, die durch die folgenden Formeln berechnet werden können, sind: unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines aktuellen Blocks gelten,
      Figure 00040001
      wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild und td ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild ist;
    • (d) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor des Makroblocks, die durch die folgenden Formeln berechnet werden können, sind: unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rück wärtsbewegungsvektor eines aktuellen Blocks gelten,
      Figure 00050001
      wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, td ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild und tb' ein Abstand im Zeitbereich zwischen dem aktuellen B-Bild und dem Vorwärts-Referenzvollbild ist, auf das das B-Bild möglicherweise zeigt;
    • (e) Zwei Bildblocks, auf die MVB und MVF zeigen, Bildreferenzblöcke sind, die dem Makroblock entsprechen.
  • Die vorliegende Erfindung verwendet den Bewegungsvektor des Vorwärts-Referenzvollbildes, das durch Zeigen auf das B-Bild in derselben Richtung erhalten wurde, um den Bewegungsvektor des zugehörigen Blocks in einem Rückwärts-Referenzvollbild zu ersetzen, und berechnet die Vorwärts- und Rückwärtsbewegungsvektoren des B-Bildes, um das mögliche Problem der nicht übereinstimmenden Bewegungsvektoren in einem Codiermodus mit fester Referenzvollbildanzahl zu lösen und die Codiereffizienz größtmöglich zu gewährleisten.
  • Die durch die vorliegende Erfindung bereitgestellte Lösung wird anhand der nachfolgenden detaillierten Beschreibung von bevorzugten Ausführungsformen der Erfindung unter Bezugnahme auf die Figuren besser verstanden werden.
  • Kurze Beschreibung der Figuren
  • 1 ist eine schematische Darstellung, die das P-Bild darstellt, das auf das Referenzvollbild P_REF_1 zeigt, aus dem Stand der Technik;
  • 2 ist eine schematische Darstellung, die das P-Bild zeigt, das auf das Referenzvollbild P_REF_0 in der Ausführungsform der vorliegenden Erfindung zeigt;
  • 3 ist eine schematische Darstellung, die das P-Bild zeigt, das auf das Referenzvollbild P_REF_1 in der Ausführungsform der vorliegenden Erfindung zeigt.
  • Detaillierte Beschreibung der bevorzugten Ausführungsformen
  • Die Ausführungslehre der vorliegenden Erfindung ist: zunächst Entscheiden, ob das Vorwärts-Referenzvollbild, auf das der Bewegungsvektor zeigt, jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild möglicherweise zeigen kann, wenn es nicht jenseits liegt, dann Berechnen des Vorwärtsbewegungsvektors des B-Bildes unter Verwendung des herkömmlichen Verfahrens und Ermitteln des Vorwärtsbildreferenzblocks; wenn es jenseits liegt, dann das Verwenden des Verfahrens des Minimierens des Bewegungsvektors, so dass der berechnete Vorwärtsbewegungsvektor nicht jenseits der maximalen Reichweite des Vorwärts-Referenzvollbildes liegt, auf das das B-Bild möglicherweise zeigen kann, womit man den tatsächlichen Vorwärtsbildreferenzblock ermitteln kann.
  • Wenn man das Bild am Codier-Ende codiert, weist das Verfahren zum Ermitteln eines Bildreferenzblocks in einem direkten Modus bei einer festen Referenzvollbildanzahl, das durch die vorliegende Erfindung offenbart wird, die folgenden Schritte auf:
    • (a) Durchführen einer Bewegungsschätzung für jeden Block eines aktuellen B-Bildes und Ermitteln eines Bewegungsvektors MV eines entsprechenden Blocks eines Rückwärts-Referenzvollbildes;
    • (b) Entscheiden, ob der Bewegungsvektor jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild möglicherweise zeigen kann, falls nicht, dann Fortfahren mit Schritt (c); ansonsten Fortfahren mit Schritt (d);
    • (c) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines Makroblocks durch die folgenden Formeln berechnet werden können: unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines aktuellen Blocks gelten,
      Figure 00070001
      wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild und tb ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild ist;
    • (d) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor des Makroblocks durch die folgenden Formeln berechnet werden können: unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines aktuellen Blocks gelten,
      Figure 00070002
      wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, td ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild und tb' ein Abstand im Zeitbereich zwischen dem aktuellen B-Bild und dem Vorwärts-Referenzvollbild ist, auf das das B-Bild zeigen kann;
    • (e) wobei zwei Bildblöcke, auf die MVB und MVF zeigen, Bildreferenzblöcke sind, die dem Makroblock entsprechen.
  • Nach dem Ermitteln der Bildreferenzblöcke nimmt man den Durchschnitt der Pixelwerte der beiden Referenzblöcke, ermittelt einen finalen bidirektionalen Prädiktions-Referenzblock, subtrahiert den Makroblock des B-Bildes, das zu codieren ist, von dem bidirektionalen Prädiktions-Referenzblock, um einen Blockrestfehler zu ermitteln, und codiert den Blockrestfehler, um das Codieren des B-Bildes abzuschließen.
  • Die vorliegende Erfindung verwendet das Vorwärts-Referenzvollbild, auf das das B-Bild zeigen kann, um das Vorwärts-Referenzvollbild zu ersetzen, das jenseits der Reichweite liegt, innerhalb derer das B-Bild zeigen kann, um das Problem zu lösen, dass das B-Bild den Bildreferenzblock nicht ermitteln kann, wenn er außerhalb der Reichweite liegt. Obwohl der hier ermittelte Bildreferenzblock nicht der Bildreferenzblock ist, auf den das Rückwärts-P-Bild tatsächlich zeigt, ist, weil jedoch der tatsächliche Bildreferenzblock nicht ermittelt werden kann, der durch das Verfahren der vorliegenden Erfindung ermittelte Bildreferenzblock der Referenzblock, der in der gleichen Richtung wie der Bildreferenzblock liegt, auf den das P-Bild tatsächlich zeigt. Beide liegen aufgrund der Relativität des Zeitbereichs sehr nahe beieinander, sodass durch die Verwendung des Verfahrens die Codiereffizienz nicht schlechter werden wird. Wenn ein fester Bildblock verwendet wird (wie z. B. die Verwendung eines einfarbigen Bildblocks), wird der Codiereffekt nicht gewährleistet; wenn andere Verfahren verwendet werden, um den Bildblock zu ermitteln, dann kann die Relativität des Zeitbereichs des Bildes nicht verwendet werden und der Codiereffekt ebenfalls nicht vorhergesagt werden.
  • Um zu gewährleisten, dass die Relativität des Zeitbereichs zwischen den Bildern in größtem Maße verwendet wird, wird tb' in Schritt (d) das Vorwärts-Referenzvollbild des Referenzvollbildes, auf das das nächste P-Bild zeigt, auf das das B-Bild zeigen kann, d. h., wenn das B-Bild das Referenzvollbild, auf das das P-Bild zeigt, nicht erreichen kann, das nächste Vorwärts-Referenzvollbild auf das das B-Bild zeigen kann, für das B-Bild eingesetzt.
  • Aus der obigen Formel ist ersichtlich, dass die vorliegende Erfindung die Bewegungsvektoren in derselben Richtung auswählt, deren Länge auf die Reichweite minimiert wird, auf die das B-Bild zeigen kann. Dieses Verfahren verwendet die Relativität des Zeitbereichs am Besten. Wenn das nächste Vorwärts-Referenzvollbild, auf das das B-Bild zeigen kann, anstelle des Referenzvollbildes eingesetzt wird, auf das das P-Bild zeigen kann, wird die Relativität des Zeitbereichs größtmöglich ausgenutzt. Es gibt viele Verfahren, um einen Bewegungsvektor MV eines zugehörigen Blocks eines Rückwärts-Referenzvollbildes in dem Schritt (a) in der vorliegenden Erfindung zu ermitteln. Da das Rückwärts-Referenzvollbild ein P-Bild ist, weist jeder Makroblock im P-Bild einen Bewegungsvektor MV auf, das Entscheidende an Schritt (a) ist die Übereinstimmung zwischen den Makroblöcken, d. h. welcher Makroblock in dem P-Bild mit einem Makroblock in dem B-Bild übereinstimmt. Nachdem der entsprechende Makroblock gefunden wurde, dient der Bewegungsvektor MV des Makroblocks im P-Bild als Basis für die Berechnung der Vorwärts- und Rückwärtsbewe gungsvektoren des B-Bildes.
  • Im Allgemeinen wird das Übereinstimmungsverfahren der gleichen Positionen verwendet, um zu bestimmen, dass das B-Bild und das Rückwärts-Referenzvollbild der entsprechende Makroblock des P-Bildes ist, d. h. der Makroblock in dem Rückwärtsreferenz-P-Bild mit derselben Position wie der Makroblock in dem B-Bild ist der entsprechende Block. Unterschiedliche Algorithmen können jedoch unterschiedliche Übereinstimmungsverfahren aufweisen, durch ein beliebiges Übereinstimmungsverfahren kann jedoch der Bewegungsvektor jenseits der Reichweite liegen, auf die das B-Bild zeigen kann.
  • Das durch die vorliegende Erfindung offenbarte Verfahren ist bei einer beliebigen Codierung eines Prädiktionsmodus anwendbar. Jeder Makroblock in dem aktuellen B-Bild weist viele Prädiktionsmodi wie z. B. Vorwärts- und Rückwärtsmodi usw. auf. Die technische Lösung der vorliegenden Erfindung wird insbesondere beschrieben, indem man den universellen Direktcodiermodus als ein Beispiel im Nachfolgenden nimmt, bei dem die Anzahl der festen Referenzvollbilder 2 ist.
  • Zuerst wird der Bewegungsvektor jedes Blocks des Rückwärts-Referenzvollbildes relativ zu dem Vorwärts-Referenzvollbild für das zu codierende B-Bild ermittelt. Da der Bewegungsvektor vom P-Bild ist, kann der Bewegungsvektor zu dem Referenzvollbild P_REF_0 (siehe 2) oder das Referenzvollbild P_REF_1 (siehe 3) zeigen.
  • Der Vektor MV (x, y) zum Herleiten des Bewegungsvektors des aktuellen Blocks des B-Bildes im direkten Modus wird mittels des erhaltenen Bewegungsvektors jedes Blocks des Rückwärts-Referenzvollbildes ermittelt, und der Bewegungsvektor kann von einem Block des Rückwärtsreferenzbildes kommen, das dieselbe räumliche Anordnung wie der aktuelle Block aufweist, wie in 1 dargestellt, sie zeigt die Partition im direkten Modus des aktuellen Blocks und die daneben angeordnete Partition, die dem räumlichen Ort entspricht.
  • Zweifellos können andere Verfahren den Bewegungsvektor herleiten. In 1 bezeichnet 1 den aktuellen Codierblock, 2 bezeichnet den entsprechenden Block mit derselben Position wie das P-Bild und die Bezugszeichen in den anderen Figuren haben dieselbe Bedeutung.
  • Wenn es auf das Referenzvollbild P_REF_0, wie in 2 dargestellt, zeigt, liegt das Referenzvollbild nicht jenseits der Reichweite des Vorwärts-Referenzvollbildes, auf das das B- Bild zeigen kann, der Vorwärts- und Rückwärtsbewegungsvektor des aktuellen Blocks kann gemäß des Bewegungsvektors des entsprechenden Rückwärtsblocks ermittelt werden:
    Figure 00100001
  • MVF und MVB sind der Vorwärtsbewegungsvektor und der Rückwärtsbewegungsvektor, die dem aktuellen Block entsprechen. Hier ist tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, td ist ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild, und MV bezeichnet den Bewegungsvektor des entsprechenden Anteils des Rückwärtsreferenzbild relativ zu dem Vorwärts-Referenzvollbild.
  • Wenn es auf das Referenzvollbild P_REF_1 zeigt, wie in 3 dargestellt, liegt das Referenzvollbild jenseits der Reichweite des Vorwärts-Referenzvollbildes, auf das das B-Bild zeigen kann. Für den Bildmakroblock des Referenzvollbildes kann das B-Bild nichts ermitteln. Deshalb ist es notwendig, den Bildblock von P_REF_0 für den Bildblock von P_REF_1 zu ersetzen, sodass der Vorwärts- und Rückwärtsbewegungsvektor des aktuellen Blocks gemäß dem Bewegungsvektor des entsprechenden Rückwärtsblocks ermittelt werden können:
    Figure 00100002
  • Hier ist tb' ein Abstand im Zeitbereich zwischen dem aktuellen B-Bild und dem Vorwärts-Referenzvollbild P_REF_0, und MVF und MVB sind der Vorwärtsbewegungsvektor und der Rückwärtsbewegungsvektor, die dem aktuellen Block entsprechen. Hier ist tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, td ist ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild, und MV bezeichnet den Bewegungsvektor des entsprechenden Anteils des Rückwärtsreferenzbildes relativ zu dem Vorwärts-Referenzvollbild.
  • Die beiden Bildblöcke, auf die MVB und MVF zeigen, sind die Bildreferenzblöcke, die dem Makroblock entsprechen. Nach dem Ermitteln des Bildreferenzblocks, bilde man den Durchschnitt der Pixelwerte der beiden Referenzblöcke, um einen finalen bidirektionalen Prädiktions-Refernzblock zu erhalten, man subtrahiere den Makroblock des zu codierenden B-Bildes von dem bidirektionalen Prädiktions-Referenzblock, um einen Blockrestfehler zu erhalten, und codiere den Blockrestfehler, um das Codieren des B-Bildes abzuschließen.
  • Die Decodierprozedur ist das inverse Verfahren des Codierens, das Verfahren ist wie folgt:
    Zunächst Bestimmen des Prädiktionsmodus des aktuellen Blocks, wenn es sich um einen direkten Modus handelt, dann fährt man mit den folgenden Schritten fort; wenn es ein anderer Prädiktionsmodus ist, dann fährt man mit dem entsprechenden Verfahren fort;
    Ermitteln des Bewegungsvektors MV zum Herleiten des Rückwärts-Referenzvollbildes aus dem Codierstrom; wenn das Referenzvollbild, das dem Bewegungsvektor MV entspricht, nicht jenseits des maximalen Vorwärtsreferenzblocks liegt, auf den das B-Bild zeigen kann, dann lassen sich die Vorwärts- und Rückwärtsbewegungsvektoren aus den folgenden Formeln ermitteln:
    Figure 00110001
  • MVF und MVB sind der Vorwärtsbewegungsvektor und der Rückwärtsbewegungsvektor, die dem aktuellen Block entsprechen. Hier ist tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, td ist ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild, und MV bezeichnet den Bewegungsvektor des entsprechenden Anteils des Rückwärtsreferenzbildes relativ zu dem Vorwärts-Referenzvollbild.
  • Falls das Referenzvollbild, das dem Bewegungsvektor MV entspricht, jenseits des maximalen Vorwärtsreferenzblocks liegt, auf das das B-Bild zeigen kann, dann können die Vorwärts- und Rückwärtsbewegungsvektoren aus den folgenden Formeln ermittelt werden:
    Figure 00120001
  • Hier ist tb' ein Abstand im Zeitbereich zwischen dem aktuellen B-Bild und dem Vorwärts-Referenzvollbild P_REF_0, ein endgültiger bidirektionaler Prädiktions-Referenzblock kann durch Bilden des Durchschnitts der Pixelwerte ermittelt werden, die der Prädiktion entsprechen, auf die MVB und MVF zeigen, und ein aktueller Bildblock wird durch Addieren des bidirektionalen Prädiktions-Referenzblocks und des entsprechenden Blockrestfehlers gebildet, um das gesamte Decodierverfahren abzuschließen.
  • Es versteht sich, dass die obigen Ausführungsformen lediglich verwendet werden, um zu erläutern, jedoch nicht, um die vorliegende Erfindung einzuschränken. Trotz der detaillierten Beschreibung der vorliegenden Erfindung unter Bezugnahem auf die obigen bevorzugten Ausführungsformen versteht es sich, dass verschiedene Modifikationen, Veränderungen oder äquivalente Ersetzungen durch den einschlägigen Fachmann durchgeführt werden können, ohne vom Wesen und Umfang der vorliegenden Erfindung abzuweichen, und dass sie von den Ansprüchen der vorliegenden Erfindung abgedeckt sind.
  • Zusammenfassung
  • Die vorliegende Erfindung offenbart ein Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codiermodus mit fester Referenzvollbildanzahl, das die folgenden Schritte aufweist: Durchführen einer Bewegungsschätzung für jeden Block eines aktuellen B-Bildes und Ermitteln eines Bewegungsvektors MV eines entsprechenden Blocks eines Rückwärts-Referenzvollbildes; Entscheiden, ob der Bewegungsvektor jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild zeigen kann, falls nicht, dann Berechnen der Vorwärts- und Rückwärtsbewegungsvektoren auf einem normalen Weg; falls ja, dann Verwenden des Bewegungsvektors des Vorwärts-Referenzvollbildes, das das B-Bild in derselben Richtung erreichen kann, um den Bewegungsvektor des entsprechenden Blocks in der Rückwärtsreferenz zu ersetzen, und Berechnen der Vorwärts- und Rückwärtsbewegungsvektoren des B-Bildes; schließlich gelten zwei Bildblöcke, auf die die letztlich ermittelten Vorwärts- und Rückwärtsbewegungsvektoren zeigen, als die Bildreferenzblöcke, die dem Makroblock entsprechen. Die vorliegende Erfindung löst das möglicherweise aufgetretene Problem von nicht übereinstimmenden Bewegungsvektoren, und kann die Codiereffizienz in größtem Maße gewährleisten.

Claims (3)

  1. Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codiermodus mit fester Referenzvollbildanzahl, das die folgenden Schritte aufweist: (a) Durchführen einer Bewegungsschätzung für jeden Block eines aktuellen B-Bildes und Ermitteln eines Bewegungsvektors MV eines entsprechenden Blocks eines Rückwärts-Referenzvollbildes; (b) Entscheiden, ob der Bewegungsvektor jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild zeigen kann, falls nicht, dann Fortfahren mit Schritt (c); ansonsten mit Schritt (d); (c) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines Makroblocks sich durch die folgenden Formeln berechnen lassen: unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines aktuellen Blocks gelten,
    Figure 00140001
    wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, und td ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild sind; (d) wobei ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor des Makroblocks sich durch die nachfolgenden Formeln berechnen lassen: unter der Annahme, dass MVF und MVB als ein Vorwärtsbewegungsvektor und ein Rückwärtsbewegungsvektor eines aktuellen Blocks gelten,
    Figure 00150001
    wobei hier tb ein Abstand im Zeitbereich zwischen einem aktuellen Bild und einem Vorwärtsreferenzbild, td ein Abstand im Zeitbereich zwischen einem Vorwärtsreferenzbild und einem Rückwärtsreferenzbild, und tb' ein Abstand im Zeitbereich zwischen dem aktuellen B-Bild und dem Vorwärts-Referenzvollbild ist, auf das das B-Bild zeigen kann; (e) wobei zwei Bildblöcke, auf die MVB und MVF zeigen, die Bildreferenzblöcke sind, die dem Makroblock entsprechen.
  2. Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codiermodus mit fester Referenzvollbildanzahl nach Anspruch 1, wobei das Ermitteln eines Bewegungsvektors MV eines entsprechenden Blocks eines Rückwärts-Referenzvollbilds in dem Schritt (a) umfasst: Auswählen eines Makroblocks mit derselben Position wie ein zu codierender Makroblock in dem B-Bild, um einen entsprechenden Makroblock aus einem Rückwärtsreferenz-P-Bild zu bilden, und Ermitteln eines Bewegungsvektors des Makroblocks in dem P-Bild.
  3. Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codiermodus mit fester Referenzvollbildanzahl nach Anspruch 1, wobei das Entscheiden, ob der Bewegungsvektor des entsprechenden Blocks in dem Rückwärts-Referenzvollbild jenseits eines maximalen Vorwärts-Referenzvollbildes liegt, auf das das B-Bild zeigen kann, in Schritt (b) umfasst: Vergleichen, ob ein Zeitbereich, der das maximale Vorwärts-Referenzvollbild, auf das das B-Bild zeigen kann, ermittelt, größer oder gleich einem Zeitbereich eines Vorwärts-Referenzvollbildes ist, auf das der Bewegungsvektor des entsprechenden Blocks in dem Rückwärts-Referenzvollbild zeigt, falls ja, dann ist es nicht jenseits des maximalen Vorwärts-Referenzvollbildes, auf das das B-Bild zeigen kann; an sonsten ist es jenseits davon.
DE200411002564 2003-12-31 2004-07-19 Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codier-Modus mit fester Referenzvollbildanzahl Active DE112004002564B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNB200310116089XA CN1321534C (zh) 2003-12-31 2003-12-31 固定参考帧数编码方式下获取图像参考块的方法
CN200310116089.X 2003-12-31
PCT/CN2004/000827 WO2005067299A1 (en) 2003-12-31 2004-07-19 Method for obtaining image reference block in a code mode of fixed reference frame number

Publications (2)

Publication Number Publication Date
DE112004002564T5 true DE112004002564T5 (de) 2008-03-06
DE112004002564B4 DE112004002564B4 (de) 2012-11-08

Family

ID=34304833

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200411002564 Active DE112004002564B4 (de) 2003-12-31 2004-07-19 Verfahren zum Ermitteln eines Bildreferenzblocks in einem Codier-Modus mit fester Referenzvollbildanzahl

Country Status (5)

Country Link
US (1) US8116375B2 (de)
JP (1) JP4642033B2 (de)
CN (1) CN1321534C (de)
DE (1) DE112004002564B4 (de)
WO (1) WO2005067299A1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101119493B (zh) * 2007-08-30 2010-12-01 威盛电子股份有限公司 区块式数字编码图像的译码方法及装置
US9402550B2 (en) 2011-04-29 2016-08-02 Cybertronics, Inc. Dynamic heart rate threshold for neurological event detection
CN104427345B (zh) * 2013-09-11 2019-01-08 华为技术有限公司 运动矢量的获取方法、获取装置、视频编解码器及其方法
WO2021211966A1 (en) * 2020-04-18 2021-10-21 Alibaba Group Holding Limited Convolutional-neutral-network based filter for video coding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10336665A (ja) * 1997-05-28 1998-12-18 Nec Eng Ltd 双方向予測ベクトル検出回路
EP1092321A1 (de) * 1999-04-30 2001-04-18 Koninklijke Philips Electronics N.V. Videokodierungsverfahren mit auswahl des kodiermodus zur b-bild kodierung
CN1182726C (zh) * 1999-10-29 2004-12-29 皇家菲利浦电子有限公司 视频编码方法
JP3674535B2 (ja) * 2001-05-08 2005-07-20 日本電気株式会社 動画像符号化方法および装置
CN100505878C (zh) * 2001-11-06 2009-06-24 松下电器产业株式会社 运动画面编码方法及运动画面解码方法
US20050117645A1 (en) * 2002-01-24 2005-06-02 Jim Lin Coding video pictures in a pb frames mode
KR100508798B1 (ko) * 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
JP2004007563A (ja) * 2002-04-19 2004-01-08 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
EP1411729B1 (de) * 2002-04-19 2016-03-23 Panasonic Intellectual Property Corporation of America Bewegungsvektorkalkulationsverfahren
EP1418762A1 (de) * 2002-05-22 2004-05-12 Matsushita Electric Industrial Co., Ltd. Kodierungsverfahren für bewegliche bilder, dekodierungsverfahren für bewegliche bilder und datenaufzeichnungsmedium
EP2227018A1 (de) * 2002-07-02 2010-09-08 Panasonic Corporation Verfahren zur Berechnung von Bewegungsvektoren und Bildcodierungsverfahren
JP2004088737A (ja) * 2002-07-02 2004-03-18 Matsushita Electric Ind Co Ltd 画像符号化方法および画像復号化方法
JP2004040512A (ja) * 2002-07-03 2004-02-05 Matsushita Electric Ind Co Ltd 画像符号化方法および画像復号方法
KR100506864B1 (ko) * 2002-10-04 2005-08-05 엘지전자 주식회사 모션벡터 결정방법

Also Published As

Publication number Publication date
CN1535025A (zh) 2004-10-06
JP2007517438A (ja) 2007-06-28
US8116375B2 (en) 2012-02-14
DE112004002564B4 (de) 2012-11-08
US20070116123A1 (en) 2007-05-24
CN1321534C (zh) 2007-06-13
JP4642033B2 (ja) 2011-03-02
WO2005067299A1 (en) 2005-07-21

Similar Documents

Publication Publication Date Title
DE69817460T2 (de) Bildsequenzdekodierungsverfahren
DE69839100T2 (de) Verbesserte Videokodierung unter Verwendung von adaptiven Blockparametern für kodierte/unkodierte Blöcke
DE102010046508B4 (de) Verfahren und Vorrichtung, um einen Suchbereich für die Bewegungsabschätzung adaptiv auszuwählen
DE69632232T2 (de) Verfahren und Vorrichtung zur Komprimierung von Videoinformationen mit bewegungsabhängiger Prädiktion
CA3011301C (en) Adaptive filtering based upon boundary strength
DE60027955T2 (de) Verfahren und Vorrichtung zur kontextbasierten Inter/Intra Kodierungsmodeauswahl
DE69433272T2 (de) Vorrichtung zum Vermeiden von Rundungsfehlern bei der inversen Transformation von Transformationskoeffizienten eines Bewegtbildsignales
CN112369030A (zh) 视频编码系统中用于解码目前编码单元的继承运动信息
DE69735756T2 (de) Dynamische steuerung der kodierrate in einem blockbasierten videokodierungssystem
DE19825042A1 (de) Verfahren zur Bewegungsvektorcodierung bei MPEG-4
DE19734882A1 (de) Verfahren zum Kodieren von Bewegungsvektoren bei Filmaufnahmen
WO2008084996A1 (en) Method and apparatus for deblocking-filtering video data
DE602005005321T2 (de) Verfahren und vorrichtung zur codierung einer bildsequenz unter verwendung von vorhergesagten und nicht vorhergesagten bildern, die jeweils mehrere makroblöcke enthalten
Liu et al. Simple method to segment motion field for video coding
DE69834901T2 (de) Bewegungskompensierte prädiktive bildcodierung und -decodierung
DE102006043707A1 (de) Verfahren zur Datenkompression in einer Videosequenz
EP1134981A1 (de) Automatische Bestimmung der optimalen Suchfenstergrösse für Bewegungsschätzung
DE102011008630A1 (de) Techniken zur Bewegungsseinschätzung
JP2011229145A (ja) 符号化ユニットにおける動画符号化においてハイブリッド多仮説予測を行う方法、および関連装置
DE60213039T2 (de) MPEG4-Videokodierung mit "skipped macroblock" Mode
EP0956539B1 (de) Verfahren und anordnung zur codierung und decodierung eines digitalisierten bildes
DE10343220B3 (de) Verfahren und Vorrichtung zur Transcodierung eines Datenstroms, der ein oder mehrere codierte digitalisierte Bilder umfasst
DE69835431T2 (de) Bildkodier-und-dekodierverfahren und-vorrichtung
EP1081959B1 (de) Verfahren zum Erkennen von Zeilensprung oder progressiver Abtastung des Inhalt einer Videosequenz
EP1941744B1 (de) Verfahren und vorrichtungen zur bestimmung und rekonstruktion eines prädizierten bildbereichs

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final

Effective date: 20130209