DE60022018T2 - Verfahren und vorichtung zur bewegungsvektorfeldkodierung - Google Patents

Verfahren und vorichtung zur bewegungsvektorfeldkodierung Download PDF

Info

Publication number
DE60022018T2
DE60022018T2 DE60022018T DE60022018T DE60022018T2 DE 60022018 T2 DE60022018 T2 DE 60022018T2 DE 60022018 T DE60022018 T DE 60022018T DE 60022018 T DE60022018 T DE 60022018T DE 60022018 T2 DE60022018 T2 DE 60022018T2
Authority
DE
Germany
Prior art keywords
motion
motion vector
field
vector
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60022018T
Other languages
English (en)
Other versions
DE60022018D1 (de
Inventor
Miroslaw Guildford BOBER
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE60022018D1 publication Critical patent/DE60022018D1/de
Application granted granted Critical
Publication of DE60022018T2 publication Critical patent/DE60022018T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Kodierung von Bewegungsvektorfeldern für Abfolgen von digitalisierten Bildern.
  • Das Prinzip der Bewegungskompensation für die Komprimierung von digitalisierten Filmbildern ist gut bekannt. In der Mehrheit der bekannten Lösungswege, darunter MPEG-1, MPEG-2 und H263 wird die Bewegungskompensation durch Verwenden von quadratischen oder rechteckigen Pixelblöcken durchgeführt und jedem Block wird ein Bewegungsvektor zugewiesen. Zum Beispiel ist es bekannt, einen Block von Pixeln, zum Beispiel einen 16 × 16-Block, mit Blöcken in einem vorhergehenden Bezugsbild, üblicherweise innerhalb eines begrenzten Bereichs des Bezugsbildes zu vergleichen. Der Block im Bezugsbild, welcher ziemlich ähnlich dem vorliegenden, unter Betrachtung stehenden Block ist, wird unter Verwendung eines Algorithmus wie dem kleinsten quadratischen Fehler gefunden und ein entsprechender Bewegungsvektor dem vorliegenden Block beigefügt. Daher werden 16 × 16 Blöcke in einem vorliegenden Bild mit einem jeweiligen Bewegungsvektor in Verbindung gebracht, wie in 1 dargestellt. Die Bewegungsvektoren werden nachfolgend auf entweder Full-Pel oder Sub-Pel-Genauigkeit (üblicherweise Half-Pel oder Quarter-Pel) quantiziert und das Ergebnis wird üblicherweise unterschiedlich kodiert.
  • Zuweisen eines einzelnen Bewegungsvektors für einen Pixelblock in einem Bild in bekannter Weise, was oben zusammengefasst ist, ist nützlich zum Darstellen von Verschiebungsbewegung. Jedoch gibt es eine Anzahl von Nachteilen in einem Lösungsweg, der auf blockbasierender Bewegungskompensation der oben besprochenen Art beruht, welcher deutlich die Leistung in Vorhersagealgorithmen beschränken kann. Zum Beispiel arbeitet so ein Lösungsweg nicht gut für Bereiche, welche Bewegung wie eine Rotation oder eine Maßstabsveränderung umfassen, welche komplexer ist als einfache Verschiebungsbewegung. Auch arbeitet die blockbasierende Vorhersage schlecht bei nicht starrer Bewegung wie jene, welche zum Beispiel durch Wolken oder Menschen gezeigt wird. Des Weiteren setzt der blockbasierende Lösungsweg Bewegungsgrenzen entlang der Blöcke und kann nicht genau Bewegungsgrenzen innerhalb der Blöcke wiederspiegeln. Des Weiteren können rekonstruierte Bilder "blockige" Kunstgebilde darstellen, insbesondere in Situationen, wo eine Bewegungsgrenze über einen Block verläuft.
  • Um solche Probleme zu erleichtern, haben manche Systeme veränderliche, blockgroße Bewegungskompensation mit parametrischen Bewegungsmodellen (darunter quasi-affine und affine Bewegungsmodelle zusätzlich zu einem Verschiebungsmodell) eingesetzt. In jenen Systemen hängt die Größe des Blocks, welcher für die Bewegungskompensation und das Bewegungsmodell verwendet wird, davon ab, wie viele sich bewegende Objekte in einem Bereich vorhanden sind, und hängt davon ab, wie komplex das Bewegungsfeld ist. Solch ein Lösungsweg bietet einige Verbesserungen gegenüber dem Lösungsweg, welcher Blöcke einer feststehenden Größe verwendet, wobei aber der Verbesserung Grenzen gesetzt sind.
  • Aspekte der Erfindung sind in den begleitenden Ansprüchen dargelegt.
  • Im Kontext dieser Beschreibung bedeutet der Begriff dicht in Bezug auf ein Bewegungsvektorfeld, dass es für einen Pixelblock der Größe 8 × 8 Pixel wenigstens zwei Bewegungsvektoren gibt. Zum Beispiel kann ein Bewegungsvektor jedem 4 × 4 Pixelblock oder jedem 2 × 2 Pixelblock zugewiesen sein. Vorzugsweise wird jedem Pixel ein Bewegungsvektor zugewiesen.
  • Als ein Ergebnis der Erfindung kann eine wirkungsvolle Darstellung des Bewegungsfelds zum Kodieren erzielt werden.
  • Ein rekonstruiertes Bild mit verbesserter visueller Qualität kann als ein Ergebnis der Bewegungskomposition mit besserer Vorhersage und der Tatsache, dass die Anzahl der Kunstgebilde verringert werden kann, erzielt werden. Insbesondere blockige Kunstgebilde können verringert oder zu Gänze ausgeschlossen werden. Auch bietet sich der Lösungsweg von selbst für eine skalierbare Darstellung des Bewegungsfeldes mit erhöhter Robustheit für Übertragungsfehler an, was unten genauer besprochen wird.
  • Gemäß einer Ausführungsform wird eine Mehrzahl von Versionen eines Bewegungsvektorfeldes mit unterschiedlichen Auflösungen erzeugt und kodiert.
  • Als ein Ergebnis können eine skalierbare Darstellung des Bewegungsfeldes und ein eingebetteter Bitstrom erzeugt werden. Daher kann eine grobe Version des Bewegungsvektorfeldes leicht durch Dekodieren eines Teils des Bitstromes rekonstruiert werden. Dies weist mehrere Vorteile auf. Zum Beispiel kann, wenn ein Teil des Bitstroms in der Übertragung schlecht übermittelt wird, immer noch eine Version des Bewegungsfeldes mit geringer Auflösung erstellt und zur Bewegungskompensation verwendet werden. Alternativ können einige Anwendungen nur eine grobe Version des Feldes erfordern und daher können Verarbeitungsleistung und Speichererfordernisse durch Rekonstruieren des groben Bildes direkt von einem verkürzten Bitstrom eingespart werden, als wenn eine volle Version rekonstruiert und dann geringer abgetastet wird, um eine grobe Version zu erzielen. Solch ein Lösungsweg kann zum Beispiel bei Videomobiltelefonen nützlich sein.
  • Gemäß einer Ausführungsform wird ein Bewegungsvektorfeld vorverarbeitet, um die Entropie zu verringern, ohne den Vorhersagefehler deutlich zu verringern. Dies kann durch Durchschnittsbildung der benachbarten Bewegungsvektoren getan werden, möglichst mit anderen Einschränkungen, welche die Wirkungen begrenzen, die solches Durchschnittsbilden auf die Qualität der Bewegungsvorhersage und auf den Schutz vor Bewegungsunstetigkeiten aufweisen kann.
  • Eine weitere Ausführungsform schließt das Identifizieren, wo Bewegungsunstetigkeiten im Bild auftreten, und das Glätten des Bewegungsvektorfeldes unter Miteinbeziehung, wo Bewegungsunstetigkeiten im Bild auftreten, mit ein.
  • Als ein Ergebnis kann eine genauere Wiedergabe des Bewegungsvektorfeldes erzielt werden.
  • Diese und andere Aspekte der Erfindung sind in den angeschlossenen Ansprüchen dargelegt.
  • Ausführungsformen der Erfindung werden nun mit Bezugnahme auf die begleitenden Zeichnungen beschrieben, wobei:
  • 1 eine Darstellung eines Bewegungsvektorfeldes gemäß dem Stand der Technik ist;
  • 2 ein Blockdiagramm eines Kodierers gemäß einer Ausführungsform der Erfindung ist;
  • 3 eine Darstellung eines Bildbereichs ist, welcher Unstetigkeitskennungen zeigt;
  • 4 ein Blockdiagramm eines Bauteils des Kodierers ist, gezeigt in 2;
  • 5 eine Darstellung einer Bitstromausgabe aus dem Kodierer ist, gezeigt in 2;
  • 6 ein Blockdiagramm eines Dekodierers gemäß einer Ausführungsform der Erfindung ist; und
  • 7 ein Blockdiagramm eines hybriden DCT/MC-Codec gemäß einer Ausführungsform der Erfindung ist.
  • 2 ist ein Blockdiagramm eines Multiauflösungsbewegungsvektorfeld(MMVF)-Kodierers gemäß einer Ausführungsform der Erfindung. Der MMVF-Kodierer, wie in 2 gezeigt, umfasst ein Bewegungsabschätzer(ME)-Modul 210 zum Erzeugen eines Bewegungsvektorfelds und eine Bewegungsunstetigkeitsabbildung für ein Bild in einer Abfolge von Bildern, welche in das Modul eingegeben werden. Die Ausgabe des Bewegungsabschätzer-Moduls ist verbunden mit der Eingabe eines Entropieverringerungsmoduls 220, welches zum Verarbeiten des Bewegungsvektorfelds unter Verwendung der Bewegungsunstetigkeitsabbildung vorhanden ist, um ein entropiebegrenztes Bewegungsvektorfeld mit Unstetigkeiten zu erzeugen. Die Ausgabe des Entropieverringerungsmoduls 220 ist mit der Eingabe eines Multiauflösungsvektorquantisierungsbewegungsfeld- und Unstetigkeitenkodiermoduls 230 verbunden, welches zum Erzeugen einer multiauflösungsvektorquantisierten (MMVF) Darstellung des Bewegungsvektorfelds vorhanden ist.
  • Der Betrieb des MMVF-Kodierers wird nun genauer im Folgenden beschrieben.
  • Das Bewegungsabschätzermodul 210 arbeitet mit einer Abfolge von Eingabebildkadern, um dichte Bewegungsvektorfelder zu erzeugen, jedes mit einer beigefügten Bewegungsunstetigkeitsabbildung.
  • Ein Bewegungsvektorfeld für einen Bildkader wird unter Verwendung von Bewegungsabschätzung, die auf dem Bildkader und einem Bezugskader beruht, abgeleitet. In dieser Ausführungsform wird die Abschätzung unter Verwendung des Bezugskaders durchgeführt, welcher von der kodierten Version des Originals des Bezugskaders und des nachfolgenden Originalkaders rekonstruiert wurde. Als eine Alternative könnte zum Beispiel die Bewegungsabschätzung unter Verwendung eines Originalbezugskaders und des Originalnachfolgekaders durchgeführt werden.
  • Die Bewegungsabschätzung wird unter Verwendung einer Variante einer bekannten Blockabgleichungstechnik durchgeführt. Ein Block von 16 × 16 Pixel im Bildkader wird mit Blöcken im Bezugskader verglichen. Wenn das ähnlichste Ebenbild gefunden wurde, wird ein entsprechender Bewegungsvektor einem Bezugspixel zugewiesen, welches in dieser Ausführungsform das oberste linke Pixel der vier Zentrumspixel ist. In anderen Ausführungsformen kann das Bezugspixel jedes Pixel in einem m × n-Block sein, aber es ist vorzugsweise nahe oder im Zentrum des Blocks. Diese Schritte werden für überlappende 16 × 16 Blöcke im Bildkader wiederholt, um einen Bewegungsvektor für jedes Pixel im Bild und folglich ein Bewegungsvektorfeld für das ganze Bild zu erzielen. Obwohl das Bewegungsvektorfeld, welches auf diese Weise erzeugt wird, noch eine blockartige Struktur aufweisen kann, wird ein genaues, dichtes Bewegungsvektorfeld im Entropieverringerungsmodul 220 zurückgewonnen. Andere Verfahren zum Erlangen eines Bewegungsvektors für ein Pixel, wie Pel-rekursive Techniken oder auf Gradienten basierende Verfahren, können verwendet werden, wie in "Digital Pictures – Representation, Compression and Standards" von A. Netravali und B.G. Haskell, Plenum Publishing 1995 beschrieben.
  • Das Bewegungsabschätzermodul 210 erzeugt auch eine Bewegungsunstetigkeitsabbildung, welche Bewegungsunstetigkeiten im Bildkader wiederspiegelt. Allgemein sind Bewegungsunstetigkeiten zwischen Pixeln angeordnet und so weist jedes Pixel vier Unstetigkeitskennungen 611, 612, 613, 614 auf, welche ihm beigefügt sind, eine für oben, unten, rechts und links, wie in 3 gezeigt. Jede Unstetigkeitskennung wird von zwei benachbarten Pixeln geteilt. Zum Beispiel stellt die rechte Unstetigkeitskennung 612 für Pixel 600 die linke Unstetigkeitskennung 612 für das Pixel 602 dar, welches sich benachbart dem Pixel 600 auf der rechten Seite befindet.
  • Bewegungsunstetigkeiten im Bild werden durch Verwenden einer geeigneten Technik identifiziert, wie die Technik, welche in der Arbeit "Robust Motion Analysis" durch M. Bober und J. Kittler, CVPR, 1994, pp 947–952, beschrieben ist. Kurz gesagt, statistische Analyse wird eingesetzt, um die Verbreitung der Restfehler in einem Block in Bezug auf den ähnlichsten Ebenbildblock im vorherigen Kader abzuschätzen. Pixel, welche einen Restfehler außerhalb eines annehmbaren Bereichs aufweisen, werden so behandelt, als gehörten sie einem zu jenen im Rest des Blocks unterschiedlichen Bewegungsbereich an. Die Grenzen zwischen unterschiedlichen Bewegungsbereichen sind die Bewegungsunstetigkeiten.
  • Das Bewegungsvektorfeld und die Bewegungsunstetigkeitsabbildung, welche durch das Bewegungsabschätzermodul 210 abgeleitet werden, werden dem Entropieverringerungsmodul 220 eingegeben. Das Entropieverringerungsmodul 220 verarbeitet das Bewegungsvektorfeld, welches im Bewegungsabschätzermodul 210 abgeschätzt wird, wobei die Bewegungsunstetigkeitskennzeichen mit in Betracht gezogen werden, um die Bewegungsgrenzen zu erhalten, um eine entropiebeschränktes Bewegungsvektorfeld zu erzeugen. Das Verfahren basiert auf einer Pel-rekursiven Technik und wird genauer unten beschrieben.
  • Das Verarbeiten für ein einzelnes Pixel im Bild wird nun für ein einzelnes Pixel mit Bezugnahme auf 3 beschrieben. Das zentrale Pixel 600 und seine vier Nachbarn: oben, links, rechts und unten 601, 602, 603, 604 werden betrachtet. Außerdem werden die vier Bewegungsunstetigkeitskennzeichen 611, 612, 613, 614 für das zentrale Pixel 600 betrachtet. Jedes Pixel weist einen Bewegungsvektor auf, der ihm beigefügt ist, das heißt, Pixel 600 besitzt einen Bewegungsvektor V600 und so weiter. Nach dem Verarbeiten wird ein neuer Wert des Bewegungsvektors V600 für das zentrale Pixel berechnet.
  • Das Verarbeiten in dieser Ausführungsform basiert auf dem Heranziehen eines gewichteten Durchschnitts des Bewegungsvektors des zentralen Pixels 600 und der Bewegungsvektoren jener benachbarten Pixel 601, 602, 603, 604, welche nicht vom zentralen Pixel durch ein aktives Unstetigkeitskennzeichen getrennt sind. Genauer gesagt, V600x(i + 1) = [(k·V600x(i)) + V601x(i) + V602x (i) + V603x(i) + V604x(i)]/(k + 4)und V600y(i + 1) = [(k·V600y(i)) + V601y(i) + V602y(i) + V603y(i) + V604y(i)]/(k + 4)wobei V60nx(i) und V60ny(i) die Bewegungsvektorkomponenten sind, welche dem Pixel 60n in der i-ten Iteration zugewiesen sind, und k eine Konstante größer als oder gleich null ist.
  • Wenn eines oder mehrere der benachbarten Pixel vom zentralen Pixel durch eine aktive Bewegungsgrenze getrennt ist/sind, wird es/werden sie in der Berechnung mit dementsprechender Anpassung des Nenners ausgelassen. Zum Beispiel wird unter der Annahme, dass das Bewegungsunstetigkeitskennzeichen 611 aktiv ist, V600x(i + 1) so berechnet: V600x(i + 1) = [(k·V600x(i)) + V602x(i) + V603x(i) + V604x(i)]/(k + 3)
  • In einer alternativen Ausführungsform basiert das Verarbeiten wieder auf einem Durchschnitt, aber der Vorhersagefehler wird ebenfalls miteinbezogen.
  • Genauer gesagt, V600x(i + 1) = [(V601x(i) + V602x(i) + V603x(i) + V604x(i))/4] – PE/((m + V 2I)·VxI) V600y(i + 1) = [(V601y(i) + V602y(i) + V603y(i) + V604y(i)/4] – PE/((m + V 2I)·VyI)
  • Hier ist PE der Vorhersagefehler, das ist der Unterschied in Luminanz-Werten zwischen dem Pixel 600 und dem Pixel im Bezugskader nach dem Versatz unter Verwendung des Bewegungsvektors, welcher in der Iteration i berechnet wurde, das ist V600(i), wo V600(i) = (V600x(i), V600y(i)). VxI und VyI sind die Komponenten des Bildintensitätsgradienten für Pixel 600. Der Bildgradient in dieser Ausführungsform wird auf der Grundlage der Luminanz-Werte des zentralen Pixels und eines benachbarten Pixels berechnet. Insbesondere gilt: VxI = I602 – I600 und VyI = I601 – I600, wo I60n den Luminanz-Wert des Pixels 60n darstellt. Der Bildgradient kann auf andere Arten unter Verwendung benachbarter Pixel berechnet werden. Zum Beispiel VxI und VyI können als
  • Figure 00090001
  • Es gilt: V 2I = (VxI)2 + (VyI)2, und m ist eine Konstante größer 0. In dieser alternativen Ausführungsform gilt: m = 100. Wiederum, wenn eines der benachbarten Pixel durch eine aktive Bewegungsgrenze getrennt ist, wird es von der Berechnung ausgeschlossen. Daher gilt dann unter der Annahme, dass das Bewegungsunstetigkeitskennzeichen 611 aktiv ist, V600x(i + 1) = [(V602x(i) + V603x(i) + V604x(i))/3] – PE/((m + V 2I)·VxI)
  • In jedem der alternativen Verarbeitungsverfahren, die oben beschrieben sind, wird das Verarbeiten für alle Pixel im Bild durchgeführt und eine Anzahl von Iterationen oder Durchläufe wird ausgeführt. Die Ordnung, in welcher die Pixel in einem einzelnen Durchgang verarbeitet werden, beeinflusst die Ergebnisse nur unwesentlich. In diesen Ausführungsformen werden 5–10 Iterationen durchgeführt, obwohl die optimale Anzahl der Iterationen in anderen Ausführungsformen vom Typ des Bewegungsabschätzers, der eingesetzt wird, abhängt.
  • Als ein Ergebnis der Verarbeitung, wie oben beschrieben, wird eine geglättete, entropiebeschränkte Version des Bewegungsvektorfeldes erzielt, wobei die Bewegungsunstetigkeiten bewahrt bleiben. Durch Miteinbeziehen der Bewegungsunstetigkeitskennzeichen und des Vorhersagefehlers im zweiten Verarbeitungsverfahren, oben beschrieben, wird das Glätten nur in den Bereichen durchgeführt, wo es nicht den Wirkungsgrad der Bewegungskompensationsvorhersage verringert. Eine Beispieldarstellung eines Bereichs eines Bewegungsvektorfeldes mit Bewegungsunstetigkeiten als Ausgabe durch das Entropieverringerungsmodul 200 wird, gekennzeichnet als 225, in 2 gezeigt, wo die Kreise Pixel darstellen, die Pfeile Bewegungsvektoren darstellen und die Linie zwischen den Pixeln eine Bewegungsunstetigkeit darstellt.
  • Das entropiebeschränkte Bewegungsvektorfeld mit Bewegungsunstetigkeiten, erzeugt durch das Entropieverringerungsmodul 220, ist die Eingabe für das Multiauflösungsbewegungsvektorfeldquantisations(MMVFQ)- und Unstetigkeitenkodiermodul 230.
  • 4 zeigt das MMVFQ- und Unstetigkeitenkodiermodul detaillierter.
  • Mit Bezugnahme auf 4 ist das Bewegungsvektorfeld, welches vom Entropieverringerungsmodul 220 erzielt wird, die Eingabe in ein Bewegungsfeldpyramidenmodul 310, welches einen Satz von n + 1 Bewegungsfeldern erzeugt, welche Versionen des Originalbewegungsvektorfeldes mit abnehmenden räumlichen Auflösungen sind. Die n + 1 Bewegungsfelder weisen die Bildauflösungen s0 bis sn auf, wo das Bewegungsfeld mit der Originalbildauflösung die Auflösung sn und das gröbste Auflösungsbewegungsfeld eine Auflösung s0 aufweist. Ein Bewegungsfeld der Auflösung sm wird durch Tiefpassfilterung und geringerer Abtastrate der Bewegung höherer Auflösung der Auflösung s(m + 1) erzielt. Dieser Vorgang wird n Male ausgeführt, beginnend vom Originalbewegungsfeld, um die n + 1 Felder zu erzeugen, was eine Pyramide von Bewegungsvektorfeldern genannt wird.
  • Gemäß dieser Ausführungsform ist der geringere Abtastungsfaktor k 2, und der Tiefpassfiltervorgang mittelt die vx und vy Werte innerhalb eines 2 × 2 Blocks. Die Durchschnittswerte vx_aver und vy_aver werden dann hergenommen, um die Bewegung des Blocks bei gröberer Auflösung darzustellen. Jedoch können verschiedene geringere Abtastfaktoren k (k > 1) und verschiedene Tiefpassfilter verwendet werden.
  • Die Pyramide der Bewegungsfelder wird dann verarbeitet. Das Bewegungsfeld bei Auflösung s0 wird durch einen Vektorquantisation(VQ)-Kodierer 330a kodiert, welcher ein Kodebuch c0 verwendet. Die Ausgabe vom VQ-Kodierer 330a geht an ein Modul 380a zum Entropiekodieren, um eine Darstellung des Bewegungsfeldes auf der gröbsten Auflösung s0 auszubilden, und an einen VQ-Dekodierer 360a. Der VQ-Dekodierer 360a verwendet das Kodebuch c0, um das grobe Bewegungsfeld zu rekonstruieren, welches dann an ein höheres Abtastmodul 340a weitergegeben wird, wo die Auflösung des Bewegungsfeldes um einen Faktor k erhöht wird. Ein Differentialmodul 350a berechnet den Unterschied zwischen dem Bewegungsfeld bei Auflösung s1 und dem höher abgetasteten wiederhergestellten Bewegungsfeld, welches vom Feld der Auflösung s0 erhalten wird. Das so erzielte Restfehlerbewegungsfeld bei Auflösung s1 ist die Ausgabe vom Differentialmodul 350a, um durch den VQ-Kodierer 330b unter Verwendung des Kodebuches c1 verarbeitet zu werden. Die oben beschriebenen Schritte werden rekursiv bei zunehmenden Auflösungen wiederholt, bis die Bewegungsfelder bei allen Auflösungen bis zur Originalauflösung verarbeitet worden sind und n + 1 Komponentendarstellungen des Originalbewegungsvektorfeldes erzielt sind.
  • Die Vektorquantisation, die oben erwähnt ist, wird für jedes der Bewegungsvektorfelder in den Kodiermodulen 330a330n durchgeführt. Die Vektorquantisation verläuft analog zu jener, welche in "Scalable image encoding using Gaussian pyramid vector quantization with resolution-independent block size" von L. Cieplinski und M. Bober, Proceedings IEEE International Conference on Acoustics, Speech and Signal Processing 1997, Band 4, pp 2949–2952, beschrieben ist, wo die Vektorquantisation in Bezug auf die Luminanzwerte eines Standbildes beschrieben ist.
  • Die Vektoren, auf welche die Vektorquantisation auf jeder Auflösung angewendet wird, können auf eine der folgenden Arten gebildet werden:
    • 1) Durch unabhängiges Gruppieren von o (o > 1) Komponentengeschwindigkeiten von nicht überlappenden Bereichen in den Geschwindigkeitskomponentenfeldern vx und vy. Die Bereiche weisen identische Gestalt auf und bedecken gemeinsam das gesamte Geschwindigkeitsfeld. Für jeden Bereich werden zwei o-dimensionale Vektoren gebildet VQx = (vx1, ...vxi, ...vxo), VQy = (vy1, ...vyi, ...vyo), wobei vxi, vyi die x und y Geschwindigkeitskomponenten des Pixels i innerhalb des Blocks sind.
    • In diesem Beispiel weisen VQx und VQy dieselben Abmessungen auf, aber sie können auch unterschiedliche Abmessungen aufweisen.
    • 2) Durch Durchführen einer Transformation auf dem Vektorfeld V vor dem Ausbilden der Vektoren wie oben. Der Zweck der Transformation besteht darin, um die Komponentenfelder statistisch unabhängig zu machen oder um ihre Korrelation zu verringern, um die Kodierleistung zu verbessern. Zum Beispiel kann jeder Vektor v = (vx, vy) an jedem Pixelort im Bild in log-polare Darstellung vp = (vpr, vpa) umgewandelt werden, wobei die Komponenten vpa, vpr so definiert sind: vpr = Quadratwurzel (vx·vx + vy·vy) vpa = arkus tangens (vy/vx), if vx ≠ 0. Π/2, if vx = 0 und vy > 0 –Π/2, if vx = 0 und vy < 0.
    • Für jeden Bereich werden zwei o-dimensionale Vektoren gebildet VQr = (vpr1, ...vpj, ...vpro), VQa = (vpa1, ...vpaj, ...vpao), wobei vprj, vpaj aus der Transformation erhalten werden, die oben umrissen ist.
    • 3) Die Komponentenvektoren VQx, VQy, wie in 2) definiert, können zusammengruppiert werden, um den Vektor VQ = (VQx, VQy) oder VQ = (VQr, VQa) zu bilden, und VQ kann quantisiert werden. Natürlich weist der VQ-Vektor, der auf diese Weise gebildet wird, die Dimension 2o auf.
    • In dieser Ausführungsform wird das Verfahren aus 2) oben mit rechteckigen Blöcken aus 2 × 2 Pixeln angewendet, so dass VQ auf 4-dimensionalen Vektoren durchgeführt wird.
  • Durch Verwenden von Vektoren, welche Komponenten von Bewegungsvektoren von mehr als einem Pixel oder Block aufweisen, kann die VQ Korrelationen zwischen Geschwindigkeitskomponenten zwischen benachbarten Pixeln oder Blöcken ausnutzen. Zum Beispiel sind im Verfahren aus 1) oben die Komponenten VQx von benachbarten Pixeln wahrscheinlich gleich, außer zum Beispiel, wo eine Bewegungsunstetigkeit auftritt. In ähnlicher Weise sind die Komponenten VQy wahrscheinlich gleich. Diese Charakteristik kann im Bestimmen des Kodebuches für die Vektorquantisation verwendet werden, was zu einem höheren Wirkungsgrad führt.
  • Die Komponentendarstellungen 370 ... 37n des Bewegungsvektorfeldes, welches vom Entropiekodierer 380a380n ausgegeben wird, werden in eine eingebettete Darstellung 260, wie zum Beispiel in 5 gezeigt, verbunden, welche die Komponentendarstellungen bei unterschiedlichen Auflösungen zeigt, wobei sie durch Trenner getrennt sind.
  • Ein Dekodierer 500 zum Dekodieren der eingebetteten Darstellung des Bewegungsfeldes, um die Bewegungsfelder bei unterschiedlichen Auflösungen sowie das Originalbewegungsfeld zu rekonstruieren, ist in 6 gezeigt. Die Rekonstruktion beginnt mit der gröbsten Auflösungsdarstellung. Sie wird durch einen Entropiedekodierer 510a dekodiert und an einen VQ-Dekodierer 515a weitergegeben, wo sie unter Verwendung des Kodebuches c0 dekodiert wird, um das rekonstruierte Bewegungsfeld bei Auflösung s0 zu erhalten. Das rekonstruierte Bewegungsfeld s0 wird dann mit erhöhter Abtastrate durch das Up-Sampling-Modul 525a auf gleiche Weise wie im Kodierer abgetastet, um eine Annäherung des Feldes bei Auflösung s1 zu erhalten. Der Restfehler für das Bewegungsfeld bei Auflösung s1 wird dann auf eine gleiche Weise rekonstruiert. Der Restfehler für die Auflösung s1 und das Feld, welches mit höherer Abtastrate aus dem Feld bei Auflösung s0 abgetastet wird, werden in einem Summenbildungsmodul addiert, um ein rekonstruiertes Bewegungsfeld auf der Auflösungsstufe s1 zu erzeugen. Der Vorgang wird auf jeder feineren Auflösung wiederholt, bis das Originalauflösungsbewegungsfeld erzielt wird. Jedoch kann der Vorgang bei jeder beliebigen Auflösung vor der Originalauflösung angehalten werden, wenn dies gewünscht ist.
  • 7 zeigt einen hybriden DCT/MC-Codec zum Kodieren und Dekodieren von Videobilddaten gemäß einer Ausführungsform der vorliegenden Erfindung.
  • Die Kodiererseite umfasst ein DCT-Modul 710 zum Durchführen diskreter Kosinus-Transformationen an den Eingabebilddaten. Das DCT-Modul 710 ist mit einem anpassbaren Quantisierer 720 zum Durchführen sich anpassender Quantisation an der DCT-Koeffizienten-Ausgabe aus dem DCT-Modul verbunden. Der Quantisierer 720 wird durch einen Ratenregler 730 gesteuert. Die Ausgabe des Quantisierers 720 ist mit einem Variable-Längen-Kodierer 740 und einem Invers-Quantisierer 750 verbunden. Die Ausgabe des Invers-Quantisierers ist mit einem Invers-DCT-Modul 760 zum Rekonstruieren einer Version des Originalkaders verbunden. Die Ausgabe des DCT-Moduls 760 ist mit einer Mehrzahl von Kaderspeichern 770 verbunden. Die Ausgaben der Kaderspeicher 770 sind mit einem Multi-Auflösungs-Bewegungsvektorfeld(MMVF)-Kodierer 780 zum Ableiten und Kodieren eines Bewegungsvektorfeldes verbunden. Der MMVF-Kodierer 780 ist mit einem höheren Bewegungskompensationsmodul 790 zum Durchführen von Bewegungskompensation auf eine bekannte Weise verbunden. Der MMVF-Kodierer 780 gibt auch Daten, welche ein kodiertes Bewegungsvektorfeld darstellen, an den Variable-Längen-Kodierer 740 aus und die Ausgabe des Variable-Längen-Kodierers 740 ist mit einem Puffer 800 verbunden. Der Puffer 800 wird verwendet, um den Ratenregler 730 anzupassen, und die gespeicherten Daten werden zur Übertragung oder Aufzeichnung auf einem Aufzeichnungsmedium ausgegeben.
  • Entsprechende Komponenten sind im Dekodierer bereitgestellt, darunter ein Puffer 810, ein Variable-Längen-Kodierer 820, ein Invers-Quantisierer 830, ein Invers-DCT-Modul 840, ein höheres Bewegungskompensationsmodul 850, Kaderspeicher 860, ein MMVF-Dekodierer 870.
  • Der Kodierer und der Dekodierer arbeiten im Wesentlichen auf eine bekannte Weise zum Kodieren der Videobilddaten, abgesehen vom Kodieren und Dekodieren des Bewegungsvektorfeldes unter Verwendung des MMVF-Kodierers 780 und des Dekodierers 870. Der MMVF-Kodierer 780 und der Dekodierer 870 arbeiten im Wesentlichen so, wie oben beschrieben. Jedoch führen hier der Variable-Längen-Kodierer 740 und der Dekodierer 820 die Entropiekodierung und -dekodierung anstelle der Entropiekodierer 380a380n und -dekodierer 515a515n durch, wie oben beschrieben. Es ist möglich, einen einzelnen Variable-Längen-Kodierer 940 anstelle der n Entropiekodierer 380a380n zu verwenden, wobei unterschiedliche Verweistabellen für die Bilddaten bei unterschiedlichen Auflösungen eingesetzt werden und wobei desgleichen für den Dekodierer 820 gilt.
  • Der Wirkungsgrad (basierend auf der durchschnittlichen Anzahl von Bits pro Pixel) des Kodierens, wie oben beschrieben, kann gleich den oder besser als die bekannten Verfahren sein. Obwohl die Zuweisung eines Bewegungsvektors zu jedem Pixel die Menge der Bewegungsinformation erhöht, wird diese in der nachfolgenden Verarbeitung verringert, das heißt in der Entropieverringerungsverarbeitung und der Vektorquantisation. Die durchschnittliche Anzahl der Bits pro Pixel wird natürlich vom Wesen der Daten, welche kodiert werden, abhängen.
  • In der Ausführungsform der Erfindung, die oben beschrieben ist, wird eine Bewegungsunstetigkeitsabbildung abgeleitet und in den nachfolgenden Verarbeitungsschritten verwendet, aber es ist nicht wesentlich, Bewegungsunstetigkeiten zu beachten. Statt wie in der beschriebenen Ausführungsform einen Bewegungsvektor für jedes Pixel abzuleiten, ist die Erfindung auch auf einen Lösungsweg anwendbar, wo ein Bewegungsvektor einer Gruppe von Pixeln wie zum Beispiel einem 2 × 2 oder 4 × 4 Pixelblock zugewiesen werden kann. Ein wichtiges Merkmal jedoch besteht darin, dass das sich ergebende Bewegungsvektorfeld dicht ist.
  • Die Erfindung ist insbesondere für Anwendungen nützlich, welche Bildsequenzen betreffen, wenn eine oder mehrere der folgenden Bedingungen zutreffen:
    • i) die Kanalbandbreite ist begrenzt;
    • ii) das Risiko der Datenverstümmelung ist hoch, oder
    • iii) der Benutzer kann aus dem Erzielen einer Version mit geringer Auflösung der Bewegungsdaten einen Vorteil ziehen.
  • Bewegungsinformation, welche gemäß der Erfindung abgeleitet und dargestellt ist, kann in einer Datenbank gespeichert und für Such- und Auswertungszwecke verwendet werden. Zum Beispiel kann eine Person, welche nach einer Abfolge eines bestimmten Bewegungstyps sucht, zuerst grobe Bewegungsinformation aus der Datenbank (welche Bewegungsvektorinformation speichert, die gemäß der vorliegenden Erfindung erzeugt wurde) erhalten und dann eine ausgewählte Abfolge in ursprünglicher Auflösung abrufen.

Claims (17)

  1. Verfahren zur Darstellung von Bewegung in einer Folge von digitalisierten Bildern, umfassend das Ableiten eines Bewegungsvektorfeldes für ein Bild, worin ein Bewegungsvektor für eine Gruppe von Pixeln von der Abmessung weniger als ein 8 × 8 Pixel-Block abgeleitet wird, und Ausführung der Vektorquantisation auf dem Bewegungsvektorfeld, dadurch gekennzeichnet, dass die Vektorquantisation an Vektoren ausgeführt wird, welche durch Zusammengruppieren entsprechender Komponenten von wenigstens zwei Bewegungsvektoren des Bewegungsvektorfeldes ausgebildet sind.
  2. Verfahren nach Anspruch 1, worin ein Bewegungsvektor für jedes Pixel abgeleitet wird.
  3. Verfahren nach Anspruch 1 oder Anspruch 2, wobei gruppierte entsprechende Vektorkomponenten separat von anderen gruppierten entsprechenden Vektorkomponenten vektorquantisiert werden.
  4. Verfahren nach einem der Ansprüche 1 bis 3, umfassend das Ausführen variabler Längenkodierung nach der Vektorquantisation.
  5. Verfahren nach einem der Ansprüche 1 bis 4, umfassend das Identifizieren, wo Bewegungsunstetigkeiten im Bild auftreten.
  6. Verfahren nach einem der Ansprüche 1 bis 5, umfassend das Verarbeiten des Bewegungsvektorfeldes, um die Entropie des Vektorfeldes vor der Vektorquantisation zu verringern.
  7. Verfahren nach Anspruch 6 in Abhängigkeit von Anspruch 5, worin die Bewegungsunstetigkeiten beim Verarbeiten zur Entropie-Verringerung eingesetzt werden.
  8. Verfahren nach Anspruch 6 oder Anspruch 7, worin die Entropie-Verringerung durch Ersetzen eines gegebenen Bewegungsvektors durch einen neuen Bewegungsvektors durchgeführt wird, worin die Berechnung des neuen Bewegungsvektors die Durchschnittsbildung über Bewegungsvektoren in der Nachbarschaft des gegebenen Bewegungsvektors mit einschließt.
  9. Verfahren nach Anspruch 8 in Abhängigkeit von Anspruch 7, worin ein Bewegungsvektor, welcher vom gegebenen Bewegungsvektor durch eine Bewegungsunstetigkeit getrennt ist, in der Durchschnittsbildung unberücksichtigt bleibt.
  10. Verfahren nach einem der Ansprüche 1 bis 9, umfassend das Erzeugen und Kodieren einer Mehrzahl von Versionen des Bewegungsvektorfelds mit unterschiedlichen Auflösungen.
  11. Verfahren nach Anspruch 10, umfassend Abtasten mit niedriger Abtastrate des Bewegungsvektorfeldes, um niedrig abgetastete Versionen des Feldes mit einer ersten groben Auflösung und mit einer zweiten feineren Auflösung zu erzeugen, Kodieren des Bewegungsvektorfeldes grober Auflösung, Abtasten mit erhöhter Abtastrate des Feldes mit grober Auflösung und Vergleichen des mit erhöhter Abtastrate abgetasteten Feldes mit grober Auflösung mit dem Feld feinerer Auflösung, um einen Restfehler zu erzeugen, und Kodieren des Restfehlers auf der feineren Auflösung als das Bewegungsvektorfeld, welches vektorquantisiert ist.
  12. Verfahren nach einem der vorangehenden Ansprüche, worin Vektorquantisation an Vektoren, welche Komponenten aufweisen, die x Geschwindigkeitskomponenten der Bewegungsvektoren für n Nachbarpixel oder -blöcken entsprechen, und Komponenten durchgeführt wird, welche y Geschwindigkeitskomponenten der Bewegungsvektoren für m Nachbarpixel oder -blöcken entsprechen, wobei n und m größer oder gleich 2 sind.
  13. Verfahren nach einem der vorangehenden Ansprüche, worin Vektorquantisation an Vektoren durchgeführt wird, welche durch Gruppieren entsprechender Komponenten von mehr als zwei Bewegungsvektoren gebildet werden.
  14. Kodierer, welcher ausgelegt ist, um Bewegungsinformation für eine Abfolge von digitalisierten Bildern zu kodieren, umfassend Mittel zum Durchführen der Schritte eines Verfahrens nach einem der Ansprüche 1 bis 13.
  15. Dekodierer, umfassend einen Vektorquantisationsdekodierer, welcher ausgelegt ist, um Bewegungsinformation für eine Abfolge von digitalisierten Bildern zu dekodieren, die entsprechend einem Verfahren nach einem der Ansprüche 1 bis 13 kodiert wurden.
  16. Kodierer nach Anspruch 14, umfassend einen Bewegungsabschätzer (210) zum Ableiten eines Bewegungsvektorfeldes für ein Bild und einen Vektorquantisierer (230) zum Kodieren des Bewegungsvektorfeldes.
  17. Hybrider DCT-MC Codec, umfassend einen Kodierer nach Anspruch 14 oder Anspruch 16 und einen Dekodierer nach Anspruch 15.
DE60022018T 1999-03-16 2000-03-16 Verfahren und vorichtung zur bewegungsvektorfeldkodierung Expired - Lifetime DE60022018T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB9906034 1999-03-16
GB9906034A GB2348064A (en) 1999-03-16 1999-03-16 Motion vector field encoding
PCT/GB2000/000985 WO2000056076A1 (en) 1999-03-16 2000-03-16 Method and apparatus for motion vector field encoding

Publications (2)

Publication Number Publication Date
DE60022018D1 DE60022018D1 (de) 2005-09-22
DE60022018T2 true DE60022018T2 (de) 2006-06-29

Family

ID=10849720

Family Applications (2)

Application Number Title Priority Date Filing Date
DE60022018T Expired - Lifetime DE60022018T2 (de) 1999-03-16 2000-03-16 Verfahren und vorichtung zur bewegungsvektorfeldkodierung
DE60044541T Expired - Lifetime DE60044541D1 (de) 1999-03-16 2000-03-16 Verfahren und Vorrichtung zur Bewegungsvektorfeldkodierung

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE60044541T Expired - Lifetime DE60044541D1 (de) 1999-03-16 2000-03-16 Verfahren und Vorrichtung zur Bewegungsvektorfeldkodierung

Country Status (8)

Country Link
US (2) US6944227B1 (de)
EP (3) EP1555833B1 (de)
JP (2) JP2000295628A (de)
CN (3) CN1717050A (de)
AU (1) AU3304900A (de)
DE (2) DE60022018T2 (de)
GB (1) GB2348064A (de)
WO (1) WO2000056076A1 (de)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100359115B1 (ko) * 2000-05-24 2002-11-04 삼성전자 주식회사 영상 코딩 방법
US7295614B1 (en) * 2000-09-08 2007-11-13 Cisco Technology, Inc. Methods and apparatus for encoding a video signal
US6851608B1 (en) * 2002-03-07 2005-02-08 Commerciant, L.P. System and method for uncontrolled velocity scanning
CN100551059C (zh) * 2004-05-14 2009-10-14 Nxp股份有限公司 用于从隔行编码帧产生逐行帧的设备
US8798148B2 (en) * 2007-06-15 2014-08-05 Physical Optics Corporation Apparatus and method employing pre-ATR-based real-time compression and video frame segmentation
US8605786B2 (en) * 2007-09-04 2013-12-10 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
US20090158309A1 (en) * 2007-12-12 2009-06-18 Hankyu Moon Method and system for media audience measurement and spatial extrapolation based on site, display, crowd, and viewership characterization
US8213723B2 (en) * 2008-12-29 2012-07-03 Yahoo! Inc. Method and system for determining near duplicate images
US8520736B2 (en) * 2009-04-14 2013-08-27 Fastvdo, Llc Real-time superresolution and video transmission
KR102127401B1 (ko) * 2010-01-12 2020-06-26 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
EP2490448A1 (de) * 2011-02-18 2012-08-22 Siemens Aktiengesellschaft Kodierverfahren und Bildkodiervorrichtung zur Kompression einer Bildsequenz
FR2972588A1 (fr) * 2011-03-07 2012-09-14 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US8743967B2 (en) * 2011-03-09 2014-06-03 Vixs Systems, Inc. Multi-format video decoder with vector processing instructions and methods for use therewith
FR2977111A1 (fr) 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US8913664B2 (en) * 2011-09-16 2014-12-16 Sony Computer Entertainment Inc. Three-dimensional motion mapping for cloud gaming
CN103222266B (zh) * 2011-11-21 2018-02-23 松下知识产权经营株式会社 图像处理装置以及图像处理方法
US9990004B2 (en) * 2013-04-02 2018-06-05 Samsung Dispaly Co., Ltd. Optical detection of bending motions of a flexible display
KR102059066B1 (ko) 2015-08-24 2019-12-24 후아웨이 테크놀러지 컴퍼니 리미티드 모션 벡터 필드 코딩 방법 및 디코딩 방법, 및 코딩 및 디코딩 장치들
US10970855B1 (en) 2020-03-05 2021-04-06 International Business Machines Corporation Memory-efficient video tracking in real-time using direction vectors

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4661853A (en) * 1985-11-01 1987-04-28 Rca Corporation Interfield image motion detector for video signals
US4849810A (en) * 1987-06-02 1989-07-18 Picturetel Corporation Hierarchial encoding method and apparatus for efficiently communicating image sequences
US5150209A (en) * 1990-05-11 1992-09-22 Picturetel Corporation Hierarchical entropy coded lattice threshold quantization encoding method and apparatus for image and video compression
EP0466981B1 (de) 1990-07-20 1997-02-26 Koninklijke Philips Electronics N.V. Vorrichtung zur Verarbeitung von Bewegungsvektoren
JP2950633B2 (ja) * 1991-03-27 1999-09-20 沖電気工業株式会社 動きベクトル検出装置
SE469866B (sv) * 1991-04-12 1993-09-27 Dv Sweden Ab Metod för estimering av rörelseinnehåll i videosignaler
EP0631444B1 (de) * 1992-03-03 1998-12-23 Kabushiki Kaisha Toshiba Koder für zeitveränderliche bilder
SG50718A1 (en) 1993-10-11 1998-07-20 Thomson Multimedia Sa Method and apparatus for correcting motion vectors
US5471252A (en) * 1993-11-03 1995-11-28 Matsushita Electric Industrial Corporation Of America Method and apparatus for estimating motion vector fields by rejecting local outliers
US5539469A (en) 1994-12-30 1996-07-23 Daewoo Electronics Co., Ltd. Apparatus for determining motion vectors through the use of an adaptive median filtering technique
US5600646A (en) * 1995-01-27 1997-02-04 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5574663A (en) * 1995-07-24 1996-11-12 Motorola, Inc. Method and apparatus for regenerating a dense motion vector field
US6026182A (en) * 1995-10-05 2000-02-15 Microsoft Corporation Feature segmentation
JP2000506686A (ja) * 1995-10-25 2000-05-30 サーノフ コーポレイション オーバラップブロック動き補償及びゼロツリーウェーブレット符号化を用いる低ビットレートビデオ符号化器
DE19541457C1 (de) * 1995-11-07 1997-07-03 Siemens Ag Verfahren zur Codierung eines Videodatenstroms einer aus Bildblöcken bestehenden Videosequenz
US5692063A (en) * 1996-01-19 1997-11-25 Microsoft Corporation Method and system for unrestricted motion estimation for video
US5748247A (en) * 1996-04-08 1998-05-05 Tektronix, Inc. Refinement of block motion vectors to achieve a dense motion field
JPH10248065A (ja) * 1997-03-04 1998-09-14 Nippon Hoso Kyokai <Nhk> 動きベクトル検出装置
EP0864999A3 (de) * 1997-03-13 1999-09-08 Philips Patentverwaltung GmbH Bildverarbeitungs-Verfahren für die medizinische Diagnostik
DE69809920T2 (de) * 1997-07-28 2003-10-09 Idt Internat Digital Technolog Verfahren und vorrichtung zur mehrfachauflösung objektorientierter bewegungsschätzung
US6625216B1 (en) * 1999-01-27 2003-09-23 Matsushita Electic Industrial Co., Ltd. Motion estimation using orthogonal transform-domain block matching
EP1050850A1 (de) * 1999-05-03 2000-11-08 THOMSON multimedia Verfahren zur Bestimmung einer dominanten Bewegung zwischen zwei Bildern

Also Published As

Publication number Publication date
CN1343424A (zh) 2002-04-03
EP1169867B1 (de) 2005-08-17
EP1536650A2 (de) 2005-06-01
GB9906034D0 (en) 1999-05-12
WO2000056076A1 (en) 2000-09-21
US7724826B2 (en) 2010-05-25
EP1555833B1 (de) 2010-06-09
DE60022018D1 (de) 2005-09-22
GB2348064A (en) 2000-09-20
JP2000295628A (ja) 2000-10-20
EP1169867A1 (de) 2002-01-09
US20050207500A1 (en) 2005-09-22
EP1555833A2 (de) 2005-07-20
CN1882087A (zh) 2006-12-20
CN1201591C (zh) 2005-05-11
CN1717050A (zh) 2006-01-04
US6944227B1 (en) 2005-09-13
EP1555833A3 (de) 2008-02-27
EP1536650A3 (de) 2008-02-27
AU3304900A (en) 2000-10-04
JP2011055536A (ja) 2011-03-17
DE60044541D1 (de) 2010-07-22

Similar Documents

Publication Publication Date Title
DE60022018T2 (de) Verfahren und vorichtung zur bewegungsvektorfeldkodierung
DE69836696T2 (de) Verfahren und vorrichtung zur durchführung einer hierarchischen bewegungsschätzung unter verwendung einer nicht-linearen pyramide
DE69533870T2 (de) Vorrichtung zur Bilddekodierung
DE602004004379T2 (de) Verfahren und einrichtungen zur codierung und decodierung einer bildsequenz mittels bewegungs-/texturzerlegung und wavelet-codierung
DE19983369B4 (de) Bildkompression unter Verwendung einer gerichteten vorhersagenden Codierung der Wavelet-Koeffizienten
DE69627982T2 (de) Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern
DE69633129T2 (de) Waveletbaum-bildcoder mit überlappenden bildblöcken
DE69824554T2 (de) Verfahren und anordnung zum erzeugen eines standbildes mit hoher auflösung
DE69736852T2 (de) Codierung- und Decodierungssystem für bewegte Bilder mit beliebig geformten Objekten
US20030076334A1 (en) Texture replacement in video sequences and images
DE69635369T2 (de) Videokodierungsvorrichtung
EP0285902A2 (de) Verfahren zur Datenreduktion digitaler Bildsequenzen
WO2012110491A1 (de) Kodierverfahren und bildkodiervorrichtung zur kompression einer bildsequenz
DE3837590A1 (de) Verfahren zum reduzieren der datenrate von digitalen bilddaten
DE19739266B4 (de) Verfahren und Vorrichtung zum Kodieren binärer Formen
DE69635836T2 (de) Verfahren und Vorrichtung zur Kodierung eines Bildes mit einer Kontur in einem Videosignal
DE602004001993T2 (de) Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression
DE19825042A1 (de) Verfahren zur Bewegungsvektorcodierung bei MPEG-4
DE102004007637A1 (de) Verfahren zum Erzeugen eines Bildes mit erhöhter Auflösung unter Verwendung einer Mehrzahl von Bildern mit niedriger Auflösung
DE69937833T2 (de) Verfahren und vorrichtung zur skalierbaren formkodierung
DE69818751T2 (de) Dekompression von interpolierten Bildern
DE69630199T2 (de) Verfahren und gerät zur selektiven kompression von video-codec
DE69915843T2 (de) Teilbandkodierung/-dekodierung
DE112009004282T5 (de) Techniken zur Bewegungsschätzung
DE60032452T2 (de) Verfahren zur globalen bewegungsschätzung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)