DE69112362T2 - Verfahren zur codierung von einem bewegungsfeld mit einstellbaren parametern in einer sich bewegenden bildfolge. - Google Patents

Verfahren zur codierung von einem bewegungsfeld mit einstellbaren parametern in einer sich bewegenden bildfolge.

Info

Publication number
DE69112362T2
DE69112362T2 DE69112362T DE69112362T DE69112362T2 DE 69112362 T2 DE69112362 T2 DE 69112362T2 DE 69112362 T DE69112362 T DE 69112362T DE 69112362 T DE69112362 T DE 69112362T DE 69112362 T2 DE69112362 T2 DE 69112362T2
Authority
DE
Germany
Prior art keywords
vectors
image
coding
motion
vecti
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69112362T
Other languages
English (en)
Other versions
DE69112362D1 (de
Inventor
Philippe Guillotel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of DE69112362D1 publication Critical patent/DE69112362D1/de
Application granted granted Critical
Publication of DE69112362T2 publication Critical patent/DE69112362T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Kodierverfahren für ein Bewegungsfeld in einer Folge bewegter Bilder mit einstellbaren Parametern.
  • Die Bewegungsanalyse in einer Folge bewegter Bilder, insbesondere beim Fernsehen, ist eine grundsätzlich wichtige Operation in der Folge von Operationen bei der Bildverarbeitung.
  • Die bekannten hierarchischen Schätzmethoden, wie sie z.B. in der französischen Patentanmeldung 8911328 der vorliegenden Anmelderin beschrieben sind, scheinen bis heute am wirksamsten und am besten der Tatsache angepaßt zu sein, daß das Bewegungsfeld eines Bildes als eine Gruppe von Bildzonen mit konstanter Verschiebung betrachtet werden kann. Diese Methoden besitzen auch den Vorteil, daß sie eine konstante Verschiebung in homogenen Bildzonen ergeben und es ermöglichen, die Verschiebung entsprechend den großen in Bewegung befindlichen Zonen (Panoramazonen usw.) zu finden, aber auch eine recht gute Genauigkeit ergeben, insbesondere an den Grenzen der bewegten Zonen und in den Zonen mit unter schiedlichen Bewegungen.
  • Das sich stellende Problem liegt aber darin, daß das Feld der erhaltenen Vektoren so kodiert werden kann, daß ein möglichst geringer Datendurchsatz entsteht. Dieses Problem wurde bisher dadurch gelöst, daß einerseits die Kodierung eines Bewegungsfelds als Teil der Bildkodierung und andererseits die spezifische Kodierung eines Bewegungsfelds insbesondere für Fernsehanwendungen hoher Genauigkeit unterschieden wurden.
  • Beispiele für die Kodierung des Bewegungsfelds als Teil der Bildkodierung finden sich in den folgenden Veröffentlichungen:
  • "Variable block-size image coding" von J. Jacques VAISEY und Allen GERSHO in IEEE 1987
  • "Video codec for audiovisual services AT px64 Kbits" Draft revision of recommendation H. 261 vom 30. März 1990
  • "Motion vector coding with conditional transmission" von WOO YOUNG CHOI und RAE-HONG PARK in Signal processing, Vol. 18, Nº 3, November 1989, Seiten 259 bis 267.
  • Beispiele für die Kodierung von Bewegungsfeldern für besondere Anwendungen wie das Fernsehen finden sich in den folgenden Aufsätzen:
  • "HDMAC coding for MAC compatible Broadcasting of HDTV signals" von F.W.P. VREESWIJK und Dr. M.R. HAGHIRI in 3rd International workshop on HDTV, 30. August 1989, Turin
  • "Coding of motion information on signal processing of HDTV" von J.P. HENOT in 2nd International workshop on signal processing of HDTV vom 29. Februar bis 2. März 1988, l'Aquila.
  • Im ersteren Fall bildete eine Kodierung der Bewegungsvektoren nur etwa 10% des gesamten Datendurchsatzes. Unter diesen Bedingungen braucht man daher keine spezielle Entwicklung. Die verwendeten Verfahren sind dieselben wie für die Bildkodierung und bestehen darin, eine Kodierung variabler Länge angepaßt auf Differentialmethoden bezüglich der Nachbarpunkte des laufenden Punkts oder bezüglich des Mittelwerts der Umgebungspunkte oder auch angepaßt an Entropiemethoden durchzuführen, wobei im letzteren Fall die Berechnung eines Histogramms notwendig ist. Gewisse Lösungen verwenden andererseits eine Zerlegung durch einen Kodierbaum, um die homogenen Zonen des Bilds zusammenzufassen.
  • In diesen verschiedenen Anwendungen ist der binäre Aufwand für das Bewegungsfeld nicht das Hauptproblem. Die beim hochauflösenden Fernsehen auftretenden Zwänge führten jedoch zur Entwicklung spezieller Kodiermethoden für die Verschiebungsinformationen. Der oben zitierte Aufsatz vom M.J. Henot verwendet eine Kodierung, um die räumliche Korrelation im Bild zu verwenden, während der Aufsatz von Vreeswijk und Haghiri die Verwendung einer Relativadressierung der Vektoren eines Bilds bezüglich des vorherigen verwendet, um die zeitliche Korrelation einzubringen.
  • Trotzdem läßt sich mit diesen Methoden der Datendurchsatz nicht regeln oder sogar manchmal ein Durchsatz unter 1 Mbit/s mit einer vernünftigen Bildqualität erreichen.
  • Ziel der Erfindung ist es, die vorgenannten Nachteile zu beseitigen.
  • Hierzu ist Gegenstand der Erfindung ein Verfahren zur Kodierung eines Bewegungsfelds in einer Folge bewegter Bilder mit justierbaren Parametern, dadurch gekennzeichnet, daß es darin besteht, jedes Bewegungsfeld des Bilds gemäß einem Kodierbaum zu zerlegen, der in aufeinanderfolgenden Schritten der Zerlegung des Bilds in Blöcke bestimmter Abmessung erstellt wurde, wobei jeder erhaltene Bildblock erneut zerlegt wird, bis ein homogener Block erhalten wird, d.h. eine Bildzone mit gleichförmiger Bewegung, und dann, ausgehend von einem Menü von Vektoren (Vecti), das den Wert der im Bild vorliegenden Bewegungsvektoren (Vecti) und von Kodewörtern (MCi) enthält, die die Adresse dieser Vektoren in den Menüs angeben, die Vektoren (Vecti) entsprechend diesen homogenen Zonen zu identifizieren.
  • Aufgrund der Tatsache, daß das erfindungsgemäße Verfahren ein Vektormenü verwendet, ergibt sich der Vorteil, daß das Verfahren die Möglichkeit der Durchsatzregulierung und der Kodierung mittels räumlichen und zeitlichen Kodierbaums unter Berücksichtigung der Bewegung über zwei au feinanderfolgende Bilder hinweg bietet. Außerdem ergibt sich die Möglichkeit, Kodewörter variabler Länge abhängig von der Anzahl von Vektoren je Makroblock zu haben, die zu kodierende Information durch Unterdrückung der am wenigsten oft auftretenden Vektoren zu begrenzen, anstatt die Informationen räumlich zu analysieren; es ergibt sich eine Obergrenze für den Durchsatz, und schließlich kann der Kodierbaum als ein spezieller "Vektor" oder auch getrennt kodiert werden.
  • Der Vorteil des erfindungsgemäßen Verfahrens besteht auch darin, daß man es in jeder Bildverarbeitungsvorrichtung verwenden kann, die eine Verringerung des Datendurchsatzes erfordert. Es kann insbesondere bei der Kodierung von Bewegungsfeldern im hochauflösenden Fernsehen, bei der Kodierung von Bildern ebenso wie von Daten entsprechend Fernseh-Hilfssignalen des Fernsehsystems verwendet werden, das unter der Bezeichnung HDMAC bekannt ist. Das Verfahren gibt dem Benutzer die Möglichkeit, gemäß seinen Zwängen die Kodierparameter zu wählen, die den besten Kompromiß zwischen Durchsatz und Qualität bieten, und zwar dynamisch, d.h. in unterschiedlicher Weise, je nach den Bildern und abhängig vom erhaltenen Durchsatz oder der erhaltenen Qualität, oder statisch, d.h. von Anfang an unverändert.
  • Andere Merkmale und Vorzüge der Erfindung gehen aus der nachfolgenden Beschreibung und den beiliegenden Zeichnungen hervor.
  • Die Figuren 1A, 1B, 1C zeigen ein Verfahren zur Zerlegung der Bilder in Blöcke, denen ein Zerlegungsbaum für die Kodierung der Blöcke zugeordnet ist.
  • Figur 2 zeigt einen Aufbau der zu übertragenden Bewegungsfelder nach der Anwendung der Zerlegung in einen Kodierbaum gemäß den Figuren 1A, 1B, 1C.
  • Figur 3 zeigt den Aufbau der zu übertragenden Kodewörter, wenn die Anzahl von der Anzahl von Knoten zugefügten Blättern größer als die Größe des zu übertragenden Bilds ist.
  • Figur 4 zeigt einen Aufbau des zu übertragenden Vektormenüs, indem eine Zerlegung in Kodierbäume über zwei aufeinanderfolgende Bilder erfolgt.
  • Figur 5 zeigt einen Aufbau der zu übertragenden Bewegungsfelder nach Anwendung der Zerlegung in einen Kodierbaum gemäß den Figuren 1C, 1B, 1C für den Fall, daß der Baum getrennt für die Vektoren kodiert wird.
  • Um ein Feld von Bewegungsvektoren so kodieren zu können, daß man für die Bildübertragung einen möglichst geringen Durchsatz an Kodewörtern erreicht, besteht die Idee der Erfindung darin, diese Informationen so zusammenzufassen, daß man ein Vektorfeld mit möglichst großen Blöcken entsprechend homogenen Bildzonen erhält. Dies läuft daraus hinaus, daß ein durch die homogenen Bildzonen definierte Kodierbaum bestimmt wird und dieser Kodierbaum mit der Kodierung eines Bewegungsfeldes unter Berücksichtigung von variablen Parametern verknüpft wird, um einen guten Kompromiß zwischen Auflösung und Durchsatz zu erzielen.
  • Die Zerlegung in einen Kodierbaum besteht, wie die Figuren 1A, 1B und 1C zeigen, darin, ein Bild in homogene Blöcke einer Größe n n zu zerlegen, wobei n möglichst groß ist, und dann der so erhaltenen Zerlegung einen Baum (Figur 1C) zuzuordnen, dessen Wurzel R das Bild, dessen Knoten (N&sub1; bis N&sub7;) die Blöcke einer Größe 2n 2n, die nicht homogen sind und in vier Unterblöcke einer Größe nun zerlegt werden, und dessen Blätter F&sub1; bis F&sub2;&sub5; die homogenen Blöcke einer Größe n n darstellen. So erhält man im Fall des in den Figuren 1A, 1B und 1C dargestellten Beispiels vier Kodeebenen, von denen eine erste Ebene (Ebene 1) einem Block von 8 8 Bildpunkten entspricht, der die Wurzel bildet, eine zweite Ebene (Ebene 2) vier Blöcken einer Größe von 4 4 Bildpunkten entspricht, eine dritte Ebene (Ebene 3) aus neun Blöcken von je 2 2 Bildpunkten und die vierte Ebene (Ebene 4) aus den verbleibenden Bildpunkten besteht.
  • Anstatt nun eine Information für jeden Elementarblock oder jeden Bildpunkt zu haben, ergibt das erfindungsgemäße Verfahren eine Zerlegung in Zonen, in denen die zu kodierende Information identisch ist (durch die Blätter dargestellt).
  • Bei der Kodierung eines Bewegungsfeldes ist die zu kodierende Information der Wert des erhaltenen Verschiebungsvektors, zu dem eine Kodierung der für den Aufbau des Dekodierungsbaums erforderlichen Knoten in Form eines speziellen "Vektors" beigefügt wird.
  • Vorausgesetzt, daß die Kodierung auf Vektoren einer Nennamplitude von ±V in waagrechter und senkrechter Bildrichtung beschränkt ist, beträgt die Anzahl möglicher Kombinationen (2V+1)² und die Anzahl der für die Kodierung erforderlichen Bits log&sub2;[(2V+1)²].
  • Beispielsweise beträgt für einen Vektor einer Amplitude von ±6 Bildpunkten (V = 6) die Anzahl der Kombinationen 13 13 + 1 (Knoten) = 170 und die Anzahl von Bits je Kodewort beträgt 8.
  • Da jedoch in einem Bild nicht unbedingt alle möglichen Vektoren vorliegen, besteht ein Merkmal der Erfindung darin, ein Vektormenü zu bilden, das alle im Bild vorhandenen Vektoren enthält. Unter diesen Bedingungen ist die zu kodierende Information nicht mehr der Wert des Vektors, sondern eine Relativadressierung im Menü.
  • Betrachtet man wieder das obige Beispiel und nimmt an, daß nur 45 unterschiedliche Vektoren von den 169 möglichen vorliegen, dann reduziert sich die Anzahl der Kombinationen auf 45+1 = 46, und die Anzahl von Bits je Kodewort verringert sich auf 6.
  • Dies bedingt jedoch eine Übertragung der Menüvektoren zusammen mit ihren Kodewörtern, wie dies die Konfiguration in Figur 2 zeigt. In dieser Figur bildet das Feld Deb ein Anfangswort, das die Vektorzahl (n) und die Kodewortzahl (m - Blatt- und Knotenzahl) enthält. Die Felder Vecti stellen die im Bild vorhandenen Vektoren dar und die Felder MCi stellen die Kodewörter dar, die entweder einen Knoten oder die Nummer eines Menüvektors bilden.
  • Wenn auch die obige Zerlegung der Bewegungsvektoren in einen Kodebaum die starke zweidimensionale Korrelation zwischen den Bewegungsvektoren ausnutzt, so berücksichtigt sie doch nicht die zeitliche Korrelation, die zwischen einem Bild und dem nächsten existiert und die sicher eine Durchsatzverringerung erlaubt. Dieses Problem wird erfindungsgemäß durch eine Zerlegung in einen Kodierbaum gelöst, die sich nicht mehr auf ein Bild, sondern auf zwei aufeinanderfolgende Bilder bezieht und zu einem einzigen Baum für beide Bilder führt.
  • Ein homogener Block muß unter diesen Bedingungen räumlich in beiden aufeinanderfolgenden Bildern mit demselben Vektor homogen sein. Die Anzahl von Menüvektoren ist also gleich der Anzahl von unterschiedlichen Vektoren des laufenden Bilds und des vorhergehenden oder nachfolgenden Bilds, und die Anzahl von Kombinationen ist gleich der Anzahl unterschiedlicher Vektoren des laufenden Bilds multipliziert mit der Anzahl unterschiedlicher Vektoren des vorhergehenden oder nachfolgenden Bilds.
  • Wenn für ein Bild einer Größe von n n Bildpunkten die Anzahl von Blättern, die der Anzahl von Knoten zugefügt wurde, größer wird als das Produkt n n, macht die Kodierung durch Zerlegung in einen Kodebaum keinen Sinn mehr, und in diesem Fall werden die Kodewörter direkt gemäß der Organisation in Figur 3 übertragen, bei der die Kodewörter MCi sich nur auf den Index des entsprechenden Vektors im Menü beziehen und kein Knoten berücksichtigt wird. Es gibt dann ebensoviele Kodewörter MCi wie Bildpunkte. Natürlich entspricht dieser Fall einem Maximaldurchsatz.
  • Wenn die Zerlegung über zwei aufeinanderfolgende Bilder erfolgt, enthält das Feld Deb die Anzahl N&sub1; von Vektoren des laufenden Bilds, die Anzahl N&sub2; von Vektoren des vorhergehenden (oder folgenden) Bilds, die Anzahl unterschiedlicher Vektoren (N) im laufenden und im vorhergehenden (oder folgenden) Bild und die Anzahl von Kodewörtern MC. Das Menü der Vektoren VECT&sub1; .. VECTn wird dann wie in Figur 4 dargestellt übertragen, indem die einander entsprechenden Vektoren in den Vektorgruppen N&sub1; und N&sub2; berücksichtigt werden, die nicht zweimal im Menü übertragen werden müssen.
  • Wie in den eine Kodierung erfordernden Anwendungen ist der maximal zulässige Durchsatz im allgemeinen festgelegt. Das erfindungsgemäße Verfahren hat den Vorteil, daß es ein beliebiges Bewegungsfeld unabhängig vom festgelegten Maximaldurchsatz kodieren kann. Es ergibt sich jedoch eine Verringerung der Qualität, wenn die festgelegten Maximaldurchsätze immer geringer werden. Ein guter Kompromiß zwischen Durchsatz und Qualität kann durch Anpassung der Größe der Blocks erreicht werden. Beispielsweise kann anstelle einer Zerlegung des Kodierbaums bis zu einem Bildpunkt diese Zerlegung stets bei einer Blockgröße von 2 2 oder 4 4 Bildpunkten enden, wobei ein Vektor jeder Elementargröße zugeordnet ist. Der Durchsatz wird unter diesen Bedingungen abnehmen. Es ist auch möglich, die Amplitude der Vektoren zu regeln. In diesem Fall kann der Durchsatz deutlich verringert werden, und nur ein Vektormenü muß verändert werden aufgrund der relativen Adressierung. Eine andere Methode der Durchsatzverringerung kann auch darin bestehen, die Anzahl von Vektoren je Bild und damit die Anzahl von Bits je Kodewort zu begrenzen, aber dieses Verfahren führt dazu, daß gewisse Vektoren im Bild verboten werden. Zerlegt man das Bild aber in Makroblöcke einer Größe von beispielsweise einem Viertelbild und berechnet man einen Baum für jeden dieser Blöcke so, daß mehrere Menüs je Bild erhalten werden, dann kann die Anzahl von Vektoren in jedem Makroblock verringert werden und doch für jedes Bild die Möglichkeit erhalten bleiben, alle möglichen Vektoren zu haben.
  • Um deutliche Verschlechterungen des Bewegungsfelds zu vermeiden, ist es wichtig, einen Kompromiß zwischen der Größe der Makroblöcke und der maximal zulässigen Anzahl von Vektoren innerhalb dieser Blöcke zu finden. Diese Parameter können bei der Initialisierung des Verfahrens bestimmt werden oder natürlich auch während der Übertragung, um eine Übertragung mit konstantem Durchsatz zu gewährleisten. In diesem letzteren Fall kann die Kodierung des Bewegungsfelds anfangs ohne Einschränkung erfolgen und dann erst, wenn der optimale Durchsatz überschritten wird, durch Einwirkung auf gewisse Parameter verändert werden, um unterhalb des festgelegten Maximaldurchsatzes zu bleiben.
  • Das erfindungsgemäße Verfahren wird vorzugsweise bei der Kodierung der Fernsehbilder der HDMAC-Norm angewendet. In diesem Fall findet nämlich die Kodierung auf der Basis von Blöcken von 16 16 Bildpunkten alle 40 ms statt, indem jeweils zwei verschachtelte Halbbilder betrachtet werden. Bei einer derartigen Kodierung wird jeder Block nach drei Modi definiert, nämlich einem Modus 80 ms für die festen Blöcke, für die die Bewegung Null ist, einen Modus 40 ms für die Blöcke mit einer Bewegungsamplitude unter 6 Bildpunkten und einen Modus 20 ms für die Blöcke mit einer Bewegung größer als ±6 Bildpunkte. Nur der Modus 40 ms, der Verschiebungsvektoren verwendet, wird bewegungsmäßig kompensiert, und über 80 ms entsprechend der Dauer von zwei verschachtelten Bildern werden nur die folgenden Kombinationen zugelassen (80-80, 40-40, 40-20, 20-40, 20-20). Das erfindungsgemäße Kodierverfahren berücksichtigt diese Verringerung der Anzahl möglicher Kombinationen, wobei der Modus 40 ms die Bewegungskompensation nur in einem von zwei Halbbildern verwendet. Die zu kodierende Information in Blöcken von 16 16 Bildpunkten ist diejenige des mit dem ggf. einem Maximaldurchsatz von 1 Mbit/s zugeordneten Vektor erhaltenen Modus.
  • Die Definitionsparameter des Kodierbaums sind dann folgende:
  • - Größe der Elementarblöcke 16 16 Bildpunkte
  • - Amplitude der Vektoren: ±6 Bildpunkte
  • - Größe des gewählten Makroblocks 128 128 Bildpunkte
  • - Größe der hochauflösenden Bilder 1440 1152 Bildpunkte
  • - maximal zulässiger Durchsatz 1Mbit/s
  • - kodierte Information alle 80 ms für einen Block von 16 16 Bildpunkten.
  • Die Anzahl von Kombinationen ist für jede Moduskombination wie folgt definiert:
  • 80-80 T 1 Kombination
  • 40-40 T N&sub1; N&sub2; Kombinationen
  • 40-20 T N&sub1; Kombinationen
  • 20-40 T N&sub2; Kombinationen
  • 20-20 T 1 Kombination
  • Hierbei bezeichnet N&sub1; die Anzahl von Vektoren im ersten Bild je Block von 128 128 Bildpunkten.
  • N&sub2; bezeichnet die Anzahl von Vektoren im zweiten Bild je Block von 128 128 Bildpunkten.
  • Für N1max = N2max = 64 gilt:
  • - die Anzahl der maximalen Möglichkeiten (einschließlich eines Knotens) ist gleich
  • 3+N&sub1;+N&sub2;+N&sub1; N&sub2; = 4227 und kann mit Kodewörtern von 13 Bits kodiert werden.
  • Da nach der Norm HDMAC nur 1408 Punkte je Zeile und 1152 Zeilen übertragen werden, beträgt die Anzahl von zu berücksichtigenden Makroblöcken einer Größe von 128 128 Bildpunkten 99 Makroblöcke.
  • Zurückkommend auf die Figuren 2, 3 und 4 enthält das Anfangswort Deb jedes Makroblocks unter diesen Bedingungen für jedes der beiden aufeinanderfolgenden Bilder 1 und 2:
  • - N&sub1; Vektoren des Bilds 1 (N&sub1; liegt zwischen 0 und 64)
  • - N&sub2; Vektoren des Bildes 2 (N&sub2; liegt zwischen 0 und 64)
  • - N unterschiedliche Vektoren in den Bildern 1 und 2 (N ist gleich dem Maximum der Summe der N&sub1; und N&sub2; Vektoren)
  • - und n Kodewörter (n liegt zwischen 1 und 64).
  • Das ergibt insgesamt N&sub1; N&sub2; N n = 34881600 mögliche Kombinationen, die durch ein Kodewort Deb von 26 Bits dargestellt werden können (diese Informationen sind für die Dekodierung notwendig, um die Kodewörter im Binärfluß wieder zu finden).
  • Die Vektoren einer Amplitude von ±6 Bildpunkten erfordern 8 Bits für die Kodierung. Der theoretische maximale Binärdurchsatz ist unter diesen Bedingungen gleich dem Produkt aus der Anzahl von übertragenen Makroblöcken (99) mit der Summe der das Wort Deb bildenden Bits (26), der das Vektormenü bildenden Bits (2 64 8) und der Bits des Kodeworts (64 13). Das erhaltene Produkt wird erneut mit der Frequenz 12,5 Hz entsprechend einer Übertragung dieses Pakets von Bits alle 80 ms multipliziert.
  • Bei der betrachteten HDMAC-Anwendung beträgt der sich ergebende Durchsatz 2328975 Bits/s. Um in den Durchsatzbereich von 1 Mbit/s zu gelangen, muß die Anzahl von Vektoren auf 13 je Makroblock (aus den 64 möglichen) begrenzt werden. Der erhaltene Durchsatz beläuft sich dann auf
  • 99 [19+(13 2 8)+(64 8)] 12,5 = 914513 Bits/s
  • Betrachtet man nicht mehr Vektoren der Amplitude von ±6 Bildpunkten, sondern Vektoren von ±14 Bildpunkten in waagrechter Bildrichtung und von ±8 Bildpunkten in senkrechter Bildrichtung, dann beläuft sich der maximale Durchsatz auf
  • 99 (19+(13 2 9)+(64 8)] 12,5 = 946687,5 Bits/s
  • Natürlich kann anstelle der oben angegebenen Begrenzung der Anzahl von Vektoren auf 13 in allen Bildern diese Begrenzung auch dynamisch erfolgen, indem beispielsweise alle möglichen Vektoren übertragen werden, wenn der Durchsatz unter 1 Mbit/s liegt, indem aber die Anzahl von Vektoren soweit begrenzt wird, bis der Durchsatz unter 1 Mbit/s gelangt. Die Begrenzung auf 13 der Vektoren kann erfolgen, indem nur die 13 am meisten in einem Makroblock auftretenden Vektoren genommen werden und indem den entfallenen Vektoren der nächstliegende der 13 Vektoren zugeordnet wird.
  • Andererseits kann die normale Größe der Blöcke, die bei der HDMAC-Kodierung 16 16 Bildpunkte beträgt, ggf. verringert werden, da das erfindungsgemäße Verfahren immer angewendet werden kann, unabhängig von der gewählten maximalen oder minimalen Größe der Blöcke.
  • Um den Durchsatz verringern, ist es günstig, nicht mehr einen Knoten als einen speziellen ''Vektor" zu kodieren (um den Baum bei der Dekodierung wiedererstellen zu können), sondern ein Feld ARBRE wie in Figur 5 gezeigt zu übertragen, das den Kodebaum darstellt. Jedes Bit dieses Felds gibt eine Knoten oder ein Blatt an. Das erste Bit bezeichnet den Zustand der Wurzel (Block einer Größe von n n Bildpunkten, Blatt oder Knoten), das zweite, dritte, vierte und fünfte Bit den Zustand der vier Unterblöcke der Größe n/2 n/2 usw. bis zur vorletzten möglichen Ebene. So wäre in den Figuren 1A, 1B, 1C das Wort ARBRE:
  • 1 0111 0000 0011 0110
  • Hierbei bedeutet:
  • 0111 --- F&sub1;N&sub1;N&sub2;N&sub3;
  • 0000 --- Unterblöcke von F&sub1;
  • 0011 --- F&sub1;F&sub3;N&sub4;N&sub5;
  • 0000 --- F&sub4;F&sub5;F&sub6;F&sub7;
  • 0110 --- F&sub8;N&sub6;N&sub7;F&sub9;
  • sowie 1 = Knoten
  • 0 = Blatt
  • Die Kodewörter (MCi) stellen nur noch eine der Kombinationen Modus/Vektor dar.
  • Für die HDMAC-Anwendung ergeben sich vier Ebenen (128, 64, 32, 16). Das Wort ARBRE enthält somit 21 Bits.
  • Der Gewinn an Durchsatz beruht auf der Tatsache, daß vorher ein Knoten mit ebensovielen Bits kodiert wurde, wie ein Vektor (also mit maximal 8 Bits). Geht man davon aus, daß nur 5 Knoten (unter den 21 möglichen) vorliegen, brauchte man 8 5 = 40 Bits für den Baum. Mit der vorliegenden Methode sind nur 21 Bits erforderlich. Im Grenzfall kann diese Methode einen Gewinn von
  • [21(Anzahl der Knoten) 8)-[21] = 147 Bits je Makroblock mit 8 Bits je Kodewort, d.h. 147 99 12,5 = 181812,5 Bits/s ergeben.
  • Außerdem kann mit der getrennten Kodierung des Baums der in Figur 3 gezeigte Fall verwendet werden, wenn der Baum vollständig zerlegt wird. So gewährleistet man den gleichen maximaldurchsatz wie vorher (das Wort ARBRE wird nicht übertragen).

Claims (9)

1. Verfahren zur Kodierung eines Bewegungsfelds in einer Folge bewegter Bilder mit justierbaren Parametern, dadurch gekennzeichnet, daß es darin besteht, jedes Bewegungsfeld des Bilds gemäß einem Kodierbaum zu zerlegen, der in aufeinanderfolgenden Schritten der Zerlegung des Bilds in Blöcke bestimmter Abmessung erstellt wurde, wobei jeder erhaltene Bildblock erneut zerlegt wird, bis ein homogener Block erhalten wird, d.h. eine Bildzone mit gleichförmiger Bewegung, und dann, ausgehend von einem Menü von Vektoren (Vecti), das den Wert der im Bild vorliegenden Bewegungsvektoren (Vecti) und von Kodewörtern (MCi) enthält, die die Adresse dieser Vektoren in den Menüs angeben, die Vektoren (Vecti) entsprechend diesen homogenen Zonen zu identifizieren.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Zerlegung jedes Bewegungsfelds innerhalb von Bildblöcken (n n Bildpunkte) vorbestimmter Abmessungen stattfindet.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Größe der Blöcke einstellbar ist.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Länge der Bewegungsvektoren eingestellt wird.
5. Verfahren nach einem beliebigen der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß es darin besteht, das Bild in Makroblöcke bestimmter Abmessung zu zerlegen und einen Kodierbaum für jeden dieser Makroblöcke so zu berechnen, daß mehrere Vektormenüs je Bild erhalten werden.
6. Verfahren nach einem beliebigen der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Zerlegung in einen Kodierbaum über zwei aufeinanderfolgende Bilder stattfindet.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß es darin besteht, die Anzahl von Vektoren zu begrenzen, indem die am wenigsten oft vorkommenden Vektoren entfallen.
8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Kodierbaum als ein spezieller Vektor beschrieben oder getrennt übertragen werden kann.
9. Verfahren nach Anspruch 1 oder 5, dadurch gekennzeichnet, daß es darin besteht, die Anzahl von Adressbits der Bewegungsvektoren (Vecti) abhängig von der Anzahl von Bewegungsvektoren (Vecti) im Menü festzulegen.
DE69112362T 1990-06-29 1991-06-25 Verfahren zur codierung von einem bewegungsfeld mit einstellbaren parametern in einer sich bewegenden bildfolge. Expired - Fee Related DE69112362T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9008299A FR2664117B1 (fr) 1990-06-29 1990-06-29 Procede de codage a parametres ajustables d'un champ de mouvement dans une sequence d'images animees.
PCT/FR1991/000505 WO1992000651A1 (fr) 1990-06-29 1991-06-25 Procede de codage a parametres ajustables d'un champ de mouvement dans une sequence d'images animees

Publications (2)

Publication Number Publication Date
DE69112362D1 DE69112362D1 (de) 1995-09-28
DE69112362T2 true DE69112362T2 (de) 1996-02-08

Family

ID=9398205

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69112362T Expired - Fee Related DE69112362T2 (de) 1990-06-29 1991-06-25 Verfahren zur codierung von einem bewegungsfeld mit einstellbaren parametern in einer sich bewegenden bildfolge.

Country Status (10)

Country Link
US (1) US5296927A (de)
EP (1) EP0489890B1 (de)
JP (1) JPH05502564A (de)
AT (1) ATE126959T1 (de)
DE (1) DE69112362T2 (de)
DK (1) DK0489890T3 (de)
ES (1) ES2076537T3 (de)
FR (1) FR2664117B1 (de)
GR (1) GR3017635T3 (de)
WO (1) WO1992000651A1 (de)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2697706B1 (fr) * 1992-11-03 1994-11-25 Thomson Csf Procédé et dispositif de réduction de débit pour l'enregistrement d'images sur magnétoscope.
FR2700037B1 (fr) * 1992-12-24 1995-01-27 Thomson Csf Dispositif d'estimation hiérarchique du mouvement de séquence d'images.
US5444489A (en) * 1993-02-11 1995-08-22 Georgia Tech Research Corporation Vector quantization video encoder using hierarchical cache memory scheme
JP3846642B2 (ja) * 1994-01-31 2006-11-15 ソニー株式会社 動き量検出方法及び動き量検出装置
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
FR2783123B1 (fr) * 1998-09-04 2000-11-24 France Telecom Procede d'estimation du mouvement entre deux images
US6919901B2 (en) * 2002-01-15 2005-07-19 International Business Machines Corporation Graphics system register data generation
JP5622613B2 (ja) * 2011-02-25 2014-11-12 三菱電機株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
TWI482099B (zh) * 2012-09-07 2015-04-21 Altek Corp 影像處理紀錄系統及其影像處理紀錄方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3877105D1 (de) * 1987-09-30 1993-02-11 Siemens Ag, 8000 Muenchen, De
FR2631768B1 (fr) * 1988-05-20 1990-08-17 Labo Electronique Physique Systeme d'emission et reception de television a haute definition a debit de donnees reduit
FR2633468B1 (fr) * 1988-06-24 1990-11-09 France Etat Procede de codage de donnees d'assistance a la reconstruction d'images electroniques animees sous-echantillonnees

Also Published As

Publication number Publication date
GR3017635T3 (en) 1996-01-31
EP0489890A1 (de) 1992-06-17
ATE126959T1 (de) 1995-09-15
DE69112362D1 (de) 1995-09-28
US5296927A (en) 1994-03-22
FR2664117A1 (fr) 1992-01-03
WO1992000651A1 (fr) 1992-01-09
DK0489890T3 (da) 1995-12-27
FR2664117B1 (fr) 1996-06-21
JPH05502564A (ja) 1993-04-28
EP0489890B1 (de) 1995-08-23
ES2076537T3 (es) 1995-11-01

Similar Documents

Publication Publication Date Title
EP0290085B1 (de) System zur Übertragung von Videobildern
DE69720559T2 (de) Methode zur Bildkodierung mit Kodes variabler Länge
DE69015695T2 (de) Einrichtung zur Transformationskodierung.
DE3751529T2 (de) System zum Kodieren eines Bewegtbildsignals.
DE3850627T2 (de) Vorrichtung zum Codieren von digitalen Videosignalen und eine entsprechende Decodiervorrichtung.
DE4442643B4 (de) Verfahren zum Abschätzen der Bewegung in einem Bewegtbild
EP0830029A2 (de) Verfahren zur Reduzierung von Daten in Videosignalen
DE69112362T2 (de) Verfahren zur codierung von einem bewegungsfeld mit einstellbaren parametern in einer sich bewegenden bildfolge.
EP0773690A2 (de) Verfahren zur Codierung eines Videodatenstroms
DE3889939T2 (de) Verfahren und Mittel zur Kodierung und Dekodierung eines Bildsignals.
EP1323313B1 (de) Verfahren und anordnung zum übertragen eines vektors
DE3851277T2 (de) Vorhersage-Kodiersystem mit Geräuschverminderung.
DE3726601C2 (de)
DE69630122T2 (de) Verfahren und Vorrichtung zur Vorfilterung von Videobildern
DE3545106C2 (de)
WO2000008601A1 (de) Verfahren und anordnung zur bewegungsschätzung in einem digitalisierten bild mit bildpunkten
EP0336510B1 (de) Prädiktiver Standbildcodierer
EP0442096A2 (de) Einrichtung zur bandbreitenreduzierenden Codierung von Videosignalen
EP1110407A1 (de) Verfahren und anordnung zur codierung und decodierung eines digitalisierten bildes mit anwendung eines objektgesamtbewegungsvektors
EP0981910B1 (de) Verfahren und vorrichtung zur codierung eines digitalisierten bildes
EP0244001B1 (de) Hybrid-Codierer für Videosignale
DE69216257T2 (de) Videosignalkodierer
DE10022262A1 (de) Verfahren und eine Anordnung zur Codierung bzw. Decodierung einer Folge von Bildern
EP0284962B1 (de) Verfahren zur Bilddatenreduktion für digitale Fernsehsignale
DE102004041418A1 (de) Verfahren zur Codierung eines ersten und zweiten Datenwortes und Verfahren zur Decodierung eines codierten Datenwortes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee