DE69112362T2

DE69112362T2 - Verfahren zur codierung von einem bewegungsfeld mit einstellbaren parametern in einer sich bewegenden bildfolge.

Info

Publication number: DE69112362T2
Application number: DE69112362T
Authority: DE
Inventors: Philippe Guillotel
Original assignee: Thomson CSF SA
Current assignee: Thales SA
Priority date: 1990-06-29
Filing date: 1991-06-25
Publication date: 1996-02-08
Anticipated expiration: 2011-06-26
Also published as: GR3017635T3; EP0489890A1; ATE126959T1; DE69112362D1; US5296927A; FR2664117A1; WO1992000651A1; DK0489890T3; FR2664117B1; JPH05502564A; EP0489890B1; ES2076537T3

Description

Die vorliegende Erfindung betrifft ein Kodierverfahren für ein Bewegungsfeld in einer Folge bewegter Bilder mit einstellbaren Parametern.
Die Bewegungsanalyse in einer Folge bewegter Bilder, insbesondere beim Fernsehen, ist eine grundsätzlich wichtige Operation in der Folge von Operationen bei der Bildverarbeitung.
Die bekannten hierarchischen Schätzmethoden, wie sie z.B. in der französischen Patentanmeldung 8911328 der vorliegenden Anmelderin beschrieben sind, scheinen bis heute am wirksamsten und am besten der Tatsache angepaßt zu sein, daß das Bewegungsfeld eines Bildes als eine Gruppe von Bildzonen mit konstanter Verschiebung betrachtet werden kann. Diese Methoden besitzen auch den Vorteil, daß sie eine konstante Verschiebung in homogenen Bildzonen ergeben und es ermöglichen, die Verschiebung entsprechend den großen in Bewegung befindlichen Zonen (Panoramazonen usw.) zu finden, aber auch eine recht gute Genauigkeit ergeben, insbesondere an den Grenzen der bewegten Zonen und in den Zonen mit unter schiedlichen Bewegungen.
Das sich stellende Problem liegt aber darin, daß das Feld der erhaltenen Vektoren so kodiert werden kann, daß ein möglichst geringer Datendurchsatz entsteht. Dieses Problem wurde bisher dadurch gelöst, daß einerseits die Kodierung eines Bewegungsfelds als Teil der Bildkodierung und andererseits die spezifische Kodierung eines Bewegungsfelds insbesondere für Fernsehanwendungen hoher Genauigkeit unterschieden wurden.
Beispiele für die Kodierung des Bewegungsfelds als Teil der Bildkodierung finden sich in den folgenden Veröffentlichungen:
"Variable block-size image coding" von J. Jacques VAISEY und Allen GERSHO in IEEE 1987
"Video codec for audiovisual services AT px64 Kbits" Draft revision of recommendation H. 261 vom 30. März 1990
"Motion vector coding with conditional transmission" von WOO YOUNG CHOI und RAE-HONG PARK in Signal processing, Vol. 18, Nº 3, November 1989, Seiten 259 bis 267.
Beispiele für die Kodierung von Bewegungsfeldern für besondere Anwendungen wie das Fernsehen finden sich in den folgenden Aufsätzen:
"HDMAC coding for MAC compatible Broadcasting of HDTV signals" von F.W.P. VREESWIJK und Dr. M.R. HAGHIRI in 3rd International workshop on HDTV, 30. August 1989, Turin
"Coding of motion information on signal processing of HDTV" von J.P. HENOT in 2nd International workshop on signal processing of HDTV vom 29. Februar bis 2. März 1988, l'Aquila.
Im ersteren Fall bildete eine Kodierung der Bewegungsvektoren nur etwa 10% des gesamten Datendurchsatzes. Unter diesen Bedingungen braucht man daher keine spezielle Entwicklung. Die verwendeten Verfahren sind dieselben wie für die Bildkodierung und bestehen darin, eine Kodierung variabler Länge angepaßt auf Differentialmethoden bezüglich der Nachbarpunkte des laufenden Punkts oder bezüglich des Mittelwerts der Umgebungspunkte oder auch angepaßt an Entropiemethoden durchzuführen, wobei im letzteren Fall die Berechnung eines Histogramms notwendig ist. Gewisse Lösungen verwenden andererseits eine Zerlegung durch einen Kodierbaum, um die homogenen Zonen des Bilds zusammenzufassen.
In diesen verschiedenen Anwendungen ist der binäre Aufwand für das Bewegungsfeld nicht das Hauptproblem. Die beim hochauflösenden Fernsehen auftretenden Zwänge führten jedoch zur Entwicklung spezieller Kodiermethoden für die Verschiebungsinformationen. Der oben zitierte Aufsatz vom M.J. Henot verwendet eine Kodierung, um die räumliche Korrelation im Bild zu verwenden, während der Aufsatz von Vreeswijk und Haghiri die Verwendung einer Relativadressierung der Vektoren eines Bilds bezüglich des vorherigen verwendet, um die zeitliche Korrelation einzubringen.
Trotzdem läßt sich mit diesen Methoden der Datendurchsatz nicht regeln oder sogar manchmal ein Durchsatz unter 1 Mbit/s mit einer vernünftigen Bildqualität erreichen.
Ziel der Erfindung ist es, die vorgenannten Nachteile zu beseitigen.
Hierzu ist Gegenstand der Erfindung ein Verfahren zur Kodierung eines Bewegungsfelds in einer Folge bewegter Bilder mit justierbaren Parametern, dadurch gekennzeichnet, daß es darin besteht, jedes Bewegungsfeld des Bilds gemäß einem Kodierbaum zu zerlegen, der in aufeinanderfolgenden Schritten der Zerlegung des Bilds in Blöcke bestimmter Abmessung erstellt wurde, wobei jeder erhaltene Bildblock erneut zerlegt wird, bis ein homogener Block erhalten wird, d.h. eine Bildzone mit gleichförmiger Bewegung, und dann, ausgehend von einem Menü von Vektoren (Vecti), das den Wert der im Bild vorliegenden Bewegungsvektoren (Vecti) und von Kodewörtern (MCi) enthält, die die Adresse dieser Vektoren in den Menüs angeben, die Vektoren (Vecti) entsprechend diesen homogenen Zonen zu identifizieren.
Aufgrund der Tatsache, daß das erfindungsgemäße Verfahren ein Vektormenü verwendet, ergibt sich der Vorteil, daß das Verfahren die Möglichkeit der Durchsatzregulierung und der Kodierung mittels räumlichen und zeitlichen Kodierbaums unter Berücksichtigung der Bewegung über zwei au feinanderfolgende Bilder hinweg bietet. Außerdem ergibt sich die Möglichkeit, Kodewörter variabler Länge abhängig von der Anzahl von Vektoren je Makroblock zu haben, die zu kodierende Information durch Unterdrückung der am wenigsten oft auftretenden Vektoren zu begrenzen, anstatt die Informationen räumlich zu analysieren; es ergibt sich eine Obergrenze für den Durchsatz, und schließlich kann der Kodierbaum als ein spezieller "Vektor" oder auch getrennt kodiert werden.
Der Vorteil des erfindungsgemäßen Verfahrens besteht auch darin, daß man es in jeder Bildverarbeitungsvorrichtung verwenden kann, die eine Verringerung des Datendurchsatzes erfordert. Es kann insbesondere bei der Kodierung von Bewegungsfeldern im hochauflösenden Fernsehen, bei der Kodierung von Bildern ebenso wie von Daten entsprechend Fernseh-Hilfssignalen des Fernsehsystems verwendet werden, das unter der Bezeichnung HDMAC bekannt ist. Das Verfahren gibt dem Benutzer die Möglichkeit, gemäß seinen Zwängen die Kodierparameter zu wählen, die den besten Kompromiß zwischen Durchsatz und Qualität bieten, und zwar dynamisch, d.h. in unterschiedlicher Weise, je nach den Bildern und abhängig vom erhaltenen Durchsatz oder der erhaltenen Qualität, oder statisch, d.h. von Anfang an unverändert.
Andere Merkmale und Vorzüge der Erfindung gehen aus der nachfolgenden Beschreibung und den beiliegenden Zeichnungen hervor.
Die Figuren 1A, 1B, 1C zeigen ein Verfahren zur Zerlegung der Bilder in Blöcke, denen ein Zerlegungsbaum für die Kodierung der Blöcke zugeordnet ist.
Figur 2 zeigt einen Aufbau der zu übertragenden Bewegungsfelder nach der Anwendung der Zerlegung in einen Kodierbaum gemäß den Figuren 1A, 1B, 1C.
Figur 3 zeigt den Aufbau der zu übertragenden Kodewörter, wenn die Anzahl von der Anzahl von Knoten zugefügten Blättern größer als die Größe des zu übertragenden Bilds ist.
Figur 4 zeigt einen Aufbau des zu übertragenden Vektormenüs, indem eine Zerlegung in Kodierbäume über zwei aufeinanderfolgende Bilder erfolgt.
Figur 5 zeigt einen Aufbau der zu übertragenden Bewegungsfelder nach Anwendung der Zerlegung in einen Kodierbaum gemäß den Figuren 1C, 1B, 1C für den Fall, daß der Baum getrennt für die Vektoren kodiert wird.
Um ein Feld von Bewegungsvektoren so kodieren zu können, daß man für die Bildübertragung einen möglichst geringen Durchsatz an Kodewörtern erreicht, besteht die Idee der Erfindung darin, diese Informationen so zusammenzufassen, daß man ein Vektorfeld mit möglichst großen Blöcken entsprechend homogenen Bildzonen erhält. Dies läuft daraus hinaus, daß ein durch die homogenen Bildzonen definierte Kodierbaum bestimmt wird und dieser Kodierbaum mit der Kodierung eines Bewegungsfeldes unter Berücksichtigung von variablen Parametern verknüpft wird, um einen guten Kompromiß zwischen Auflösung und Durchsatz zu erzielen.
Die Zerlegung in einen Kodierbaum besteht, wie die Figuren 1A, 1B und 1C zeigen, darin, ein Bild in homogene Blöcke einer Größe n n zu zerlegen, wobei n möglichst groß ist, und dann der so erhaltenen Zerlegung einen Baum (Figur 1C) zuzuordnen, dessen Wurzel R das Bild, dessen Knoten (N&sub1; bis N&sub7;) die Blöcke einer Größe 2n 2n, die nicht homogen sind und in vier Unterblöcke einer Größe nun zerlegt werden, und dessen Blätter F&sub1; bis F&sub2;&sub5; die homogenen Blöcke einer Größe n n darstellen. So erhält man im Fall des in den Figuren 1A, 1B und 1C dargestellten Beispiels vier Kodeebenen, von denen eine erste Ebene (Ebene 1) einem Block von 8 8 Bildpunkten entspricht, der die Wurzel bildet, eine zweite Ebene (Ebene 2) vier Blöcken einer Größe von 4 4 Bildpunkten entspricht, eine dritte Ebene (Ebene 3) aus neun Blöcken von je 2 2 Bildpunkten und die vierte Ebene (Ebene 4) aus den verbleibenden Bildpunkten besteht.
Anstatt nun eine Information für jeden Elementarblock oder jeden Bildpunkt zu haben, ergibt das erfindungsgemäße Verfahren eine Zerlegung in Zonen, in denen die zu kodierende Information identisch ist (durch die Blätter dargestellt).
Bei der Kodierung eines Bewegungsfeldes ist die zu kodierende Information der Wert des erhaltenen Verschiebungsvektors, zu dem eine Kodierung der für den Aufbau des Dekodierungsbaums erforderlichen Knoten in Form eines speziellen "Vektors" beigefügt wird.
Vorausgesetzt, daß die Kodierung auf Vektoren einer Nennamplitude von ±V in waagrechter und senkrechter Bildrichtung beschränkt ist, beträgt die Anzahl möglicher Kombinationen (2V+1)² und die Anzahl der für die Kodierung erforderlichen Bits log&sub2;[(2V+1)²].
Beispielsweise beträgt für einen Vektor einer Amplitude von ±6 Bildpunkten (V = 6) die Anzahl der Kombinationen 13 13 + 1 (Knoten) = 170 und die Anzahl von Bits je Kodewort beträgt 8.
Da jedoch in einem Bild nicht unbedingt alle möglichen Vektoren vorliegen, besteht ein Merkmal der Erfindung darin, ein Vektormenü zu bilden, das alle im Bild vorhandenen Vektoren enthält. Unter diesen Bedingungen ist die zu kodierende Information nicht mehr der Wert des Vektors, sondern eine Relativadressierung im Menü.
Betrachtet man wieder das obige Beispiel und nimmt an, daß nur 45 unterschiedliche Vektoren von den 169 möglichen vorliegen, dann reduziert sich die Anzahl der Kombinationen auf 45+1 = 46, und die Anzahl von Bits je Kodewort verringert sich auf 6.
Dies bedingt jedoch eine Übertragung der Menüvektoren zusammen mit ihren Kodewörtern, wie dies die Konfiguration in Figur 2 zeigt. In dieser Figur bildet das Feld Deb ein Anfangswort, das die Vektorzahl (n) und die Kodewortzahl (m - Blatt- und Knotenzahl) enthält. Die Felder Vecti stellen die im Bild vorhandenen Vektoren dar und die Felder MCi stellen die Kodewörter dar, die entweder einen Knoten oder die Nummer eines Menüvektors bilden.
Wenn auch die obige Zerlegung der Bewegungsvektoren in einen Kodebaum die starke zweidimensionale Korrelation zwischen den Bewegungsvektoren ausnutzt, so berücksichtigt sie doch nicht die zeitliche Korrelation, die zwischen einem Bild und dem nächsten existiert und die sicher eine Durchsatzverringerung erlaubt. Dieses Problem wird erfindungsgemäß durch eine Zerlegung in einen Kodierbaum gelöst, die sich nicht mehr auf ein Bild, sondern auf zwei aufeinanderfolgende Bilder bezieht und zu einem einzigen Baum für beide Bilder führt.
Ein homogener Block muß unter diesen Bedingungen räumlich in beiden aufeinanderfolgenden Bildern mit demselben Vektor homogen sein. Die Anzahl von Menüvektoren ist also gleich der Anzahl von unterschiedlichen Vektoren des laufenden Bilds und des vorhergehenden oder nachfolgenden Bilds, und die Anzahl von Kombinationen ist gleich der Anzahl unterschiedlicher Vektoren des laufenden Bilds multipliziert mit der Anzahl unterschiedlicher Vektoren des vorhergehenden oder nachfolgenden Bilds.
Wenn für ein Bild einer Größe von n n Bildpunkten die Anzahl von Blättern, die der Anzahl von Knoten zugefügt wurde, größer wird als das Produkt n n, macht die Kodierung durch Zerlegung in einen Kodebaum keinen Sinn mehr, und in diesem Fall werden die Kodewörter direkt gemäß der Organisation in Figur 3 übertragen, bei der die Kodewörter MCi sich nur auf den Index des entsprechenden Vektors im Menü beziehen und kein Knoten berücksichtigt wird. Es gibt dann ebensoviele Kodewörter MCi wie Bildpunkte. Natürlich entspricht dieser Fall einem Maximaldurchsatz.
Wenn die Zerlegung über zwei aufeinanderfolgende Bilder erfolgt, enthält das Feld Deb die Anzahl N&sub1; von Vektoren des laufenden Bilds, die Anzahl N&sub2; von Vektoren des vorhergehenden (oder folgenden) Bilds, die Anzahl unterschiedlicher Vektoren (N) im laufenden und im vorhergehenden (oder folgenden) Bild und die Anzahl von Kodewörtern MC. Das Menü der Vektoren VECT&sub1; .. VECTn wird dann wie in Figur 4 dargestellt übertragen, indem die einander entsprechenden Vektoren in den Vektorgruppen N&sub1; und N&sub2; berücksichtigt werden, die nicht zweimal im Menü übertragen werden müssen.
Wie in den eine Kodierung erfordernden Anwendungen ist der maximal zulässige Durchsatz im allgemeinen festgelegt. Das erfindungsgemäße Verfahren hat den Vorteil, daß es ein beliebiges Bewegungsfeld unabhängig vom festgelegten Maximaldurchsatz kodieren kann. Es ergibt sich jedoch eine Verringerung der Qualität, wenn die festgelegten Maximaldurchsätze immer geringer werden. Ein guter Kompromiß zwischen Durchsatz und Qualität kann durch Anpassung der Größe der Blocks erreicht werden. Beispielsweise kann anstelle einer Zerlegung des Kodierbaums bis zu einem Bildpunkt diese Zerlegung stets bei einer Blockgröße von 2 2 oder 4 4 Bildpunkten enden, wobei ein Vektor jeder Elementargröße zugeordnet ist. Der Durchsatz wird unter diesen Bedingungen abnehmen. Es ist auch möglich, die Amplitude der Vektoren zu regeln. In diesem Fall kann der Durchsatz deutlich verringert werden, und nur ein Vektormenü muß verändert werden aufgrund der relativen Adressierung. Eine andere Methode der Durchsatzverringerung kann auch darin bestehen, die Anzahl von Vektoren je Bild und damit die Anzahl von Bits je Kodewort zu begrenzen, aber dieses Verfahren führt dazu, daß gewisse Vektoren im Bild verboten werden. Zerlegt man das Bild aber in Makroblöcke einer Größe von beispielsweise einem Viertelbild und berechnet man einen Baum für jeden dieser Blöcke so, daß mehrere Menüs je Bild erhalten werden, dann kann die Anzahl von Vektoren in jedem Makroblock verringert werden und doch für jedes Bild die Möglichkeit erhalten bleiben, alle möglichen Vektoren zu haben.
Um deutliche Verschlechterungen des Bewegungsfelds zu vermeiden, ist es wichtig, einen Kompromiß zwischen der Größe der Makroblöcke und der maximal zulässigen Anzahl von Vektoren innerhalb dieser Blöcke zu finden. Diese Parameter können bei der Initialisierung des Verfahrens bestimmt werden oder natürlich auch während der Übertragung, um eine Übertragung mit konstantem Durchsatz zu gewährleisten. In diesem letzteren Fall kann die Kodierung des Bewegungsfelds anfangs ohne Einschränkung erfolgen und dann erst, wenn der optimale Durchsatz überschritten wird, durch Einwirkung auf gewisse Parameter verändert werden, um unterhalb des festgelegten Maximaldurchsatzes zu bleiben.
Das erfindungsgemäße Verfahren wird vorzugsweise bei der Kodierung der Fernsehbilder der HDMAC-Norm angewendet. In diesem Fall findet nämlich die Kodierung auf der Basis von Blöcken von 16 16 Bildpunkten alle 40 ms statt, indem jeweils zwei verschachtelte Halbbilder betrachtet werden. Bei einer derartigen Kodierung wird jeder Block nach drei Modi definiert, nämlich einem Modus 80 ms für die festen Blöcke, für die die Bewegung Null ist, einen Modus 40 ms für die Blöcke mit einer Bewegungsamplitude unter 6 Bildpunkten und einen Modus 20 ms für die Blöcke mit einer Bewegung größer als ±6 Bildpunkte. Nur der Modus 40 ms, der Verschiebungsvektoren verwendet, wird bewegungsmäßig kompensiert, und über 80 ms entsprechend der Dauer von zwei verschachtelten Bildern werden nur die folgenden Kombinationen zugelassen (80-80, 40-40, 40-20, 20-40, 20-20). Das erfindungsgemäße Kodierverfahren berücksichtigt diese Verringerung der Anzahl möglicher Kombinationen, wobei der Modus 40 ms die Bewegungskompensation nur in einem von zwei Halbbildern verwendet. Die zu kodierende Information in Blöcken von 16 16 Bildpunkten ist diejenige des mit dem ggf. einem Maximaldurchsatz von 1 Mbit/s zugeordneten Vektor erhaltenen Modus.
Die Definitionsparameter des Kodierbaums sind dann folgende:
- Größe der Elementarblöcke 16 16 Bildpunkte
- Amplitude der Vektoren: ±6 Bildpunkte
- Größe des gewählten Makroblocks 128 128 Bildpunkte
- Größe der hochauflösenden Bilder 1440 1152 Bildpunkte
- maximal zulässiger Durchsatz 1Mbit/s
- kodierte Information alle 80 ms für einen Block von 16 16 Bildpunkten.
Die Anzahl von Kombinationen ist für jede Moduskombination wie folgt definiert:
80-80 T 1 Kombination
40-40 T N&sub1; N&sub2; Kombinationen
40-20 T N&sub1; Kombinationen
20-40 T N&sub2; Kombinationen
20-20 T 1 Kombination
Hierbei bezeichnet N&sub1; die Anzahl von Vektoren im ersten Bild je Block von 128 128 Bildpunkten.
N&sub2; bezeichnet die Anzahl von Vektoren im zweiten Bild je Block von 128 128 Bildpunkten.
Für N1max = N2max = 64 gilt:
- die Anzahl der maximalen Möglichkeiten (einschließlich eines Knotens) ist gleich
3+N&sub1;+N&sub2;+N&sub1; N&sub2; = 4227 und kann mit Kodewörtern von 13 Bits kodiert werden.
Da nach der Norm HDMAC nur 1408 Punkte je Zeile und 1152 Zeilen übertragen werden, beträgt die Anzahl von zu berücksichtigenden Makroblöcken einer Größe von 128 128 Bildpunkten 99 Makroblöcke.
Zurückkommend auf die Figuren 2, 3 und 4 enthält das Anfangswort Deb jedes Makroblocks unter diesen Bedingungen für jedes der beiden aufeinanderfolgenden Bilder 1 und 2:
- N&sub1; Vektoren des Bilds 1 (N&sub1; liegt zwischen 0 und 64)
- N&sub2; Vektoren des Bildes 2 (N&sub2; liegt zwischen 0 und 64)
- N unterschiedliche Vektoren in den Bildern 1 und 2 (N ist gleich dem Maximum der Summe der N&sub1; und N&sub2; Vektoren)
- und n Kodewörter (n liegt zwischen 1 und 64).
Das ergibt insgesamt N&sub1; N&sub2; N n = 34881600 mögliche Kombinationen, die durch ein Kodewort Deb von 26 Bits dargestellt werden können (diese Informationen sind für die Dekodierung notwendig, um die Kodewörter im Binärfluß wieder zu finden).
Die Vektoren einer Amplitude von ±6 Bildpunkten erfordern 8 Bits für die Kodierung. Der theoretische maximale Binärdurchsatz ist unter diesen Bedingungen gleich dem Produkt aus der Anzahl von übertragenen Makroblöcken (99) mit der Summe der das Wort Deb bildenden Bits (26), der das Vektormenü bildenden Bits (2 64 8) und der Bits des Kodeworts (64 13). Das erhaltene Produkt wird erneut mit der Frequenz 12,5 Hz entsprechend einer Übertragung dieses Pakets von Bits alle 80 ms multipliziert.
Bei der betrachteten HDMAC-Anwendung beträgt der sich ergebende Durchsatz 2328975 Bits/s. Um in den Durchsatzbereich von 1 Mbit/s zu gelangen, muß die Anzahl von Vektoren auf 13 je Makroblock (aus den 64 möglichen) begrenzt werden. Der erhaltene Durchsatz beläuft sich dann auf
99 [19+(13 2 8)+(64 8)] 12,5 = 914513 Bits/s
Betrachtet man nicht mehr Vektoren der Amplitude von ±6 Bildpunkten, sondern Vektoren von ±14 Bildpunkten in waagrechter Bildrichtung und von ±8 Bildpunkten in senkrechter Bildrichtung, dann beläuft sich der maximale Durchsatz auf
99 (19+(13 2 9)+(64 8)] 12,5 = 946687,5 Bits/s
Natürlich kann anstelle der oben angegebenen Begrenzung der Anzahl von Vektoren auf 13 in allen Bildern diese Begrenzung auch dynamisch erfolgen, indem beispielsweise alle möglichen Vektoren übertragen werden, wenn der Durchsatz unter 1 Mbit/s liegt, indem aber die Anzahl von Vektoren soweit begrenzt wird, bis der Durchsatz unter 1 Mbit/s gelangt. Die Begrenzung auf 13 der Vektoren kann erfolgen, indem nur die 13 am meisten in einem Makroblock auftretenden Vektoren genommen werden und indem den entfallenen Vektoren der nächstliegende der 13 Vektoren zugeordnet wird.
Andererseits kann die normale Größe der Blöcke, die bei der HDMAC-Kodierung 16 16 Bildpunkte beträgt, ggf. verringert werden, da das erfindungsgemäße Verfahren immer angewendet werden kann, unabhängig von der gewählten maximalen oder minimalen Größe der Blöcke.
Um den Durchsatz verringern, ist es günstig, nicht mehr einen Knoten als einen speziellen ''Vektor" zu kodieren (um den Baum bei der Dekodierung wiedererstellen zu können), sondern ein Feld ARBRE wie in Figur 5 gezeigt zu übertragen, das den Kodebaum darstellt. Jedes Bit dieses Felds gibt eine Knoten oder ein Blatt an. Das erste Bit bezeichnet den Zustand der Wurzel (Block einer Größe von n n Bildpunkten, Blatt oder Knoten), das zweite, dritte, vierte und fünfte Bit den Zustand der vier Unterblöcke der Größe n/2 n/2 usw. bis zur vorletzten möglichen Ebene. So wäre in den Figuren 1A, 1B, 1C das Wort ARBRE:
1 0111 0000 0011 0110
Hierbei bedeutet:
0111 --- F&sub1;N&sub1;N&sub2;N&sub3;
0000 --- Unterblöcke von F&sub1;
0011 --- F&sub1;F&sub3;N&sub4;N&sub5;
0000 --- F&sub4;F&sub5;F&sub6;F&sub7;
0110 --- F&sub8;N&sub6;N&sub7;F&sub9;
sowie 1 = Knoten
0 = Blatt
Die Kodewörter (MCi) stellen nur noch eine der Kombinationen Modus/Vektor dar.
Für die HDMAC-Anwendung ergeben sich vier Ebenen (128, 64, 32, 16). Das Wort ARBRE enthält somit 21 Bits.
Der Gewinn an Durchsatz beruht auf der Tatsache, daß vorher ein Knoten mit ebensovielen Bits kodiert wurde, wie ein Vektor (also mit maximal 8 Bits). Geht man davon aus, daß nur 5 Knoten (unter den 21 möglichen) vorliegen, brauchte man 8 5 = 40 Bits für den Baum. Mit der vorliegenden Methode sind nur 21 Bits erforderlich. Im Grenzfall kann diese Methode einen Gewinn von
[21(Anzahl der Knoten) 8)-[21] = 147 Bits je Makroblock mit 8 Bits je Kodewort, d.h. 147 99 12,5 = 181812,5 Bits/s ergeben.
Außerdem kann mit der getrennten Kodierung des Baums der in Figur 3 gezeigte Fall verwendet werden, wenn der Baum vollständig zerlegt wird. So gewährleistet man den gleichen maximaldurchsatz wie vorher (das Wort ARBRE wird nicht übertragen).

Claims

1. Verfahren zur Kodierung eines Bewegungsfelds in einer Folge bewegter Bilder mit justierbaren Parametern, dadurch gekennzeichnet, daß es darin besteht, jedes Bewegungsfeld des Bilds gemäß einem Kodierbaum zu zerlegen, der in aufeinanderfolgenden Schritten der Zerlegung des Bilds in Blöcke bestimmter Abmessung erstellt wurde, wobei jeder erhaltene Bildblock erneut zerlegt wird, bis ein homogener Block erhalten wird, d.h. eine Bildzone mit gleichförmiger Bewegung, und dann, ausgehend von einem Menü von Vektoren (Vecti), das den Wert der im Bild vorliegenden Bewegungsvektoren (Vecti) und von Kodewörtern (MCi) enthält, die die Adresse dieser Vektoren in den Menüs angeben, die Vektoren (Vecti) entsprechend diesen homogenen Zonen zu identifizieren.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Zerlegung jedes Bewegungsfelds innerhalb von Bildblöcken (n n Bildpunkte) vorbestimmter Abmessungen stattfindet.

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Größe der Blöcke einstellbar ist.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Länge der Bewegungsvektoren eingestellt wird.

5. Verfahren nach einem beliebigen der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß es darin besteht, das Bild in Makroblöcke bestimmter Abmessung zu zerlegen und einen Kodierbaum für jeden dieser Makroblöcke so zu berechnen, daß mehrere Vektormenüs je Bild erhalten werden.

6. Verfahren nach einem beliebigen der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Zerlegung in einen Kodierbaum über zwei aufeinanderfolgende Bilder stattfindet.

7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß es darin besteht, die Anzahl von Vektoren zu begrenzen, indem die am wenigsten oft vorkommenden Vektoren entfallen.

8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Kodierbaum als ein spezieller Vektor beschrieben oder getrennt übertragen werden kann.

9. Verfahren nach Anspruch 1 oder 5, dadurch gekennzeichnet, daß es darin besteht, die Anzahl von Adressbits der Bewegungsvektoren (Vecti) abhängig von der Anzahl von Bewegungsvektoren (Vecti) im Menü festzulegen.