WO2001028252A1

WO2001028252A1 - Progressive fehlertolerante codierung bzw. decodierung einer folge von bildern

Info

Publication number: WO2001028252A1
Application number: PCT/DE2000/003536
Authority: WO
Inventors: Thomas Stockhammer; Frank Burkert; Jürgen PANDEL
Original assignee: Siemens Aktiengesellschaft
Priority date: 1999-10-08
Filing date: 2000-10-06
Publication date: 2001-04-19

Abstract

Es wird ein Verfahren zur Codierung einer Folge von Bildern angegeben, wobei jedes Bild der Folge von Bildern eine Basisinformation und eine Zusatzinformation aufweist. Die Basisinformation wird mit einem Blockcode geschützt und zusammen mit der daraus resultierenden Redundanz abgespeichert. Die Zusatzinformation wird für jedes Bild progressiv codiert, wobei mit zunehmender Progressionsstufe schrittweise der Blockcode eine geringere Redundanz und damit Fehlertoleranz aufweist.

Description

Beschreibung

PROGRESSIVE FEHLERTOLERANTE CODIERUNG BZW. DECODIERUNG EINER FOLGE VON BILDERN

Die Erfindung betrifft ein Verfahren und eine Anordnung zur Codierung bzw. Decodierung einer Folge von Bildern.

Ein Verfahren zur Bildkomprimierung mit dazugehöriger Anordnung ist bekannt aus [1] . Das bekannte Verfahren dient im MPEG-Standard als Codierverfahren und basiert im wesentlichen auf der hybriden DCT (Diskreten Cosinus Transformation) mit Bewegungskompensation. Ein ähnliches Verfahren wird für die Bildtelefonie mit n x 64kbit/s (CCITT- Empfehlung H.261), für die TV-Kontribution (CCR-Empfehlung 723) mit 34 bzw. 45Mbit/s und für Multimedia-Applikationen mit l,2Mbit/s (ISO-MPEG-1) verwendet. Die hybride DCT besteht aus einer zeitlichen Verarbeitungsstufe, die die Verwandtschaftsbeziehungen aufeinanderfolgender Bilder ausnutzt, und einer örtlichen Verarbeitungsstufe, die die Korrelation innerhalb eines Bildes ausnutzt.

Die örtliche Verarbeitung ( Intrafra e-Codierung) entspricht im wesentlichen der klassischen DCT-Codierung. Das Bild wird in Blocke von 8x8 Bildpunkten zerlegt, die jeweils mittels

DCT in den Frequenzbereich transformiert werden. Das Ergebnis ist eine Matrix von 8x8 Koeffizienten, die naherungsweise die zweidimensionalen Ortsfrequenzen im transformierten Bildblock widerspiegeln. Ein Koeffizient mit Frequenz 0 (Gleichanteil) stellt einen mittleren Grauwert des Bildblocks dar.

Nach der Transformation findet eine Datenexpansion statt. Allerdings wird in natürlichen Bildvorlagen eine Konzentration der Energie um den Gleichanteil (DC-Wert) stattfinden, wahrend die hochstfrequenten Koeffizienten meist nahezu Null sind. In einem nächsten Schritt erfolgt eine spektrale Gewichtung der Koeffizienten, so daß die Amplitudengenauigkeit der hochfrequenten Koeffizienten verringert wird. Hierbei nutzt man die Eigenschaften des menschlichen Auges aus, das hohe Ortsfrequenzen weniger genau auflost als niedrige.

Ein zweiter Schritt der Datenreduktion erfolgt m Form einer adaptiven Quantisierung, durch die die Amplitudengenauigkeit der Koeffizienten weiter verringert wird bzw. durch die die kleinen Amplituden zu Null gesetzt werden. Das Maß der

Quantisierung hangt dabei vom Füllstand des Ausgangspuffers ab: Bei leerem Puffer erfolgt eine feine Quantisierung, so daß mehr Daten erzeugt werden, wahrend bei vollem Puffer grober quantisiert wird, wodurch sich die Datenmenge reduziert.

Nach der Quantisierung wird der Block diagonal abgetastet ("zιgzag"-Scannmg) , anschließend erfolgt eine Entropiecodierung, die eine weitere Datenreduktion bewirkt. Hierfür werden zwei Effekte ausgenutzt:

1.) Die Statistik der Amplitudenwerte (hohe Amplitudenwerte treten seltener auf als kleine, so daß den seltenen Ereignissen lange und den häufigen Ereignissen kurze Codeworter zugeordnet werden (Variable-Length-Codierung, VLC) . Auf diese Weise ergibt sich im Mittel eine geringere Datenrate als bei einer Codierung mit fester Wortlange. Die variable Rate der VLC wird anschließend im Pufferspeicher geglättet.

2.) Man nutzt die Tatsache aus, daß von einem bestimmten Wert an m den meisten Fallen nur noch Nullen folgen. Statt aller dieser Nullen übertragt man lediglich einen EOB-Code (End Of Block) , was zu einem signifikanten Codiergewinn bei der Kompression der Bilddaten fuhrt. Statt der Ausgangsrate von bspw. 512bιt sind dann nur 46bιt für diesen Block zu übertragen, was einem Kompressionsfaktor von über 11 entspricht.

Einen weiteren Kompressionsgewinn erhalt man durch die zeitliche Verarbeitung (Interframe-Codierung) . Zur Codierung von Differenzbildern wird weniger Datenrate benotigt als für die Oπgmalbilder, denn die Amplitudenwerte sind weitaus geringer.

Allerdings sind die zeitlichen Differenzen nur klein, wenn auch die Bewegungen im Bild gering sind. Sind hingegen die Bewegungen im Bild groß, so entstehen große Differenzen, die wiederum schwer zu codieren sind. Aus diesem Grund wird die Bild-zu-Bild-Bewegung gemessen (Bewegungsschatzung) und vor der Differenzbildung kompensiert (Bewegungskompensation) .

Dabei wird die Bewegungsinformation mit der Bildinformation übertragen, wobei üblicherweise nur ein Bewegungsvektor pro Makroblock (z.B. vier 8x8-Bιldblocke) verwendet wird.

Noch kleinere Amplitudenwerte der Differenzbilder werden erhalten, wenn statt der verwendeten Pradiktion eine bewegungskompensierte bidirektionale Pradiktion benutzt wird.

Bei einem bewegungskompensierten Hybrideoder wird nicht das Bildsignal selbst transformiert, sondern das zeitliche

Differenzsignal. Aus diesem Grund verfugt der Coder auch über eine zeitliche Rekursionsschleife, denn der Pradiktor muß den Pradiktionswert aus den Werten der bereits übertragenen (codierten) Bilder berechnen. Eine identische zeitliche Rekursionsschleife befindet sich im Decoder, so daß Coder und Decoder völlig synchronisiert sind.

Im MPEG-2-Codιerverfahren gibt es hauptsachlich drei verschiedene Methoden, mit denen Bilder verarbeitet werden können: I-Bilder: Bei den I-Bildern wird keine zeitliche Pradiktion verwendet, d.h., die Bildwerte werden direkt transformiert und codiert. I-Bilder werden verwendet, um den Decodiervorgang ohne Kenntnis der zeitlichen Vergangenheit neu beginnen zu können, bzw. um eine Resynchronisation bei Übertragungsfehlern zu erreichen.

P-Bilder: Anhand der P-Bilder wird eine zeitliche Pradiktion vorgenommen, die DCT wird auf den zeitlichen

Pradiktionsfehler angewandt.

B-Bilder: Bei den B-Bildern wird der zeitliche bidirektionale Pradiktionsfehler berechnet und anschließend transformiert. Die bidirektionale Pradiktion arbeitet grundsatzlich adaptiv, d.h. es wird eine Vorwartspradiktion, eine Ruckwartspradiktion oder eine Interpolation zugelassen.

Ein Bildsequenz wird bei der MPEG-2-Codιerung m sog. GOPs

(Group Of Pictures) eingeteilt, n Bilder von einem I-Bild zum nächsten bilden eine GOP . Der Abstand zwischen den P-Bildern wird mit m bezeichnet, wobei sich jeweils m-1 B-Bilder zwischen den P-Bildern befinden. Die MPEG-Syntax überlaßt es jedoch dem Anwender, wie m und n gewählt werden, m-1 bedeutet, daß keine B-Bilder verwendet werden, und n=l bedeutet, daß nur I-Bilder codiert werden.

Aus [2] ist em Verfahren zur Bewegungsschatzung im Rahmen eines Verfahrens zur blockbasierten Bildcodierung bekannt. Dabei wird vorausgesetzt, daß ein digitalisiertes Bild Bildpunkte aufweist, die in Bildblocken von insbesondere 8x8 Bildpunkten oder 16x16 Bildpunkten zusammengefaßt sind. Gegebenenfalls kann ein Bildblock auch mehrere Bildblocke umfassen. Ein Beispiel hierfür stellt ein Makroblock mit 6 Bildblocken dar, von denen 4 Bildblocke für Helligkeitsinformation und 2 Bildblocke für Farbinformation vorgesehen sind.

Bei einer Folge von Bildern wird für ein zu codierendes Bild unter Berücksichtigung der Bildblocke dieses Bildes wie folgt verfahren:

■ Es wird für den Bildblock, für den eine Bewegungsschatzung durchgeführt werden soll, in einem zeitlich vorhergehenden Bild, ausgehend von einem Bildblock, der sich m der gleichen relativen Position in dem vorhergehenden Bild befand

(= vorangegangener Bildblock) , ein Wert für ein Fehlermaß bestimmt. Dazu wird bevorzugt eine Summe über die Betrage der Differenzen von den Bildpunkten zugeordneter Codierungsinformation des Bildblocks und des vorangegangenen Bildblocks bestimmt.

Unter Codierungsinformation ist hierbei eine Helligkeitsinformation (Lummanzwert) und/oder eine Farbinformation (Chrominanzwert) zu verstehen, welche jeweils einem Bildpunkt zugeordnet ist. " In einem Suchraum vorgebbarer Große und Form um die Ausgangsposition m dem zeitlich vorhergehenden Bild wird jeweils für em Gebiet derselben Große des vorangegangenen Bildblocks, verschoben um einen oder einen halben Bildpunkt, em Wert des Fehlermaßes bestimmt.

^■ In einem Suchraum der Große nxn-Bildpunkte ergeben

2 sich n (Fehler-) Werte . Es wird derjenige verschobene vorangegangene Bildblock in dem zeitlich vorhergehenden Bild ermittelt, für den das Fehlermaß einen minimalen Fehlerwert ergibt. Für diesen

Bildblock wird angenommen, daß dieser vorangegangene Bildblock mit dem Bildblock des zu codierenden Bildes, für den die Bewegungsschatzung durchgeführt werden soll, am besten übereinstimmt. ■ Das Ergebnis der Bewegungsschatzung ist ein

Bewegungsvektor, mit dem die Verschiebung zwischen dem Bildblock m dem zu codierenden Bild und dem ausgewählten Bildblock in dem zeitlich vorhergehenden Bild beschrieben wird.

■ Eine Kompression der Bilddaten wird dadurch erreicht, daß der Bewegungsvektor und das Fehlersignal codiert werden.

■ Insbesondere wird die Bewegungsschatzung für jeden Bildblock eines Bildes durchgeführt.

Ein objektbasiertes Bildkompressionsverfahren basiert auf einer Zerlegung des Bildes in Objekte mit beliebiger

Berandung. Die einzelnen Objekte werden in verschiedenen "Video Object Plans" getrennt voneinander codiert, übertragen und in einem Empfanger (Decoder) wieder zusammengesetzt. Wie oben beschrieben, wird be herkömmlichen Codierverfahren das gesamte Bild in quadratische Bildblocke unterteilt. Dieses Prinzip wird auch bei objektbasierten Verfahren übernommen, indem das zu codierende Objekt in quadratische Blocke unterteilt und für jeden Block separat eine Bewegungsschatzung mit einer Bewegungskompensation durchgeführt wird.

Bei der Übertragung einer Folge von Bildern (Bilddaten) über einen gestörten Kommunikationskanal, insbesondere einen mobilen (Funk-) Kanal oder einen verlustbehafteten drahtgebundenen Kanal, können Teile der Bilddaten verloren gehen. Ein solcher Verlust der Bilddaten äußert sich m Form drastischer Qualitatsembruche m mehr oder weniger großen Bildbereichen. Da, wie oben beschrieben, bei Bildcodierung/Bilddecodierung Verfahren der Bewegungsschatzung mit Bewegungskompensation eingesetzt werden, verschwindet die Bildstörung auch dann nicht, wenn der Ubertragungskanal wieder eine fehlerfreie Übertragung gewährleistet. Dies liegt daran, daß sich bei der Bewegungsschatzung insbesondere e einmal auftretender Fehler bis zur Übertragung des nächsten Vollbildes

(Intrabild) fortbesteht. Es erfolgt daher eine äußerst störende Fehlerfortpflanzung. Videodatenkompressionsverfahren nach bekannten Standards H.261, H.263, MPEG-1/2/4 verwenden eine bewegungskompensierte Pradiktion (Bewegungsschatzung mit Fehlerkorrektur) und eine transformationsbasierte Restfehlercodierung, wobei bevorzugt die diskrete Cosinustransformation als

Transformationscodierung eingesetzt wird. MPEG-2 enthalt Vorschlage für eine skalierbare Codierung (hierarchische Codierung) . Dabei wird ein Bild unterteilt eine Basisinformation mit einer vorgegebenen Bildqualltat und einer Zusatzinformation, die zur Herstellung einer vollständigen Bildqualltat (ausreichende Bildqualitat) zusätzlich codiert und übertragen wird. Bei Übertragungsfehlern im Bereich der Zusatzinformation ist immer noch sichergestellt, daß das jeweilige Bild in einer Qualität, die durch die Basisinformation hergestellt ist, rekonstruiert werden kann.

Ferner bekannt ist em progressives Verfahren zur Codierung von Einzelbildern (siehe [3, 4]). Dabei reicht bereits eine geringe Datenmenge aus, um das Bild m einer Basisqualitat zu rekonstruieren. Je mehr zusätzliche Daten empfangen werden, desto besser wird die Qualltat des Bildes.

In [5] wird vorgeschlagen, em solch progressives

Bildcodierverfahren für die Codierung von Bewegtbildern einzusetzen.

Verfahren zur Fehlerkompensation bzw. Fehlerkorrektur sind in [6] beschrieben. Insbesondere eignet sich der sogenannte

Reed-Solomon-Code zur nahezu optimalen Codierung, das heißt mit einer geringen Menge an Redundanz ist es möglich, viele Fehler der zu übertragenden Information zu kompensieren.

Nun ist es von Nachteil, daß auch bei der progressiven Bildcodierung eine Störung ohne Fehlerschutz m dem Übertragungskanal zu lang anhaltenden, drastischen Qualitatsembußen fuhrt.

Die Aufgabe der Erfindung besteht darin, eine Möglichkeit der fehlertoleranten Codierung einer Folge von Bildern anzugeben, wobei insbesondere eine möglichst effiziente Nutzung des gestörten Kanals hinsichtlich Bildqualitat der Folge von Bildern erreicht wird.

Diese Aufgabe wird gemäß den Merkmalen der unabhängigen

Patentansprüche gelost. Weiterbildungen der Erfindung ergeben sich auch aus den abhangigen Ansprüchen.

Zur Losung der Aufgabe wird e Verfahren zur Codierung einer Folge von Bildern angegeben, wobei jedes Bild der Folge von Bildern eine Basisinformation und eine Zusatzinformation aufweist. Die Basisinformation wird mit einem Blockcode geschützt und zusammen mit der daraus resultierenden Redundanz abgespeichert. Die Zusatzinformation wird für jedes Bild progressiv codiert, wobei mit zunehmender

Progressionsstufe schrittweise der Blockcode eine geringere Redundanz und damit Fehlertoleranz aufweist.

Hierbei sei angemerkt, daß die Codierung jedes Bildes auch einen Bildbereich, insbesondere em Bildobjekt innerhalb des Bildes, umfassen kann.

Unter progressiver Codierung wird verstanden, daß die Bildqualitat eines Bildes mit der Anzahl der übertragenen Bilddaten steigt, wobei jeder Schritt der progressiven

Codierung, das heißt ede Progressionsstufe, eine qualitative Verbesserung des Gesamtbildes (oder entsprechend eines Teils des Gesamtbildes) bewirkt. Liegt innerhalb einer Progressionsstufe em Ubertragungsfehler vor, der nicht mittels Blockcode kompensiert werden kann, so kann insbesondere von den weiteren progressiven Bilddaten zur Verbesserung dieses Bildes abgesehen werden; die Bildqualitat wird nach Auftreten eines nicht korrigierbaren Übertragungsfehlers nicht weiter verbessert.

Daher ist es zweckmäßig, auch die progressiv codierte Zusatzinformation mit Redundanz zu versehen, so daß, zumindest in den ersten Progressionsstufen, eine vorbestimmte Anzahl von Übertragungsfehlern kompensierbar ist. Dadurch ist sichergestellt, daß bei einem qualitativ "ausreichenden" Kanal im Mittel einige Progressionsstufen zur Verbesserung des Bildes herangezogen werden können.

Grundsatzlich gilt, daß, je mehr Daten bei konstanter Datenrate für die Fehlerkorrektur vorgesehen sind, desto schlechter ist (bei einem ungestörten Kanal) die Bildqualitat des übertragenen Bildes. Der Kompromiß besteht somit zum einen darin, entsprechend dem Ubertragungskanal ausreichend Redundanz für die Basisinformation vorzusehen, so daß sichergestellt ist, daß die Basisinformation auch bei Störung des Ubertragungskanals wiederhergestellt werden kann. Die Zusatzinformation wird zweckmäßig von Progressionsstufe zu Progressionsstufe mit weniger Redundanz versehen, so daß abhangig von der Störung des Ubertragungskanals nur eine graduelle Verschlechterung des Bildes erzielt wird. Dadurch ist vorteilhaft gewährleistet, daß sich keine Übertragungsfehler von Bild zu Bild fortpflanzen und die

Anpassung der Qualltat des Bildes an die Übertragungsqualltat des Kanals dynamisch erfolgt. Unterliegt der

Ubertragungskanal starken qualitativen Schwankungen, so wird mit dem vorgestellten Verfahren gewährleistet, daß einige Bilder graduell schlechter, andere wieder qualitativ besser übertragen werden. Die Bilder werden dabei stets mindestens in der der Basisinformation entsprechenden Bildqualitat übertragen .

Hierbei sei angemerkt, daß im beschriebenen Szenario davon ausgegangen wird, daß die Folge von Bildern auf Seite eines Encoders codiert wird und über den beschriebenen Übertragungskanal zu einem Decoder übertragen wird. Der Decoder sorgt für die Wiederherstellung der Basisinformation und, soweit möglich, der Zusatzinformation und stellt insbesondere die erhaltene Folge von Bildern dar.

Eine Weiterbildung besteht darin, daß die Redundanz zur Basisinformation derart bemessen wird, daß eine Wiederherstellung der Basisinformation durch einen Decoder auch bei entsprechend schlechtem Übertragungskanal erfolgen kann .

Eine andere Weiterbildung besteht darin, daß für die Zusatzinformation ab einer vorgegebenen Progressionsstufe keine eigene Redundanz vorgesehen wird. Ab dieser Progressionsstufe können somit keine Übertragungsfehler kompensiert werden.

Eine Ausgestaltung besteht darin, daß der Blockcode em Reed- Solomon-Code ist.

Eine andere Ausgestaltung besteht darin, daß die Basisinformation zeitlich aufeinanderfolgender Bilder dazu genutzt wird, daß eine Bewegungsschatzung mit Fehlerkorrektur durchgeführt wird. Insbesondere erfolgt die Bewegungsschatzung mit Fehlerkorrektur nur anhand der übertragenen Basismformationen. Anhand der auf den Basisinformationen aufbauenden Zusatzinformationen erfolgt keine Bewegungsschatzung. Somit wird die Zusatzinformation zur Verbesserung der Bildqualitat jedes einzelnen Bildes eingesetzt, Fehler m der Zusatzinformation spielen dann nur für dieses jeweilige Bild eine Rolle. Bei dem nachfolgenden Bild wird erneut Zusatzinformation rekonstruiert, so daß die Fehler m der Zusatzinformation des vorangegangenen Bildes keine Rolle spielen.

Eine andere Weiterbildung besteht darin, daß die Zusatzinformation der Bilder selbst unterteilt ist eine erste Ebene und in eine zweite Ebene, wobei die erste Ebene mittels umfangreicherer Redundanz rekonstruierbar ist als die zweite Ebene und damit eine Bewegungsschatzung mit/ohne Fehlerkorrektur auch auf der ersten Ebene durchgeführt werden kann.

Eine andere Ausgestaltung besteht darin, daß bei Unterschreiten einer vorgegebenen Gute für den Übertragungskanal (dynamisch) eine Intrabild-Codierung erfolgt. In so einem Fall kann sichergestellt werden, daß anhand der Intrabild-Codierung em vollständiges Bild (ohne Bewegungsschatzung) übertragen wird.

Eine Weiterbildung besteht darin, eine Decodierung der Folge von Bildern durchzufuhren, wobei für jedes Bild eine

Umsetzung bzw. Rekonstruktion der Basismformation und eine Umsetzung bzw. Rekonstruktion der Zusatzinformation (jeweils - wenn möglich - anhand der Redundanz) durchgeführt wird.

Eine andere Weiterbildung besteht darin, daß die Decodierung eines Bildes abgeschlossen wird, sobald die Zusatzinformation nicht mehr rekonstruierbar ist. In so einem Fall smd auf dem Ubertragungskanal Fehler aufgetreten, die anhand der Redundanz (so sie vorhanden ist) nicht mehr rekonstruierbar smd. Demnach smd die weiteren Informationen der progressiven Codierung nicht mehr verwertbar.

Eine Ausgestaltung besteht darin, daß der Ubertragungskanal em mobiler Kanal, d.h. insbesondere em Kanal für Mobilfunk, ist, auf dem Paketverluste auftreten können. Weiterhin kann der Ubertragungskanal bei Internetanwendungen eingesetzt werden, sei er dabei mobil oder stationär (drahtgebunden) ausgeführt. Auch bei Internetanwendungen können auf dem Ubertragungskanal Paketverluste auftreten. Das oben beschriebene Verfahren stellt auch auf derartigen

Ubertragungskanalen eine effiziente Bildcodierung bzw. Bilddecodierung sicher. Auch wird zur Losung der Aufgabe eine Anordnung zur Codierung einer Folge von Bildern angegeben, wobei jedes Bild der Folge von Bildern eine Basisinformation und eine Zusatzinformation aufweist. Die Anordnung umfaßt eine Prozessoreinheit, die derart eingerichtet ist, daß a) die Basisinformation mit einem Blockcode geschützt werden kann und mit der daraus resultierenden Redundanz abspeicherbar ist; b) die Zusatzinformation für jedes Bild progressiv codierbar ist, wobei mit zunehmender Progressionsstufe schrittweise der Blockcode eine geringere Redundanz und damit Fehlertoleranz aufweist.

Auch ist eine Anordnung zur Decodierung einer Folge von

Bildern vorgesehen, der eine Prozessoreinheit aufweist, die derart eingerichtet ist, daß a) eine Umsetzung bzw. Rekonstruktion der Basisinformation und b) eine Umsetzung bzw. Rekonstruktion der Zusatzinformation erfolgt .

Diese Anordnungen smd insbesondere geeignet zur Durchfuhrung des erfmdungsgemäßen Verfahrens oder einer seiner vorstehend erläuterten Weiterbildungen.

Ausfuhrungsbeispiele der Erfindung werden nachfolgend anhand der Zeichnungen dargestellt und erläutert.

Es zeigen

Fig.l eine Skizze, die eine Codierung von Bildern, die jeweils Basisinformation und Zusatzinformation aufweisen, veranschaulicht; Fig.2 eine Skizze, die veranschaulicht, wie die progressive fehlertolerante Codierung eines Bildes erfolgt;

Fig.3 eine Skizze mit einem Bildcoder und einem Bilddecoder;

Fig.4 eine Prozessoreinheit.

In Fig.l wird eine Skizze gezeigt, die eine Codierung von Bildern, die jeweils Basisinformationen und

Zusatzinformationen aufweisen, veranschaulicht. Dazu smd drei Bilder 101, 102 und 103 dargestellt, die jeweils eine Basisinformation B und eine Zusatzinformation Z aufweisen. Anhand einer Redundanz zu der Basisinformation B ist sichergestellt, daß für jedes Bild die Basisinformation B, auch bei gestörtem Ubertragungskanal, rekonstruierbar ist. Durch diese Rekonstruierbarkeit erfolgt für die Basismformation B eine fehlerfreie Bewegungskompensation, das heißt aufgrund der zuverlässig erhaltenen Basisinformation B ist eine Pradiktion eines aktuellen Bildes aus dem vorangegangenen Bild möglich. Die Zusatzinformation Z setzt auf der Basisinformation B jedes einzelnen Bildes 101 bis 103 auf. Die Zusatzinformationen Z der Bilder smd untereinander nicht verknüpft, das heißt abhangig von der aktuellen Störung des Ubertragungskanals wird pro Bild mehr oder weniger Zusatzinformation Z m Form eines progressiven Verfahrens genutzt, um die jeweilige Bildqualitat des einzelnen Bildes mehr oder weniger stark zu verbessern. Ist beispielsweise der Ubertragungskanal kurzfristig stark gestört, so kann es bei einem einzelnen Bild dazu kommen, daß nur wenig Daten der Zusatzinformation Z zur Rekonstruktion des Bildes eingesetzt werden können. In diesem Fall konnte dieses Bild einer Qualltat dargestellt werden, die sich nur unwesentlich von der durch die Basisinformation B sichergestellten Qualltat unterscheidet. Ist die

(kurzfristige) Störung des Ubertragungskanals vorbei, so kann bereits im zeitlich nachfolgenden Bild (bei geringer bzw. ganzlich ohne Störung des Ubertragungskanals) die gesamte Zusatzinformation Z verwertbar sein, dieses nachfolgende Bild wird demnach in (bestmöglicher) Qualltat, die aus Informationen der Basisinformation B und Zusatzinformation Z besteht, dargestellt. Das Verfahren ermöglicht somit eine graduelle Verschlechterung einzelner stark gestörter Bilder, ohne daß diese Verschlechterung auf nachfolgende Bilder Einfluß nimmt.

Fig.2 zeigt eine Skizze, die veranschaulicht, wie die progressive fehlertolerante Codierung eines Bildes erfolgt. Dazu ist em Bild 201 dargestellt, das Basisinformation BgxK_ß mit zugehöriger Redundanz BgxKp umfaßt. Die Redundanz ist dazu geeignet, daß e entsprechender Blockcode (insbesondere em Reed-Solomon-Code) gewährleistet, daß auch bei Störung des Übertragungskanals die Basisinformation B_ßXKg wiederherstellbar ist. Ferner weist das Bild 201 Zusatzinformation auf, die für jede Progressionsstufe B^ (ι ist die Progressionsstufe, wobei gilt: l = 1..5) im Vergleich zu einer vorangegangenen Progressionsstufe Bz₍ι-i₎ eine geringere Datenmenge als Redundanz KR_X bereitgestellt wird, mit jeder Progressionsstufe erfolgt (falls die Zusatzinformation der Progressionsstufe ohne Störung empfangen wurde bzw. die Redundanz dieser Progressionsstufe eine Wiederherstellung der Zusatzinformation erlaubt) eine neue schrittweise qualitative Verbesserung des Bildes. Um hohe Progressionsstufen, die spat folgen (d.h. hoher Wert l) und zu einer zusätzlichen qualitativen Aufwertung des Bildes fuhren, nutzen zu können, ist es sinnvoll, niedrige Progressionsstufen mit Redundanz zu versehen.

Die anteilige Redundanz ist m Fig.2 eingezeichnet (für die erste Progressionsstufe B21 ist dies die Redundanz K^i). Nun ist es sinnvoll, mit wachsender Progressionsstufe innerhalb dieser der Zusatzmformation einen größeren Anteil als der

Redundanz einzuräumen. So stellt die Basisinformation bereits eine M destqualitat des Bildes sicher, eine schrittweise Verbesserung anhand der Zusatzinformation soll unter Berücksichtigung der dynamischen "Storverhaltnisse" des Übertragungskanals erfolgen. Die Storverhaltnisse werden effektiv berücksichtigt, indem eine schrittweise Abstufung der zu der jeweiligen Zusatzinformation gehörenden Redundanz erfolgt.

Das Übertragungssystem erlaubt eine Bitrate von R^ in Bit/s. Eine Bildwiederholrate sei Rf, angegeben in Frames/s. Damit betragt die Anzahl N der je Bildrahmen (Frame) im zeitlichen Mittel übertragbaren Bits:

N - ^Rb^D

Rf

wobei N auch der Große des BxNg Blockmterleavers (siehe [5]) entspricht. Durch eine Ratenkontrolle des Videocoders ist die Anzahl der je Frame generierten Bits bekannt. Ebenso bekannt, sei es durch Abschätzung oder durch Messung, ist die maximal auftretende Paketfehlerrate bzw. Paketverlustrate bei einer bestimmten Paketgroße auf dem Ubertragungskanal. Mit Hilfe dieser Großen können nun der (Ng, Kg) -Blockcode und der Blockmterleaver parametrisiert werden. Vorteilhaft wird dazu eine Reed-Solomon-Code über einen Galois-Feld GF(2^m) gewählt. Dann werden bei der Codierung Kg*m Informationsbits auf Ng Symbole der Lange m Bits abgebildet und der Code kann

(N_B - K_B)

Fehler

2

bzw.

(Ng - Kg) Erasures

korrigieren. Hierbei sei angemerkt, daß bei Erasures die Position des Datenverlusts bekannt ist. Durch Codeverkurzung kann jedes beliebige N_B realisiert werden. Dann werden die Zusatzinformationen mit einem (N_B,Kg) Reed-Solomon-Code codiert. Aus der Codierung resultieren B_B Codeworte für die Basisinformation bzw. Bg Codeworte für die Zusatzinformation. Die Parameter erfüllen zweckmäßig die Bedingung

(B_B+B_E)*N_B*m = N.

Basiert die Zusatzinformation auf einer progressiven

Videocodierung, ist es vorteilhaft, anstatt eines (N_B,Kg)- Blockcodes mehrere verschiedene (N_B,KE_I)~ Blockcodes für die Fehlertoleranz der Zusatzinformation zu verwenden. Die für die Rekonstruktion signifikante Information erfahrt dadurch einen höheren Schutz gegen Ubertragungsfehler (größere

Fehlertoleranz) als die weniger wichtige Zusatzinformation, so daß die Bildqualitat im Mittel optimal ist. Mit einer zunehmenden Paketfehlerrate können immer weniger Teile der Zusatzinformation rekonstruiert werden. Die Bildqualitat geht langsam auf die durch die Basisinformation sichergestellte Bildqualitat zurück.

Fig.3 zeigt eine Skizze einer Anordnung zur Durchfuhrung eines blockbasierten Bildcodierverfahrens .

Em zu codierender Videodatenstrom mit zeitlich aufeinanderfolgenden digitalisierten Bildern wird einer Bildcodierungsemheit 1201 zugeführt. Die digitalisierten Bilder smd unterteilt in Makroblocke 1202, wobei jeder Makroblock 16x16 Bildpunkte hat. Der Makroblock 1202 umfaßt vier Bildblocke 1203, 1204, 1205 und 1206, wobei jeder Bildblock 8x8 Bildpunkte, denen Lummanzwerte (Helligkeitswerte) zugeordnet smd, enthalt. Weiterhin umfaßt jeder Makroblock 1202 zwei Chrommanzblocke 1207 und 1208 mit den Bildpunkten zugeordneten Chrominanzwerten (Farbdifferenzwerte) . Die Bildblocke werden einer Transformationscodierungsemheit 1209 zugeführt. Bei einer Differenzbildcodierung werden zu codierende Werte von Bildblocken zeitlich vorangegangener Bilder von den aktuell zu codierenden Bildblocken abgezogen, es wird nur die Differenzbildungsmformation 1210 der Transformationscodierungsemheit (Diskrete Cosinus Transformation, DCT) 1209 zugeführt. Dazu wird über eine Verbindung 1234 der aktuelle Makroblock 1202 einer Bewegungsschatzungsemheit 1229 mitgeteilt. In der Transformationscodierungse heit 1209 werden für die zu codierenden Bildblocke bzw. Differenzbildblocke Spektralkoeffizienten 1211 gebildet und einer Quantisierungseinheit 1212 zugeführt. Quantisierte Spektralkoeffizienten 1213 werden sowohl einer Scaneinheit 1214 als auch einer mversen

Quantisierungseinheit 1215 m einem Ruckwartspfad zugeführt. Nach einem Scanverfahren, z.B. einem "zιgzag"-Scanverfahren, wird auf den gescannten Spektralkoeffizienten 1232 eine Entropiecodierung m einer dafür vorgesehenen Entropiecodierungseinheit 1216 durchgeführt. Die entropiecodierten Spektralkoeffizienten werden als codierte Bilddaten 1217 über einen Kanal, vorzugsweise eine Leitung oder eine Funkstrecke, zu einem Decoder übertragen.

In der mversen Quantisierungseinheit 1215 erfolgt eine mverse Quantisierung der quantisierten Spektralkoeffizienten 1213. So gewonnene Spektralkoeffizienten 1218 werden einer mversen Transformationscodierungsemheit 1219 (Inverse Diskrete Cosinus Transformation, IDCT) zugeführt. Rekonstruierte Codierungswerte (auch Differenzcodierungswerte) 1220 werden im Differenzbildmodus einen Addierer 1221 zugeführt. Der Addierer 1221 erhalt ferner Codierungswerte eines Bildblocks, die sich aus einem zeitlich vorangegangenen Bild nach einer bereits durchgeführten Bewegungskompensation ergeben. Mit dem Addierer 1221 werden rekonstruierte

Bildblocke 1222 gebildet und m einem Bildspeicher 1223 abgespeichert . Chrominanzwerte 1224 der rekonstruierten Bildblocke 1222 werden aus dem Bildspeicher 1223 einer Bewegungskompensationse heit 1225 zugeführt. Für Helligkeitswerte 1226 erfolgt eine Interpolation in einer dafür vorgesehenen Interpolationsemheit 1227. Anhand der Interpolation wird die Anzahl in dem jeweiligen Bildblock enthaltener Helligkeitswerte vorzugsweise verdoppelt. Alle Helligkeitswerte 1228 werden sowohl der Bewegungskompensationsemheit 1225 als auch der Bewegungsschatzungsemheit 1229 zugeführt. Die Bewegungsschatzungsemheit 1229 erhalt außerdem die Bildblocke des jeweils zu codierenden Makroblocks (16x16 Bildpunkte) über die Verbindung 1234. In der Bewegungsschatzungsemheit 1229 erfolgt die

Bewegungsschatzung unter Berücksichtigung der interpolierten Heiligkeitswerte ("Bewegungsschatzung auf Halbpixelbasis"). Vorzugsweise werden bei der Bewegungsschatzung absolute Differenzen der einzelnen Heiligkeitswerte m dem aktuell zu codierenden MakroblocK 1202 und dem rekonstruierten

Makroblock aus dem zeitlich vorangegangenen Bild ermittelt.

Das Ergebnis der Bewegungsschatzung ist em Bewegungsvektor 1230, durch den eine örtliche Verschiebung des ausgewählten Makroblocks aus dem zeitlich vorangegangenen Bild zu dem zu codierenden Makroblock 1202 zum Ausdruck kommt.

Sowohl Helligkeitsmformation als auch Chrominanzinformation bezogen auf den durch die Bewegungsschatzungsemheit 1229 ermittelten Makroblock werden um den Bewegungsvektor 1230 verschoben und von den Codierungswerten des Makroblocks 1202 subtrahiert (siehe Datenpfad 1231).

In Fig. ist eine Prozessoreinheit PRZE dargestellt. Die Prozessoreinheit PRZE umfaßt einen Prozessor CPU, einen

Speicher MEM und eine Input/Output-Schmttstelle IOS, die über e Interface IFC auf unterschiedliche Art und Weise genutzt wird: Über eine Grafikschnittstelle wird eine Ausgabe auf einem Monitor MON sichtbar und/oder auf einem Drucker PRT ausgegeben. Eine Eingabe erfolgt über eine Maus MAS oder eine Tastatur TAST. Auch verfügt die Prozessoreinheit PRZE über einen Datenbus BUS, der die Verbindung von einem Speicher MEM, dem Prozessor CPU und der Input/Output-Schnittstelle IOS gewährleistet. Weiterhin sind an den Datenbus BUS zusätzliche Komponenten anschließbar, z.B. zusätzlicher Speicher, Datenspeicher (Festplatte) oder Scanner.

Literaturverzeichnis :

[1] J. De Lameillieure, R. Schäfer: "MPEG-2-Bildcodierung für das digitale Fernsehen", Fernseh- und Kino-Technik, 48. Jahrgang, Nr.3/1994, Seiten 99-107.

[2] M. Bierling: "Displacement Estimation by Hierarchical

Blockmatching", SPIE, Vol.1001, Visual Communications and Image Processing '88, S.942-951, 1988.

[3] Terminals for Telematic Services, ISO/IEC 10918 T.80- T.87.

[4] A. Said, W. A. Pearlman: "A new, fast, and efficient image coded based on set partitioning in hierarchical trees", IEEE Transactions on Circuits and Systems for Video Technology, vol. 6, pp 243-250, June 1996

[5] Weiping Li : "Fine Granularity Using Bit-Plane Coding of DCT-Coefficients", ISO/IEC JTC1/SC29/WG 11, no . MPEG98/4204.

[6] Shu Lin, Daniel Costello: "Error Control Coding", Prentice-Hall, 1983.

Claims

Patentansprüche

1. Verfahren zur Codierung einer Folge von Bildern, wobei jedes Bild der Folge von Bildern eine Basisinformation und eine Zusatzinformation aufweist, a) bei dem die Basisinformation anhand eines Blockcodes mit einer Redundanz abgespeichert wird; b) bei dem die Zusatzinformation für jedes Bild progressiv coα ert wird, wobei mit zunehmender Progressionsstufe schrittweise der Blockcode eine geringere Redundanz zum Fehlerschutz aufweist.

2. Verfahren nach Anspruch 1, bei dem die Redundanz zur Basismformation derart bemessen wird, daß eine Wiederherstellung der

Basisinformation durch einen Decoder auch auf einem schlechten Ubertragungskanal erfolgen kann.

3. Verfahren nach Anspruch 1 oder 2, bei dem für die Zusatzinformation ab einer vorgegebenen Progressionstufe kein Fehlerschutz vorgesehen wird.

4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Blockcode em Reed-Solomon-Code ist.

5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Basisinformationen zeitlich aufeinanderfolgender Bilder genutzt werden, um eine Bewegungsschatzung und eine Bewegungskompensation durchzufuhren.

6. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Zusatzinformationen der Bilder wiederum unterteilt smd m eine erste Ebene und m eine zweite Ebene, wobei die erste Ebene mittels umfangreicherer

Redundanz als die zweite Ebene rekonstruierbar ist und damit eine Bewegungsschatzung und eine Bewegungskompensation auch auf der ersten Ebene durchgeführt wird.

7. Verfahren nach einem der vorhergehenden Ansprüche, bei dem bei Unterschreiten einer vorgegebener Gute für den Übertragungskanal eine Intrabild-Codierung durchgeführt wird.

8. Verfahren zur Decodierung einer Folge von Bildern, die nach einem der vorhergehenden Ansprüche codiert wurde, bei dem für jedes Bild a) eine Umsetzung bzw. Rekonstruktion der Basisinformation und b) eine Umsetzung bzw. Rekonstruktion der Zusatzinformation erfolgt.

9. Verfahren nach Anspruch 8, bei dem em Abbruch der Decodierung des jeweiligen Bildes erfolgt, sobald die Zusatzinformation nicht mehr rekonstruierbar ist.

10. Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Ubertragungskanal em mobiler Kanal ist, auf dem Paketverluste auftreten können.

11. Verfahren nach einem der Ansprüche 1 bis 9, bei dem der Ubertragungskanal für Internetanwendungen eingesetzt wird, wobei auf dem Kanal Paketverluste auftreten können.

12. Anordnung zur Codierung einer Folge von Bildern, wobei jedes Bild der Folge von Bildern eine Basismformation und eine Zusatzinformation aufweist, bei der eine Prozessoremheit vorgesehen ist, die derart eingerichtet ist, daß a) die Basisinformation anhand eines Blockcodes mit einer Redundanz abspeicherbar ist; b) die Zusatzinformation für jedes Bild progressiv codierbar ist, wobei mit zunehmender Progressionsstufe schrittweise der Blockcode eine geringere Fehlertoleranz aufweist.

13. Anordnung zur Decodierung einer Folge von Bildern, die nach mittels einer Anordnung nach Anspruch 12 codiert wurde, bei der eine Prozessoreinheit vorgesehen ist, die derart eingerichtet ist, daß a) eine Umsetzung bzw. Rekonstruktion der Basisinformation und b) eine Umsetzung bzw. Rekonstruktion der Zusatzinformation erfolgt.