DE10225434B4 - Verfahren und Vorrichtung zur Videocodierung - Google Patents
Verfahren und Vorrichtung zur Videocodierung Download PDFInfo
- Publication number
- DE10225434B4 DE10225434B4 DE10225434A DE10225434A DE10225434B4 DE 10225434 B4 DE10225434 B4 DE 10225434B4 DE 10225434 A DE10225434 A DE 10225434A DE 10225434 A DE10225434 A DE 10225434A DE 10225434 B4 DE10225434 B4 DE 10225434B4
- Authority
- DE
- Germany
- Prior art keywords
- image
- prediction
- reference images
- predicted image
- blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Abstract
Verfahren
zur Videocodierung, bei dem mindestens ein prädiziertes Bild (n) einer Bildfolge
aus mindestens zwei Referenzbildern, die sich in beliebiger zeitlicher
Lage vor und/oder nach dem prädizierten
Bild befinden, derart gebildet wird, dass mindestens zwei Referenzbildern
unterschiedliche Gewichte (g1, g2 ...) zugeordnet werden und dass
das prädizierte
Bild durch eine gewichtete Mittelwertbildung aus den mindestens
zwei Referenzbildern berechnet wird.
Description
- Die Erfindung betrifft ein Verfahren bzw. eine Vorrichtung zur Videocodierung, bei dem/der ein prädiziertes Bild durch Mittelwertbildung von Referenzbildern erzeugt wird.
- Digitale Videodaten werden für eine Speicherung oder Übertragung in der Regel komprimiert, um das enorme Datenvolumen signifikant zu reduzieren. Die Kompression erfolgt dabei sowohl durch Elimination der in den Videodaten enthaltenen Signalredundanz als auch durch Beseitigung der für das menschliche Auge nicht wahrnehmbaren irrelevanten Signalteile. Dies wird in der Regel durch ein hybrides Codierverfahren erreicht, bei dem das zu codierende Bild zunächst zeitlich prädiziert und der verbleibende Prädiktionsfehler anschließend in den Frequenzbereich, zum Beispiel durch eine diskrete Cosinustransformation, transformiert und dort quantisiert und durch einen variablen Längencode codiert wird. Die Bewegungsinformation und die quantisierten Spektralkoeffizienten werden schließlich übertragen.
- Die Leistungsfähigkeit des hybriden Codierverfahrens hängt nun ganz wesentlich von der Güte der zeitlichen Prädiktion ab. Je besser diese Vorhersage der nächsten zu übertragenden Bildinformation ist, desto kleiner ist der nach der Prädiktion verbleibende Prädiktionsfehler und um so weniger Datenrate muss anschließend für die Codierung dieses Fehlers aufgewendet werden. Eine wesentliche Aufgabe bei der Kompression von Videodaten besteht also darin, eine möglichst exakte Prädiktion des zu codierenden Bildes aus der bereits zuvor übertragenden Bildinformation zu gewinnen.
- Die Prädiktion eines Bildes wird bisher dadurch bewirkt, dass das Bild zunächst in regelmäßige Teilstücke, typischerweise quadratische Blöcke der Größe 8×8 oder 16×16 Bildpunkte, eingeteilt wird, und für jeden dieser Bildblöcke anschließend eine Prädiktion aus der bereits im Empfänger bekannten Bildinformation durch Bewegungskompensation ermittelt wird. Es können hierbei zwei grundsätzliche Fälle der Prädiktion unterschieden werden:
- – Uni-direktionale Prädiktion: Die Bewegungskompensation erfolgt hier ausschließlich auf der Basis des zuvor übertragenden Bildes und führt zu sogenannten "P-Frames".
- – Bi-direktionale Prädiktion: Die Prädiktion des Bildes erfolgt durch Überlagerung von zwei Bildern, von denen eines zeitlich voran liegt und ein weiteres zeitlich nachfolgt und das zu sogenannten "B-Frames" führt. Zu beachten ist hierbei, dass beide Referenzbilder bereits übertragen worden sind.
- Im zuletzt genannten Fall muss der tatsächliche Prädiktionswert durch Mittelwertbildung aus beiden Referenzbildern errechnet werden. In dem bisher standardisierten Verfahren MPEG-1 bis MPEG-4 bzw. H.263 wird dazu stets eine gleichgewichtige Mittelung durchgeführt, das heißt dass die beiden möglichen Prädiktionen addiert und die resultierende Summe anschließend halbiert wird.
- Die der Erfindung zugrunde liegende Aufgabe besteht nun darin, ein Verfahren bzw. eine Vorrichtung zur Videocodierung anzugeben, bei dem/der die erforderliche Gesamtdatenrate für die Codierung des Bildes möglichst klein wird.
- Diese Aufgabe wird hinsichtlich des Verfahrens durch die Merkmale des Patentanspruchs 1 und hinsichtlich der Anordnung durch die Merkmale des Patentanspruchs 7 erfindungsgemäß gelöst.
- Die weiteren Ansprüche betreffen vorteilhafte Ausgestaltungen der Erfindung.
- Die Erfindung wird nachfolgend anhand eines in den Zeichnungen dargestellten Beispiels näher erläutert. Dabei zeigt
-
1 eine Bildfolge zur Verdeutlichung der erfindungsgemäßen Prädiktion, -
2 eine Darstellung mit zwei aufeinander folgenden Bildern zur Erläuterung einer bei der Prädiktion auftretenden Überlagerung von Blöcken und -
3 ein Blockdiagramm zur Erläuterung der erfindungsgemäßen Vorrichtung. - Die Erfindung liegt im Wesentlichen in einer Verallgemeinerung der aus der Codierung von B-Frames bekannten gleichmäßigen Überlagerung von zwei Prädiktionen hin zu einer gewichteten Überlagerung. Die Gewichtung wird dabei z. B. an die Zuverlässigkeit des für die Bestimmung der Prädiktion verwendeten Referenzbildes gekoppelt. Da ein Zusammenhang zwischen der Zuverlässigkeit und dem jeweiligen Quantisierungsparameter besteht, kann vorteilhafterweise auch eine Koppelung an den auch im Empfänger bekannten Quantisierungsparameter erfolgen.
- In
1 ist eine Bildfolge ... n–2, n–1, n, n+1, n+2 ... in einer Zeit t dargestellt. Das Bild n+1 ist hier z. B. ein reines intraframecodiertes Bild, also ein sogenanntes I-Frame, und das Bild n–1 ist beispielsweise ein prädiktiv codiertes Referenzbild, also ein sogenanntes P-Frame. Zwischen den beiden Bildern n–1 und n+1 befindet sich ein durch bidirektionale Prädiktion erzeugtes Bild, also ein sogenanntes B-Frame. Für den Fall, dass zwei oder mehrere mögliche Prädiktionen zur Verfügung stehen, werden hier die Gewichtungen g1, g2, g3, g4 ... nicht notwendigerweise gleich gewählt, sondern so bestimmt, dass eine möglichst gute Gesamtprädiktion erfolgt. Dies bedeutet, dass nicht notwendigerweise eine gleichmäßige Gewichtung für zwei Referenzbilder vorgenommen wird, sondern, wie im Blockschaltbild von3 angedeutet, jedes der beispielsweise zwei Referenzbilder mit einem Gewichtungsfaktor g1 bzw. g2 multipliziert und die beiden Produkte addiert werden. Das Resultat wird dann durch die Summe der beiden Richtungsfaktoren g1 und g2 dividiert. - Im einfachsten Fall kann dies dadurch erreicht werden, dass ein als reines intraframecodiertes Bild n+1 eine höhere Gewichtung g2 erhält als ein prädiktiv codiertes Referenzbild n–1 mit der Gewichtung g1, da intraframecodierte Bilder in der Regel eine deutlich bessere Qualität aufweisen als prädizierte Bilder.
- Die Gewichtung von I-Frames kann beispielsweise g2 = 2/3 und die Gewichtung von P-Frames g1 = 1/3 betragen.
- Hierbei müssen diese Gewichtungsfaktoren vom Sender zum Empfänger als zusätzliche Seiteninformation übertragen werden. Da sich aber die Güte der resultierenden Gesamtprädiktion durch die Adaption mit variablen Gewichtungsfaktoren deutlich verbessert, wird der Nachteil der zusätzlich zu übertragenden Seiteninformation durch die Einsparung bei der Übertragung des Prädiktionsfehlers mehr als kompensiert.
- Um die Übertragung der Gewichtungsfaktoren zu vermeiden und gleichzeitig auf die Komplexität bei einer freien Faktorenwahl auf der Senderseite zu reduzieren, kann die Bestimmung der Gewichtsfaktoren auch weiter formalisiert werden. Eine vorteilhafte Ausgestaltung besteht beispielsweise darin, dass eine inverse Kopplung der Faktoren an die Stufenbreite der für die Codierung der Referenzbilder verwendeten Quantisierer erfolgt. Konkret bedeutet dies, dass ein Block aus einem Referenzbild dann eine hohe Gewichtung erhält, wenn dieser Referenzblock mit einer niedrigen Quantisierungsstufe, also einer hohen Quantisierungsgenauigkeit, codiert wurde und umgekehrt. Die Rechtfertigung für diese Kopplung ist darin begründet, dass eine große Quantisierungsstufenbreite bzw. eine geringe Quantisierungsgenauigkeit auch mit einer entsprechend schlechten Bildqualität und damit einer geringen Zuverlässigkeit als Referenzbild verbunden ist. Da die für jeden Block verwendeten Quantisierungsstufen ohnehin übertragen werden und somit dem Empfänger bekannt sind, können die Gewichtungsfaktoren für die Überlagerung der beiden einzelnen Prädiktionen unmittelbar errechnet werden.
- In
2 ist ein Block b innerhalb des Bildes n sowie vier benachbarte Blöcke b1 ... b4 in dem Vorgängerbild n–1 dargestellt. Hieraus wird deutlich, dass der für die Prädiktion verwendete Block b im Regelfall gleichzeitig mehrere codierte Einzelblöcke im Referenzbild n–1 überlagert und eine weitere Festlegung der zu verwendenden Quantisierungsstufe erforderlich ist, da im allgemeinen Fall die Blöcke b1 ... b4 jeweils unterschiedliche Quantisierungsstufen aufweisen können. Der Gewichtungsfaktor g1 kann hierbei aus einer Mittelwertbildung aus den Quantisierungsstufen für die Blöcke b1 ... b4 oder beispielsweise durch Feststellung der größten Quantisierungsstufe der Quantisierer für diese Blöcke ermittelt werden. - Bei der Prädiktion mit Hilfe einer gewichteten Mittelwertbildung werden mindestens zwei Referenzbilder herangezogen, deren zeitliche Lage in der Bildsequenz prinzipiell völlig beliebig ist, wobei entweder mindestens ein Referenzbild vor und mindestens ein Referenzbild zeitlich nach dem prädizierten Bild n oder aber auch entweder alle Referenzbilder zeitlich vor oder alle Referenzbilder zeitlich nach dem prädizierten Bild liegen können.
Claims (7)
- Verfahren zur Videocodierung, bei dem mindestens ein prädiziertes Bild (n) einer Bildfolge aus mindestens zwei Referenzbildern, die sich in beliebiger zeitlicher Lage vor und/oder nach dem prädizierten Bild befinden, derart gebildet wird, dass mindestens zwei Referenzbildern unterschiedliche Gewichte (g1, g2 ...) zugeordnet werden und dass das prädizierte Bild durch eine gewichtete Mittelwertbildung aus den mindestens zwei Referenzbildern berechnet wird.
- Verfahren nach Anspruch 1, bei dem die Gewichte so gewählt werden, dass sie der jeweiligen Zuverlässigkeit des jeweiligen Referenzbildes für die Prädiktion entsprechen.
- Verfahren nach Anspruch 1 oder 2, bei dem ein rein intraframe (I) codiertes Referenzbild (n+1) höher gewichtet wird als ein prädiktiv (P) codiertes Referenzbild (n+1).
- Verfahren nach einem der Ansprüche 1 bis 3, bei dem die Gewichtungsfaktoren als zusätzliche Seiteninformation übertragen werden.
- Verfahren nach einem der Ansprüche 1 bis 3, bei dem das mindestens eine prädizierte Bild (n) einer Bildfolge in mindestens zwei Blöcke (b, ...) aufgeteilt wird, bei dem die Gewichtungsfaktoren in Abhängigkeit der pro Block übertragenen Quantisierungsstufenbreite der für die Codierung der Referenzbilder verwendeten Quantisierer gebildet wird, wobei die Bildung der Gewichtsfaktoren invers zur Quantisierungsstufenbreite erfolgt.
- Verfahren nach Anspruch 5, bei dem ein für die Prädiktion verwendeter Block (b) gleichzeitig mehrere codierte Einzelblöcke (b1 ... b4) im jeweiligen Referenzbild (n–1) überlagert und bei dem das Gewicht des für die Prädiktion verwendeten Blocks (b) entweder aus dem inversen Mittelwert der Quantisierungsstufenbreiten der Einzelblöcke oder invers zum größten Wert dieser Quantisierungsstufen gebildet wird.
- Vorrichtung zur Videocodierung, bei der eine Einrichtung (G) zur gewichteten Mittelwertbildung derart vorhanden ist, dass mindestens ein prädiziertes Bild (n) einer Bildfolge aus mindestens zwei unterschiedlich gewichteten (g1, g2) Referenzbildern (n–1, n+1) gebildet wird.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10225434A DE10225434B4 (de) | 2002-06-07 | 2002-06-07 | Verfahren und Vorrichtung zur Videocodierung |
US10/216,647 US7580458B2 (en) | 2002-06-07 | 2002-08-12 | Method and apparatus for video coding |
US12/458,669 US8111748B2 (en) | 2002-06-07 | 2009-07-20 | Method and apparatus for video coding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10225434A DE10225434B4 (de) | 2002-06-07 | 2002-06-07 | Verfahren und Vorrichtung zur Videocodierung |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10225434A1 DE10225434A1 (de) | 2004-01-08 |
DE10225434B4 true DE10225434B4 (de) | 2004-12-30 |
Family
ID=29594331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10225434A Expired - Lifetime DE10225434B4 (de) | 2002-06-07 | 2002-06-07 | Verfahren und Vorrichtung zur Videocodierung |
Country Status (2)
Country | Link |
---|---|
US (2) | US7580458B2 (de) |
DE (1) | DE10225434B4 (de) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10225434B4 (de) * | 2002-06-07 | 2004-12-30 | Siemens Ag | Verfahren und Vorrichtung zur Videocodierung |
US8406301B2 (en) | 2002-07-15 | 2013-03-26 | Thomson Licensing | Adaptive weighting of reference pictures in video encoding |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995021503A1 (en) * | 1994-02-02 | 1995-08-10 | British Broadcasting Corporation | Video motion estimation |
US5589885A (en) * | 1992-03-17 | 1996-12-31 | Nec Corporation | Moving picture coding and decoding circuit |
US6275535B1 (en) * | 1998-06-23 | 2001-08-14 | Stmicroelectronics S.A. | Method and device for decoding an image compressed in particular according to the MPEG standards, especially a bidirectional image |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63211987A (ja) * | 1987-02-27 | 1988-09-05 | Sony Corp | 予測符号化装置 |
US5151784A (en) * | 1991-04-30 | 1992-09-29 | At&T Bell Laboratories | Multiple frame motion estimation |
JPH0583696A (ja) * | 1991-06-07 | 1993-04-02 | Sony Corp | 画像符号化装置 |
JPH05344493A (ja) * | 1992-06-10 | 1993-12-24 | Victor Co Of Japan Ltd | 動画像符号化装置 |
MY118360A (en) * | 1996-04-30 | 2004-10-30 | Nippon Telegraph & Telephone | Scheme for detecting shot boundaries in compressed video data using inter-frame/inter field prediction coding and intra-frame/intra-field coding |
US6359929B1 (en) * | 1997-07-04 | 2002-03-19 | Matsushita Electric Industrial Co., Ltd. | Image predictive decoding method, image predictive decoding apparatus, image predictive coding apparatus, and data storage medium |
US6195389B1 (en) * | 1998-04-16 | 2001-02-27 | Scientific-Atlanta, Inc. | Motion estimation system and methods |
DE10225434B4 (de) * | 2002-06-07 | 2004-12-30 | Siemens Ag | Verfahren und Vorrichtung zur Videocodierung |
-
2002
- 2002-06-07 DE DE10225434A patent/DE10225434B4/de not_active Expired - Lifetime
- 2002-08-12 US US10/216,647 patent/US7580458B2/en active Active
-
2009
- 2009-07-20 US US12/458,669 patent/US8111748B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5589885A (en) * | 1992-03-17 | 1996-12-31 | Nec Corporation | Moving picture coding and decoding circuit |
WO1995021503A1 (en) * | 1994-02-02 | 1995-08-10 | British Broadcasting Corporation | Video motion estimation |
US6275535B1 (en) * | 1998-06-23 | 2001-08-14 | Stmicroelectronics S.A. | Method and device for decoding an image compressed in particular according to the MPEG standards, especially a bidirectional image |
Also Published As
Publication number | Publication date |
---|---|
DE10225434A1 (de) | 2004-01-08 |
US20090279607A1 (en) | 2009-11-12 |
US7580458B2 (en) | 2009-08-25 |
US20030227971A1 (en) | 2003-12-11 |
US8111748B2 (en) | 2012-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69635369T2 (de) | Videokodierungsvorrichtung | |
DE60027495T2 (de) | Video-codierverfahren und video-codiervorrichtung | |
DE69827548T2 (de) | Anordnung zur Vorverarbeitung für MPEG-2-Kodierung | |
DE19730360B4 (de) | Bilddatenfilterungsvorrichtung und Verfahren zur Verminderung von Bilddatencodierfehlern | |
DE69816342T2 (de) | Prädiktives Bilddekodierungsverfahren | |
DE60215241T2 (de) | Verfahren und Vorrichtung zur Reduzierung von Störungen in dekodierten Bildern mit Nachfilterung | |
DE69837003T2 (de) | Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem | |
DE102005029127A1 (de) | Verfahren und Vorrichtung zur optimierten prädiktiven Videocodierung | |
DE19643915A1 (de) | Verfahren und Schaltung zur Bestimmung eines Quantisierintervalls in einem Bildkodierer | |
WO2010020592A1 (de) | Verfahren zum codieren einer folge von digitalisierten bildern | |
DE102019103346A1 (de) | Ssim-basierte rate-distortion-optimierung für eine verbesserte wahrnehmbare qualität bei videos | |
EP1774790B1 (de) | Verfahren und vorrichtung zum codieren und decodieren | |
DE10113880B4 (de) | Verfahren zur Komprimierung und Dekomprimierung von Videodaten | |
DE19737805A1 (de) | Verfahren und Vorrichtung zum Kodieren eines Bewegungsvektors | |
DE10343220B3 (de) | Verfahren und Vorrichtung zur Transcodierung eines Datenstroms, der ein oder mehrere codierte digitalisierte Bilder umfasst | |
EP2521357A1 (de) | Verfahren und Vorrichtung zur Filterung von kodierten Bildpartitionen | |
DE10204617B4 (de) | Verfahren und Vorrichtungen zur Kompression und Dekompression eines Videodatenstroms | |
DE10296787B4 (de) | Selektive Prädikation für ein Intra-Codieren eines Videodatenblocks | |
DE69729438T2 (de) | Verfahren und Gerät zur prädiktiven Kodierung der Objektinformation von Videosignalen | |
EP0703711B1 (de) | Coder zur segmentweisen Codierung eines Bildsignales | |
EP1425920B1 (de) | Verfahren zur videocodierung und computerprogrammprodukt | |
EP0525900B1 (de) | Filterschaltung zur Vorverarbeitung eines Videosignals | |
DE60036585T2 (de) | Videodatencoder und Verfahren zur Codierung von Videodaten | |
DE10225434B4 (de) | Verfahren und Vorrichtung zur Videocodierung | |
EP1110407B1 (de) | Verfahren und anordnung zur codierung und decodierung eines digitalisierten bildes mit anwendung eines gesamtbewegungsvektors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right |