DE69738264T2 - Videokodierungs- und Videodekodierungsvorrichtung - Google Patents

Videokodierungs- und Videodekodierungsvorrichtung Download PDF

Info

Publication number
DE69738264T2
DE69738264T2 DE1997638264 DE69738264T DE69738264T2 DE 69738264 T2 DE69738264 T2 DE 69738264T2 DE 1997638264 DE1997638264 DE 1997638264 DE 69738264 T DE69738264 T DE 69738264T DE 69738264 T2 DE69738264 T2 DE 69738264T2
Authority
DE
Germany
Prior art keywords
block
resolution
image
error signal
prediction error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE1997638264
Other languages
English (en)
Other versions
DE69738264D1 (de
Inventor
Akira Nakagawa
Kimihiko Kazui
Eishi Morimatsu
Takahiro Shimizu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Application granted granted Critical
Publication of DE69738264D1 publication Critical patent/DE69738264D1/de
Publication of DE69738264T2 publication Critical patent/DE69738264T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf eine Videokodierungsvorrichtung und eine Videodekodierungsvorrichtung, und genauer auf eine Videokodierungsvorrichtung, die vorhersagendes Kodieren von digitalen Videosignalen durchführt, und eine Videodekodierungsvorrichtung, die die ursprünglichen Bewegungsbilder aus dem vorhersagend-kodierten Videosignal reproduziert, das durch die Videokodierungsvorrichtung erzeugt wird.
  • 2. Beschreibung des Standes der Technik
  • Der ITU-T Standard H.261 und die ISO-Standard MPEG-1 und MPEG-2 sind z. B. gut anerkannte internationale Standards für Bewegungsbild-Kodierungstechniken. Jene Standards verwenden hybride Kodierungsalgorithmen, wobei der Kodierungsprozess wie folgt fortfahren wird: (1) ein Quellenbild wird in Blöcke von Bildpunkten (Pixel) unterteilt, (2) orthogonale Transformation (z. B. diskrete Kosinustransformation) und Bewegungskompensation werden unabhängig auf jeden Block angewendet und (3) quantisierte Videodaten werden durch Entropiekodierung komprimiert.
  • Wenn eine Bewegung beträchtlicher Größe oder ein vollständiger Szenenübergang in der Mitte einer Sequenz von Videorahmen aufgetreten sind, können die oben beschriebenen hybriden Videokodierungstechniken an einem überwältigenden Umfang kodierter Rahmendaten leiden, die ein gewisses Standardmaß überschreiten, das für jeden Rahmen zulässig ist. In diesem Fall wird der Kodierer zwangsweise den Umfang kodierter Daten in einem Versuch reduzieren, dies auf das Standardmaß zu regeln. Dies wird extreme Verschlechterung in der Bildqualität und grobes Rahmenunterabtasten (oder einen Abfall in Rahmenaktualisierungsraten) verursachen, was somit zu nicht akzeptabel schlechten Bildern führt, wenn in den Empfangsenden rekonstruiert.
  • Ein Videokodierungssystem, das auf Vermeidung des obigen Problems zielt, wird zum Beispiel in der japanischen Patentanmeldung Nr. 8-75605 (1996) durch den gleichen Anmelder der vorliegenden Erfindung vorgeschlagen. In diesem vorgeschlagenen System reduziert die Videokodierungsvorrichtung die Auflösung von eingegebenen Rahmensignalen, um den Umfang kodierter Rahmendaten zu regeln, wenn ein vollständiger Szenenübergang oder eine massive Bewegung in der Mitte einer Sequenz von Videorahmen aufgetreten ist.
  • 14 ist ein Blockdiagramm dieser Videokodierungsvorrichtung, die in der japanischen Patentanmeldung Nr. 8-75605 vorgeschlagen wird. Die Vorrichtung von 14 unterstützt zwei Arten von Bildauflösungen: das übliche Zwischenformat (CIF (Common Intermediate Format), 352×288 Pixel) and Viertel-CIF (QCIF (quarter-CIF), 176×144 Pixel). Eine CIF/QCIF-Auswahlsteuervorrichtung 125 bestimmt, welche Bildauflösung verwendet werden sollte, um Quellenbilder zu kodieren, in Anbetracht des Umfangs von kodierten Rahmendaten, die in einer vorhersagenden Kodierung erzeugt werden, Quantisiererschrittgröße und einigen anderen Parametern. Z. B. wählt die CIF/QCIF-Auswahlsteuervorrichtung 125 normalerweise das CIF hoher Auflösung, während sie QCIF geringer Auflösung wählt, wenn ein großer Umfang von Daten als ein Ergebnis der Kodierung erzeugt wurde.
  • Ein Rahmenspeicher 122 wird verwendet, um rekonstruierte (oder dekodierte) Bilder der vorherigen Rahmen zu speichern. Unter Vergleich des Quellenbildes des aktuellen Rahmens mit einem dekodierten Bild, das aus dem Rahmenspeicher 122 abgerufen wird, als das Bezugsbild berechnet eine Vorhersageparameter-Kalkulationseinheit 112 Bewegungsvektoren des aktuellen Rahmens. Hier wird ein Bild in eine Vielzahl von Blöcken partitioniert und der Vergleich von Rahmendaten wird auf einer Basis Block für Block durchgeführt. Jedes Quellenrahmenbild wird entweder einer Interrahmenkodierung oder einer Interrahmenkodierung unterzogen. Eine Vorhersageparameter-Kalkulationseinheit 112 bestimmt, welches Kodierungsschema auf das Quellenrahmenbild angewendet werden sollte. Wenn die Interrahmenkodierung aktiviert ist, erzeugt eine Vorhersagebild-Generierungseinheit 113 ein Vorhersagebild des aktuellen Rahmens basierend auf dem dekodierten Bild des vorherigen Rahmens und den Bewegungsvektoren, die durch die Vorhersageparameter-Kalkulationseinheit 112 kalkuliert werden.
  • Eine Vorhersagefehlersignal-Generierungseinheit 114 erzeugt ein Vorhersagefehlersignal durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild auf einer Basis Block für Block. Ein CIF/QCIF-Konverter 131 ändert die Auflösung dieses Vorhersagefehlersignals, was ursprünglich CIF ist, zu dem, was durch die CIF/QCIF-Auswahlsteuervorrichtung 125 ausgewählt wird. Genauer gibt der CIF/QCIF-Konverter 131 das Vorhersagefehlersignal aus wie es ist aus, wenn die CIF-Auflösung durch die CIF/QCIF-Auswahlsteuervorrichtung 125 ausgewählt ist, und er konvertiert wiederum die Auflösung zu QCIF, wenn die QCIF-Auflösung gewählt ist.
  • Eine Kodierungssteuervorrichtung 124 empfängt Information in Bezug auf den Umfang der resultierenden kodierten Daten von einer Entropiekodierungseinheit 117 (später beschrieben), ebenso wie Erhalten von Information über eine Pufferbelegung aus einem Kodierungsdatenpuffer 118 (später beschrieben). Basierend auf derartiger Information bestimmt die Kodierungssteuervorrichtung 124 die Quantisiererschrittgröße und verteilt sie zu einem Quantisierer 116, einem Dequantisierer 119, der CIF/QCIF-Auswahlsteuervorrichtung 125 und dem Entropiekodierer 117.
  • Ein DCT-Prozessor 115 wendet eine orthogonale Transformation, oder eine digitale Kosinustransformation (DCT) auf die Ausgabe des CIF/QCIF-Konverters 131 an, und ein Quantisierer 116 quantisiert die erhaltenen DCT-Koeffizienten in Übereinstimmung mit der Quantisiererschrittgröße, die durch die Kodierungssteuervorrichtung 124 spezifiziert wird.
  • Der Entropiekodierer 117 empfängt die quantisierten DCT-Koeffizienten von dem Quantisierer 116, die Bildauflösung von der CIF/QCIF-Auswahlsteuervorrichtung 125 und die Bewegungsvektoren und Kodierungsschemainformation von der Vorhersageparameter-Kalkulationseinheit 112. Entropiekodierung ist ein Datenkomprimierungsprozess, der kürzere Codeworte häufigen Ereignissen und längere Codeworte weniger häufigen Ereignissen zuweist. Aus einer vordefinierten Codeworttabelle fragt der Entropiekodierer 117 Codeworte ab, die für jede Kombination der oben empfangenen Daten relevant sind, wobei dadurch die kodierten Rahmendaten ausgegeben werden.
  • Die quantisierten DCT-Koeffizienten, die durch den Quantisierer 116 erzeugt werden, werden auch dem Dequantisierer 119 für eine Umkehrquantisierung (Inversquantisierung), oder Dequantisierung, zugeführt. Die resultierenden Ausgangssignale werden dann einem inversen diskreten Kosinustransformations-(IDCT, inverse discrete cosine transform)Prozess unterzogen, der durch einen IDCT-Prozessor 120 ausgeführt wird, um das ursprüngliche Vorhersagefehlersignal zu reproduzieren. Wenn das reproduzierte Vorhersagefehlersignal das QCIF-Format als ein Ergebnis der Auflösungsverringerung durch den CIF/QCIF-Konverter 131 hat, konvertiert es ein QCIF/CIF-Konverter 132 erneut, um die ursprüngliche CIF-Auflösung wiederherzustellen. Ein Dekodierungsbildgenerator 121 rekonstruiert ein Bild durch Hinzufügen des Vorhersagefehlersignals, das durch den QCIF/CIF-Konverter 132 ausgegeben wird, zu dem Vorhersagebild, das durch den Vorhersagebildgenerator 113 erzeugt wird. Dieses vollständig dekodierte Bild wird dann zu einem Rahmenspeicher 122 für eine Speicherung transferiert.
  • Wie oben beschrieben, überwacht die vorgeschlagene Videokodierungsvorrichtung den Umfang von kodierten Rahmendaten und dergleichen, und falls irgendeine beträchtliche Erhöhung in dem Umfang von kodierten Rahmendaten erwartet wird, wird die Vorrichtung die Auflösung des Vorhersagefehlersignals von CIF zu QCIF reduzieren.
  • Der CIF/QCIF-Konverter 131 führt eine derartige Auflösungsverringerung durch einen Herabtastprozess (Downsampling-Prozess) durch, wie in 15 beispielhaft dargestellt. Genauer repräsentieren weiße Punkte in 15 CIF-Pixel und in ihnen platzierte Kleinbuchstaben zeigen ihre jeweiligen Vorhersagefehlersignalwerte an. Schwarze Punkte repräsentieren QCIF-Pixel, und Großbuchstaben neben ihnen bedeuten ihre jeweiligen Vorhersagefehlersignalwerte. Der Herabtastprozess kalkuliert die QCIF-Vorhersagefehlersignalwerte A, B, C und D durch Mittelwertbildung von vier Werten der CIF-Pixel, die jedes von den QCIF-Pixel umgeben. Z. B. wird der Bildpunktwert A als A = (a + b + e + f)/4 (1)erhalten.
  • Im Gegensatz dazu führt der QCIF/CIF-Konverter 132 eine QCIF-CIF-Auflösungskonvertierung durch einen Herauftastprozess (Upsampling-Prozess) durch, wie in 16 gezeigt wird. Genauer repräsentieren schwarze Punkte QCIF-Pixel, und Großbuchstaben neben ihnen zeigen ihre jeweiligen Vorhersagefehlersignalwerte an, während weiße Punkte CIF-Pixel repräsentieren und Kleinbuchstaben in ihnen ihre jeweiligen Vorhersagefehlersignalwerte anzeigen. Um die CIF-Vorhersagefehlersignalwerte a, b, c usw. zu erhalten, kalkuliert der Herauftastprozess einen gewichteten Mittelwert von vier QCIF-Pixel, die jedes CIF-Pixel umgeben. Z. B. wird der Bildpunktwert f als f = (9A + 3B + 3C + D)/16 (2)erhalten, wobei vier QCIF-Werte mit Gewichtungskoeffizienten aufsummiert werden, die in Übereinstimmung mit ihren jeweiligen Abständen von dem Bildpunkt 134 von Interesse bestimmt werden.
  • Es sollte hier vermerkt werden, dass die oben beschriebene konventionelle Videokodierungsvorrichtung unter der Annahme aufgebaut ist, dass alle Blöcke in einem Rahmen durch Verwenden eines konsistenten Kodierungsschemas kodiert sind. Genauer wird angenommen, dass jeder Block in einem gegebenen Rahmen entweder einer Intrarahmenkodierung oder einer Interrahmenkodierung unterzogen wird, aber dieses Kodierungsschema in der Mitte des Rahmens nicht umgeschaltet werden kann.
  • In der Realität können jedoch manchmal die zwei unterschiedlichen Kodierungsschemata auf unterschiedliche Blöcke in dem gleichen Rahmen angewendet werden. Falls dies der Fall ist, werden einige benachbarte Blöcke innerhalb des gleichen Rahmens auf unterschiedlichen Wegen kodiert sein. Z. B. wird die Bildpunktabbildung betrachtet, die in 16 veranschaulicht ist. Hier repräsentiert eine gestrichelte Linie 133 eine Blockgrenze, wo sich in das angewendete Kodierungsschema von Interrahmenkodierung zu Intrarahmenkodierung ändert oder umgekehrt. Um einen Vorhersagefehlersignalwert f in einem CIF-Pixel 134 zu kalkulieren, verwendet der QCIF/CIF-Konverter 132 die Gleichung f = (9A + 3B + 3C + D)/16 (3)wobei die QCIF-Pixelwerte C und D, die Gegenstand des anderen Kodierungsschemas sind, das Ergebnis f beeinträchtigen werden. Bezug nehmend nun auf 17 werden nachstehend Probleme erörtert, die durch diesen gemischten Bildpunktverweis verursacht werden.
  • 17 zeigt schematisch einen Prozess der vorhersagenden Kodierung und Dekodierung eines Quellenbildes. 17 besteht aus sechs Grafiken, (a) bis (f), von denen jede darstellt, wie die Bildpunktwerte variieren werden, wenn über einige unterschiedliche Blöcke hinweg abgetastet wird. Mit anderen Worten zeigen diese Grafiken die Profile von Bildpunktwerten in der Nachbarschaft einer gewissen Blockgrenze. Genauer ist die linke Hälfte von jedem Profil (mit "Intra" bezeichnet) ein Block, der Gegenstand der Intrarahmenkodierung ist, während die rechte Hälfte (mit "Inter" bezeichnet) ein Block ist, der Gegenstand der Interrahmenkodierung ist, wobei die vertikale gestrichelte Linie die Blockgrenze anzeigt. Die obere linke Grafik (a) zeigt das Profil eines Quellenbildes, in dem die Bildpunktwerte in beiden Blöcken nur flach sind. Da der linke Block der Intrarahmenkodierung unterzogen wird und somit keinen Bezugsrahmen für Vorhersage hat, werden seine Bildpunktwerte in dem Vorhersagebildprofil (b) Nullen sein. Entsprechend weist das resultierende Vorhersagefehlersignal (c) große Differenzwerte in dem linken Block auf, während kleine Werte in dem rechten Block gezeigt werden, der Gegenstand der Interrahmenkodierung ist. Übrigens implizieren in 17 (und auch in späteren Figuren) die großen Zeichen "+" bzw. "–" Subtraktion und Addition von Bildern.
  • In einer derartigen Situation, wo zwei benachbarte Blöcke mit unterschiedlichen Schemata kodiert sind (d. h. Intrarahmen und Interrahmen), werden die Herauftastoperationen, die durch den QCIF/CIF-Konverter 132 ausgeführt werden, wie zuvor erwähnt, eine Mischung von unterschiedlich kodierten Bildpunktwerten in der Nähe der Blockgrenze einführen. D. h. das reproduzierte Vorhersagefehlersignal wird deformiert, wie in einem Profile (d) von 17 veranschaulicht, als ein Ergebnis der Herauftastoperationen durch den QCIF/CIF-Konverter 132. Dann wird die Summierung dieses reproduzierten Vorhersagefehlersignals (d) und eines Vorhersagebildes (e), das gleich dem Vorhersagebild (b) ist, das von der Vorhersagebild-Generierungseinheit 113 bereitgestellt wird, ein dekodiertes Bild (f) liefern. Wie in 17 veranschaulicht, enthält das resultierende dekodierte Bild (f) einige Verzerrung in der Nähe der Blockgrenze. Treue von dekodierten Bildern zu den ursprünglichen Bildern ist eine der wichtigsten Gestaltungsbetrachtungen in Videodekodierern.
  • Wie im Gegensatz dazu ist das Bild (f), das durch die konventionelle Videokodierungsvorrichtung rekonstruiert wird, verschieden von dem ursprünglichen Quellenbild (a).
  • Diese Art eines Problems kann nicht nur in der besonderen Situation auftreten, in der zwei unterschiedliche Kodierungsschemata auf benachbarte Blöcke in einem Rahmen angewendet werden, sondern sie kann potenziell für beliebige Videorahmen auftreten, die einige scharfe Kanten enthalten, die eine große Differenz oder Diskontinuität in Bildpunktwerten in einer gewissen Blockgrenze in einem einzelnen Rahmen aufweisen. Derartige Diskontinuitätsübergänge von Bildpunktwerten können auch in derartigen Videorahmen beobachtet werden, wo zwei benachbarte Blöcke ziemlich unterschiedliche Bewegungsvektoren haben. Wenn dekodiert, wird das Bild an ähnlichem Rauschen, oder Artefakten, leiden, die in der Nähe der Grenze jener benachbarten Blöcke erzeugt werden.
  • RESÜMEE DER ERFINDUNG
  • Unter Betrachtung des obigen besteht ein Ziel der vorliegenden Erfindung darin, eine Videokodierungsvorrichtung und eine Videodekodierungsvorrichtung vorzusehen, die dekodierte Bildern ohne Einführung von unerwünschtem Rauschen reproduzieren können, selbst wenn eine beliebige beträchtliche Differenz in Bildpunktwerten oder Diskontinuität in einer gewissen Blockgrenze existiert.
  • Um das obige Ziel zu erreichen, ist gemäß der vorliegenden Erfindung eine Videokodierungsvorrichtung zum Durchführen von vorhersagendem Kodieren von digitalen Videoeingangssignalen vorgesehen. Die Vorrichtung umfasst: (a) Auflösungsbestimmungsmittel zum Auswählen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes eines aktuellen Rahmens zu verwenden ist, wobei die Bildauflösung entweder eine geringe Auflösung oder eine hohe Auflösung ist; (b) Dekodierungsbildspeichermittel (Speichermittel eines dekodierten Bildes) zum Speichern eines vergangenen dekodierten Bildes, das in einem vorherigen Rahmen reproduziert wird; (c) Vorhersageparameter-Kalkulationsmittel, das mit dem Auflösungsbestimmungsmittel gekoppelt ist, zum Bestimmen, welches von zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und auch zum Kalkulieren von Bewegungsvektoren der Blöcke in dem Quellenbild, wobei die zwei Kodierungsschemata eine Intrarahmenkodierung und eine Interrahmenkodierung enthalten, und die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke (Teile) gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel bestimmt ist; (d) Vorhersagebild-Generierungsmittel zum Erzeugen eines Vorhersagebildes durch Kalkulation von Bildpunktwerten auf einer Basis Block für Block, wobei die Kalkulation der Bildpunktwerte enthält Zuweisung von Nullen zu Bildpunktwerten der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und Kalkulation der Bildpunktwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und den Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel erhalten werden; (e) Vorhersagefehlersignal-Generierungsmittel zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild; (f) erstes Auflösungskonvertierungsmittel zum Herabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel erzeugt wird, um die geringe Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt wird; (g) Orthogonaltransformations-/Quantisierungsmittel zum Anwenden eines Orthogonaltransformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel verarbeitet wird; (h) Codezuordnungsmittel zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgefragt wird, worin die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, die Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt wird, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel bestimmt wird, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel kalkuliert werden, enthält, und die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die zuvor jeder möglichen Kombination der gegebenen Menge von Daten zugewiesen werden; (i) Dequantisierungs-/Umkehrorthogonaltransformationsmittel zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, um das Vorhersagefehlersignal zu reproduzieren; (j) zweites Auflösungskonvertierungsmittel zum Anwenden eines Herauftastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel gesendet wird, um die hohe Auflösung vorzusehen, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, was durch das erste Auflösungskonvertierungsmittel verarbeitet wird, wobei der Herauftastprozess, wenn ein Bildpunktwert in einem Block kalkuliert wird, der Gegenstand von einem der zwei Kodierungsschemata ist, nicht auf beliebige Bildpunkte verweist, die zu einem beliebigen anderen Block benachbart zu dem Block von Interesse gehören, falls der benachbarte Block Gegenstand des anderen Kodierungsschemas ist, sondern mindestens auf die Bildpunkte verweist, die zu dem Block von Interesse gehören; und (k) Dekodierungsbild-Generierungsmittel zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel erzeugt wird, und zum Ausgeben des dekodierten Bildes zu dem Dekodierungsbildspeichermittel.
  • Um das obige Ziel zu erreichen, ist auch eine andere Videokodierungsvorrichtung zum Durchführen einer vorhersagenden Kodierung von digitalen Videoeingangssignalen vorgesehen. Diese Vorrichtung umfasst: (a) Auflösungsbestimmungsmittel zum Auswählen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes eines aktuellen Rahmens zu verwenden ist, wobei die Bildauflösung entweder eine geringe Auflösung oder eine hohe Auflösung ist; (b) Dekodierungsbildspeichermittel zum Speichern eines vergangenen dekodierten Bildes, das in einem vorherigen Rahmen reproduziert wird; (c) Vorhersageparameter-Kalkulationsmittel, das mit dem Auflösungsbestimmungsmittel gekoppelt ist, zum Bestimmen, welches der zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und auch zum Kalkulieren von Bewegungsvektoren der Blöcke in dem Quellenbild, wobei die zwei Kodierungsschemata eine Intrarahmenkodierung und eine Interrahmenkodierung enthalten, und die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel bestimmt ist; (d) Vorhersagebild-Generierungsmittel zum Erzeugen eines Vorhersagebildes durch Kalkulation von Bildpunktwerten auf einer Basis Block für Block, wobei die Kalkulation der Bildpunktwerte enthält Zuweisung von Nullen zu Bildpunktwerten der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und Kalkulation der Bildpunktwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist, und den Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel erhalten werden; (e) Vorhersagefehlersignal-Generierungsmittel zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild; (f) erstes Auflösungskonvertierungsmittel zum Herabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel erzeugt wird, um die geringe Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel bestimmt ist; (g) Orthogonaltransformations-/Quantisierungsmittel zum Anwenden eines Orthogonaltransformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel verarbeitet wird; (h) Codezuordnungsmittel zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgefragt wird, worin die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, die Bildauflösung, die durch das Bildauflösungsmittel bestimmt ist, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel bestimmt ist, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel kalkuliert sind, enthält, und die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die jeder möglichen Kombination der gegebenen Menge von Daten zuvor zugewiesen sind; (i) Dequantisierungs-/Umkehrorthogonaltransformationsmittel zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels, um das Vorhersagefehlersignal zu reproduzieren; (j) zweites Auflösungskonvertierungsmittel zum Anwenden eines Herauftastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel gesendet wird, um die hohe Auflösung vorzusehen, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, was durch das erste Auflösungskonvertierungsmittel verarbeitet wird; (k) Vorhersagebild-Modifikationsmittel zum Bestimmen neuer Werte von Bildpunkten in einem Block, der einer Blockgrenze benachbart ist, mit Bezug auf andere Bildpunkte in einem anderen Block, der dem Block von Interesse benachbart ist, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, die durch das erste Auflösungskonvertierungsmittel verarbeitet wird; und (1) Dekodierungsbild-Generierungsmittel zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Modifikationsmittel verarbeitet wird, und zum Ausgeben des dekodierten Bildes zu dem Dekodierungsbildspeichermittel.
  • Die obigen und andere Ziele, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung offensichtlich sein, wenn in Verbindung mit den begleitenden Zeichnungen aufgenommen, die bevorzugte Ausführungsformen der vorliegenden Erfindung auf dem Weg eines Beispiels veranschaulichen.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Es zeigt:
  • 1 eine erste konzeptionelle Ansicht der vorliegenden Erfindung;
  • 2 eine zweite konzeptionelle Ansicht der vorliegenden Erfindung;
  • 3 ein Blockdiagramm, das einen spezifischen Aufbau einer ersten Ausführungsform der vorliegenden Erfindung zeigt;
  • 4 ein Diagramm, um einen Herauftastprozess zu erläutern, der durch eine Herauftasteinheit ausgeführt wird;
  • 5 ein Blockdiagramm, das den Aufbau einer zweiten Ausführungsform der vorliegenden Erfindung zeigt;
  • 6 ein Blockdiagramm, das den Aufbau einer dritten Ausführungsform der vorliegenden Erfindung zeigt;
  • 7 ein Blockdiagramm, das den Aufbau einer vierten Ausführungsform der vorliegenden Erfindung zeigt;
  • 8 ein Blockdiagramm, das den Aufbau einer fünften Ausführungsform der vorliegenden Erfindung zeigt;
  • 9 ein Diagramm, um einen Herauftastprozess zu erläutern, der durch eine Herauftasteinheit in der fünften Ausführungsform ausgeführt wird;
  • 10 ein Diagramm, um einen Prozess zu erläutern, der durch ein Grenznachbarschaftsfilter durchgeführt wird;
  • 11 ein Diagramm, das zeigt, wie ein prädiktions-kodiertes Quellenbild in einer Videokodierungsvorrichtung der vorliegenden Erfindung dekodiert wird;
  • 12 ein Diagramm, um einen Prozess zu erläutern, der durch das Grenznachbarschaftsfilter durchgeführt wird, wenn ein Betriebsbefehlssignal dazu wegen einer kritischen Differenz zwischen zwei benachbarten Blöcken im Sinne der Größe von Bewegungsvektoren gesendet wird;
  • 13 ein Blockdiagramm, das den Aufbau einer sechsten Ausführungsform der vorliegenden Erfindung zeigt;
  • 14 ein Blockdiagramm, das eine konventionelle Videokodierungsvorrichtung zeigt;
  • 15 ein Diagramm, um einen konventionellen Herabtastprozess zu erläutern;
  • 16 ein Diagramm, um einen konventionellen Herauftastprozess zu erläutern; und
  • 17 ein Diagramm, das zeigt, wie ein prädiktions-kodiertes Quellenbild in der konventionellen Videokodierungsvorrichtung dekodiert wird.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Nachstehend werden mehrere bevorzugte Ausführungsformen der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • Zuerst wird unter Bezug auf 1 das Konzept einer ersten Ausführungsform der vorliegenden Erfindung erläutert. Diese erste Ausführungsform bezieht sich speziell auf eine Videokodierungsvorrichtung.
  • Die erste Ausführungsform der vorliegenden Erfindung schlägt eine Videokodierungsvorrichtung vor, die die folgenden Elemente umfasst.
    • (a) Auflösungsbestimmungsmittel 1 zum Auswählen einer Bildauflösung, die in einer Videokodierung eines Quellenbildes eines aktuellen Rahmens zu verwenden ist. Hier kann die Bildauflösung entweder eine geringe Auflösung oder eine hohe Auflösung sein.
    • (b) Dekodierungsbildspeichermittel 2 zum Speichern eines vergangenen dekodierten Bildes, das in einem vorherigen Rahmen reproduziert wird.
    • (c) Vorhersageparameter-Kalkulationsmittel 3, das mit dem Auflösungsbestimmungsmittel 1 gekoppelt ist, zum Bestimmen, welches der zwei Kodierungsschemata verwendet werden sollte, um einzelne Blöcke zu kodieren, durch Vergleichen des Quellenbildes des aktuellen Rahmens mit dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel gespeichert ist. Das Vorhersageparameter-Kalkulationsmittel 3 kalkuliert auch Bewegungsvektoren der Blöcke in dem Quellenbild. Es wird vermerkt, dass die zwei Kodierungsschemata eine Intrarahmenkodierung und eine Interrahmenkodierung enthalten, und die Blöcke durch Partitionieren eines gegebenen Bildes in Stücke gemäß der Bildauflösung definiert sind, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist.
    • (d) Vorhersagebild-Generierungsmittel 4 zum Erzeugen eines Vorhersagebildes durch Kalkulation von Bildpunktwerten auf einer Basis Block für Block. Diese Kalkulation der Bildpunktwerte enthält Zuweisung von Nullen als die Bildpunktwerte der Blöcke, die Gegenstand der Intrarahmenkodierung sind, und Kalkulation der Bildpunktwerte der anderen Blöcke, die Gegenstand der Interrahmenkodierung sind, basierend auf dem vergangenen dekodierten Bild, das in dem Dekodierungsbildspeichermittel 2 gespeichert ist, und den Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 erhalten werden.
    • (e) Vorhersagefehlersignal-Generierungsmittel 5 zum Erzeugen eines Vorhersagefehlersignals für jeden Block durch Kalkulieren von Differenzen zwischen dem Quellenbild und dem Vorhersagebild.
    • (f) Erstes Auflösungskonvertierungsmittel 6 zum Herabtasten des Vorhersagefehlersignals, das durch das Vorhersagefehlersignal-Generierungsmittel 5 erzeugt wird, um die geringe Auflösung vorzusehen, abhängig von der Bildauflösung, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist.
    • (g) Orthogonaltransformations-/Quantisierungsmittel 7 zum Anwenden eines Orthogonaltransformationsprozesses und eines Quantisierungsprozesses auf das Vorhersagefehlersignal, das durch das erste Auflösungskonvertierungsmittel 6 verarbeitet wird;
    • (h) Codezuordnungsmittel 8 zum Ausgeben eines Codewortes, das für eine gegebene Menge von Daten relevant ist, wobei das Codewort aus einer vordefinierten Codeworttabelle abgefragt wird. Hier enthält die gegebene Menge von Daten mindestens die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels 7, die Bildauflösung, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist, das Kodierungsschema, das durch das Vorhersageparameter-Kalkulationsmittel 3 bestimmt ist, und die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 kalkuliert sind. Es wird vermerkt, dass die vorbestimmte Codeworttabelle eine Vielzahl von Codeworten enthält, die zuvor jeder möglichen Kombination der gegebenen Menge von Daten zugewiesen sind.
    • (i) Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 zum Anwenden eines Dequantisierungsprozesses und eines Umkehrorthogonaltransformationsprozesses auf die Ausgabe des Orthogonaltransformations-/Quantisierungsmittels 7, um das Vorhersagefehlersignal zu reproduzieren.
    • (j) Zweites Auflösungskonvertierungsmittel 10 zum Anwenden eines Herauftastprozesses auf das reproduzierte Vorhersagefehlersignal, das von dem Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 gesendet wird, um die hohe Auflösung vorzusehen, falls das reproduzierte Vorhersagefehlersignal die geringe Auflösung hat, was durch das erste Auflösungskonvertierungsmittel 6 verarbeitet wird. Wenn ein Bildpunktwert in einem derartigen Block kalkuliert wird, der Gegenstand von einem der zwei Kodierungsschemata ist, verweist der Herauftastprozess nicht auf beliebige Bildpunkte, die zu einem beliebigen anderen Block gehören, der dem Block von Interesse benachbart ist, falls der benachbarte Block Gegenstand des anderen Kodierungsschemas ist. Das zweite Auflösungskonvertierungsmittel 10 verweist jedoch mindestens auf die Bildpunkte, die zu dem Block von Interesse gehören.
    • (k) Dekodierungsbildgenerierungsmittel 11 zum Aufbauen eines dekodierten Bildes durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das durch das zweite Auflösungskonvertierungsmittel 10 verarbeitet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel 4 erzeugt wird, und zum Ausgeben des dekodierten Bildes zu dem Dekodierungsbildspeichermittel 2.
  • In der oben beschriebenen strukturellen Anordnung bestimmt das Auflösungsbestimmungsmittel 1 die Bildauflösung, in der das Quellenbild zu kodieren ist. Genauer wählt das Auflösungsbestimmungsmittel 1 eine hohe Auflösung, wenn die Codezuordnungseinheit 8 eine kleinere Menge von kodierten Daten als ein vorbestimmtes Standardvolumen erzeugt hat. Es wählt wiederum eine geringe Auflösung, wenn die Menge der kodierten Daten größer als das Standardcodevolumen ist.
  • Für jeden Block, der durch Partitionieren des Quellenbildes gemäß der Bildauflösung definiert ist, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist, führt das Vorhersageparameter-Kalkulationsmittel 3 eine Berechnung eines Bewegungsvektors durch, ebenso wie eine Bestimmung, welches Kodierungsschema (d. h. Intrarahmen oder Interrahmen) auf den Block angewendet werden sollte. Das Vorhersagebild-Generierungsmittel 4 erzeugt ein Vorhersagebild auf einer Basis Block für Block, gemäß der Ausgabe des Vorhersageparameter-Kalkulationsmittels 3. D. h. wenn die Intrarahmenkodierung auf einen gewissen Block angewendet wird, gibt das Vorhersagebild-Generierungsmittel 4 Nullen für die Bildpunktwerte des Blocks von Interesse als Teil des Vorhersagebildes in Bearbeitung aus. Wenn wiederum die Interrahmenkodierung angewendet wird, erzeugt das Vorhersagebild-Generierungsmittel 4 ein Vorhersagebild des Blocks durch Anwenden des kalkulierten Bewegungsvektors auf die relevanten Daten, die von dem Dekodierungsbildspeichermittel 2 abgerufen werden, das die rekonstruierten Bilder in einigen vorherigen Rahmen speichert.
  • Das Vorhersagefehlersignal-Generierungsmittel 5 erzeugt ein Vorhersagefehlersignal durch Kalkulieren von Differenzen zwischen dem aktuellen Rahmenbild und dem Vorhersagebild auf einer Basis Block für Block. Das erzeugte Vorhersagefehlersignal wird dann dem ersten Auflösungskonvertierungsmittel 6 zur Verringerung der Bildauflösung unterzogen, falls es durch das Auflösungsbestimmungsmittel 1 gefordert wird. Genauer leitet das erste Auflösungskonvertierungsmittel 6 das Vorhersagefehlersignal wie es ist weiter, wenn die hohe Auflösung durch das Auflösungsbestimmungsmittel 1 ausgewählt ist, und es konvertiert die Bildauflösung des Signals herab zu der geringen Auflösung, wenn die geringe Auflösung durch das Auflösungsbestimmungsmittel 1 ausgewählt ist.
  • Als Nächstes wendet das Orthogonaltransformations-/Quantisierungsmittel 7 eine Orthogonaltransformation und Quantisierungsprozesse auf die Ausgabe des ersten Auflösungskonvertierungsmittels 6 an. Das Codezuordnungsmittel 8 empfängt mindestens das Ausgabesignal des Orthogonaltransformations-/Quantisierungsmittels 7, die Bildauflösung, die durch das Auflösungsbestimmungsmittel 1 bestimmt ist, und das Kodierungsschema und Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 erhalten werden. Es werden einige geeignete Codeworte, um verschiedene Kombinationen jener Arten von Daten darzustellen, in einer Codeworttabelle vorbereitet. Das Codezuordnungsmittel 8 ruft derartige Codeworte ab, die für die empfangenen Daten relevant sind, und überträgt sie zu den empfangenden Enden über einen Übertragungskanal.
  • Das Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 dequantisiert das Ausgangssignal des Orthogonaltransformations-/Quantisierungsmittels 7, und es führt ferner eine Umkehrorthogonaltransformation aus, um das Vorhersagefehlersignal wie ursprünglich generiert zu reproduzieren. In dem Fall, dass das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal unterabgetastet hat, um seine Auflösung zu reduzieren, wird das reproduzierte Vorhersagefehlersignal natürlich die reduzierte Bildauflösung haben. In diesem Fall versucht das zweite Auflösungskonvertierungsmittel 10, die ursprüngliche Auflösung durch Durchführen eines Herauftastprozesses auf die zuvor beschriebene Weise wiederherzustellen. Es wird daran erinnert, dass dieser Herauftastprozess ein Prozess ist, um die Bildpunktwerte hoher Auflösung aus den Werten von einigen umgebenden Bildpunkten geringer Auflösung zu erhalten. In der vorliegenden Erfindung wird jedoch der Herauftastprozess nicht auf die Bildpunkte verweisen, die zu einem beliebigen benachbarten Block gehören, der Gegenstand eines anderen Kodierungsschemas ist, das sich von dem auf den vorliegenden Block angewendeten unterscheidet. Als eine abwechselnde Anordnung kann der Herauftastprozess so implementiert sein, dass er die Bildpunkte in anderen Blöcken vernachlässigen wird, sondern nur auf den vorliegenden Block von Interesse verweisen wird.
  • Mit einem derartigen Herauftastalgorithmus verhindert die vorliegende Erfindung den Unterschied in Kodierungsschemata aus Beeinflussung des reproduzierten Vorhersagefehlersignals im Gegensatz zu dem konventionellen Herauftastprozess, wo die Blöcke mit unterschiedlichen Kodierungsschemata einiges unerwünschtes Rauschen in dem reproduzierten Signal verursachen, wie in dem Profil (d) von 17 veranschaulicht wird. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal, das durch das zweite Auflösungskonvertierungsmittel 10 ausgegeben wird, die ursprüngliche Signalform haben, wie in dem Profil (c) gezeigt wird. Die oben beschriebene Auflösungskonvertierung wird nicht ausgeführt, wenn das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal nicht herab getastet hat. In diesem Fall leitet das zweite Auflösungskonvertierungsmittel 10 das reproduzierte Vorhersagefehlersignal weiter wie es ist.
  • Das Dekodierungsbild-Generierungsmittel 11 rekonstruiert ein Bild durch Hinzufügen des reproduzierten Vorhersagefehlersignals, das von dem zweiten Auflösungskonvertierungsmittel 10 gesendet wird, zu dem Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel 4 generiert wird. Das resultierende Bild, oder dekodierte Bild, wird dann dem Dekodierungsbildspeichermittel 2 bereitgestellt.
  • Auf die oben beschriebene Weise kann die vorliegende Erfindung die Bewegungsbilder ohne Einführung von unerwünschtem Rauschen reproduzieren, selbst wenn einige gemischte Kodierungsschemata zum Kodieren eines Rahmens verwendet werden, oder mit anderen Worten, selbst wenn zwei benachbarte Blöcke eine große Differenz in Bildpunktwerten aufweisen.
  • Die erste Ausführungsform der vorliegenden Erfindung wird nachstehend detaillierter beschrieben.
  • 3 ist ein Blockdiagramm, das einen spezifischen Aufbau der ersten Ausführungsform der vorliegenden Erfindung zeigt. In 3 empfängt eine Auflösungsauswahlsteuervorrichtung 21, die dem Auflösungsbestimmungsmittel 1 in 1 entspricht, die Quantisiererschrittgröße von einer Steuereinheit 33 (später beschrieben). Sie empfängt auch die Menge von kodierten Rahmendaten von einem Entropiekodierer 28, und die Pufferbelegungsinformation von einem Kodierungsdatenpuffer 34. Basierend auf der gesamten empfangenen Information bestimmt die Auflösungsauswahlsteuervorrichtung 21 eine geeignete Bildauflösung für jeden Rahmen, sodass die Videoinformation, die zu den empfangenden Enden abgegeben wird, nicht an unerträglicher Bildqualitätsverschlechterung wegen der groben Unterabtastung der Rahmen leiden wird. In der ersten Ausführungsform wählt die Auflösungsauswahlsteuervorrichtung 21 normalerweise eine hohe Auflösung von 352×288 Pixel, oder die CIF-Auflösung. Wenn eine große Menge von kodierten Daten als ein Ergebnis des Kodierungsprozesses erzeugt wird, wählt sie eine geringe Auflösung von 175×144 Pixel, oder die QCIF-Auflösung. Die Auflösungsauswahlsteuervorrichtung 21 kann als eine alternative Anordnung derart konfiguriert sein, dass sie drei oder mehr Arten von Auflösungen umschalten wird. Bezüglich der anwendbaren Algorithmen zum Bestimmen der Bildauflösung sieht die zuvor erwähnte japanische Patentanmeldung Nr. 8-75605 (1996) z. B. eine detaillierte Beschreibung vor. Eine Benachrichtigung über die bestimmte Auflösung wird zu einem Herabtastschalter 26b, einem Tiefpassfilterschalter 32b, einem Vorhersageparameterkalkulator 23 und einem Herauftastschalter 30b gesendet, wie später beschrieben wird. Sie wird auch einem Entropiekodierer 28 zugeführt, obwohl der Signalfluss in 3 nicht veranschaulicht wird.
  • Ein Rahmenspeicher 22, der als das Dekodierungsbildspeichermittel 2 in 1 dient, wird verwendet, um Bilddaten von einem oder mehr Rahmen zu speichern, die in den letzten wenigen Kodierungszyklen rekonstruiert sind. Ein Vorhersageparameterkalkulator 23 ist, was in 1 als das Vorhersageparameter-Kalkulationsmittel 3 beschrieben wird. Für jeden Block, der durch Partitionieren des Quellenbildes gemäß der Bildauflösung erhalten wird, die durch die Auflösungsauswahlsteuervorrichtung 21 bestimmt wird, kalkuliert der Vorhersageparameterkalkulator 23 einen Bewegungsvektor, ebenso wie eine Bestimmung des Kodierungsschemas (d. h. Intrarahmen oder Interrahmen), das anzuwenden ist. Die Größe von jedem Block hängt von der Auflösung ab, die durch die Auflösungsauswahlsteuervorrichtung 21 bestimmt wird. Sie ist entweder 16×16 Pixel für CIF-Auflösung oder 32×32 Pixel für QCIF-Auflösung. Die Information über das bestimmte Kodierungsschema wird zu dem Vorhersagebildschalter 24b und der Herauftasteinheit 30a gesendet, während der kalkulierte Bewegungsvektor von jedem Block dem Tiefpassfilterschalter 32b und dem Entropiekodierer 28 zugeführt wird.
  • Ein Vorhersagebildgenerator 24a und ein Vorhersagebildschalter 24b dienen als das Vorhersagebild-Generierungsmittel 4, das in 1 gezeigt wird. Der Vorhersagebildgenerator 24a fragt ein relevantes vergangenes dekodiertes Bild von dem Rahmenspeicher 22 ab und wendet dann die Bewegungsvektoren, die von der Vorhersageparameter-Kalkulationseinheit 23 gesendet werden, auf das abgefragte Bild an, um ein Vorhersagebild des aktuellen Rahmens aufzubauen. Der Vorhersagebildschalter 24b ist ein Schalter, um den Inhalt der Vorhersagebilder auf einer Basis Block für Block zu steuern, in Übereinstimmung mit dem Kodierungsschema, das durch den Vorhersageparameterkalkulator 23 spezifiziert ist. Genauer gibt der Vorhersagebildschalter 24b Nullen für die vorhergesagten Bildpunktwerte aus, wenn der Block der Intrarahmenkodierung unterzogen wird. Er wählt wiederum das Vorhersagebild, das von dem Vorhersagebildgenerator 24a ausgegeben wird, wenn die Interrahmenkodierung spezifiziert ist.
  • Ein Tiefpassfilter 32a entfernt Hochfrequenzkomponenten, die in jedem vorhergesagten Block enthalten sind. Basierend auf dem Bewegungsvektor von jedem Block, der von dem Vorhersageparameterkalkulator 23 gesendet wird, untersucht ein Tiefpassfilterschalter 32b, wie schnell sich jeder Block bewegt, wobei dadurch die Blöcke in zwei Gruppen klassifiziert werden: eine Gruppe schneller Bewegung und eine Gruppe von weniger Bewegung. Der Tiefpassfilterschalter 32b verwendet ferner die Bildauflösung, die durch die Auflösungsauswahlsteuervorrichtung 21 bereitgestellt wird, um zu bestimmen, ob die Hochfrequenzkomponenten zu aktivieren sind oder nicht. Genauer wählt, wenn die QCIF-Auflösung spezifiziert ist und der Block von Interesse in die Gruppe schneller Bewegung fällt, der Tiefpassfilterschalter 32b die Ausgabe des Tiefpassfilters 32a. Wenn die QCIF-Auflösung spezifiziert ist, aber der Block in die Gruppe von weniger Bewegung fällt, oder wenn die CIF-Auflösung spezifiziert ist, wird der Tiefpassfilterschalter 32b andererseits das Tiefpassfilter 32a umgehen.
  • Im wesentlichen ist die Frequenzreaktion eines vorhersagenden Kodierungsprozesses Gegenstand der Nyquist-Bandbreitenbegrenzung. D. h. wenn mit dem QCIF-Bildformat gearbeitet wird, ist der Kodierungsprozess nicht in der Lage, die Frequenzkomponenten über die Nyquist-Frequenz (τ1), die durch die QCIF-Auflösung definiert ist, hinaus zu kodieren. Die höheren Frequenzkomponenten über τ1 hinaus, falls sie existieren, könnten einige Kodierungsfehler verursachen, die sich in der Kodierungsschleife akkumulieren, was im Lauf der Zeit zu einer Verschlechterung in der Qualität von Bildern führt. Es ist deshalb notwendig, derartige unerwünschte Komponenten höherer Frequenz aus dem Vorhersagebild zu entfernen um zu verhindern, dass sich der Kodierungsfehler akkumuliert, und deshalb ist das Tiefpassfilter 32a in die Videokodierungsvorrichtung der vorliegenden Erfindung einbezogen.
  • Andererseits besteht ein Bild allgemein aus Bereichen, die relativ geringe oder keine Bewegungen aufweisen (z. B. ein Hintergrundbild), und Bereichen, die schnelle Bewegungen enthalten (z. B. ein Schauspieler oder eine Schauspielerin). Falls das oben beschriebene Tiefpassfilter auf die Blöcke in weniger aktiven Bereichen angewendet wird, wird die resultierende Hochfrequenzunterdrückung die Schärfe des Bildes in jenen Bereichen verderben. Da es natürlich keine Notwendigkeit gibt, die Bildinformation in derartigen weniger aktiven Bereichen, die bei einem hohen Komprimierungsverhältnis kodiert werden können, weiter zu reduzieren, sollte die Hochfrequenzunterdrückung auf sie nicht angewendet werden.
  • Aus diesem Grund ist die Videokodierungsvorrichtung von 3 so konfiguriert, dass der Tiefpassfilterschalter 32b das Vorhersagebild, dessen Hochfrequenzkomponenten durch das Tiefpassfilter 32a beseitigt sind, nur auswählen wird, wenn die QCIF-Auflösung spezifiziert ist und der Block in die Gruppe schneller Bewegung fällt.
  • Eine Vorhersagefehlersignal-Generierungseinheit 25 dient als das Vorhersagefehlersignal-Generierungsmittel 5 in 1. Die Kombination einer Herabtasteinheit 26a und eines Herabtastschalters 26b entspricht dem ersten Auflösungskonvertierungsmittel 6 in 1. Das Vorhersagefehlersignal, das durch die Vorhersagefehlersignal- Generierungseinheit 25 für jeden Block erzeugt wird, wird der Herabtasteinheit 26a zugeführt, um einen Herabtastprozess anzuwenden, wie zuvor mit Bezug auf 15 beschrieben wird. Der Herabtastschalter 26b wird verwendet, um den Herabtastprozess für das Vorhersagefehlersignal zu umgehen, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt er die direkte Ausgabe der Vorhersagefehlersignal-Generierungseinheit 25, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er die Ausgabe der Herabtasteinheit 26a.
  • Das Orthogonaltransformations-/Quantisierungsmittel 7 in 1 ist als eine Kombination eines DCT-Prozessors (8×8 DCT) 27a und eines Quantisierers 27b implementiert. Der DCT-Prozessor 27a führt eine diskrete Kosinustransformation für jeden Bildpunktblock von 8×8 durch, wobei dadurch eine Menge von Transformationskoeffizienten geliefert wird. Der Quantisierer 27b quantisiert die Transformationskoeffizienten gemäß der Quantisiererschrittgröße, die von der Kodierungssteuervorrichtung 33 gesendet wird (später beschrieben). Die erhaltenen Werte werden als quantisierte Koeffizienten bezeichnet.
  • Die Kodierungssteuervorrichtung 33 empfängt Information über die Menge der resultierenden kodierten Daten von einem Entropiekodierer 28 (später beschrieben), ebenso wie sie über die Pufferbelegung durch einen Kodierungsdatenpuffer 34 informiert wird. Basierend auf diesen zwei Arten von Information bestimmt und verteilt die Kodierungssteuervorrichtung 33 die Quantisiererschrittgröße zu dem Quantisierer 27b, Dequantisierer 29a, der Auflösungsauswahlsteuervorrichtung 29a und dem Entropiekodierer 28.
  • Der Entropiekodierer 28, der als das Codezuordnungsmittel 8 in 1 dient, empfängt die quantisierten Koeffizienten von dem Quantisierer 27b, die Bildauflösung von der Auflösungsauswahlsteuervorrichtung 21 (Signalfluss ist in 3 weggelassen), die Quantisiererschrittgröße von der Kodierungssteuervorrichtung 33 und das Kodierungsschema und Bewegungsvektoren von dem Vorhersageparameterkalkulator 23. Aus einer vorbereiteten Codetabelle heraus fragt der Entropiekodierer 28 Codeworte ab, die für die einzelnen Kombinationen jener empfangenen Daten relevant sind, wobei dadurch die kodierten Rahmendaten ausgegeben werden. Der Kodierungsdatenpuffer 34 dient als ein zeitweilige Speicher für die kodierten Rahmendaten, die durch den Entropiekodierer 28 erzeugt werden.
  • Ein Dequantisierer 29a und ein IDCT-Prozessor (8×8 IDCT) 29b arbeiten als das Dequantisierungs-/Umkehrorthogonaltransformatiosmittel 9 in 1. Eine Herauftasteinheit 30a und ein Herauftastschalter 30b arbeiten in Kombination als das zweite Auflösungskonvertierungsmittel 10 in 1. Wenn versucht wird, einen Block in einem gewissen Kodierungsschema zu verarbeiten, das durch den Vorhersageparameterkalkulator 23 bestimmt ist, untersucht die Herauftasteinheit 30a zuerst, ob der Block von Interesse zu beliebigen Blöcken, die Gegenstand des anderen Kodierungsschemas sind, benachbart ist oder nicht. Falls ein derartiger benachbarter Block gefunden wird, wird die Herauftasteinheit 30a den Block von Interesse konvertieren, um die Auflösung durch Herauftasten der Bildpunkte zu erhöhen. Der Herauftastalgorithmus, der in diesem Fall verwendet wird, wird später mit Bezug auf 4 beschrieben. Falls der Block keine derartigen benachbarten Blöcke hat, führt die Herauftasteinheit 30a einen konventionellen Herauftastprozess durch, wie in 16 veranschaulicht wird.
  • Der Herauftastschalter 30b erlaubt dem reproduzierten Vorhersagefehlersignal, den Herauftastprozess zu umgehen, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt er die genaue Ausgabe des IDCT-Prozessors 29b aus, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er die Ausgabe der Herauftasteinheit 30a aus. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal, das der nächsten Stufe zugeführt wird, konsistent die CIF-Auflösung haben.
  • Eine Dekodierungsbild-Generierungseinheit 31 entspricht dem Dekodierungsbild-Generierungsmittel 11 in 1. Die Dekodierungsbild-Generierungseinheit 31 führt die Summierung des Vorhersagebildes und des reproduzierten Vorhersagefehlersignals durch, um ein vollständig dekodiertes Bild zu erhalten. Es wird vermerkt, dass alle Signale, die in diese Summierung einbezogen sind, eine vereinheitlichte Auflösung haben, d. h. das CIF. Das dekodierte Bild wird in den Rahmenspeicher 22 für einen zukünftigen Abruf gesichert.
  • 4 stellt den obigen Herauftastprozess dar, der durch die Herauftasteinheit 30a durchgeführt wird. Bezug nehmend auf 4 repräsentieren schwarze Punkte QCIF-Pixel, und alphabetische Zeichen in Großbuchstaben sind ihnen beigefügt, um ihre jeweiligen Vorhersagefehlersignalgrade anzuzeigen. Auch repräsentieren weiße Punkte CIF-Pixel, und Kleinbuchstaben zeigen ihre jeweiligen Vorhersagefehlersignalgrade an. Es gibt einen Blockgrenze 36, wie durch eine gestrichelte Linie dargestellt, in der das angewendete Kodierungsschema von Intrarahmen zu Interrahmen oder umgekehrt umgeschaltet wird.
  • Mit Bezug auf die Vorhersagefehlersignalwerte von inneren CIF-Pixel, die der Blockgrenze 36 nicht unmittelbar benachbart sind, kalkuliert die Herauftasteinheit 30a einen gewichteten Mittelwert der Werte von vier QCIF-Pixel, die jedes CIF-Pixel umgeben. Z. B. wird ein CIF-Pixelwert f durch Kalkulieren von f = (9A + 3B + 3C + D)/16 (4)erhalten, wobei die vier QCIF-Werte mit geeigneten Gewichtungsfaktoren aufsummiert werden, die durch ihre jeweiligen Abstände von dem CIF-Pixel in Bearbeitung bestimmt sind. Es wird vermerkt, dass dieser Algorithmus der gleiche wie der konventionelle Herauftastalgorithmus ist, der in 16 erläutert wird.
  • Im Gegensatz zu dem obigen werden die Vorhersagefehlersignalwerte in den Bildpunkten, die sich unmittelbar benachbart zu der Blockgrenze 36 befinden, durch die Herauftasteinheit 30a kalkuliert, wobei nur zwei benachbarte QCIF-Pixel betrachtet werden, oder ohne Verweis auf die Bildpunkte über die Blockgrenze 36 hinaus, die Gegenstand für das andersartige Kodierungsschema sind. Z. B. wird der Signalwert b als b = (3A + B)/4 (5)erhalten. Ein anderer Bildpunktwert, sagen wir i, wird durch Kalkulieren eines gewichteten Mittelwertes i = (A + 3C)/4 (6)erhalten, wobei ähnlich nur auf zwei QCIF-Pixel verwiesen wird. Bezüglich noch eines anderen Bildpunkts, das in einer Ecke der Blockgrenze 36 benannt als a ist, wird sein Wert mit Bezug auf ein einzelnes QCIF-Pixel als a = A (7)kalkuliert.
  • Dank des oben beschriebenen Herauftastalgorithmus verhindert die vorliegende Erfindung den Unterschied in Kodierungsschemata durch Beeinflussung des reproduzierten Vorhersagefehlersignals im Gegensatz zu dem konventionellen Herauftastprozess, wo die Blöcke mit unterschiedlichen Kodierungsschemata einiges unerwünschtes Rauschen in dem reproduzierten Vorhersagefehlersignal verursachen können, wie in dem Signalprofil (d) von 17 veranschaulicht wird. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal, das in dem Ausgang der Herauftasteinheit 30a erscheint, ein nahezu ursprüngliches Signalprofil aufweisen, wie in dem Signalprofil (c) gezeigt wird.
  • Deshalb kann die vorliegende Erfindung die ursprünglichen Bilder ohne Einführung von Rauschen reproduzieren, selbst wenn einige gemischte Kodierungsschemata zum Komprimieren eines Rahmens verwendet werden, oder selbst wenn ein beträchtlicher Unterschied in Bildpunktwerten in einer gewissen Blockgrenze existiert.
  • In der oben beschriebenen ersten Ausführungsform untersucht die vorgeschlagene Herauftasteinheit 30a, ob der Block von Interesse einem beliebigen anderen Block benachbart ist oder nicht, der Gegenstand für das andersartige Kodierungsschema ist, und falls ein derartiger benachbarter Block gefunden wird, wird sie die Bildpunkte unter Verwendung des in 4 erläuterten Algorithmus herauf tasten. Als ein wechselnder Algorithmus ist es jedoch möglich, einfach jeden Block durch Verwenden der Werte seiner inneren Bildpunkte heraufzutasten, ungeachtet dessen, ob der Block der Grenze zwischen unterschiedlichen Kodierungsschemata benachbart ist oder nicht. Während ein kleiner Fehler dadurch vorhanden ist, dass die Schärfe von Quellenbildern in den dekodierten Bildern etwas verloren gehen kann, wird dieses alternative Verfahren wegen seines Vorteils in der Einfachheit der Herauftasteinheit 30a die Hardwarekosten reduzieren und das Leistungsverhalten verbessern.
  • Als Nächstes wird eine zweite Ausführungsform der vorliegenden Erfindung, die sich auch auf eine Videokodierungsvorrichtung bezieht, nachstehend beschrieben.
  • 5 ist ein Blockdiagramm, das den Aufbau der zweiten Ausführungsform der vorliegenden Erfindung zeigt. Da die zweite Ausführungsform im wesentlichen den gleichen Aufbau wie den der ersten Ausführungsform hat, wird sich die folgende Beschreibung auf die unterschiedlichen Punkte konzentrieren, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.
  • Im Vergleich zu der ersten Ausführungsform ist die zweite Ausführungsform dadurch unterscheidbar, dass ein 8×8 DCT-Prozessor 38, ein 16×16 DCT-Prozessor 39, eine Extraktionseinheit 40 und ein Selektor 41 an Stelle der Herabtasteinheit 26a, des Herabtastschalters 26b und des DCT-Prozessors 27a der ersten Ausführungsform eingeführt sind. Die zweite Ausführungsform verwendet effektiv die Ähnlichkeit zwischen einer 16×16 Orthogonaltransformation und einer 8×8 Orthogonaltransformation in ihren Grundlagen. Genauer wendet der 16×16 DCT-Prozessor 39 eine 16×16 Orthogonaltransformation auf das Vorhersagefehlersignal mit dem CIF-Format an, und die Extraktionseinheit 40 extrahiert die Niederfrequenzkomponenten aus den erhaltenen Transformationskoeffizienten. Die Komponenten, die derart extrahiert werden, werden eine gute Schätzung der Transformationskoeffizienten sein, die durch eine 8×8 Orthogonaltransformation von unterabgetasteten QCIF-Bildern erhalten würden. Andererseits wendet der 8×8 DCT-Prozessor 38, der parallel mit dem 16×16 DCT-Prozessor 39 und der Extraktionseinheit 40 angeordnet ist, eine 8×8 Orthogonaltransformation auf das gleiche Vorhersagefehlersignal an.
  • Entsprechend wählt der Selektor 41 eine Menge von Transformationskoeffizienten aus, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt der Selektor 41 die Ausgabe des 8×8 DCT-Prozessors 38, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er wiederum die Ausgabe der Extraktionseinheit 40. Der Quantisierer 27b empfängt dann die Menge von Transformationskoeffizienten, die ausgewählt wurde.
  • Neben einer Bereitstellung der gleichen Funktionen wie in der ersten Ausführungsform wird die zweite Ausführungsform den Umfang von Berechnungslasten im Vergleich zu der ersten Ausführungsform stark reduzieren.
  • Als Nächstes wird nachstehend eine dritte Ausführungsform der vorliegenden Erfindung in Bezug auf eine Videokodierungsvorrichtung beschrieben.
  • 6 ist ein Blockdiagramm, das einen spezifischen Aufbau der dritten Ausführungsform der vorliegenden Erfindung zeigt. Da die dritte Ausführungsform im wesentlichen den gleichen Aufbau wie den der ersten Ausführungsform hat, wird sich die folgende Beschreibung auf ihre unterschiedlichen Punkte konzentrieren, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.
  • Die dritte Ausführungsform ist von der ersten Ausführungsform dadurch unterscheidbar, dass ein 8×8 IDCT-Prozessor 42, eine Zuweisungseinheit 43, ein 16×16 IDCT-Prozessor 44 und ein Selektor 45 an Stelle der Herauftasteinheit 30a, des Herauftastschalters 30b und eines IDCT-Prozessors 29b der ersten Ausführungsform eingeführt sind. Wie in der zweiten Ausführungsform verwendet die dritte Ausführungsform die Ähnlichkeit zwischen einer 16×16 Orthogonaltransformation und einer 8×8 Orthogonaltransformation im Sinne der Transformationsbasis. Genauer betrachtet die Koeffizientenzuweisungseinheit 43 die dequantisierten 8×8 Transformationskoeffizienten, die von dem Dequantisierer 29a als 8×8 Niederfrequenzkomponenten gesendet werden, als Teil eines 16×16 Transformationskoeffizientenblocks. Die Koeffizientenzuweisungseinheit 43 weist ferner Nullen den verbleibenden Transformationskoeffizienten zu. Der derart gebildete 16×16 Transformationskoeffizientenblock wird dann durch den IDCT-Prozessor 44 einer Umkehrtransformation unterzogen. Das Vorhersagefehlersignal, das durch diesen Prozess reproduziert wird, ist nahezu das gleiche wie das, das aus Transformationskoeffizienten eines CIF-Bildes reproduziert wird. Andererseits wendet der 8×8 IDCT-Prozessor 42, der parallel zu der Koeffizientenzuweisungseinheit 43 und dem 16×16 IDCT-Prozessor 44 angeordnet ist, eine 8×8 Umkehrorthogonaltransformation auf die gleichen dequantisierten 8×8 Transformationskoeffizienten an.
  • Der Selektor 45 wählt eines der Ausgangssignale der zwei IDCT-Prozessoren 42 und 44 aus, abhängig von der Bildauflösung, die von der Auflösungsauswahlsteuervorrichtung 21 empfangen werden. Für die Blöcke, wo die CIF-Auflösung spezifiziert ist, wählt der Selektor 45 die Ausgabe des 8×8 DCT-Prozessors 42, und für die Blöcke, wo die QCIF-Auflösung spezifiziert ist, wählt er die Ausgabe des 16×16 IDCT- Prozessors 44 aus. Das derart ausgewählte reproduzierte Vorhersagefehlersignal wird dann der Dekodierungsbild-Generierungseinheit 31 bereitgestellt.
  • Neben dem Angebot der gleichen Funktionen wie in der ersten Ausführungsform wird die dritte Ausführungsform der vorliegenden Erfindung den Umfang von notwendigen Berechnungslasten im Vergleich zu der ersten Ausführungsform stark reduzieren.
  • Als Nächstes wird nachstehend eine vierte Ausführungsform der vorliegenden Erfindung beschrieben. Anders als die vorherigen drei Ausführungsformen bezieht sich diese vierte Ausführungsform auf eine Videodekodierungsvorrichtung.
  • 7 ist ein Blockdiagramm, das den Aufbau der vierten Ausführungsform der vorliegenden Erfindung zeigt. Da die vierte Ausführungsform einige Elemente einsetzt, die mit der ersten Ausführungsform gemeinsam sind, wird die folgende Beschreibung die Erläuterung für derartige Elemente nicht wiederholen, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.
  • Bezug nehmend auf 7 reproduziert ein Entropiedekoder 47 Daten, wie etwa quantisierte Koeffizienten, Bildauflösung, Quantisiererschrittgröße, Kodierungsschema und Bewegungsvektoren, aus den kodierten Rahmendaten heraus, die von einem sendenden Ende empfangen werden. Der Entropiedekoder 47 verteilt jene reproduzierten Daten zu anderen Funktionsblöcken in der Vorrichtung. Genauer werden die quantisierten Koeffizienten und die Quantisiererschrittgröße zu dem Dequantisierer 29a gesendet; die Bildauflösung wird an den Herauftastschalter 30b und den Tiefpassfilterschalter 32b abgegeben; das Kodierungsschema wird dem Vorhersagebildschalter 24b und der Herauftasteinheit 30a zugeführt; die Bewegungsvektoren werden dem Vorhersagebildgenerator 24a und dem Tiefpassfilterschalter 32b bereitgestellt. Operationen jener Funktionsblöcke innerhalb des Bereichs, der durch die wechselnden langen und kurzen Striche angezeigt ist, werden hier nicht beschrieben, da sie auf die gleiche Weise arbeiten, wie in der ersten Ausführungsform beschrieben wird.
  • Die Ausgabe dieser Videodekodierungsvorrichtung wird von der Dekodierungsbild-Generierungseinheit 31 abgezweigt. Das heißt die dekodierten Bilder, die durch die Dekodierungsbild-Generierungseinheit 31 vollständig rekonstruiert werden, werden zu einem externen Videomonitor oder ähnlichen Einrichtungen ausgegeben, während sie in dem Rahmenspeicher 22 als die Bezugsrahmen für vorhersagende Kodierung gesichert werden.
  • Auf die oben beschriebene Weise empfängt und dekodiert die Videodekodierungsvorrichtung der vierten Ausführungsform das kodierte Videosignal, das durch eine Videokodierungsvorrichtung erzeugt wird. Dieser Dekodierungsprozess setzt die Herauftasteinheit 30a ein. Wie in der ersten Ausführungsform der vorliegenden Erfindung erlaubt die Herauftasteinheit 30a, dass die Bilder ohne Rauschen oder Artefakte reproduziert werden, selbst wenn einige unterschiedliche Kodierungsschemata zum Komprimieren eines Rahmens verwendet werden, oder selbst wenn mit anderen Worten die Bildpunktwerte eine große Differenz in einer gewissen Blockgrenze aufweisen.
  • Als Nächstes wird nachstehend eine fünfte Ausführungsform der vorliegenden Erfindung beschrieben. Diese fünfte Ausführungsform bezieht sich auf eine Videokodierungsvorrichtung.
  • 2 zeigt das Konzept der fünften Ausführungsform. Wegen ihrer Ähnlichkeit zu der ersten Ausführungsform, die in 1 dargestellt wird, sind in 2 gleichen Elementen gleiche Bezugszeichen beigefügt.
  • Die fünfte Ausführungsform ist von der ersten Ausführungsform dadurch unterscheidbar, dass ein zweites Auflösungskonvertierungsmittel 15 verschieden von dem zweiten Auflösungsmittel funktioniert, das in der ersten Ausführungsform angeführt wird, und auch dadurch, dass die Videokodierungsvorrichtung ferner ein Vorhersagebild-Modifikationsmittel 13 umfasst, das zwischen dem Vorhersagebild-Generierungsmittel 4 und dem Dekodierungsbild-Generierungsmittel 11 angeordnet ist. Ferner umfasst die fünfte Ausführungsform ein Vorhersagebild-Modifikationssteuermittel 14, das mit dem Vorhersagebild-Modifikationsmittel 13 verknüpft ist.
  • In dem Fall, dass das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal herab getastet hat, um seine Bildauflösung zu reduzieren, wird das Vorhersagefehlersignal, das durch das Dequantisierungs-/Umkehrorthogonaltransformationsmittel 9 reproduziert wird, die gleiche reduzierte Bildauflösung haben. In diesem Fall versucht das zweite Auflösungskonvertierungsmittel 12, die ursprüngliche Auflösung durch Durchführen eines Herauftastprozesses wiederherzustellen. In der fünften Ausführungsform kann dieser Herauftastprozess auf die Bildpunkte verweisen, die zu den Blöcken über eine Blockgrenze hinaus gehören, ungeachtet der Größe jener Bildpunktwerte, wie in den konventionellen Herauftastalgorithmen.
  • Wenn das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal herab getastet hat, um die Bildauflösung zu reduzieren, bestimmt das Vorhersagebild-Modifikationssteuermittel 14, ob die Werte von Bildpunkten, die sich nahe einer bestimmten Blockgrenze befinden, zu modifizieren sind oder nicht. In dem Fall, dass das erste Auflösungskonvertierungsmittel 6 das ursprüngliche Vorhersagefehlersignal herab getastet hat, um die Bildauflösung zu reduzieren, und falls das Vorhersagebild-Modifikationssteuermittel 14 bestimmt hat, die Bildpunktwerte in der bestimmten Blockgrenze zu modifizieren, wird das Vorhersagebild-Modifikationsmittel 13 die Werte der Bildpunkte, die sich entlang der bestimmten Blockgrenze befinden, mit Bezug auf andere Bildpunkte über diese Grenze hinaus modifizieren.
  • Genauer untersucht das Vorhersagebild-Modifikationssteuermittel 14 das Vorhersagebild, das durch das Vorhersagebild-Generierungsmittel 4 erzeugt wird, um die Differenz von Block zu Block im Sinne von Bildpunktwerten zu evaluieren. Falls irgendeine kritische Differenz, die einen gewissen Schwellenpegel überschreitet, in beliebigen bestimmten Blöcken beobachtet wird, betrachtet das Vorhersagebild-Modifikationssteuermittel 14 die Grenze zwischen derartigen Blöcken als die zuvor erwähnte bestimmte Blockgrenze. Hierin wird diese bestimmte Blockgrenze als eine kritische Blockgrenze bezeichnet, wo eine Modifikation von Bildpunktwerten erforderlich ist. In der Realität kann jedoch die kritische Blockgrenze nicht durch einen bitweisen Vergleich von Bildpunkten direkt identifiziert werden, sondern wird durch Beobachtung von Blöcken basierend auf einem der folgenden zwei Kriterien geschätzt.
  • Das erste Kriterium ist die Differenz in Kodierungsschemata, die auf benachbarte Blöcke angewendet werden. Das Vorhersagebild-Modifikationssteuermittel 14 untersucht die Kodierungsschemata, die durch das Vorhersageparameter- Kalkulationsmittel 3 tatsächlich für jeden Block zugewiesen sind. Falls ein Block von Interesse beliebigen anderen Blöcken benachbart ist, die Gegenstand für ein anderes Kodierungsschema sind, erkennt das Vorhersagebild-Modifikationssteuermittel 14 die Grenze von den zwei benachbarten Blöcken als eine kritische Grenze.
  • Das zweite Kriterium ist der Unterschied in Bewegungsvektoren. Hier werden die Bewegungsvektoren, die durch das Vorhersageparameter-Kalkulationsmittel 3 erzeugt werden, auf einer Basis Block für Block evaluiert. Genauer vergleicht das Vorhersagebild-Modifikationssteuermittel 14 den Bewegungsvektor eines Blocks von Interesse mit dem eines beliebigen benachbarten Blocks. Falls die beobachtete Differenz in einer Vektorgröße größer als eine vorbestimmte Schwelle ist, erkennt das Vorhersagebild-Modifikationssteuermittel 14 diese Blockgrenze als eine kritische Grenze.
  • Kurz gesagt impliziert eine beliebige Differenz von Block zu Block in angewendeten Kodierungsschemata das Vorhandensein beliebiger kritischer Differenzen in Bildpunktwerten. Alternativ werden diskontinuierliche Variationen, die in der Bewegungsvektordomäne beobachtet werden, die gleiche logische Schlussfolgerung vorsehen. Das Vorhersagebild-Modifikationssteuermittel 14 erfasst derartige kritische Differenzen und bestimmt, die Bildpunktwerte entlang der kritischen Blockgrenze zu modifizieren. Dann weist das Vorhersagebild-Modifikationssteuermittel 14 das Vorhersagebild-Modifikationsmittel 13 an, eine Glättungsoperation durchzuführen, um die Diskontinuität in den Bildpunktwerten zu beseitigen.
  • Siehe z. B. 11, die einige spezifische Profile von Bildpunktwerten in einigen Punkten in einer Videokodierungsvorrichtung gemäß der vorliegenden Erfindung zeigt. In 11 enthält ein Quellenbild (a) beide Arten von Blöcken, einer Gegenstand für Intrarahmenkodierung und der andere Gegenstand für Interrahmenkodierung. Die Grenze jener unterschiedlichen Arten von Blöcken wird durch eine vertikale gestrichelte Linie angezeigt. Da der Intrarahmenkodierungsblock auf der linken Seite keinen Bezugsrahmen für Rahmenvorhersage hat, werden ihre Bildpunktwerte in dem Vorhersagebild (b) einfach auf Nullen gesetzt. Entsprechend wird das resultierende Vorhersagefehlersignal (c) große Werte in dem Intrarahmenkodierungsblock aufweisen, während sich kleine Werte für den Interrahmenkodierungsblock zeigen.
  • In einer derartigen Situation, wo zwei benachbarte Blöcke mit unterschiedlichen Schemata kodiert sind (d. h. Intrarahmen und Interrahmen), wird der Herauftastprozess, der durch das zweite Auflösungskonvertierungsmittel 12 ausgeführt wird, eine Mischung von unterschiedlich kodierten Bildpunktwerten in der Nähe der Blockgrenze verursachen, was eine gewisse Verzerrung in dem reproduzierten Vorhersagefehlersignal (d) einführt, wie es der Fall in dem zuvor angeführten konventionellen Herauftastprozess ist.
  • Andererseits wendet gemäß der vorliegenden Erfindung das Vorhersagebild-Modifikationsmittel 13 eine Glättungsoperation auf die Bildpunkte an, die sich entlang der kritischen Blockgrenze in dem Vorhersagebild (b) befinden, wobei dadurch ein geglättetes Vorhersagebild (e) geliefert wird. Durch Hinzufügen des reproduzierten Vorhersagefehlersignals (d) zu dem geglätteten Vorhersagebild (e) erbringt das Dekodierungsbild-Generierungsmittel 11 schließlich das dekodierte Bild (f), das dem ursprünglichen Quellenbild (a) ziemlich ähnlich ist. D. h. die Videokodierungsvorrichtung der fünften Ausführungsform verhindert, dass beliebiges Rauschen in der Nähe von Blockgrenzen in dem dekodierten Bild eingeführt wird, anders als die konventionelle Videokodierungsvorrichtung, die an dieser Art von Rauschen leidet.
  • Die oben beschriebene Bildglättung wird nicht ausgeführt, wenn das erste Auflösungskonvertierungsmittel 6 den Herabtastprozess auf das ursprüngliche Vorhersagefehlersignal nicht angewendet hat. In diesem Fall leitet das Vorhersagebild-Modifikationsmittel 13 das Vorhersagebild wie es ist zu dem Dekodierungsbild-Generierungsmittel 11 weiter.
  • Die obige Erörterung, die das Vorhandensein derartiger Blöcke angenommen hat, die mit zwei unterschiedlichen Kodierungsschemata verarbeitet wurden, ist auch auf den Fall anwendbar, dass es einen beträchtlichen Unterschied zwischen zwei benachbarten Blöcken im Sinne einer Größe von Bewegungsvektoren gibt.
  • Auf die oben beschriebene Weise erlaubt die fünfte Ausführungsform, dass die Bilder ohne unerwünschtes Rauschen reproduziert werden, selbst wenn einige Bildpunktwerte irgendeine Diskontinuität in einer gewissen Blockgrenze aufweisen.
  • 8 ist ein Blockdiagramm, das einen detaillierten Aufbau der fünften Ausführungsform der vorliegenden Erfindung zeigt. Da die fünfte Ausführungsform im wesentlichen den gleichen Aufbau wie den der ersten Ausführungsform hat, die in 3 dargestellt wird, wird sich die folgende Beschreibung auf ihre unterschiedlichen Punkte konzentrieren, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.
  • Diese fünfte Ausführungsform ist von der ersten Ausführungsform dadurch unterscheidbar, dass eine Herauftasteinheit 49 anders als die Herauftasteinheit 30a der ersten Ausführungsform arbeitet, und auch dadurch, dass ein Grenznachbarschaftsfilter 50 zwischen den Tiefpassfilterschalter 32b und die Dekodierungsbild-Generierungseinheit 31 der ersten Ausführungsform neu eingefügt ist. Ferner ist die fünfte Ausführungsform dadurch unterscheidbar, dass sie eine Filteroperationssteuervorrichtung 53 umfasst, die mit dem Grenznachbarschaftsfilter 50 gekoppelt ist. Anders als die Herauftasteinheit 30a in der ersten Ausführungsform untersucht die Herauftasteinheit 49 nicht, ob jeder Block beliebigen anderen Blöcken benachbart ist oder nicht, die Gegenstand eines anderen Kodierungsschemas sind. Vielmehr führt sie den konventionellen Herauftastprozess durch, wie in 16 veranschaulicht, wobei auf beliebige relevante Bildpunkte nicht nur innerhalb des Blocks, sondern auch über die Blockgrenze hinaus verwiesen wird.
  • 9 zeigt einen Herauftastprozess, der durch die Herauftasteinheit 49 durchgeführt wird. In 9 repräsentieren schwarze Punkte und Großbuchstaben QCIF-Pixel und ihre jeweiligen Vorhersagefehlersignalwerte, während weiße Punkte und Kleinbuchstaben CIF-Pixel und ihre jeweiligen Vorhersagefehlersignalwerte repräsentieren. Eine gestrichelte Linie 51 zeigt eine Blockgrenze an, wo sich das Kodierungsschema von Interrahmenkodierung zu Intrarahmenkodierung oder umgekehrt ändert. Um die Vorhersagefehlersignalwerte a, b, c usw. der CIF-Pixel benachbart zu der Blockgrenze 51 zu erhalten, kalkuliert die Herauftasteinheit 49 einen gewichteten Mittelwert der Werte von vier QCIF-Pixel, die jedes CIF-Pixel umgeben, wobei ihre jeweiligen Abstände von dem CIF-Pixel von Interesse betrachtet werden. Z. B. wird der Signalwert a als a = (9A + 3B + 3C + D)/16 (8) erhalten.
  • Als solche verweist die Herauftasteinheit 49 nicht nur auf die QCIF-Pixel A und B, sondern auch auf die Pixel C und D, die Gegenstand für das andere Kodierungsschema sind.
  • Bezug nehmend zurück auf 8 empfängt die Filteroperationssteuervorrichtung 53 die Bildauflösung von der Auflösungsauswahlsteuervorrichtung 21 und das Kodierungsschema für jeden Block von dem Vorhersageparameterkalkulator 23. Wenn die Ausgabe der Herabtasteinheit 26a durch den Herabtastschalter 26b ausgewählt wird (d. h. wenn das Vorhersagefehlersignal herab getastet wird, um die QCIF-Auflösung zu haben), untersucht die Filteroperationssteuervorrichtung 53, ob der Block von Interesse beliebigen anderen Blöcken benachbart ist oder nicht, die Gegenstand für ein anderes Kodierungsschema sind. Falls ein derartiger benachbarter Block gefunden wird, wird die Filteroperationssteuervorrichtung 53 ein Operationsbefehlssignal senden, um das Grenznachbarschaftsfilter 50 zu aktivieren.
  • Das Grenznachbarschaftsfilter 50 wird über das Kodierungsschema für jeden Rahmen informiert gehalten, das durch den Vorhersageparameterkalkulator 23 bestimmt wird. Bei Empfang des Operationsbefehlssignals von der Filteroperationssteuervorrichtung 53 führt das Grenznachbarschaftsfilter 50 eine Glättungsoperation aus, um die Diskontinuität in den Pixelwerten nahe der Blockgrenze zu eliminieren. Dieses geglättete Vorhersagefehlersignal wird dann der Dekodierungsbild-Generierungseinheit 31 zugeführt.
  • 10 erläutert einen Prozess, der durch das Grenznachbarschaftsfilter 50 ausgeführt wird. Es wird angenommen, dass ein Vorhersagebild, das zwei unterschiedliche Kodierungsschemata einbezieht, dem Grenznachbarschaftsfilter 50 über den Tiefpassfilterschalter 32b zugeführt wird. Weiße Punkte in 10 repräsentieren einige Pixel als Teil des Vorhersagebildes, und Kleinbuchstaben, die ihnen beigefügt sind, zeigen ihre jeweiligen Pixelwerte an. Eine Blockgrenze 52 ist eine Grenze, in der das Kodierungsschema von Interrahmenkodierung zu Intrarahmenkodierung oder umgekehrt umgeschaltet wird. Genauer ist der untere rechte Block unter der Blockgrenze 52 intrarahmen-kodiert, während die anderen Blöcke interrahmen-kodiert sind. In diesem Vorhersagebild sind alle Pixelwerte o, p, q, r, u, v, w und x des intrarahmen-kodierten Blocks natürlich auf Null gesetzt. In einer derartigen Situation wendet das Grenznachbarschaftsfilter 50 einen Glättungsoperator auf die Pixel an, die der Blockgrenze 52 benachbart sind, sodass ihre Werte h, i, j, k, l, n, o, p, q, r, t, und u kontinuierlich sein werden. Genauer kalkuliert das Grenznachbarschaftsfilter 50 einen neuen Pixelwert für jedes Pixel, das zu dem interrahmen-kodierten Block gehört. Es wird z. B. der Pixelwert j genommen. Der neue Wert j* für dieses Pixel wird als j* = (9c + 9d + 9i + 9j + 3e + 3f + 3k + 3l)/64 (9)kalkuliert. Für einen anderen Pixelwert q wird sein neuer Pixelwert q* als q* = (c + d + i + j + 3e + 3f + 3k + 3l)/64 (10)ausgedrückt.
  • Wenn die Bildpunkte in dem interrahmen-kodierten Block große Werte haben, wird das Vorhersagebild eine große Variation oder Diskontinuität in seinen Pixelwertprofilen aufweisen, wegen den Nullen, die dem intrarahmen-kodierten Block zugewiesen sind. Das Grenznachbarschaftsfilter 50 glättet eine derartige Variation und beseitigt die Diskontinuität von Pixelwerten, wie ferner nachstehend mit Bezug auf 11 beschrieben wird.
  • 11 ist ein Diagramm, um einen Prozess zum vorhersagenden Kodieren und Dekodieren eines Quellenbild zu erläutern. 11 besteht aus sechs Grafiken (a) bis (f), die die verschiedenen Profile von Pixelwerten in der Nachbarschaft einer gewissen Blockgrenze darstellen, die entlang der Zeitachse eines Kodierungsprozesses angeordnet sind.
  • Ein Quellenbild (a) enthält die folgenden zwei Arten von Blöcken: einen Block, der Gegenstand für Intrarahmenkodierung ist (links), und einen anderen Block, der Gegenstand für Interrahmenkodierung ist (rechts). Hier wird die Grenze von jenen unterschiedlichen Arten von Blöcken als eine vertikale gestrichelte Linie angezeigt. Mit Bezug auf den intrarahmen-kodierten Block sind seine Pixelwerte in einem Vorhersagebild (b) Nullen. Deshalb weist das resultierende Vorhersagefehlersignal (a)–(b) oder (c) große Werte in dem intrarahmen-kodierten Block und kleine Werte in dem interrahmen-kodierten Block auf.
  • In einer derartigen Situation, wo zwei benachbarte Blöcke mit unterschiedlichen Schemata kodiert sind (d. h. Intrarahmen und Interrahmen), wird der Herauftastprozess, der durch die Herauftasteinheit 49 der vorliegenden Erfindung ausgeführt wird, eine Mischung von unterschiedlich kodierten Pixelwerten in der Nachbarschaft der Blockgrenze einführen, wie in dem zuvor erwähnten konventionellen Herauftastprozess. Als ein Ergebnis wird das Profil des reproduzierten Vorhersagefehlersignals verzerrt sein, wie in (d) veranschaulicht wird.
  • In der vorliegenden Ausführungsform wendet jedoch das Grenznachbarschaftsfilter 50 eine Glättungsoperation auf die Pixel entlang der Blockgrenze in dem ursprünglichen Vorhersagebild (b) an, und entsprechend kann ein geglättetes Vorhersagebild (e) erhalten werden. Das Dekodierungsbild-Generierungsmittel 11 erbringt somit ein vollständig dekodiertes Bild (f) durch Hinzufügen des reproduzierten Vorhersagefehlersignals (d) zu dem geglätteten Vorhersagebild (e). Das heißt die Videokodierungsvorrichtung der fünften Ausführungsform verhindert, dass das Rauschen in der Nachbarschaft einer Blockgrenze in dem dekodierten Bild (f) eingeführt wird, anders als die konventionelle Videokodierungsvorrichtung, die an dieser Art von Rauschen leidet.
  • Die oben beschriebene fünfte Ausführungsform ist so konfiguriert, dass die Filteroperationssteuervorrichtung 53 das Kodierungsschema von jedem Block von dem Vorhersageparameterkalkulator 23 zusätzlich zu der Bildauflösung von der Auflösungsauswahlsteuervorrichtung 21 empfangen wird. Als eine alternative Anordnung kann sie so konfiguriert sein, dass sie die Bewegungsvektoren an Stelle des Kodierungsschemas von dem gleichen Vorhersageparameterkalkulator 23 empfangen wird. In diesem Fall vergleicht die Filteroperationssteuervorrichtung 53 den Bewegungsvektor eines Blocks von Interesse mit jenen von beliebigen benachbarten Blöcken im Sinne einer Größe von Vektoren, nachdem erfasst wurde, dass das Vorhersagefehlersignal auf die QCIF-Auflösung herab getastet wurde. Falls irgendein Unterschied beobachtet wird, der größer als eine vorbestimmte Schwelle ist, wird die Filteroperationssteuervorrichtung 53 ein Operationsbefehlssignal zu dem Grenznachbarschaftsfilter 50 senden.
  • Bei Empfang des Operationsbefehlssignals von der Filteroperationssteuervorrichtung 53 führt das Grenznachbarschaftsfilter 50 eine Glättungsoperation aus, um die Diskontinuität in den Pixelwerten entlang der Blockgrenze zu beseitigen. Der hier verwendete Glättungsalgorithmus kann jedoch nicht der gleiche wie der sein, der zuvor beschrieben wird. Dies ist so, da die obige Blockgrenze nicht immer eine Grenze von unterschiedlichen Kodierungsschemata bedeutet. D. h. da die Blöcke auf einer Seite der Grenze nicht immer intrarahmen-kodiert sind, können die Pixel in jenen Blöcken von Null verschiedene Werte haben. Ein vorgeschlagener Glättungsalgorithmus wird nun nachstehend mit Bezug auf 12 beschrieben.
  • 12 ist ein Diagramm, um einen Glättungsprozess zu erläutern, der durch das Grenznachbarschaftsfilter 50 durchgeführt wird, wenn ein Operationsbefehlssignal dorthin gesendet wird. Es wird angenommen, dass der Tiefpassfilterschalter 32b das Grenznachbarschaftsfilter 50 mit einem Vorhersagebild versorgt hat, das einige benachbarte Bewegungsvektoren einbezieht, die eine große Differenz in der Größe aufweisen, die eine vorbestimmte Schwelle überschreitet. Genauer repräsentieren weiße Punkte in 12 als Teil des Vorhersagebildes, und Kleinbuchstaben, die ihnen beigefügt sind, zeigen ihre jeweiligen Pixelwerte an. Die Bewegungsvektoren auf einer Seite einer Blockgrenze 55 sind nicht gleich jenen auf der anderen Seite im Sinne von Vektorgrößen, sondern vielmehr ist die Differenz größer als eine vorbestimmte Schwelle.
  • In einer derartigen Situation wird das Grenznachbarschaftsfilter 50 zuerst mittlere Pixelwerte A, B, C und D kalkulieren. Wie als schwarze Punkte in 12 dargestellt, werden jene Mittelwerte den Werten von imaginären Pixel entsprechen, die sich zwischen einer ersten Serie von Pixel [h, i, j, k, l, n, t], die der Blockgrenze 55 unmittelbar benachbart sind, und einer zweiten Serie von Pixel [a, b, c, d, e, f, g, m, s], die als Nächstes zu der ersten Serie von Pixel ausgerichtet sind, befinden. Gleichermaßen kalkuliert das Grenznachbarschaftsfilter 50 ferner mittlere Pixelwerte E und F, die den Werten von imaginären Pixel aus schwarzen Punkten zwischen einer dritten Serie von Pixel [o, p, q, r, u], die der Blockgrenze 55 unmittelbar benachbart sind, und einer vierten Serie von Pixel [v, w, x], die als Nächstes zu der dritten Serie von Pixel ausgerichtet sind, entsprechen. Z. B. werden die mittleren Pixelwerte A und B als A = (a + b + g + h)/4 (11) B = (c + d + i + j)/4 (12)kalkuliert.
  • Danach kalkuliert das Grenznachbarschaftsfilter 50 die Werte der ersten Serie und der dritten Serie von Pixel, wobei auf die mittleren Pixelwerte A, B, C, D, E, und F verwiesen wird. Z. B. werden neue Pixelwerte h*, j* und q* für die gegenwärtigen Pixelwerte h, j und q wie folgt erhalten: h* = (9A + 3B + 3D + E)/16 (13) j* = (9B + 3C + 3E + F)/16 (14) q* = (B + 3C + 3E + 9F)/16 (15)
  • Auf diese Weise glättet das Grenznachbarschaftsfilter 50 die Variation in Pixelwerten herab, wenn sie in der Nachbarschaft einer Blockgrenze steil gewesen ist.
  • Die fünfte Ausführungsform kann die folgende modifizierte Anordnung erlauben. D. h. die Filteroperations- Steuervorrichtung 53 wird beseitigt, und das Grenznachbarschaftsfilter 50 wird stattdessen über die Bildauflösung direkt von der Auflösungsauswahl-Steuervorrichtung 21 informiert. Wenn das Vorhersagefehlersignal zu der QCIF-Auflösung herab getastet wurde, wird das Grenznachbarschaftsfilter 50 stets die oben beschriebene Glättungsoperation auf die Pixel in der Nachbarschaft jeder Blockgrenze anwenden, ungeachtet dessen, ob irgendeine kritische Differenz in Pixelwerten vorhanden ist oder nicht.
  • Diese alternative Konfiguration sieht einen Vorteil im Sinne von Einfachheit des Systems vor, wobei somit ermöglicht wird, die Verarbeitungszeit zu reduzieren. Genauer erfordert die Analyse einer Differenz von Block zu Block mit Bezug auf die Pixelwerte in einer Blockgrenze tatsächlich eine feste Zeitdauer, da die Filteroperationssteuervorrichtung 53 die Analyse nicht starten kann, bis die Information über Kodierungsschemata oder Bewegungsvektoren der relevanten Blöcke für eine Untersuchung bereit sein wird. Die obige Alternative wird eine derartige zeitraubende Analyse beseitigen und erlaubt somit, dass die Gesamtverarbeitungszeit reduziert wird.
  • Als Nächstes wird nachstehend die sechste Ausführungsform der vorliegenden Erfindung beschrieben. Diese sechste Ausführungsform bezieht sich auf eine Videodekodierungsvorrichtung.
  • 13 zeigt einen spezifischen Aufbau der sechsten Ausführungsform. Da die sechste Ausführungsform einige Elemente einsetzt, die mit der fünften Ausführungsform gemeinsam sind, wird die folgende Beschreibung die Erläuterung für derartige Elemente nicht wiederholen, während gleichen Elementen gleiche Bezugszeichen beigefügt sind.
  • Bezug nehmend auf 13 reproduziert ein Entropiedekoder 54 quantisierte Koeffizienten, Bildauflösung, Quantisiererschrittgröße, Kodierungsschema und Bewegungsvektoren wie ursprünglich erzeugt, durch Verarbeiten der kodierten Rahmendaten, die von einem sendenden Ende empfangen werden. Der Entropiedekoder 54 verteilt jene reproduzierten Signale zu anderen Funktionsblöcken in der Vorrichtung. Genauer werden die quantisierten Koeffizienten und die Quantisiererschrittgröße zu dem Dequantisierer 29a gesendet; die Bildauflösung wird zu dem Herauftastschalter 30b, dem Tiefpassfilterschalter 32b und der Filteroperationssteuervorrichtung 53 abgegeben; das Kodierungsschema wird dem Vorhersagebildschalter 24b, dem Grenznachbarschaftsfilter 50 und der Filteroperationssteuervorrichtung 53 zugeführt; die Bewegungsvektoren werden dem Vorhersagebildgenerator 24a und dem Tiefpassfilterschalter 32b bereitgestellt. Es wird vermerkt, dass es auch möglich ist, dieses System auf eine derartige Weise zu konfigurieren, dass die Filteroperationssteuervorrichtung 53 Bewegungsvektoren an Stelle der Kodierungsschemata empfangen wird. Operationen jener Funktionsblöcke innerhalb des Bereichs, der durch die wechselnden langen und kurzen Striche angezeigt wird, werden hier nicht beschrieben, da sie mit der zuvor beschriebenen fünften Ausführungsform gemeinsam sind.
  • Das Vorhersagefehlersignal, das durch den Entropiedekoder 54 reproduziert wird, kann in dem sendenden Ende ursprünglich zu der QCIF-Auflösung herab konvertiert sein. Auch kann das reproduzierte Vorhersagebild einige benachbarte Blöcke enthalten, die kritische Differenzen in Pixelwerten aufweisen. Bei Erfassung jener Ereignisse und Bedingungen erteilt die Filteroperationssteuervorrichtung 53 ein Operationsbefehlssignal zu dem Grenznachbarschaftsfilter 50.
  • Derartige kritische Differenzen in Pixelwerten werden durch irgendeine Differenz von Block zu Block in angewendeten Kodierungsschemata, oder alternativ durch beträchtliche diskontinuierliche Variationen, die in der Bewegungsvektordomäne beobachtet werden, impliziert. Bei Empfang des Operationsbefehlssignals von der Filteroperationssteuervorrichtung 53 führt das Grenznachbarschaftsfilter 50 eine Glättungsoperation aus, um die Diskontinuität in Pixelwerten nahe der betroffenen Blockgrenze zu beseitigen.
  • Die Ausgabe dieser Videodekodierungsvorrichtung wird in der Dekodierungsbild-Generierungseinheit 31 erhalten. Die Videorahmensignale, die durch die Dekodierungsbild-Generierungseinheit 31 vollständig rekonstruiert werden, werden zu einem Videomonitor oder anderen ähnlichen Einrichtungen ausgegeben, während sie in dem Rahmenspeicher 22 als die Bezugsrahmen für vorhersagende Kodierung gesichert werden.
  • Auf die oben beschriebene Weise empfängt und dekodiert die Videodekodierungsvorrichtung der sechsten Ausführungsform das kodierte Videosignal, das durch eine Videokodierungsvorrichtung erzeugt wird. Der Dekodierungsprozess bezieht Funktionen des Grenznachbarschaftsfilters 50 und der Filteroperationssteuervorrichtung 53 ein, die in der fünften Ausführungsform der vorliegenden Erfindung eingeführt wurden. Jene zwei Elemente erlauben, dass die Bilder ohne Einführung von Rauschen reproduziert werden, selbst wenn die Pixelwerte irgendeine Diskontinuität in einer gewissen Blockgrenze aufweisen.
  • Die obige Erörterung wird wie folgt zusammengefasst. Gemäß der vorliegenden Erfindung führt das zweite Auflösungskonvertierungsmittel einen Herauftastprozess durch, um die ursprüngliche Auflösung wiederherzustellen. In diesem Prozess kalkuliert das zweite Auflösungskonvertierungsmittel den Wert von jedem Pixel in einem bestimmten Block, ohne Verweis auf Pixel, die zu einem beliebigen benachbarten Block gehören, der Gegenstand für ein anderes Kodierungsschema ist. Als eine wechselnde Anordnung wird der Herauftastprozess die Pixel in anderen Blöcken vollständig vernachlässigen, sondern nur auf den vorliegenden Block verweisen.
  • Dank derartiger Herauftastalgorithmen verhindert die vorliegende Erfindung, dass die Differenz im Kodierungsschemata das reproduzierte Vorhersagefehlersignal beeinträchtigt, im Gegensatz zu dem konventionellen Herauftastprozess, der einiges unerwünschtes Rauschen in dem reproduzierten Signal verursacht. Als ein Ergebnis wird das reproduzierte Vorhersagefehlersignal ein Signalprofil nahe zu dem ursprünglichen aufweisen. Deshalb kann die vorliegende Erfindung die ursprünglichen Bilder ohne Einführung von unerwünschtem Rauschen reproduzieren, selbst wenn einige gemischte Kodierungsschemata zum Komprimieren eines Rahmens verwendet werden, oder selbst wenn mit anderen Worten die Pixelwerte eine kritische Differenz in einer gewissen Blockgrenze aufweisen.
  • Ferner wird gemäß der vorliegenden Erfindung das Tiefpassfilter selektiv nur aktiviert, wenn eine Kodierung geringer Auflösung durchgeführt wird und das Vorhersagebild einige Blöcke schneller Bewegung enthält. Diese strukturelle Anordnung wird verhindern, dass die Schärfe von Bildern in weniger aktiven Blöcken (z. B. Hintergrundbilder) als Teil eines Bildes verdorben wird.
  • Des weiteren wendet die vorliegende Erfindung eine Glättungsoperation auf die Nachbarschaft einer kritischen Blockgrenze an, wo die Pixelwerte eine beträchtliche Variation, oder eine große Diskontinuität, wegen der gemischten Verwendung unterschiedlicher Kodierungsschemata in einigen benachbarten Blöcken oder intensiven Differenzen in der Größe von Bewegungsvektoren in einer Blockgrenze aufweisen. Die Glättungsoperation erlaubt, dass Bilder ohne Rauschen reproduziert werden, selbst wenn die Pixelwerte in einem Rahmen irgendeine Diskontinuität in einer gewissen Blockgrenze aufweisen.

Claims (6)

  1. Decodiervorrichtung zum Reproduzieren von Original-Bewegtbildern durch Decodieren eines vorhersagecodierten Digitalvideosignals, das empfangen worden ist, umfassend: ein Aufwärtsabtastmittel zum Aufwärtsabtasten eines Blocks mit niedriger Auflösung zum Erhalten eines Hochauflösungs-Vorhersagefehlersignalwertes jedes unmittelbar an eine Blockgrenze angrenzend angeordneten Bildpunkts, einen oder zwei Nachbarbildpunkte davon berücksichtigend.
  2. Decodiervorrichtung nach Anspruch 1, wobei ein Hochauflösungs-Vorhersagefehlersignalwert eines sich an jeder Ecke des Blocks befindlichen Bildpunktes unter Berücksichtigung eines Nachbarbildpunktes davon berechnet wird; und der Hochauflösungs-Vorhersagefehlersignalwert von unmittelbar an die Blockgrenze angrenzenden Bildpunkten, außer der Bildpunkte an den Ecken des Blocks, unter Berücksichtigung zweier Nachbarbildpunkte davon berechnet wird.
  3. Decodiervorrichtung nach Anspruch 1, wobei das Aufwärtsabtastmittel die Vorhersagefehlersignalwerte von inneren Bildpunkten, die nicht unmittelbar an die Blockgrenzen angrenzen, unter Berücksichtigung von vier jeden inneren Bildpunkt umgebenden Bildpunkten berechnet.
  4. Decodierverfahren zum Reproduzieren von Original-Bewegtbildern durch Decodieren eines vorhersagecodierten Digitalvideosignals, das empfangen worden ist, umfassend: Aufwärtsabtasten eines Blocks mit einer niedrigen Auflösung zum Erhalten eines Hochauflösungs-Vorhersagefehlersignalwertes jedes unmittelbar an eine Blockgrenze angrenzenden Bildpunkts unter Berücksichtigung von einem oder zwei Nachbarbildpunkten davon.
  5. Decodierverfahren nach Anspruch 4, wobei: der Vorhersagefehlersignalwert eines Bildpunktes, der sich an jeder Ecke des Blocks befindet, unter Berücksichtigung eines Nachbarbildpunktes davon berechnet wird; und die Vorhersagefehlersignalwerte von unmittelbar an die Blockgrenzen angrenzenden Bildpunkten, mit Ausnahme der Bildpunkte an den Ecken des Blocks, unter Berücksichtigung zweier Nachbarbildpunkte davon berechnet werden.
  6. Decodierverfahren nach Anspruch 4, wobei der Aufwärtsabtastschritt ferner das Berechnen von Vorhersagefehlersignalwerten innerer, nicht unmittelbar an die Blockgrenze angrenzender Bildpunkte unter Berücksichtigung von vier jeden inneren Bildpunkt umgebenden Bildpunkten einschließt.
DE1997638264 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung Expired - Lifetime DE69738264T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP28198496 1996-10-24
JP28198496 1996-10-24
JP29475396 1996-11-07
JP29475396A JP3466032B2 (ja) 1996-10-24 1996-11-07 動画像符号化装置および復号化装置

Publications (2)

Publication Number Publication Date
DE69738264D1 DE69738264D1 (de) 2007-12-13
DE69738264T2 true DE69738264T2 (de) 2008-08-07

Family

ID=26554410

Family Applications (7)

Application Number Title Priority Date Filing Date
DE69739575T Expired - Lifetime DE69739575D1 (de) 1996-10-24 1997-07-08 Videokodierungsvorrichtung
DE1997635028 Expired - Lifetime DE69735028T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung
DE69739577T Expired - Lifetime DE69739577D1 (de) 1996-10-24 1997-07-08 Vorrichtung zur Videodekodierung
DE1997638494 Expired - Lifetime DE69738494T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung
DE1997638264 Expired - Lifetime DE69738264T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung
DE1997635743 Expired - Lifetime DE69735743T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung
DE1997638262 Expired - Lifetime DE69738262T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung

Family Applications Before (4)

Application Number Title Priority Date Filing Date
DE69739575T Expired - Lifetime DE69739575D1 (de) 1996-10-24 1997-07-08 Videokodierungsvorrichtung
DE1997635028 Expired - Lifetime DE69735028T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung
DE69739577T Expired - Lifetime DE69739577D1 (de) 1996-10-24 1997-07-08 Vorrichtung zur Videodekodierung
DE1997638494 Expired - Lifetime DE69738494T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung

Family Applications After (2)

Application Number Title Priority Date Filing Date
DE1997635743 Expired - Lifetime DE69735743T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung
DE1997638262 Expired - Lifetime DE69738262T2 (de) 1996-10-24 1997-07-08 Videokodierungs- und Videodekodierungsvorrichtung

Country Status (4)

Country Link
US (2) US6104434A (de)
EP (7) EP1646245B1 (de)
JP (1) JP3466032B2 (de)
DE (7) DE69739575D1 (de)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3466032B2 (ja) * 1996-10-24 2003-11-10 富士通株式会社 動画像符号化装置および復号化装置
US20020196853A1 (en) * 1997-06-04 2002-12-26 Jie Liang Reduced resolution video decompression
WO1999004573A1 (en) * 1997-07-16 1999-01-28 Koninklijke Philips Electronics N.V. Video coding method and device, and corresponding decoding device
US7239755B1 (en) 1997-07-30 2007-07-03 Lg Electronics Inc. Method of reducing a blocking artifact when coding moving picture
KR100244290B1 (ko) * 1997-09-09 2000-02-01 구자홍 저속 전송에서의 동영상을 위한 디블록킹 필터링 방법
US6823016B1 (en) * 1998-02-20 2004-11-23 Intel Corporation Method and system for data management in a video decoder
JP4264571B2 (ja) * 1998-04-09 2009-05-20 ソニー株式会社 ディジタル画像復号装置及び方法、並びに記録媒体
US6249549B1 (en) * 1998-10-09 2001-06-19 Matsushita Electric Industrial Co., Ltd. Down conversion system using a pre-decimation filter
JP3576402B2 (ja) * 1998-10-23 2004-10-13 三菱電機株式会社 画像復号化装置
KR100313217B1 (ko) * 1998-12-23 2001-12-28 서평원 파이프라인dct장치
US6552749B1 (en) * 1999-01-29 2003-04-22 Intel Corporation Method and apparatus for video motion compensation, reduction and color formatting
US6519369B1 (en) 1999-02-12 2003-02-11 Sony Corporation Method and apparatus for filter tap expansion
US6418548B1 (en) 1999-02-12 2002-07-09 Sony Corporation Method and apparatus for preprocessing for peripheral erroneous data
US6307979B1 (en) 1999-02-12 2001-10-23 Sony Corporation Classified adaptive error recovery method and apparatus
US6621936B1 (en) 1999-02-12 2003-09-16 Sony Corporation Method and apparatus for spatial class reduction
JP3395892B2 (ja) 1999-05-06 2003-04-14 日本電気株式会社 動画像符号化装置
US6522785B1 (en) 1999-09-24 2003-02-18 Sony Corporation Classified adaptive error recovery method and apparatus
US6351494B1 (en) 1999-09-24 2002-02-26 Sony Corporation Classified adaptive error recovery method and apparatus
US6754371B1 (en) 1999-12-07 2004-06-22 Sony Corporation Method and apparatus for past and future motion classification
US7412002B2 (en) * 2000-04-28 2008-08-12 Texas Instruments Incorporated Image preprocessing with selective lowpass filtering from motion compensation
US7031393B2 (en) * 2000-10-20 2006-04-18 Matsushita Electric Industrial Co., Ltd. Block distortion detection method, block distortion detection apparatus, block distortion removal method, and block distortion removal apparatus
JP4688279B2 (ja) 2000-11-21 2011-05-25 富士通株式会社 動画像の空間解像度自動設定方法及び装置
JP3658761B2 (ja) * 2000-12-12 2005-06-08 日本電気株式会社 画像検索システムとその画像検索方法、及び画像検索プログラムを記録した記憶媒体
US7712122B2 (en) * 2001-01-16 2010-05-04 Physical Optics Corporation Uncompressed IP multimedia data transmission and switching
US6931063B2 (en) 2001-03-26 2005-08-16 Sharp Laboratories Of America, Inc. Method and apparatus for controlling loop filtering or post filtering in block based motion compensationed video coding
US7450641B2 (en) 2001-09-14 2008-11-11 Sharp Laboratories Of America, Inc. Adaptive filtering based upon boundary strength
US7929610B2 (en) 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
US6898241B2 (en) * 2001-05-11 2005-05-24 Mitsubishi Electric Research Labs, Inc. Video transcoder with up-sampling
US20030052909A1 (en) * 2001-06-25 2003-03-20 Arcsoft, Inc. Real-time rendering of edited video stream
JP3964391B2 (ja) * 2001-06-29 2007-08-22 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
KR100445633B1 (ko) * 2001-10-19 2004-08-25 삼성전자주식회사 데이터 압축 및 복원 방법
EP1978748B1 (de) * 2001-11-29 2014-04-16 Panasonic Corporation Entfernungsverfahren für die Codierungsverzerrung
EP2938072A1 (de) * 2001-11-29 2015-10-28 Godo Kaisha IP Bridge 1 Entfernungsverfahren für kodierungsverzerrung
EP2339854A3 (de) * 2001-11-30 2013-11-13 NTT DoCoMo, Inc. Vorrichtung zur Codierung beweglicher Bilder, Vorrichtung zur Decodierung beweglicher Bilder, Verfahren zur Codierung beweglicher Bilder, Verfahren zur Decodierung beweglicher Bilder, Programm und das Programm speicherndes computerlesbares Aufzeichnungsmedium
US6996249B2 (en) * 2002-01-11 2006-02-07 Nec Laboratories America, Inc. Applying informed coding, informed embedding and perceptual shaping to design a robust, high-capacity watermark
KR100959837B1 (ko) 2002-04-26 2010-05-28 노키아 코포레이션 패러미터 값들을 코드워드 인덱스들로 매핑하기 위한최적의 방법 및 시스템
US7006572B2 (en) * 2002-05-09 2006-02-28 Mitsubishi Electric Research Labs, Inc. Method and apparatus for decoding video bitstreams to reduced spatial resolutions
US7543326B2 (en) * 2002-06-10 2009-06-02 Microsoft Corporation Dynamic rate control
US20030235250A1 (en) * 2002-06-24 2003-12-25 Ankur Varma Video deblocking
WO2004001666A2 (en) * 2002-06-25 2003-12-31 Quix Technologies Ltd. Image processing using probabilistic local behavior assumptions
BRPI0303901B1 (pt) 2002-07-11 2018-03-06 Godo Kaisha Ip Bridge 1 “Método de determinação de poder de filtragem para determinar um poder de filtragem para remover uma distorção de codificação entre blocos que constituem uma imagem, método de decodificação de imagem móvel para decodificar os dados de imagem móvel codificados, aparelho de determinação de poder de filtragem, e aparelho de codificação de imagem móvel”
US7379496B2 (en) * 2002-09-04 2008-05-27 Microsoft Corporation Multi-resolution video coding and decoding
US7589788B1 (en) * 2003-02-28 2009-09-15 Intel Corporation Method and apparatus for video motion compensation, reduction and color formatting
SG140441A1 (en) * 2003-03-17 2008-03-28 St Microelectronics Asia Decoder and method of decoding using pseudo two pass decoding and one pass encoding
US20050025383A1 (en) * 2003-07-02 2005-02-03 Celartem Technology, Inc. Image sharpening with region edge sharpness correction
US7822123B2 (en) * 2004-10-06 2010-10-26 Microsoft Corporation Efficient repeat padding for hybrid video sequence with arbitrary video resolution
JP4409897B2 (ja) * 2003-09-19 2010-02-03 株式会社リコー 画像処理装置、画像処理方法、プログラム及び情報記録媒体
US7280595B1 (en) 2003-10-21 2007-10-09 Redrock Semiconductor, Ltd. Post-inverse-quantization AC prediction with a unified variable-length-decoding and inverse-quantization stage
EP1538844A3 (de) * 2003-11-26 2006-05-31 Samsung Electronics Co., Ltd. Verfahren zur Farbfehlerbildtransformation und -kodierung
US20050137911A1 (en) * 2003-12-18 2005-06-23 Conn John P. Systems and methods for data insurance
US7889792B2 (en) * 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
KR100754388B1 (ko) * 2003-12-27 2007-08-31 삼성전자주식회사 레지듀 영상 다운/업 샘플링 방법 및 장치와 그를 이용한영상 부호화/복호화 방법 및 장치
US7649539B2 (en) * 2004-03-10 2010-01-19 Microsoft Corporation Image formats for video capture, processing and display
US8116376B2 (en) * 2004-04-02 2012-02-14 Thomson Licensing Complexity scalable video decoding
US7813430B2 (en) * 2004-05-18 2010-10-12 Sony Corporation Method and apparatus for decimation mode determination utilizing block motion
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US20060027657A1 (en) 2004-08-04 2006-02-09 Laurens Ninnink Method and apparatus for high resolution decoding of encoded symbols
US7792190B2 (en) * 2004-09-09 2010-09-07 Media Tek Singapore Pte Ltd. Inserting a high resolution still image into a lower resolution video stream
JP4483501B2 (ja) 2004-09-22 2010-06-16 株式会社ニコン 静止画を動画再生するための前処理を行う画像処理装置、プログラム、および方法
JP2006101228A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 映像処理装置
US20070195887A1 (en) * 2004-09-29 2007-08-23 Comer Mary L Method and apparatus for reduced resolution update video coding and decoding
US8243820B2 (en) * 2004-10-06 2012-08-14 Microsoft Corporation Decoding variable coded resolution video with native range/resolution post-processing operation
US7839933B2 (en) * 2004-10-06 2010-11-23 Microsoft Corporation Adaptive vertical macroblock alignment for mixed frame video sequences
US9071847B2 (en) * 2004-10-06 2015-06-30 Microsoft Technology Licensing, Llc Variable coding resolution in video codec
KR100647294B1 (ko) 2004-11-09 2006-11-23 삼성전자주식회사 화상 데이터 부호화 및 복호화 방법 및 장치
JP4889231B2 (ja) * 2005-03-31 2012-03-07 三洋電機株式会社 画像符号化方法および装置、画像復号方法
JP4618676B2 (ja) 2005-04-28 2011-01-26 株式会社リコー 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
CN101218829A (zh) * 2005-07-05 2008-07-09 株式会社Ntt都科摩 动态图像编码装置、动态图像编码方法、动态图像编码程序、动态图像解码装置、动态图像解码方法以及动态图像解码程序
JP2007043651A (ja) 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
EP1809041A1 (de) * 2006-01-11 2007-07-18 Mitsubishi Electric Information Technology Centre Europe B.V. Fehlerverschleierung für skalierbare Bildkodierung
KR101293086B1 (ko) * 2006-02-17 2013-08-06 톰슨 라이센싱 비디오 데이터 밝기 변화를 다루는 지역화된 가중 예측
JP5157898B2 (ja) * 2006-03-30 2013-03-06 日本電気株式会社 画像処理装置、画像処理システム、画像処理方法および画像処理用プログラム
KR20100085199A (ko) 2006-04-28 2010-07-28 가부시키가이샤 엔티티 도코모 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 부호화 프로그램, 화상 예측 복호 장치, 화상 예측 복호 방법 및 화상 예측 복호 프로그램
US8880571B2 (en) * 2006-05-05 2014-11-04 Microsoft Corporation High dynamic range data format conversions for digital media
JP4993676B2 (ja) * 2006-09-01 2012-08-08 キヤノン株式会社 画像符号化装置及び画像符号化方法
US7876808B2 (en) * 2006-11-30 2011-01-25 Broadcom Corp. Method and apparatus for adaptive noise and/or signal filtering in an HSDPA channel quality indicator (CQI) selection
US8054886B2 (en) 2007-02-21 2011-11-08 Microsoft Corporation Signaling and use of chroma sample positioning information
US8107571B2 (en) * 2007-03-20 2012-01-31 Microsoft Corporation Parameterized filters and signaling techniques
JP5125294B2 (ja) 2007-07-31 2013-01-23 株式会社ニコン プログラム、画像処理装置、撮像装置および画像処理方法
US8953673B2 (en) * 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
JP5015088B2 (ja) * 2008-08-06 2012-08-29 株式会社リコー 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
KR101315301B1 (ko) * 2008-10-24 2013-10-14 삼성테크윈 주식회사 영상 처리 방법 및 영상 처리 장치
GB0823481D0 (en) 2008-12-23 2009-01-28 British Telecomm Graphic data processing
JPWO2010137323A1 (ja) * 2009-05-29 2012-11-12 三菱電機株式会社 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
JP5546044B2 (ja) 2010-03-24 2014-07-09 パナソニック株式会社 画像復号装置、画像符号化装置、画像復号回路及び画像復号方法
KR101690253B1 (ko) * 2010-05-06 2016-12-27 삼성전자주식회사 영상 처리 장치 및 그 방법
KR101798079B1 (ko) * 2010-05-10 2017-11-16 삼성전자주식회사 픽셀값의 차분을 이용하여 영상 프레임을 부호화하는 방법 및 이를 위한 장치
KR20130105870A (ko) * 2010-10-27 2013-09-26 브이아이디 스케일, 인크. 적응적 비디오 코딩을 위한 시스템 및 방법
US9661301B2 (en) * 2011-02-18 2017-05-23 Sony Corporation Image processing device and image processing method
US9521418B2 (en) 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
WO2013014884A1 (ja) * 2011-07-22 2013-01-31 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、および動画像復号化装置
US11496760B2 (en) 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
US9288505B2 (en) 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
US9485503B2 (en) 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
CN104718761A (zh) * 2012-07-09 2015-06-17 日本电信电话株式会社 视频编码/解码方法、装置、程序、记录介质
US9344671B2 (en) * 2012-07-17 2016-05-17 Ati Technologies Ulc System and method for artifact removal
US11303900B2 (en) 2013-12-06 2022-04-12 Mediatek Inc. Method and apparatus for motion boundary processing
CN105323589B (zh) * 2014-07-23 2018-05-11 晨星半导体股份有限公司 应用于视频系统的编码/解码方法及编码/解码装置
US10356440B2 (en) * 2014-10-01 2019-07-16 Qualcomm Incorporated Scalable transform hardware architecture with improved transpose buffer
CN107211161B (zh) * 2015-03-10 2020-05-15 苹果公司 包括最后阶段处理的扩展空间的视频编码优化
JP6566864B2 (ja) * 2015-12-28 2019-08-28 Kddi株式会社 ビットストリーム変換装置、ビットストリーム変換方法、配信システム及びコンピュータ可読記録媒体
CN116170583A (zh) * 2017-01-16 2023-05-26 世宗大学校产学协力团 影像编码/解码方法
US11138694B2 (en) 2018-12-05 2021-10-05 Tencent America LLC Method and apparatus for geometric smoothing
CN114782676B (zh) * 2022-04-02 2023-01-06 北京广播电视台 一种视频感兴趣区域的提取方法和系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63155896A (ja) * 1986-12-19 1988-06-29 Mitsubishi Electric Corp 画像符号化復号化装置
JPH03127580A (ja) * 1989-10-13 1991-05-30 Matsushita Electric Ind Co Ltd 動き補償フレーム間符号化装置
US5123841A (en) 1990-04-02 1992-06-23 Millner Don E Interproximal dental plaque remover
US5134478A (en) * 1991-02-19 1992-07-28 Intel Corporation Method and apparatus for compressing and decompressing a digital video signal using predicted and error images
US5262854A (en) * 1992-02-21 1993-11-16 Rca Thomson Licensing Corporation Lower resolution HDTV receivers
US5262855A (en) * 1992-03-25 1993-11-16 Intel Corporation Method and apparatus for encoding selected images at lower resolution
NL9201640A (nl) * 1992-09-22 1994-04-18 Nederland Ptt Systeem omvattende ten minste één encoder voor het coderen van een digitaal signaal en ten minste één decoder voor het decoderen van een digitaal signaal, en encoder en decoder voor toepassing in het systeem volgens de uitvinding.
JP3165296B2 (ja) * 1992-12-25 2001-05-14 三菱電機株式会社 フレーム間符号化処理方式及びフレーム間符号化処理方法及び符号化制御方式
US5614952A (en) * 1994-10-11 1997-03-25 Hitachi America, Ltd. Digital video decoder for decoding digital high definition and/or digital standard definition television signals
JPH0795566A (ja) * 1993-09-21 1995-04-07 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法および装置
JP3375752B2 (ja) 1994-09-07 2003-02-10 星和電機株式会社 Ledチップ光学特性計測センサ
US5543857A (en) * 1994-10-25 1996-08-06 Thomson Consumer Electronics, Inc. Graphical menu for a television receiver
US5644361A (en) * 1994-11-30 1997-07-01 National Semiconductor Corporation Subsampled frame storage technique for reduced memory size
KR0174452B1 (ko) * 1995-02-28 1999-03-20 배순훈 디지털 영상 복호화장치
US5777677A (en) * 1996-02-09 1998-07-07 International Business Machines Corporation Approximate MPEG decoder with compressed reference frames
JP3466032B2 (ja) * 1996-10-24 2003-11-10 富士通株式会社 動画像符号化装置および復号化装置

Also Published As

Publication number Publication date
DE69735743T2 (de) 2007-04-12
US6333949B1 (en) 2001-12-25
EP1646245A1 (de) 2006-04-12
EP1699245A2 (de) 2006-09-06
DE69738262D1 (de) 2007-12-13
DE69738494D1 (de) 2008-03-13
EP1725048A2 (de) 2006-11-22
EP0838955A3 (de) 1999-03-03
DE69738262T2 (de) 2008-08-14
EP1455536A1 (de) 2004-09-08
US6104434A (en) 2000-08-15
EP1901562B1 (de) 2009-09-09
EP1648176A1 (de) 2006-04-19
DE69735028D1 (de) 2006-02-02
EP1699245A3 (de) 2007-04-18
EP0838955B1 (de) 2006-04-26
EP1725048A3 (de) 2007-04-18
DE69735028T2 (de) 2006-08-17
EP0838955A2 (de) 1998-04-29
DE69738494T2 (de) 2009-03-05
DE69735743D1 (de) 2006-06-01
JPH10191351A (ja) 1998-07-21
DE69739577D1 (de) 2009-10-22
DE69739575D1 (de) 2009-10-22
EP1699245B1 (de) 2009-09-09
EP1455536B1 (de) 2005-12-28
DE69738264D1 (de) 2007-12-13
EP1901562A1 (de) 2008-03-19
EP1648176B1 (de) 2007-10-31
EP1725048B1 (de) 2008-01-23
JP3466032B2 (ja) 2003-11-10
EP1646245B1 (de) 2007-10-31

Similar Documents

Publication Publication Date Title
DE69738264T2 (de) Videokodierungs- und Videodekodierungsvorrichtung
DE69635369T2 (de) Videokodierungsvorrichtung
DE69535228T2 (de) Bildumsetzungsvorrichtung
DE60027955T2 (de) Verfahren und Vorrichtung zur kontextbasierten Inter/Intra Kodierungsmodeauswahl
DE69233411T2 (de) Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung
DE69634423T2 (de) Videokodierung- und dekodierungsvorrichtung
DE60220106T2 (de) Verfahren und Vorrichtung zur Reduzierung von Störungen in dekodierten Bildern mit Nachfilterung
DE69735838T2 (de) Videokodierer mit Transformationskoeffizientenprädiktion
DE69929430T2 (de) Verfahren und vorrichtung zur codierung von video-information
DE69728801T2 (de) Verfahren und Vorrichtung zum Verändern der Auflösung durch direkte DCT Koeffizenten-Umsetzung
DE69908562T2 (de) Bewegungsvektorenextrapolation zur transkodierung von videosequenzen
DE60214837T2 (de) Erkennung und genaue skalierung bewegter bereiche mit zeilensprung in mpeg-2 komprimiertem video
DE69839100T2 (de) Verbesserte Videokodierung unter Verwendung von adaptiven Blockparametern für kodierte/unkodierte Blöcke
DE69233620T2 (de) Adaptive Kodierung und Dekodierung von Vollbildern und Halbbildern von Videosignalen
DE69837003T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
DE60125301T2 (de) Videosignaltranskodierung
DE69816342T2 (de) Prädiktives Bilddekodierungsverfahren
DE69824554T2 (de) Verfahren und anordnung zum erzeugen eines standbildes mit hoher auflösung
DE19758761B4 (de) Verfahren zum Intrakodieren eines von einer Pixelmatrix gebildeten Bildes
DE60309375T2 (de) Parametrisierung für verlauf-kompensation
DE69813349T2 (de) Vorrichtung zur Kontrolle der Datenmenge und Kodierer dieselbige anwendend
DE10300048A1 (de) Verfahren und Vorrichtung zur Bildcodierung und -decodierung
WO2012095490A1 (de) Kompression und dekompression von referenzbildern in einem videokoder
EP0776574B1 (de) Verfahren zur decodierung komprimierter video-daten mit reduziertem speicherbedarf
DE102019103346A1 (de) Ssim-basierte rate-distortion-optimierung für eine verbesserte wahrnehmbare qualität bei videos

Legal Events

Date Code Title Description
8364 No opposition during term of opposition