DE69635369T2 - Videokodierungsvorrichtung - Google Patents

Videokodierungsvorrichtung Download PDF

Info

Publication number
DE69635369T2
DE69635369T2 DE1996635369 DE69635369T DE69635369T2 DE 69635369 T2 DE69635369 T2 DE 69635369T2 DE 1996635369 DE1996635369 DE 1996635369 DE 69635369 T DE69635369 T DE 69635369T DE 69635369 T2 DE69635369 T2 DE 69635369T2
Authority
DE
Germany
Prior art keywords
image
spatial resolution
resolution
current frame
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE1996635369
Other languages
English (en)
Other versions
DE69635369D1 (de
Inventor
Akira Nakahara-ku Nakagawa
Kimihiko Nakahara-ku Kazui
Eishi Nakahara-ku Morimatsu
Takahiro Kouhoku-ku Shimizu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of DE69635369D1 publication Critical patent/DE69635369D1/de
Application granted granted Critical
Publication of DE69635369T2 publication Critical patent/DE69635369T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft eine Video-Codiervorrichtung und insbesondere eine Video-Codiervorrichtung, die Prädiktionscodierung von Digitalvideosignalen vornimmt.
  • 2. Beschreibung des Standes der Technik
  • Der ITU-T-Standard H.261 und die ISO-Standards MPEG-1 und MPEG-2 sind beispielsweise anerkannte internationale Standards für Bewegtbild-Codiertechniken, welche Hybridcodieralgorithmen verwenden. In diesen Standard-Videocodierschemata läuft der Codierprozess folgendermaßen ab: (1) Ein Quellenbild wird in Pixelblöcke aufgeteilt, (2) Eine orthogonale Transformation (z.B. diskrete Cosinus-Transformation)) und eine Bewegungskompensation werden unabhängig auf jeden Block angewendet und (3) quantifizierte Videodaten werden durch Entropiecodierung komprimiert.
  • Wenn eine Bewegung spürbaren Umfangs oder ein vollständiger Szenenübergang in der Mitte einer Folge von Videorahmen auftritt, können die oben beschriebenen Hybridvideocodiertechniken unter einem erdrückenden Umfang an codierten Rahmendaten leiden, die einen für jeden Rahmen zulässigen Standardpegel übersteigen. In einem solchen Fall wird der Codierer den Umfang an codierten Daten bei einem Versuch, sie auf einen Standardpegel zu reduzieren zwangsweise reduzieren. Dies wird eine extreme Verschlechterung der Bildqualität und/oder auch eine grobe Rahmenunterabtastung (oder einen Abfall der Rahmenaktualisierungsrate) verursachen, was zu nicht akzeptierbar schlechten Bildern führt beim Rekonstruieren am Empfangsende.
  • Ein Videocodiersystem, das versucht, das obige Problem zu vermeiden, ist beispielsweise in der japanischen Patent-Offenlegungsschrift mit der Veröffentlichungsnummer 7-30901 (1995) offenbart. In dem in dieser Veröffentlichung vorgeschlagenen System reduziert der Codierer die Auflösung der Eingangsrahmensignale zum Reduzieren des Umfangs an codierten Rahmendaten, wenn ein vollständiger Szenenübergang oder eine starke Bewegung in der Mitte einer Abfolge von Videorahmen aufgetreten ist. Eine solche Datenreduzierstrategie basiert auf der Tatsache, dass das Reduzieren der Bildauflösung die Wahrnehmungsqualität decodierter Bilder besser aufrechterhalten kann als das Erhöhen der Quantisiererschrittgröße. Das Videocodiersystem gemäß dem Stand der Technik verwendet eine Bewegungskorrekturberechnungsvorrichtung zum Berechnen von Zwischenrahmenversatz jedes Blockes anzeigenden Bewegungsvektoren. Das Codiersystem berechnet dann den durchschnittlichen Umfang der erhaltenen Bewegungsvektoren in einem gesamten Rahmen und wählt eine geeignete Auflösung in Übereinstimmung mit der berechneten durchschnittlichen Größe der Bewegungsvektoren aus. Auf diese Weise reduziert das Codiersystem dem Umfang an codierten Daten durch Reduzieren der Auflösung des Videosignals, wenn eine Bewegung großen Umfangs zwischen zwei aufeinanderfolgenden Rahmen beobachtet wird.
  • Das oben beschriebene Codiersystem des Standes der Technik hat jedoch die folgenden Probleme.
  • Zum einen kann das System des Standes der Technik eine unnötige Reduzierung der Bildauflösung bedingt durch nicht korrekte Interpretation von der Bewegungsvektorgröße vornehmen. Die durchschnittliche Größe von Bewegungsvektoren in einem Rahmen ist nicht immer proportional zu dem Gesamtumfang an codierten Daten. Angenommen, dass das Gesichtsfeld einer Kamera sich einfach in einer festen Richtung bewegt, wie bei einem Kameraschwenk. Die in einer solchen Situation berechneten Bewegungsvektoren werden einen großen Bewegungsumfang anzeigen, aber der Umfang an tatsächlich durch den Codierer produzierten Daten kann relativ klein sein, weil der im Codierer implementierte Bewegungsvorhersagealgorithmus effizient arbeitet und die berechneten Bewegungsvektoren dazu tendieren, gleichförmige Werte zu haben. Daher muss es in diesem Fall möglich sein, Videorahmen ohne Reduzieren ihrer Auflösung zu codieren und zu senden und die Ursprungsqualität am Empfangsende wiederherzustellen. Das Codiersystem des Standes der Technik kann jedoch gegebenenfalls unnötiger Weise die Auflösung verringern einfach wegen einer großen Durchschnittsmagnitude von Bewegungssektoren.
  • Zum Zweiten führt das Codiersystem des Standes der Technik eine unnötige Reduzierung von Bildauflösung bedingt durch eine Indifferenz von Pufferbelegung durch. Zum Regulieren der zum empfangenen Ende zu sendenden Bitstromrate verwendet das Codiersystem einen Pufferspeicher, der codierte Daten temporär speichert. Wenn die Pufferbelegung (d.h., der Umfang an codierten Daten als Teil der Pufferspeicherkapazität) kleiner ist als ein vorbestimmter Wert, kann der Puffer gegebenenfalls eine größere Menge codierter Daten annehmen als gewöhnlich. In solchen Fällen wird das konventionelle System unnötiger Weise die Auflösung bedingt durch das Vorliegen einer großen mittleren Magnitude an Bewegungsvektoren absetzen, was zu einer Verschlechterung der Bildqualität führt.
  • Zum Dritten muss das System des Standes der Technik jede Codierprozedur schneller ausführen als normale Pipeline- Systeme. Um die erforderliche Performance bereitzustellen, nehmen die meisten Videocodiersysteme Pipeline-Architektur, bei der mehrere Blöcke gleichzeitig in unterschiedlichen Stufen verarbeitet werden. Hier sei angenommen, dass dieser Blockdatenwert durch drei Stufen geführt werden soll von: Bewegungsvektorberechnung, Prädiktionsfehlerberechnung und orthogonale Transformation. Der ersten Stufe wird ein Bewegungsvektor eines ersten Blocks berechnet. In der nächsten Stufe wird der verarbeitete erste Block einer Prädiktionsfehlerberechnung unterzogen und gleichzeitig wird auf einen zweiten Block die Bewegungsvektorberechnung angewendet. Im dritten Schritt wird eine orthogonale Transformation auf den ersten Block angewendet, Prädiktionsfehler des zweiten Blockes werden berechnet und ein Bewegungssektor des dritten Blocks wird berechnet. Auf diese Weise kann ein Pipeline-Codiersystem eine Vielzahl von Prozessen, die in einer sequentiellen Weise ausgeführt werden sollen, gleichzeitig auf unterschiedliche Blöcke anwenden, hierdurch einen hohen Gesamtdurchsatzpegel bereitstellend. Im Codiersystem des Standes der Technik berechnet andererseits die Bewegungsvektorberechnungseinrichtung Bewegungsvektoren und auf das Abschließen der Vektorberechnung für den gesamten Rahmen wird die durchschnittliche Vektormagnitude berechnet, um die Bildauflösung zu bestimmen. Das heißt, die Bildauflösung kann nicht definiert werden, bis die Bewegungsvektorberechnung beendet ist und die nachfolgenden Prozesse wie die Prädiktionsfehlerberechnung, die orthogonale Transformation, die Quantisierung, die Inversquantisierung und die inverse orthognale Transformation können nicht beginnen, bis die Bildauflösung definiert ist. Daher muss das System des Standes der Technik jeden Prozess schneller ausführen als normale Pipeline-Systeme, um die Rahmencodierung innerhalb einer festen Zykluszeit zu beenden.
  • RESÜMEE DER ERFINDUNG
  • Unter Berücksichtigung des Voranstehenden ist ein Ziel der vorliegenden Erfindung, eine Video-Codiervorrichtung bereitzustellen, die geeignete und prompte Steuerung der Auflösung von Quellenbildern bereitstellt zum Regulieren des Umfangs an codierten Daten bei einem geeigneten Pegel.
  • Um das obige Ziel zu erreichen, wird gemäß der vorliegenden Erfindung ein Videocodiergerät zum Ausführen von Prädiktionscodierung digitaler Videoeingangssignale bereitgestellt, die umfasst: Eine Ortsauflösungsauswahl-Steuereinrichtung zum Auswählen einer Ortsauflösung eines ersten Bildes oder einer Ortsauflösung eines zweiten Bildes, die geringer ist als die Ortsauflösung des ersten Bildes zur Verwendung beim Codieren eines Ursprungsbildes eines momentanen Rahmens bzw. Rasterbildes basierend auf Codierinformation in dem vorherigen Rahmen, eine Ortsauflösungskonvertiereinrichtung zum Konvertieren der Ortsauflösung des Quellenbildes von der Ortsauflösung des ersten Bildes zu der Ortsauflösung des zweiten Bildes, die durch die Ortsauflösungsauswahlsteuereinrichtung ausgewählt worden ist; und eine Codiereinrichtung zum Codieren des Quellenbildes, dessen Ortsauflösung durch die Ortsauflösungskonvertiereinrichtung konvertiert worden ist, und gekennzeichnet dadurch, dass die Codierinformation mindestens eine Quantisierschrittgröße, eine Menge codierter Daten und die Pufferbelegung in dem vorangehenden Rahmen einschließt, die Ortsauflösung des zweiten Bildes ausgewählt wird, wenn der vorangehende Rahmen in der Ortsauflösung des ersten Bildes codiert worden ist, wenn eine Pufferbelegung größer ist als ein erster Schwellwert, und wenn ein Produkt der Quantisierschrittgröße und der Menge an codierten Daten größer ist als ein zweiter Schwellwert, welcher zweite Schwellwert ein Produkt der größten zulässigen Quantisierschrittgröße in der Ortsauflösung des ersten Bildes und einer Zielmenge codierter Daten pro Rahmen in der Ortsauflösung des ersten Bildes ist.
  • Das obige und andere Ziele, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung ersichtlich, wenn im Zusammenhang mit den beiliegenden Zeichnungen betrachtet, die eine bevorzugte Ausführungsform der vorliegenden Erfindung beispielhaft darlegen.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Es zeigt:
  • 1 eine Konzeptansicht der vorliegenden Erfindung; und
  • 2 ein Blockdiagramm des Aufbaus einer Ausführungsform der Erfindung.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Eine Ausführungsform der vorliegenden Erfindung wird nachstehend unter Bezugnahme auf die beiliegenden Zeichnungen beschrieben.
  • Zu Beginn wird das Prinzip eines Video-Codiersystems der Ausführungsform unter Bezugnahme auf 1 erläutert. Das Videocodiersystem der Ausführungsform umfasst eine Auflösungsauswahlsteuereinrichtung 1 zum Auswählen von Bildauflösung, die beim Codieren eines Quellenbildes eines momentanen Rahmens zu verwenden ist, basierend auf Codierinformation im vorangehenden Rahmen, wobei die Codierinformation eine Quantisierschrittgröße, den Umfang codierter Daten und die Pufferbelegung einschließt. Die Vorrichtung umfasst ferner eine Auflösungskonvertiereinrichtung 2 zum Konvertieren der Auflösung des Quellenbildes zu der Bildauflösung, die durch die Auflösungsauswahlsteuereinrichtung 1 ausgewählt worden ist und eine Codiereinrichtung 3 zum Codieren des Quellenbildes, dessen Auflösung durch die Auflösungskonvertiereinrichtung 2 konvertiert worden ist.
  • Wenn das Codieren eines Rahmens abgeschlossen ist, werden einige resultierende Informationen, die sich auf den codierten Rahmen beziehen, verfügbar, welche mindestens eine Quantisierschrittgröße, den Umfang codierter Daten und die Pufferbelegung einschließen. Solche Codierinformation gibt die Eigenschaften dieses Rahmens in einem gewissen Ausmaß an. Im Allgemeinen ändern sich die Eigenschaften von Bildern graduell mit dem Laufe der Zeit, aber es ist auch wahr, dass zwei aufeinanderfolgende Rahmen eine gute Korrelation in ihren Eigenschaften haben. Daher ist es möglich, die Eigenschaften des momentanen Rahmens, der gerade codiert wird, vorherzusagen unter Verwendung der Codierinformation des vorangehenden Rahmens. Mit anderen Worten, durch Prüfen der Codierinformation des vorangehenden Rahmens kann das System abschätzen, ob der momentane Rahmen erfolgreich codiert werden wird oder nicht anhand der folgenden Kriterien: (1) Der Umfang der codierten Daten muss innerhalb eines Zielumfangs liegen, und (2) das Bild muss, wenn es decodiert ist, einen Standardqualitätspegel erfüllen.
  • Die vorliegende Erfindung wendet die oben beschriebenen Ideen auf ein Videocodiersystem an. Gemäß der vorliegenden Erfindung schätzt das Codiersystem den Umfang an codierten Daten und die Qualität des decodierten Bildes und verwendet diese Schätzung zum Bestimmen der Bildauflösung. Das heißt, wenn abgeschätzt wird, dass jene Bedingungen nicht erfüllt werden können, reduziert das System die Bildauflösung der eingegebenen Videoinformation (d.h. reduziert die Anzahl der zu codierenden Pixel), so dass der Gesamtumfang codierter Daten verringert wird. Auf diese weise erzeugt das Codiersystem einen digitalen Videobitstrom, der glatt bzw. übergangsfrei die Ursprungsbewegung reproduziert mit weniger häufigen Rahmenverlusten, wenn er decodiert wird.
  • Spezieller wird das wie in 11 gezeigt konfigurierte Videocodiersystem folgendermaßen arbeiten. Die Auflösungsauswahlsteuereinrichtung 1 empfängt von der Codiereinrichtung 3 die Quantisierschrittgröße, den Umfang codierter Daten und die Pufferbelegung im vorangehenden Rahmencodierprozess. Basierend auf jenen drei Faktoren schätzt die Auflösungsauswahlsteuereinrichtung 1, die zuvor erwähnten Bedingungen, die im derzeitigen Rahmencodierprozess erfüllt werden oder nicht, hierbei eine Bildauflösung auswählend, die geeignet ist für ein Quellenbild oder Eingangsbild des derzeitigen Rahmens.
  • Das Quellenbild wird in der Auflösungskonvertiereinrichtung 2 verarbeitet vor dem Erreichen der Codiereinrichtung 3. Die Auflösungskonvertiereinrichtung 2 ändert die Auflösung des Quellenbildes in die von der Auflösungsauswahlsteuereinrichtung 1 ausgewählte Bildauflösung. Die Codiereinrichtung 3 codiert das Quellenbild mit jener ausgewählten Auflösung.
  • Auf diese Weise ermöglicht die vorliegende Erf indung es, dass die nächste Bildauflösung gerade nachdem der vorangehende Rahmen codiert worden ist, bestimmt werden kann. Im Gegensatz zu dem System des Standes der Technik braucht das Videocodiersystem der vorliegenden Erfindung nicht auf das Ergebnis der Mittelung der Bewegungsvektoren zu warten und demnach kann es die Quellenbildauflösung in einer prompten und geeigneten Weise bestimmen sowie den Umfang an codierten Daten auf einen geeigneten Pegel regulieren. Dank der Bereitschaft der Bildauflösung kann das System vollständig mit einem Pipeline-Schema konfiguriert werden, ohne jede Stufe davon schneller zu machen.
  • 2 ist ein Blockdiagramm zum Zeigen des detaillierten Aufbaus der Ausführungsform. Beachte, dass ein solches Videocodiersystem in der Realität einige zusätzliche Datenpfade und Schalter haben muss zum Vorbeiführen einiger Funktionselemente für die Zwischenrahmencodierung (d.h., das System führt nur Zwischenrahmencodierung aus). Da jedoch die vorliegende Erfindung sich speziell auf eine Prädiktionsvideocodiervorrichtung bezieht, ist 2 aus Gründen der Einfachheit auf die strukturelle Anordnung für ein Zwischenrahmencodiersystem fokussiert.
  • Diese Ausführungsform steht folgenderweise im Zusammenhang mit der Grundstruktur der vorliegenden Erf indung, die in ihrer Konzeptansicht gezeigt ist. Die Auflösungsauswahlsteuereinrichtung 1 in 1 entspricht einer CIF/QCIF-Auswahlsteuerung 25 in 2 und in ähnlicher Weise entspricht die Auflösungskonversionseinrichtung 2 in 1 einem CIF/QCIF-Konverter 11 in 2. Die Codiereinrichtung 3 wird als eine Kombination eines Prädiktionsparameterrechners 12, eines Prädiktionsfehlerrechners 14, eines DCT-Prozessors 15, eines Quantisierers 16, eines Entropiecodierers 17 und einer Codiersteuerung 24 implementiert.
  • H.261 lässt nur zwei Bildformate zu: Das gemeinsame Zwischenformat bzw. "common intermediate formate" (CIF) und quater-CIF (QCIF). Die CIF-Bildauflösung wird definiert als 352 × 288 Bildpunkte bzw. Pixel für Luminanzkomponenten eines Bildes, während die von QCIF 176 × 144 Bildpunkte ist. Aus Gründen der Recheneffizienz verwendet H.261 blockbasierte Algorithmen, in welchen jedes Bild in Blöcke von 8 × 8 Bildpunkten partitioniert ist.
  • Im Betrieb des Videocodiersystems der 2 setzt ein CIF/QCIF-Konverter 11 die CIF-Bildauflösung des Quellenbildes in die QCIF-Bildauflösung um gemäß Anweisungen von einer (später beschriebenen) CIF/QCIF-Auswahlsteuerung 25. Die Ausgangsgröße des CIF/QCIF-Konverters 11 wird zu einem Prädiktionsparameterrechner 12 und einem Prädiktionsfehlerrechner 14 gesendet. Ein wiederhergestelltes (oder decodiertes) Bild des Vorangehenden, in einem Rahmenspeicher 22 gespeicherten Rahmens wird ebenfalls zu dem Prädiktionsparameterrechner 12 über einen CIF/QCIF-Konverter 23 gesendet. Vollständige Details des Rahmenspeichers 22 und des CIF/QCIF-Konverters 23 werden später beschrieben. Das Quellenbild des momentanen Rahmens mit dem wiederhergestellten Bild des vorangehenden Rahmens auf einer Block-zu-Block-Basis vergleichend berechnet der Prädiktionsparameterrechner 12 Bewegungsvektoren des momentanen Rahmens. Beachte, dass die Bilder der beiden aufeinanderfolgenden Rahmen konfiguriert sind, um für einen leichteren Vergleich dieselbe Auflösung zu haben, wie später detailliert beschrieben wird. Die von dem Prädiktionsparameterrechner 12 erhaltenen Bewegungsvektoren werden dem Prädiktionsbildgenerator 13 und einem Entropiecodierer 17 zugeführt. Der Prädiktionsbildgenerator 13 empfängt zusätzlich zu den Bildvektoren ein decodiertes Bild des vorangehenden Rahmens von dem Rahmenspeicher 22 über den CIF/QCIF-Konverter 23. Basierend auf dem decodierten Bild des vorangehenden Rahmens und den Bewegungsvektoren produziert der Prädiktionsbildgenerator 13 ein Prädiktions- bzw. Vorhersagebild des momentanen Rahmens und sendet es zu einem Prädiktionsparameterrechner 14 und einem Rekonstruktionsbildgenerator 21.
  • Der Prädiktionsfehlerrechner 14 erzeugt ein Prädiktionsfehlersignal durch Berechnen von Unterschieden zwischen dem momentanen Rahmenbild, das durch den CIF/QCIF-Konverter 11 bereitgestellt wird und dem Prädiktionsbild, das von dem Prädiktionsbildgenerator 13 bereitgestellt wird. Das erzeugte Prädiktionsfehlersignal wird dann an einen DCT-Prozessor 15 gesendet. Die beiden verglichenen Bilder sind konfiguriert, um dieselbe Auflösung zu haben wie später detailliert beschrieben wird. Um die Ortsredundanz innerhalb eines Blocks zu reduzieren, wendet der DCT-Prozessor 15 eine diskrete Cosinus-Transformation (DCT) auf das Prädiktionsfehlersignal jedes Blocks an, hierdurch Transformationskoeffizienten erhalten. Ein als Nächstes zu dem DCT-Prozessor 15 angeordneter Quantisierer 16 quantisiert die Transformationskoeffizienten jedes Blocks mit einer Quantisierschrittgröße, die durch eine Codiersteuerung 24 spezifiziert ist. Die quantisierten Transformationskoeffizienten werden dann in einen Entropiecodierer 17 eingegeben, um eine Datenkompression mit einem Entropiecodieralgorithmus vorzunehmen. Spezieller empfängt der Entropiecodierer 17 die quantisierten Transformationskoeffizienten von dem Quantisierer 16, Bewegungsvektoren von dem Prädiktionsparameterrechner 12, und Quantisierer-Schrittgröße und andere Prädiktivcodiersysteminformation (z.B. Zwischenrahmen- oder Zwischenrahmencodiermus) von der Codiersteuerung 24, und die Bildauflösung von der CIF/QCIF-Auswahlsteuerung 25. Der Entropiecodierer 17 ordnet dann unterschiedliche Codes zu den Kombinationen jener empfangener Daten zu und speichert die codierten Daten in einen Code-Puffer 18. Der Code-Puffer 18 dient als temporärer Speicher der codierten Daten, die zu der Übertragungsleitung in Form eines Bitstroms bei einer konstanten Übertragungsrate ausgesendet werden.
  • Die durch den Quantisierer 16 erzeugten quantisierten Transformationskoeffizienten werden auch an den Umkehr-Quantisierer 19 gerichtet zur Entquantisierung oder inversen Quantisierung. Sie werden dann zu einer inversen diskreten Cosinus-Transformation (IDCT) durch einen IDCT-Prozessor 20 gerichtet zum Erzeugen des Prädiktionsfehlersignals. Ein Rekonstruktionsbildgenerator 21 rekonstruiert ein Bild durch Hinzufügen des von dem Prädiktionsbildgenerator 13 erzeugten Prädiktionsbildes und des Prädiktionsfehlersignals von dem IDCT-Prozessor 20. Dieses rekonstruierte Bild zeigt das Bild des derzeitigen Rahmens, aber es ist nicht exakt dasselbe wie das ursprüngliche Quellenbild, weil einige detaillierte graphische Information in dem Codierprozess verlorengegangen ist. Der Rekonstruktionsbildgenerator 21 sichert das rekonstruierte Bild in einem Rahmenspeicher 22 zur Verwendung im nächsten Rahmen. In dem obigen Summationsprozess wird die Auflösung des Prädiktionsbildes an die Auflösung des Bildes angepasst, von dem ein Prädiktionsfehlersignal hergeleitet worden ist, wie später detaillierter beschrieben wird.
  • Der Codier-Controller 24 wird von dem Entropiecodierer 17 über den Umfang an durch die Entropiecodierung erzeugten codierten Daten informiert. Der Codier-Controller 24 empfängt auch von dem Code-Puffer 18 die Pufferbelegungsinformation, welche anzeigt, wie viel Daten die Kapazität des Code-Puffers 18 belegen. Basierend auf jener Information bestimmt der Codier-Controller 24 die Quantisierschrittgröße und verteilt sie an den Quantisierer 16, den Inversquantisierer 19 und den Entropiecodierer 17, obwohl der Signalstrom zu dem inversen Quantisierer 19 in 2 weggelassen ist.
  • Die CIF/QCIF-Auswahlsteuerung 25 empfängt die Quantisierschrittgröße für jeden Block in dem vorhergehenden Rahmen von der Codiersteuerung 24, den Umfang der codierten Daten des vorhergehenden Rahmens von dem Entropiecodierer 17 und die Pufferbelegung von dem Code-Puffer 18. Basierend auf der empfangenen Information bestimmt der CIF/QCIF-Auswahl-Controller 25, welche Bildauflösung beim Codieren des momentanen Rahmens verwendet werden sollte. Vollständige Details dieses Entscheidungsprozesses werden später als separater Unterpunkt beschrieben. Die bestimmte Bildauflösung wird an den CIF/QCIF-Konverter 11, den CIF/QCIF-Konverter 23 und den Entropiecodierer 17 verteilt und ferner an den DTC-Prozessor 15 und den Anzeigeauflösungskonverter 26.
  • Wenn die CIF/QCIF-Auswahlsteuerung 25 entscheidet, die CIF-Auflösung oder die hohe Auflösung zu verwenden, leitet der CIF/QCIF-Konverter 11 einfach das Quellenbild, das die CIF-Auflösung hat, unverändert weiter zu den nachfolgenden Stufen. Der CIF/QCIF-Konverter 23 gibt einfach ein von dem Rahmenspeicher 22 geholtes wiederhergestelltes Bild aus, wenn es die CIF-Auflösung hat, oder konvertiert das geholte Bild in die CIF-Auflösung, wenn es die QCIF-Auflösung hat. Als ein Ergebnis werden die in dem Prädiktionsparameterrechner 12, dem Prädiktionsfehlerrechner 14 und dem Rekonstruktionsbildgenerator 21 verarbeiteten Signale vereinheitlicht zu dem CIF bezüglich der Bildauflösung.
  • Wenn die CIF/QCIF-Auswahlsteuerung 25 entschieden hat, CIF-Auflösung oder die niedrige Auflösung zu verwenden, konvertiert andererseits der CIF/QCIF-Konverter 11 das CIF-Quellenbild in QCIF-Bilder. Der CIF/QCIF-Konverter 23 holt das wiederhergestellte Bild des vorangehenden Rahmens aus dem Rahmenspeicher 22 und konvertiert es in QCIF-Bilder, wenn es von der CIF-Auflösung ist. Wenn das geholte Bild die QCIF-Auflösung hat, wird der CIF/QCIF-Konverter 23 einfach dieses Bild ausgeben. Als ein Ergebnis werden die in dem Prädiktionsparameterrechner 12, dem Prädiktionsfehlerrechner 14 und dem Rekonstruktionsbildgenerator 21 verarbeiteten Signale vereinheitlicht zu QCIF bezüglich der Bildauflösung.
  • Die CIF/QCIF-Auswahlsteuerung 25 weist die Bildauflösung auch für den DTC-Prozessor 15 und den Anzeigeauflösungskonverter 26 an. Die Verwendung der Bildauflösung in jenen beiden Funktionsblöcken wird direkt nach der folgenden Erläuterung in Bezug darauf, wie die CIF/QCIF-Auswahlsteuerung 25 die Bildauflösung bestimmt, beschrieben.
  • Die CIF/QCIF-Auswahlsteuerung 25 verwendet verschiedene Parameter, die zuvor definiert worden sind für den Videocodierprozess. QPTH1 ist die größte (oder gröbste) Quantisierschrittgröße, die beim Ausführen der Codierung in einem Hochauflösungsmodus, wenn nämlich die CIF-Auflösung ausgewählt ist, zulässig ist. In ähnlicher Weise ist QPTH2 die kleinste (oder feinste) Quantisierschrittgröße, die in dem Niederauflösungsmodus oder der QCIF-Auflösung zulässig ist. Btarget1 wird als einen Zielumfang codierter Daten pro Rahmen in der CIF-Auflösung definiert und Btarget1 in der QCIF-Auflösung. Die CIF/QCIF-Auswahlsteuerung 25 berechnet ein Produkt QPi-1·Bi-1, wobei QPi-1 eine Durchschnitts- Quantisierungsschrittgröße für alle Blöcke im vorangehenden Rahmen ist und Bi-1 der Umfang codierter Daten, die tatsächlich in dem derzeitigen Rahmen produziert worden sind. Ein Symbol Δ repräsentiert eine Pufferbelegung der Speichereinheit 18, wenn der vorangehende Rahmen beendet ist.
  • Hier sei angenommen, dass die CIF-Auflösung im vorangehenden Rahmen genommen worden ist. Wenn die Pufferbelegung Δ größer ist als ein vorbestimmter Standardwert ΔTH1 und das Produkt QPi-1·Bi-1 größer ist als QPTH1·Btarget1, dann wird die CIF/QCIF-Auswahlsteuerung 25 die CIF-Auflösung zum Codieren des momentanen Rahmens auswählen.
  • Noch einmal angenommen, dass die QCIF-Auflösung im vorangehenden Rahmen genommen worden ist. Wenn die Pufferbelegung Δ kleiner ist als ein anderer vorbestimmter Standardwert ΔTH2 und das Produkt QPi-1·Bi-1 kleiner ist als QPTH2·Btarget2, wird die CIF/QCIF-Auswahlsteuerung 25 die CIF-Auflösung zum Codieren des momentanen Rahmens auswählen.
  • Im Allgemeinen wird eine kleinere Quantisierschrittgröße eine größere Menge codierter Daten verursachen und eine größere Schrittgröße wird eine kleinere Menge codierter Daten verursachen. Grob ausgedrückt, die Menge codierter Daten ist umgekehrt proportional zu der Durchschnitts-Quantisierungsschrittweite aller ein Quellenbild bildender Blöcke. Mit anderen Worten, das Produkt jener zwei Faktoren ist nahezu konstant, wenn Quellenbilder mit derselben Auflösung gegeben werden. Dieses Produkt dient als ein guter Index zum Zeigen der Eigenschaften eines Quellenbildes, speziell bezüglich des Aspektes der Videocodiersteuerung, solange das Videocodiersystem mit konsistenten Systemparametern einschließlich der Bildauflösung läuft. Weil die Eigenschaften von Videobildern sich im Allgemeinen mit der Zeit ohne große Übergänge ändern, wird das oben beschriebene Produkt nicht so sehr von einem Rahmen zum nächsten Rahmen variieren und dies rechtfertigt in den meisten Fällen die Verwendung des Produktwertes im vorangehenden Rahmen als eine Schätzung für den momentanen Rahmen, der von nun an zu verarbeiten ist.
  • Die vorliegende Erfindung basiert auf der obigen Beobachtung. Im Falle, dass die CIF-Auflösung im vorangehenden Rahmen ausgewählt war, impliziert die Pufferbelegung Δ, die größer ist als der vorbestimmte Standardwert ΔTH1, dass der Code-Puffer 18 einen geringen Raum hat. Auch wenn ein Produktwert QPi-1·Bi-1 den Standardwert QPTH1·Btarget1 übersteigt, suggeriert dies, dass die momentane Rahmencodierung einen Überlauf codierter Daten verursachen würde, wenn die vorangehende Auflösung CIF, ohne Änderung darauf angewendet würde. Wenn solche Bedingungen beobachtet werden, wählt die CIF/QCIF-Auswahlsteuerung 25 die CIF-Auflösung als die neue Bildauflösung zum Codieren des derzeitigen Rahmens. In dem Fall, in dem die QCIF-Auflösung im vorangehenden Rahmen ausgewählt war, bedeutet wiederum, dass die Puffer-Belegung Δ kleiner ist als der vorbestimmte Standardwert ΔTH2, dass der Code-Puffer 18 Raum bei einem gewissen Level hat. Der Produktwert QPi-1·Bi-1 des vorangehenden Rahmens, der kleiner ist als der Standardwert QPTH2·Btarget2, zeigt an, dass die momentane Rahmencodierung zu wenig codierte Daten erzeugen würde, wenn die vorangehende Auflösung, QCIF, kontinuierlich ohne Änderung darauf angewendet würde. Wenn solche Bedingungen beobachtet werden, wählt die CIF/QCIF-Auswahlsteuerung 25 die CIF-Auflösung für die Codierung des derzeitigen Rahmens.
  • Anders als beim Codiersystem des Standes der Technik erfordert die vorliegende Erfindung keine Berechnung der durchschnittlichen Magnitude von Bewegungsvektoren. Die vorliegende Erfindung kann schnell die Bildauflösung in geeigneter Weise für den derzeitigen Rahmen basierend auf der Codierinformation im vorangehenden Rahmen bestimmen, wie oben erläutert. Daher kann das Codiersystem den Umfang der codierten Daten bei einem geeigneten Pegel regulieren.
  • Unterdessen kann das decodierter Videosignal, das von dem Rekonstruktionsbildgenerator 21 erzeugt wird, gegebenenfalls in einigen Fällen die CIF-Auflösung haben und in anderen Fällen die QCIF-Auflösung. Wenn das Beobachten der rekonstruierten Bilder erforderlich ist, wird eine solche Inkonsistenz in der Bildauflösung ein Problem mit einer Anzeigeeinheit (in 2 nicht dargestellt) mit sich bringen, die normalerweise entworfen worden ist, um nur eine feste Auflösung anzunehmen. Ein Anzeigenauflösungskonverter 26 löst dieses Problem durch Anpassen der Auflösung, um an die Anzeigeeinheit angepasst zu sein. Das heißt, in Übereinstimmung mit der durch die CIF/QCIF-Auswahlsteuerung 25 ausgewählten Auflösung ändert der Anzeigeauflösungskonverter 26 die Auflösung der von dem Rekonstruktionsbildgenerator 21 erzeugten rekonstruierten Bilder, um die Eingangssignalanforderungen der Anzeigeeinheit zu erfüllen.
  • Selbst wenn die Auflösung von QCIF zu CIF erhöht wird, wird das Vorhersagebild sich nicht unmittelbar zu CIF ändern, sondern es wird immer noch die QCIF-Auflösung haben, weil die Vorhersage auf dem rekonstruierten Bild des vorangehenden Rahmens beruht. Obwohl CIF-Bilder im Allgemeinen einige hohe Ortsfrequenzkomponenten haben, um detaillierte Bilder zu repräsentieren, lassen QCIF-Bilder jene Komponenten vollständig weg. Daher wird unmittelbar, nachdem der CIF/QCIF-Konverter 11 eine Umsetzung von CIF nach QCIF beendet, ein hochauflösendes CIF-Quellenbild unter Bezugnahme auf ein niedrigauflösendes QCIF-Vorhersagebild prädiktionscodiert, hierdurch eine plötzliche Zunahme codierter Daten verursachend. Als ein Ergebnis kann die CIF/QCIF-Auswahlsteuerung 25 gegebenenfalls wieder QCIF auswählend und es ist wahrscheinlich, dass das Ändern der Bildauflösung von einer zur anderen fortgesetzt wird. Um ein solches Oszillieren zu vermeiden, wird der DCT-Prozessor 15 zuerst nur eine beschränkte Anzahl an Transformationskoeffizienten ausgeben und sie dann graduell erhöhen, wenn die CIF/QCIF-Auswahlsteuerung 25 die Bildauflösung von QCIF nach CIF ändert. Spezieller, gibt der DCT-Prozessor 15 zuerst nur die 4 × 4-Koeffizienten aus, die Niederfrequenzkomponenten repräsentieren. Dann wird er graduell andere, höherfrequente Komponenten wie 5 × 5-, 6 × 6- und 7 × 7-Komponenten so lange einschließen, wie die aufeinanderfolgenden Rahmen in derselben CIF-Auflösung verbleiben. Auf diese Weise erhöht der DCT-Prozessor 15 die Anzahl der Koeffizienten von Niederfrequenzkomponenten zu Hochfrequenzkomponenten, hierdurch eine Änderung der Bildauflösung ohne starke Übergänge realisierend. Das spektrale Auswahlverfahren verhindert das Auftreten der Oszillation zwischen CIF und QCIF sowie ein Unterdrücken einer übermäßigen Zunahme codierter Daten.
  • Obwohl die Ausführungsform nur zwei Auflösungen, CIF und QCIF verwendet, kann die vorliegende Erfindung auch auf einem solchem System angewendet werden, das mehr Auflösungen auszuwählen ermöglicht. In diesem Fall definiert das Codiersystem unterschiedliche Standard-Quantisierschrittgrößen und Bitraten für die jeweiligen Bildauflösungen und steuert die Auflösung jedes Rahmens durch Evaluieren der vorangehenden Codierergebnisse unter Bezugnahme auf das Produkt einer relevanten Quantisierschrittgröße und die Zielmenge an codierten Daten pro Rahmen.
  • Blockbasierte Codierschemata sind als exzellente Techniken bekannt, die im Allgemeinen gute Performance bereitstellen, und die beste Effizienz wird erreicht, wenn die Bildauflösung ein ganzzahliges Vielfaches der Blockgröße ist. In einem Videocodiersystem, das mit einer blockbasierten Codiereinheit konfiguriert ist, wird jeder Block getrennt verarbeitet, egal, welche Bildauflösung gewählt ist, hierdurch die Wiederverwendung desselben Satzes an Entropiecodes in unterschiedlichen Blöcken ermöglichend. Daher wird vorgezogen, die Breite und Höhe eines Bildes auszuwählen, damit sie ganzzahlige Vielfache von n Bildpunkten sind, wobei n die Breite und die Höhe eines in Bildpunkten gemessenen Blocks ist. Das heißt, die horizontale Größe eines Bildes wird definiert als (L × n) Bildpunkte bzw. Pixel und die vertikale Größe wird ausgewählt als (M × n) Bildpunkte bzw. Pixel, wobei L und M ganze Zahlen sind. Mit solchen Bilddimensionen kann das Codiersystem effizient Bilder verschiedener Größen durch einfaches (L × M)-maliges Wiederholen der blockbasierten Codieroperationen verarbeiten.
  • Die CIF/QCIF-Auswahlsteuerung 25 bestimmt die Bildauflösung auf dieselbe Weise wie in der ersten Ausführungsform. Wenn sie beispielsweise eine hohe Auflösung oder CIF auswählt, dann leitet der CIF/QCIF-Konverter 31 das empfangene Prädiktionsfehlersignal des momentanen Rahmens zu dem DCT-Prozessor 15 ohne Modifikationen weiter. Da in diesem Fall ein decodiertes Prädiktionsfehlersignal mit der CIF-Auflösung auftritt, speist der CIF/QCIF-Konverter 32 es einfach in den Rekonstruktionsbildgenerator 21. Wenn die CIF/QCIF-Auswahlsteuerung 25 eine niedrige Auflösung oder QCIF ausgewählt hat, ändert der CIF/QCIF-Konverter 31 die Auflösung des Prädiktionsfehlersignals von CIF nach QCIF. Der CIF/QCIF-Konverter 32 empfängt demnach das decodierte Prädiktionsfehlersignal mit der QCIF-Auflösung und in diesem Fall gibt er das Signal nach dem Umsetzen seiner Auflösung in CIF aus.
  • Die oben beschriebene strukturelle Anordnung vereinheitlicht die Auflösung von in dem Prädiktionsparameterrechner 12, dem Prädiktionsfehlerrechner 14 und dem Konstruktionsbildgenerator 21 zu verarbeiteten Bilder. Erinnern wir uns, dass jene Funktionselemente in der ersten Ausführungsform sowohl CIF- als auch QCIF-Dimensionen behandeln sollten. Anders als in einer solchen ersten Ausführungsform ermöglicht die zweite Ausführungsform es ihnen, die Bilder immer in der hohen Auflösung von CIF-Dimensionen zu verarbeitet. Eingedenk des Einfügens von Auflösungskonvertern kann eine solche Konfiguration in der zweiten Ausführungsform eine bessere Qualität decodierter Bilder im Vergleich zu der ersten Ausführungsform bereitstellen.
  • Die obige Diskussion wird folgendermaßen zusammengefasst. Gemäß der vorliegenden Erfindung wird die Bildauflösung des derzeitigen Rahmens basierend auf der Quantisierschrittgröße und dem Umfang an codierten Daten in der Codierung des vorangehenden Rahmens bestimmt, sowie unter Beachtung der Pufferbelegung. Das Quellenbild des derzeitigen Rahmens wird konvertiert, um die vor der Codierung bestimmte Auflösung zu erzielen.
  • Die vorliegende Erfindung bestimmt die Auflösung des derzeitigen Rahmens unmittelbar, nachdem der vorangehende Rahmen verarbeitet worden ist. Anders als bei dem konventionellen Codiersystem braucht nicht gewartet zu werden, bis eine durchschnittliche Magnitude von Bewegungsvektoren für einen gesamten Rahmen berechnet worden ist. Das System stellt eine geeignete und prompte Steuerung der Auflösung der Quellenbilder bereit, hierdurch ermöglichend, dass der Umfang an codierten Daten bei einem geeigneten Pegel gehalten wird. Die vorliegende Erfindung ermöglicht auch eine vollständige Konfiguration des Systems in einer Pipeline-Architektur, welche genügend Performance bereitstellt, ohne eine Verbesserung jeder Stufe des Codierprozesses zu erfordern.

Claims (5)

  1. Eine Video-Codier-Vorrichtung zum Ausführen einer Prädiktions-Codierung digitaler Video-Eingangssignale, umfassend: eine Ortsauflösungsauswahl-Steuereinrichtung (1; 25) zum Auswählen einer Ortsauflösung eines ersten Bildes oder einer Ortsauflösung eines zweiten Bildes geringer als die Ortsauflösung des ersten Bildes zur Verwendung beim Codieren eines Ursprungsbildes eines gegenwärtigen Rahmens bzw. Rasterbildes basierend auf Codier-Information in dem vorherigen Rahmen, eine Ortsauflösungskonvertierungs-Einrichtung (2; 11) zum Konvertieren der Ortsauflösung des Ursprungsbildes von der Ortsauflösung des ersten Bildes zu der Ortsauflösung des zweiten Bildes, die durch die Ortauflösungsauswahl-Steuereinrichtung (1; 25) ausgewählt ist; und eine Codiereinrichtung (3; 12, 14, 15, 16, 17, 24) zum Codieren des Ursprungsbildes, dessen Ortsauflösung durch die Ortsauflösungskonvertierungs-Einrichtung konvertiert ist, und dadurch gekennzeichnet, dass die Codierinformation mindestens eine Quantisierschrittgröße, eine Menge an codierten Daten und eine Pufferbelegung in dem vorigen Rahmen enthält, wobei die Ortsauflösung des zweiten Bildes ausgewählt wird, wenn der vorherige Rahmen mit der Ortsauflösung des ersten Bildes codiert wurde, falls die Pufferbelegung größer ist als ein erster Schwellenwert, der ein vorbestimmter Standardwert ist, und falls ein Produkt der Quantisierschrittgröße und der Menge der codierten Daten größer ist als ein zweiter Schwellenwert, wobei der zweiten Schwellenwert ein Produkt ist aus der größten erlaubten Quantisierschrittgröße in der Ortsauflösung des ersten Bildes und einer Zielmenge von codierten Daten pro Rahmen in der Ortsauflösung des ersten Bildes.
  2. Eine Video-Codier-Vorrichtung nach Anspruch 1, wobei die Codiereinrichtung eine Prädiktions-Fehler-Berechnungseinrichtung (14) umfasst zum Erhalten eines Prädiktions-Fehlersignals des gegenwärtigen Rahmens durch Berechnen des Unterschieds zwischen dem Ursprungsbild des gegenwärtigen Rahmens, dessen Ortsauflösung durch die Ortsauflösungs-Konvertiereinrichtung (11) konvertiert wird und einem vorhergesagten Bild (13) des gegenwärtigen Rahmens, wobei die Video-Codier-Vorrichtung ferner umfasst, eine Bildrekonstruktions-Einrichtung (21) zum Erzeugen eines rekonstruierten Bildes des gegenwärtigen Rahmens durch Addieren eines decodierten Prädiktions-Fehlersignals des gegenwärtigen Rahmens mit dem vorhergesagten Bild des gegenwärtigen Rahmens, wobei das decodierte Prädiktions-Fehlersignal und das vorhergesagte Bild des gegenwärtigen Rahmens die gleiche Ortsauflösung aufweisen wie die Bildortsauflösung, die durch die Ortsauflösungsauswahl-Steuereinrichtung (11) ausgewählt ist.
  3. Eine Video-Codier-Vorrichtung nach Anspruch 2, ferner umfassend eine Anzeige-Auflösungs-Konvertierungs-Einrichtung (26) zum Konvertieren der Ortsauflösung des rekonstruierten Bildes des gegenwärtigen Rahmens zu einer vorbestimmten konstanten Ortsauflösung und Zuführen des rekonstruierten Bildes mit der vorbestimmten konstanten Ortsauflösung zu einer Anzeigeeinheit, die für Überwachungszwecke präpariert ist.
  4. Eine Video-Codier-Vorrichtung nach Anspruch 1, wobei die Codiereinrichtung eine Prädiktions-Fehler-Berechnungs-Einrichtung (14) umfasst, zum Erhalten eines Prädiktions-Fehlersignals des gegenwärtigen Rahmens durch Berechnen der Differenz zwischen dem Ursprungsbild des gegenwärtigen Rahmens und einem vorhergesagten Bild (13) des gegenwärtigen Rahmens, und die Ortsauflösungs-Konvertier-Einrichtung (31) neben der Prädiktions-Fehler-Berechnungs-Einrichtung (14) angeordnet ist, wobei die Video-Codier-Vorrichtung ferner umfasst: eine Ortsauflösungs-Invers-Konvertier-Einrichtung (32) zum inversen Konvertieren der Ortsauflösung eines decodierten Prädiktions-Fehlersignals des gegenwärtigen Rahmens, und eine Bildrekonstruktionseinrichtung (21), die mit der Auflösungs-Invers-Konvertier-Einrichtung (32) gekoppelt ist, zum Erzeugen eines rekonstruierten Bildes des gegenwärtigen Rahmens durch Hinzufügen des decodierten Prädiktions-Fehlersignals, dessen Ortsauflösung invers konvertiert wird durch die Ortsauflösungs-Invers-Konvertier-Einrichtung zu dem vorhergesagten Bild des gegenwärtigen Rahmens, wobei das decodierte Prädiktions-Fehlersignal und das vorhergesagte Bild des gegenwärtigen Rahmens die gleiche Ortsauflösung aufweisen, wie die Ortsauflösung, die das Ursprungsbild ursprünglich hat.
  5. Eine Video-Codier-Vorrichtung nach Anspruch 1, wobei die Codiereinrichtung umfasst: eine Orthogonal-Transformations-Einrichtung (15) zum Anwenden einer orthogonalen Transformation auf das Prädiktions-Fehlersignal des gegenwärtigen Rahmens und Ausgeben von Transformations-Koeffizienten, und eine Steuereinrichtung zum Steuern der Orthogonal-Transformations-Einrichtung, so dass die Ausgabe der Hochfrequenz-Komponenten in den Transformations-Koeffizienten unterdrück wird, sofort nach dem die Ortsauflösung des Ursprungsbildes des gegenwärtigen Rahmens von der Ortsauflösung des zweiten Bildes zu der Ortsauflösung des ersten Bildes durch die Auflösungskonvertiereinrichtung (11) verändert wird.
DE1996635369 1996-03-29 1996-11-29 Videokodierungsvorrichtung Expired - Lifetime DE69635369T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP7560596 1996-03-29
JP7560596A JP3773585B2 (ja) 1996-03-29 1996-03-29 画像符号化装置

Publications (2)

Publication Number Publication Date
DE69635369D1 DE69635369D1 (de) 2005-12-08
DE69635369T2 true DE69635369T2 (de) 2006-07-13

Family

ID=13581017

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69638224T Expired - Lifetime DE69638224D1 (de) 1996-03-29 1996-11-29 Kodiergerät mit Auflösungsumwandler
DE1996635369 Expired - Lifetime DE69635369T2 (de) 1996-03-29 1996-11-29 Videokodierungsvorrichtung

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69638224T Expired - Lifetime DE69638224D1 (de) 1996-03-29 1996-11-29 Kodiergerät mit Auflösungsumwandler

Country Status (4)

Country Link
US (1) US5805222A (de)
EP (2) EP1551186B1 (de)
JP (1) JP3773585B2 (de)
DE (2) DE69638224D1 (de)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10243399A (ja) * 1997-02-25 1998-09-11 Sharp Corp 符号量制御装置及び該符号量制御装置を含む動画像符号化装置
KR100232098B1 (ko) 1997-03-26 1999-12-01 서평원 퍼지 제어를 이용한 mpeg 영상 신호의 전송율 제어 장치
MY129665A (en) * 1997-04-09 2007-04-30 Matsushita Electric Ind Co Ltd Image predictive decoding method, image predictive decoding apparatus, image predictive coding method, image predictive coding apparatus, and data storage media
JPH10304381A (ja) * 1997-05-01 1998-11-13 Fujitsu Ltd 動画像符号化装置及び方法
JP3844844B2 (ja) * 1997-06-06 2006-11-15 富士通株式会社 動画像符号化装置及び動画像符号化方法
US6310918B1 (en) * 1997-07-31 2001-10-30 Lsi Logic Corporation System and method for motion vector extraction and computation meeting 2-frame store and letterboxing requirements
US6873368B1 (en) 1997-12-23 2005-03-29 Thomson Licensing Sa. Low noise encoding and decoding method
JP2000023162A (ja) 1998-06-29 2000-01-21 Sony Corp 符号化装置及び符号化方法
US6625322B1 (en) 1999-06-08 2003-09-23 Matsushita Electric Industrial Co., Ltd. Image coding apparatus
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
JP4378824B2 (ja) * 2000-02-22 2009-12-09 ソニー株式会社 画像処理装置及び方法
AU2001273326A1 (en) * 2000-07-11 2002-01-21 Mediaflow, Llc System and method for calculating an optimum display size for a visual object
DE10048735A1 (de) * 2000-09-29 2002-04-11 Bosch Gmbh Robert Verfahren zur Codierung und Decodierung von Bildsequenzen sowie Einrichtungen hierzu
JP4688279B2 (ja) * 2000-11-21 2011-05-25 富士通株式会社 動画像の空間解像度自動設定方法及び装置
JP2002191050A (ja) * 2000-12-22 2002-07-05 Fuji Xerox Co Ltd 画像符号化装置および方法
JP2002290243A (ja) * 2001-03-28 2002-10-04 Mitsubishi Electric Corp 符号化方法、符号化装置、復号方法、及び復号装置
EP1377065A4 (de) * 2001-03-30 2006-07-05 Sony Corp Bildsignalquantisierungseinrichtung und ihr verfahren
US7679629B2 (en) * 2003-08-15 2010-03-16 Broadcom Corporation Methods and systems for constraining a video signal
US7489362B2 (en) 2003-03-04 2009-02-10 Broadcom Corporation Television functionality on a chip
US7352808B2 (en) 2004-01-29 2008-04-01 International Business Machines Corporation System and method for the dynamic resolution change for video encoding
US7609766B2 (en) * 2005-02-08 2009-10-27 Vixs Systems, Inc. System of intra-picture complexity preprocessing
JP4724240B2 (ja) * 2009-07-02 2011-07-13 トムソン ライセンシング ビデオ信号を処理する方法
US8780976B1 (en) 2011-04-28 2014-07-15 Google Inc. Method and apparatus for encoding video using granular downsampling of frame resolution
US8681866B1 (en) 2011-04-28 2014-03-25 Google Inc. Method and apparatus for encoding video by downsampling frame resolution
GB2496015B (en) 2012-09-05 2013-09-11 Imagination Tech Ltd Pixel buffering
JP6398569B2 (ja) 2014-10-07 2018-10-03 株式会社ソシオネクスト 画像符号化装置、画像符号化方法および画像符号化プログラム
US10356406B2 (en) * 2016-01-19 2019-07-16 Google Llc Real-time video encoder rate control using dynamic resolution switching
CN109151470B (zh) 2017-06-28 2021-03-16 腾讯科技(深圳)有限公司 编码分辨率控制方法及终端
CN109151481B (zh) * 2017-06-28 2022-03-15 腾讯科技(深圳)有限公司 图片的传输和接收的方法、装置、系统、设备和介质
CN116320431B (zh) * 2023-03-20 2024-03-01 深圳市与众文化传播有限公司 视频压缩编码数据动态无线网络传输系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2688958B1 (fr) * 1992-03-17 1997-06-27 Thomson Csf Procede de codage d'images bi-standard tres bas debit et codeur-decodeur pour la mise en óoeuvre de ce procede.
JPH06141185A (ja) * 1992-10-26 1994-05-20 Nec Corp 画像間引き装置
JPH0730901A (ja) * 1993-07-12 1995-01-31 Kyocera Corp 動画像符号化方式および動画像復号化方式
US5477272A (en) * 1993-07-22 1995-12-19 Gte Laboratories Incorporated Variable-block size multi-resolution motion estimation scheme for pyramid coding
JP3252936B2 (ja) * 1993-12-24 2002-02-04 シャープ株式会社 映像情報フォーマット制御装置

Also Published As

Publication number Publication date
US5805222A (en) 1998-09-08
DE69635369D1 (de) 2005-12-08
DE69638224D1 (de) 2010-09-09
JPH09271026A (ja) 1997-10-14
EP1551186B1 (de) 2010-07-28
EP0798930B1 (de) 2005-11-02
EP0798930A2 (de) 1997-10-01
EP1551186A1 (de) 2005-07-06
JP3773585B2 (ja) 2006-05-10
EP0798930A3 (de) 2000-08-09

Similar Documents

Publication Publication Date Title
DE69635369T2 (de) Videokodierungsvorrichtung
DE69738494T2 (de) Videokodierungs- und Videodekodierungsvorrichtung
DE60027955T2 (de) Verfahren und Vorrichtung zur kontextbasierten Inter/Intra Kodierungsmodeauswahl
DE60027495T2 (de) Video-codierverfahren und video-codiervorrichtung
DE69815922T2 (de) Verfahren und Vorrichtung zur prädiktiven Bildkodierung und -dekodierung
DE4343211B4 (de) Adaptives Bildkompressionsverfahren und adaptive Bildkompressionsvorrichtung
DE10253380B4 (de) Verfahren und Einrichtung zum Kodieren sich bewegender Bilder mit fester Rechenkomplexität
DE69826823T2 (de) Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer
DE69435000T2 (de) Bildkodierungsvorrichtung
DE19825042C2 (de) Verfahren zur Bewegungsvektorcodierung bei MPEG-4
DE69829345T2 (de) Verfahren zur Verminderung des Verarbeitungsleistungsbedarfs eines Videodekoders
DE69929430T2 (de) Verfahren und vorrichtung zur codierung von video-information
DE69837003T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
DE69839100T2 (de) Verbesserte Videokodierung unter Verwendung von adaptiven Blockparametern für kodierte/unkodierte Blöcke
DE69825811T2 (de) Kodiergerät und Kodierverfahren mit Bewegungskompensation für hocheffiziente Videokodierung durch selektive Auswahl von vergangenen Bewegungsvektoren statt Benutzung von Bewegungsvektoren abgeleitet von Bewegungsschätzung
DE69535228T2 (de) Bildumsetzungsvorrichtung
DE69813911T2 (de) VERFAHREN ZUR BESTIMMUNG VON BEWEGUNGSVEKTORFELDERN MIT LOKALER BEWEGUNGSSCHäTZUNG
DE69921108T2 (de) Verfahren und vorrichtung zur adaptiven codierung eines videodatenstroms
DE10190285B4 (de) Verfahren und System zur Verarbeitung von komprimierten Videosignalen
DE60309375T2 (de) Parametrisierung für verlauf-kompensation
DE69935564T2 (de) Kodiervorrichtung und -verfahren
DE10248019A1 (de) Verfahren der adaptiven Codierung und Decodierung von bewegten Bildern und Apparat dafür
DE102019103346A1 (de) Ssim-basierte rate-distortion-optimierung für eine verbesserte wahrnehmbare qualität bei videos
DE102004021854A1 (de) Vorrichtung für sowohl eine Block-Matching Motion Compensation als auch eine Global Motion Compensation sowie Verfahren hierfür
DE4442643B4 (de) Verfahren zum Abschätzen der Bewegung in einem Bewegtbild

Legal Events

Date Code Title Description
8364 No opposition during term of opposition