DE69233411T2 - Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung - Google Patents

Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung Download PDF

Info

Publication number
DE69233411T2
DE69233411T2 DE69233411T DE69233411T DE69233411T2 DE 69233411 T2 DE69233411 T2 DE 69233411T2 DE 69233411 T DE69233411 T DE 69233411T DE 69233411 T DE69233411 T DE 69233411T DE 69233411 T2 DE69233411 T2 DE 69233411T2
Authority
DE
Germany
Prior art keywords
image
spatial
bits
pictures
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69233411T
Other languages
English (en)
Other versions
DE69233411D1 (de
Inventor
Cesar Augusto Katonah Gonzales
Eric San Francisco Viscito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE69233411D1 publication Critical patent/DE69233411D1/de
Publication of DE69233411T2 publication Critical patent/DE69233411T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Description

  • Die vorliegende Erfindung betrifft das Gebiet der Datenkompression und insbesondere ein System und Techniken zum Komprimieren digitaler Signale von sich bewegenden Videobildern in Anlehnung an Algorithmen, die der in der Beratung befindlichen MPEG-Norm, die von der Moving Picture Expert Group (MPEG) der International Standards Organization (ISO) vorgeschlagen wurde, ähnlich sind.
  • Technologische Fortschritte bei digitalen Übertragungsnetzen, digitalen Speichermedien, bei hochintegrierten Schaltkreisen und bei der digitalen Verarbeitung von Video- und Audiosignalen laufen darauf hinaus, die Übertragung und Speicherung von digitalen Videobildern in einer großen Vielzahl von Anwendungen wirtschaftlich durchzuführen. Da die Speicherung und Übertragung von digitalen Videosignalen bei vielen Anwendungen eine zentrale Stellung einnehmen und da eine unkomprimierte Darstellung eines Videosignals eine große Menge Speicherplatz erfordert, ist die Verwendung von digitalen Videokompressionstechniken für diese hochentwickelte Technik entscheidend. In diesem Zusammenhang sind im letzten Jahrzehnt mehrere internationale Standards für die Kompression digitaler Videosignale entstanden, wobei weitere gegenwärtig entwickelt werden. Diese Standards stützen sich auf Algorithmen für die Übertragung und Speicherung von komprimierten digitalen Videobildern in einer Vielzahl von Anwendungen, darunter: Bildfernsprechtechnik und Konferenzschaltungen; hochwertige digitale Fernsehübertragungen in Netzen aus Koaxialkabeln und Lichtwellenleiterkabeln sowie das terrestrische Rundsenden und Rundsenden über Direktsendesatelliten; und bei interaktiven Multimedia-Produkten auf CD-ROM, auf digitalem Audioband und in Winchester-Plattenlaufwerken.
  • Einige dieser Standards enthalten Algorithmen, die auf einem gemeinsamen Kern der Kompressionstechniken basieren, z.B. die Empfehlung 11.120 des CCITT (Consultative Committee on International Telegraphy and Telephony), die Empfehlung 11.261 des CCITT und die ISO/IEC MPEG-Norm. Der MPEG-Algorithmus wurde von der Moving Picture Expert Group (MPEG), eines Teils des gemeinsamen technischen Ausschusses der International Standards Organization (ISO) und der International Electrotechnical Commission (IEC), entwickelt. Der MPEG-Ausschuss hat einen Standard für die gemultiplexte, komprimierte Darstellung von Videosignalen und zugehörigen Audiosignalen entwickelt. Der Standard spezifiziert die Syntax des komprimierten Bitstroms und das Verfahren der Decodierung, lässt jedoch beträchtlichen Spielraum für Neuheiten und Abarten für den im Codierer verwendeten Algorithmus.
  • Da die vorliegende Erfindung in Verbindung mit einem derartigen Codierer angewendet werden kann, wird zur Vereinfachung des Verständnisses der Erfindung ein Überblick über einige sachbezogene Aspekte des MPEG-Algorithmus zur Videokompression gegeben. Es sollte jedoch angemerkt werden, dass die Erfindung außerdem auf weitere Algorithmen der Videocodierung angewendet werden kann, denen einige Merkmale des MPEG-Algorithmus gemein sind.
  • Der MPEG-Algorithmus zur Videokompression
  • Zunächst sollte klar sein, dass die Komprimierung irgendeines Datenobjekts, wie etwa eine Textseite, ein Bild, ein Sprachsegment oder eine Videobildfolge, als eine Folge von Schritten vorstellbar ist, die enthält: 1) eine Zerlegung dieses Objekts in eine Sammlung von Zeichen (Token); 2) die Darstellung dieser Zeichen durch binäre Zeichenketten, die in gewisser Hinsicht eine minimale Länge aufweisen; und 3) die Verknüpfung der Zeichenketten in einer wohldefinierten Reihenfolge. Die Schritte 2 und 3 sind verlustfrei, d.h., die ursprünglichen Daten können bei der Umkehrung eins-zu-eins wiederhergestellt werden, wobei der Schritt 2 als Entropie-Codierung bekannt ist. (Siehe z.B. T. BERGER, "Rate Distortion Theory", Englewood Cliffs, NJ: Prentice-Hall, 1977; R. McELIECE, "The Theory of Information and Coding", Reading, MA: Addison-Wesley, 1971; D. A. HUFFMAN, "A Method for the Construction of Minimum Redundancy Codes", Proc. IRE, S. 109 bis 1101, September 1952; G. G. LANGDON, "An Introduction to Arithmetic Coding", IBM J. Res. Develop., Bd. 28, S. 135 bis 149, März 1984.) Der Schritt 1 kann im Allgemeinen verlustfrei oder verlustbehaftet sein. Die meisten Algorithmen der Videokompression sind wegen einengender Bitraten-Anforderungen verlustbehaftet. Ein erfolgreicher verlustbehafteter Kompressionsalgorithmus entfernt redundante und irrelevante Daten, wodurch verhältnismäßig große Fehler dort zugelassen werden, wo sie wahrscheinlich visuell nicht bedeutend sind, und Aspekte einer Folge, auf die der menschliche Betrachter sehr empfindlich ist, sorgfältig dargestellt werden. Diese Techniken, die in dem MPEG-Algorithmus für den Schritt 1 verwendet werden, können als prädiktive/interpolative bewegungskompensierte DCT/DPCM-Hybridcodierung beschrieben werden. Die Huffman-Codierung, die auch als Codierung mit variabler Länge bekannt ist (siehe das oben angeführte Dokument von Huffman aus dem Jahr 1952), wird im Schritt 2 verwendet. Obwohl die MPEG-Norm tatsächlich eine Spezifikation des Decoders und der Syntax des komprimierten Bitstroms ist, wie erwähnt wurde, erfolgt die folgende Beschreibung der MPEG-Spezifikation für die Einfachheit der Darstellung hauptsächlich vom Standpunkt eines Codierers.
  • Die MPEG-Videonorm spezifiziert eine codierte Darstellung von Videobildern für digitale Speichermedien, wie in ISO-IEC JTC1/SC2/WG11 MPEG CD-11172, MPEG Committee Draft, 1991 dargestellt ist. Es ist vorgesehen, dass der Algorithmus bei Videobildern mit nichtverschachtelten Komponenten angewendet wird. Jedes Bild besitzt drei Komponenten: Luminanz (Y), rote Farbdifferenz (Cr) und blaue Farbdifferenz (Cb). Die Cr- und Cb-Komponenten besitzen jeweils halb so viele Abtastwerte wie die Y-Komponente, sowohl in horizontaler als auch in vertikaler Richtung.
  • Schichtstruktur einer MPEG-Bildfolge
  • Ein MPEG-Datenstrom enthält einen Videostrom und einen Audiostrom, die zusammen mit Systeminformationen und möglicherweise weiteren Bitströmen in einen System-Datenstrom gepackt sind, der als geschichtet betrachtet werden kann. In der Videoschicht des MPEG-Datenstroms sind die komprimierten Daten ebenfalls geschichtet. Eine Beschreibung der Organisation der Schichten wird das Verständnis der Erfindung unterstützen. Diese Schichten der MPEG-Video-Schichtstruktur sind in den 1 bis 4 gezeigt. Die Figuren zeigen im Einzelnen:
  • 1: ein beispielhaftes Paar von Gruppen von Bildern (GOPs);
  • 2: eine beispielhafte Makroblock-(MB)Unterteilung eines Bilds;
  • 3: eine beispielhafte Scheibenunterteilung eines Bilds; und
  • 4: eine Blockunterteilung eines Makroblocks.
  • Die Schichten betreffen die Funktionsweise des Kompressionsalgorithmus sowie die Zusammensetzung eines komprimierten Bitstroms. Die höchste Schicht ist die Video-Schicht, die Steuerinformationen und Parameter für die gesamte Bildfolge enthält. In der nächsten Schicht ist eine Bildfolge in Gruppen von aufeinander folgenden Bildern unterteilt, die jeweils als eine Gruppe von Bildern (Group of Pictures – GOP) bezeichnet werden. Eine allgemeine Darstellung dieser Schicht ist in 1 gezeigt. Eine Decodierung kann im Wesentlichen unabhängig von den vorhergehenden GOPs am Anfang einer GOP beginnen. Es gibt weder eine Beschränkung der Anzahl von Bildern, die in einer GOP vorhanden sein können, noch müssen in allen GOPs gleiche Anzahlen von Bildern vorhanden sein.
  • Die dritte Schicht oder Bildschicht ist ein einzelnes Bild. Eine allgemeine Darstellung dieser Schicht ist in 2 gezeigt. Die Luminanzkomponente jedes Bilds ist in 16 × 16 Bereiche unterteilt, und die Farbdifferenzkomponenten sind in 8 × 8 Bereiche unterteilt, die räumlich übereinstimmend mit den 16 × 16 Luminanzbereichen angeordnet sind. Dieser übereinstimmend angeordnete Luminanzbereich und die Farbdifferenzbereiche bilden gemeinsam die fünfte Schicht, die als ein Makroblock (MB) bezeichnet wird. Makroblöcke in einem Bild sind nacheinander in lexikografischer Reihenfolge, beginnend beim Makroblock 1, nummeriert.
  • Zwischen der Bildschicht und der MB-Schicht befindet sich die vierte Schicht oder Scheibenschicht. Jede Scheibe enthält eine bestimmte Anzahl von aufeinander folgenden MBs. Scheiben müssen innerhalb eines Bilds oder von Bild zu Bild keine gleichmäßige Größe besitzen. Sie können eine Größe von lediglich wenigen Makroblöcken aufweisen oder sich über mehrere Zeilen von MBs erstrecken, wie in 3 gezeigt ist.
  • Schließlich enthält jeder MB vier 8 × 8 Luminanzblöcke und zwei 8 × 8 Chrominanzblöcke, wie in 4 ersichtlich ist. Wenn die Breite jedes Luminanzbildes (in Bildelementen oder Pixeln) als C und die Höhe als R bezeichnet werden (C steht für Spalten und R für Zeilen), besitzt ein Bild eine Breite von CMB = C/16 MBs und eine Höhe von RMB = R/16 MBs. Es besitzt gleichfalls eine Höhe von CB = C/8 Blöcken und eine Höhe von RB = R/8 Blöcken.
  • Die Bildfolge-, die GOP-, die Bild- und die Scheibenschichten besitzen jeweils ihnen zugeordnete Kopfabschnitte. Die Kopfabschnitte beginnen mit an Bytes ausgerichteten Start-Codes und enthalten Informationen, die die Daten betreffen, die in den entsprechenden Schichten enthalten sind.
  • In einer GOP können drei Typen von Bildern erscheinen. Der kennzeichnende Unterschied zwischen den Bildtypen besteht in dem verwendeten Kompressionsverfahren. Der erste Typ sind Intramode-Bilder oder I-Bilder, die unabhängig von anderen Bildern komprimiert werden. Obwohl es keine feststehende obere Begrenzung des Abstands zwischen I-Bildern gibt, wird erwartet, dass sie häufig über eine vollständige Bildfolge eingestreut sind, um einen willkürlichen Zugriff sowie andere spezielle Betriebsarten zu ermöglichen. Jede GOP muss mit einem I-Bild beginnen, und in einer GOP können zusätzliche I-Bilder erscheinen. Die anderen beiden Typen von Bildern sind prädiktiv bewegungskompensierte Bilder (P-Bilder) und bidirektional bewegungskompensierte Bilder (B-Bilder), die während der folgenden Erläuterung der Bewegungskompensation beschrieben werden.
  • Für Anzahl und Reihenfolge von I-, P- und B-Bildern in einer GOP gelten bestimmte Regeln. Bezeichnet man I- und P-Bilder gemeinsam als Fixpunktbilder, muss eine GOP wenigstens ein Fixpunktbild enthalten bzw. kann mehrere Fixpunktbilder enthalten. Außerdem können sich zwischen jedem benachbarten Paar von Fixpunktbildern null oder mehr B-Bilder befinden. Eine Darstellung einer typischen GOP ist in 5 gezeigt.
  • Makroblock-Codierung in I-Bildern
  • Eine sehr nützliche Bildkompressionstechnik ist die Transformationscodierung. (Siehe N. S. JAYANT und P. NOLL, "Digital Coding of Waveforms, Principles and Applications to Speech and Video", Englewood Cliffs, NJ: Prentice-Hall, 1984 und A. G. TESCHER, "Transform Image Coding", in W. K. Pratt, Herausgeber, Image Transmission Techniques, S. 113 bis 155, New York, NY: Academic Press, 1979.) Bei der MPEG-Norm und verschiedenen anderen Kompressionsstandards ist die diskrete Kosinustransformation (DCT) die gewählte Transformation. (Siehe K. R. RAO und P. YIP, "Discrete Cosine Transform, Algorithms, Advantages, Applications", San Diego, CA: Academic Press, 1900 und N. AHMED, T. NATARAJAN und K. R. RAO, "Discrete Cosine Transform", IEEE Transactions on Computers, S. 90 bis 93, Januar 1974.) Die Kompression eines I-Bilds wird durch die folgenden Schritte erreicht: 1) Bilden der DCT von Pixelblöcken; 2) Quantisieren der DCT-Koeffizienten; und 3) Huffman-Codieren des Ergebnisses. Bei MPEG wandelt die DCT-Operation einen Block von n × n Pixeln in eine Menge von n × n Transformationskoeffizienten um. Der MPEG-Algorithmus verwendet wie mehrere der internationalen Kompressionsstandards eine DCT-Blockgröße von 8 × 8. Die eigentliche DCT-Transformation ist eine verlustfreie Operation, die innerhalb der Genauigkeit der Berechnungsvorrichtung und des Algorithmus, mit dem sie ausgeführt wird, umgekehrt werden kann.
  • Der zweite Schritt, die Quantisierung der DCT-Koeffizienten, ist im MPEG-Algorithmus die Hauptquelle von Verlusten. Werden die Elemente der zweidimensionalen Matrix der DCT-Koeffizienten als csubmn bezeichnet, wobei m und n im Bereich von 0 bis 7 liegen, wird die Quantisierung außer Kürzungs- oder Rundungskorrekturen erreicht, indem jeder DCT-Koeffizient cmn durch wmn × QP dividiert wird, wobei wmn ein Gewichtungsfaktor und QP der Quantisierungsparameter ist. Es wird angemerkt, dass QP auf jeden DCT-Koeffizienten angewendet wird. Der Gewichtungsfaktor wmn, ermöglicht, dass auf die visuell weniger wichtigen Koeffizienten eine gröbere Quantisierung angewendet wird. Es können zwei Mengen dieser Gewichtungen vorhanden sein, eine für I-Bilder und die andere für P- und B-Bilder. Es können kundenspezifische Gewichtungen in der Videobildfolge-Schicht übertragen oder Vorzugswerte verwendet werden. Der Quantisierungsparameter QP ist bei MPEG das Hauptmittel für einen Kompromiss zwischen Qualität und Bitrate. Es ist wichtig anzumerken, dass QP in einem Bild von MB zu MB variieren kann. Durch dieses Merkmal, das als adaptive Quantisierung (AQ) bezeichnet wird, können verschiedene Bereiche jedes Bilds mit unterschiedlichen Schrittgrößen quantisiert werden, und es kann bei einem Versuch verwendet werden, die visuelle Qualität in jedem Bild und von Bild zu Bild auszugleichen (und zu optimieren). Obwohl die MPEG-Norm eine adaptive Quantisierung zulässt, sind Algorithmen, die Regeln für die Verwendung der AQ enthalten, um die visuelle Qualität zu verbessern, nicht Gegenstand der Normgebung. Ein Klasse von Regeln für eine AQ ist eine Aufgabe dieser Erfindung.
  • Nach der Quantisierung werden die Informationen der DCT-Koeffizienten organisiert und unter Verwendung einer Menge von Huffman-Codes codiert. Da die Einzelheiten dieses Schritts für das Verständnis der Erfindung nicht wesentlich und in der Technik allgemein bekannt sind, erfolgt an dieser Stelle keine weitere Beschreibung. Hinsichtlich weiterer Informationen diesbezüglich kann auf das oben angeführte Dokument HUFFMAN 1952 Bezug genommen werden.
  • Bewegungskompensation
  • Die meisten Videobildfolgen weisen einen hohen Grad der Korrelation zwischen aufeinander folgenden Bildern auf. Ein nützliches Verfahren zum Entfernen dieser Redundanz vor dem Codieren eines Bilds ist die "Bewegungskompensation". Die Bewegungskompensation erfordert bestimmte Mittel zum Modellieren und Abschätzen der Bewegung in einer Szene. Bei MPEG wird jedes Bild in Makroblöcke unterteilt, und jeder MB wird mit 16 × 16 Bereichen an der gleichen allgemeinen räumlichen Stelle in einem oder mehreren vorhergesagten Bildern verglichen. Der Bereich in dem bzw. den vorhergesagten Bildern, der in bestimmter Hinsicht mit dem MB am besten übereinstimmt, wird als Vorhersage verwendet. Die Differenz zwischen dem räumlichen Ort des MB und dem seiner Vorhersage wird als Bewegungsvektor bezeichnet. Somit sind die Ausgaben der Bewegungsabschätzung und -kompensation für einen MB Bewegungsvektoren und ein bewegungskompensierter Differenz-Makroblock. Diese erfordern in komprimierter Form im Allgemeinen weniger Bits als der ursprüngliche MB selbst. Bilder, die in der Vergangenheit unter Verwendung eines einzelnen Vorhersagebilds prädiktiv bewegungskompensiert wurden, sind als P-Bilder bekannt. Diese Art der Vorhersage wird bei MPEG außerdem als zeitlich vorausschauende Vorhersage bezeichnet.
  • Wie oben erläutert wurde, kann das Zeitintervall zwischen einem P-Bild und seinem Vorsagebild größer als ein Bildintervall sein. Für Bilder, die zwischen P-Bilder oder zwischen ein I-Bild und ein P-Bild fallen, kann zusätzlich zur zeitlich vorausschauende Vorhersage eine zeitlich zurückblickende Vorhersage verwendet werden (siehe 5). Solche Bilder sind als bidirektional bewegungskompensierte Bilder oder B-Bilder bekannt. Bei B-Bildern ist zusätzlich zur Vorwärts- und Rückwärts-Vorhersage eine Interpolations-Bewegungsvorhersage zulässig, bei der die Vorhersage ein Mittelwert aus einem Block von dem vorherigen Vorhersagebild und einem Block von dem zukünftigen Vorhersagebild ist. In diesem Fall werden zwei Bewegungsvektoren benötigt.
  • Die Verwendung der bidirektionalen Bewegungskompensation führt zu einer Bewegungskompensationsstruktur in zwei Ebenen, wie in 5 dargestellt ist. Jeder Pfeil gibt die Vorhersage des Bilds, das die Pfeilspitze berührt, unter Verwendung des Bilds, das den Rasterpunkt berührt, an. Jedes P-Bild ist bewegungskompensiert, wobei das vorherige Fixpunktbild verwendet wird (von Fall zu Fall ein I-Bild oder P-Bild). Jedes B-Bild ist durch die Fixpunktbilder, die sich unmittelbar vor und nach ihm befinden, bewegungskompensiert. Bei MPEG ist weder für den Abstand zwischen Fixpunktbildern noch für den Abstand zwischen I-Bildern eine Begrenzung festgelegt. Diese Parameter müssen tatsächlich nicht über eine vollständige Bildfolge konstant sein. Bezeichnet man den Abstand zwischen I-Bildern mit N und den Abstand zwischen P-Bildern mit M, besitzt die in 5 gezeigte Bildfolge den Wert (N, M) = (9, 3). Bei der Codierung der drei Bildtypen werden unterschiedliche Mengen komprimierter Daten benötigt, um ein ähnliches Qualitätsniveau des rekonstruierten Bilds zu erreichen. Die exakten Verhältnisse hängen von vielen Dingen ab, darunter die Menge der räumlichen Einzelheiten in der Bildfolge und der Umfang und Kompensationsfähigkeit der Bewegung in der Bildfolge.
  • Es sollte deswegen klar sein, dass eine MPEG-I-Bildfolge eine Reihe von I-Bildern enthält, die keine, ein oder mehrere P-Bilder enthält, die sandwichartig zwischen ihnen eingeschoben sind. Die verschiedenen I- und P-Bilder können kein B-Bild oder ein oder mehrere B-Bilder aufweisen, die sandwichartig zwischen ihnen eingeschoben sind, wobei sie im letzteren Fall als Fixpunktbilder dienen.
  • Makroblock-Codierung in P-Bildern und B-Bildern
  • Es wird anerkannt, dass es drei Arten der Bewegungskompensation gibt, die in MBs auf B-Bilder angewendet werden können: die Vorwärtskompensation, die Rückwärtskompensation und die Interpolationskompensation. Der Codierer muss eine dieser Betriebsarten auswählen. Bei einigen MBs erzielt keine der Bewegungskompensation-Betriebsarten eine genaue Vorhersage. In diesen Fällen kann der MB in der gleichen Weise wie ein Makroblock in einem I-Bild verarbeitet werden, d.h. als ein Intramode-MB. Dies ist eine weitere mögliche MB-Betriebsart. Es gibt somit eine Vielzahl von MB-Betriebsarten für P- und B-Bilder.
  • Neben der Notwendigkeit, Zusatzinformationen zu codieren, die die MB-Betriebsart, die zum Codieren aller MBs verwendet wurde, und dieser Betriebsart zugeordnete Bewegungsvektoren betreffen, ist die Codierung von bewegungskompensierten Makroblöcken der Codierung von Intramode-MBs sehr ähnlich. Obwohl kleine Unterschiede bei der Quantisierung vorhanden sind, gilt das Modell der Division durch wmn × QP weiterhin. Ferner kann die adaptive Quantisierung (AQ) verwendet werden.
  • Ratensteuerung
  • Es ist beabsichtigt, dass der MPEG-Algorithmus hauptsächlich bei Speichermedien mit fester Bitrate verwendet werden sollte. Die Anzahl von Bits in jedem Bild wird jedoch infolge der unterschiedlichen Typen der Bildverarbeitung sowie der inhärenten zeitlichen Änderung der räumlich-zeitlichen Komplexität der zu codierenden Szene nicht immer konstant sein. Der MPEG-Algorithmus verwendet eine puffergestützte Strategie der Ratensteuerung, um sinnvolle Beschränkungen an den zulässigen Schwankung bei der Bitrate einzurichten. Eine Videopuffer-Prüfeinrichtung (VBV) ist in Form eines virtuellen Puffers vorgesehen, dessen einzige Aufgabe darin besteht, Begrenzungen der Anzahl von Bits, die zum Codieren jedes Bilds verwendet werden, so einzurichten, dass die Gesamtbitrate gleich der Soll-Zuweisung ist und die kurzfristige Abweichung von Sollwert begrenzt ist. Dieses Ratensteuerungsschema kann folgendermaßen erläutert werden. Es wird ein System betrachtet, das einen Puffer enthält, dem ein hypothetischer Decodierer folgt. Der Puffer wird mit konstanter Bitrate mit komprimierten Daten in einem Bitstrom vom Speichermedium gefüllt. Sowohl die Puffergröße als auch die Bitrate sind Parameter, die in dem komprimierten Bitstrom übertragen werden. Nach einen anfänglichen Verzögerung, die ebenfalls aus den Informationen in dem Bitstrom abgeleitet wird, entfernt der hypothetische Decodierer unverzüglich alle Daten, die dem ersten Bild zugehörig sind, aus dem Puffer. Daraufhin entfernt der Decodierer in Intervallen, die gleich der Bildrate der Bildfolge sind, alle Daten, die dem ältesten in dem Puffer befindlichen Bild zugehörig sind. Damit der Bitstrom die Forderungen der MPEG-Ratensteuerung erfüllt, ist es erforderlich, dass alle Daten für jedes Bild in dem Moment, wenn sie von dem Decodierer benötigt werden, in dem Puffer zur Verfügung stehen. Diese Forderung wird durch obere und untere Begrenzungen (UVBV und LVBV) der Anzahl von Bits, die in jedem Bild zulässig sind, wiedergegeben. Die obere und die untere Begrenzung für ein vorgegebenes Bild hängen von der Anzahl von Bits ab, die in allen diesem Bild vorhergehenden Bildern verwendet werden. Es ist die Aufgabe des Codierers, Bitströme zu erzeugen, die diese Forderung erfüllen. Es ist nicht zu erwarten, dass reale Decodierer in der oben beschriebenen Weise konfiguriert sind oder derart betrieben werden können.
  • Der hypothetische Decodierer und sein zugehöriger Puffer sind einfach Mittel, um für die Größe von komprimierten Bildern berechenbare Begrenzungen einzurichten.
  • Als eine wichtige Funktion soll ein MPEG-Codierer sicherstellen, dass der Videobitstrom, den er erzeugt, diese Begrenzungen einhält. Es gibt keine weiteren Einschränkungen an der Anzahl von Bits, die zum Codieren der Bilder in einer Bildfolge verwendet werden. Diese Freiheit sollte verwendet werden, um die Bits so zuzuordnen, dass die visuelle Qualität der sich ergebenden rekonstruierten Bilder ausgeglichen (und optimiert) wird. Eine Lösung für dieses Bitzuordnungsproblem ist eine weitere Aufgabe dieser Erfindung.
  • Das Problem
  • Es sollte deswegen aus der vorhergehenden Beschreibung des MPEG-Algorithmus klar sein, dass der Zweck der MPEG-Norm darin besteht, die Syntax des komprimierten Bitstroms und die Verfahren, die für dessen Decodierung verwendet werden, zu spezifizieren. Dem Codierer-Algorithmus und den Hardware-Entwicklern wird eine beträchtliche Freiheit eingeräumt, um ihre Systeme auf die speziellen Bedürfnisse ihrer Anwendung anzupassen. Der Grad der Komplexität in dem Codierer kann durch die visuelle Qualität bei einer bestimmten Bitrate ausgeglichen werden, um speziellen Anwendungen zu genügen. Eine große Vielfalt von komprimierten Bitraten und Bildgrößen sind außerdem möglich. Das umfasst Anwendungen, die von Bildtelefonen mit geringer Bitrate bis zu Vollbildschirm-Multimedia-Präsentationen mit einer Qualität, die mit Aufzeichnungen auf VHS-Videokassette vergleichbar ist, reichen. Demzufolge besteht das Problem, auf das die vorliegende Erfindung gerichtet ist, darin, eine Kompression von digitalen Videobildfolgen nach der MPEG-Norm zu erreichen, Techniken des oben erläuterten Typs, die adaptive Quantisierung und Bitratensteuerung verwenden, so anzuwenden, dass die visuelle Qualität der komprimierten Bildfolge optimiert wird, während sichergestellt ist, dass der Bitstrom die MPEG-Forderungen der festen Bitrate erfüllt.
  • Stand der Technik
  • Aus der veröffentlichten Literatur sind mehrere Modelle bekannt, die sich bestimmten Aspekten des Problems der adaptiven Quantisierung und der Bitratensteuerung widmen. W. H. CHEN und W. K. PRATT erläutern z.B. in ihrem Artikel "Scene Adaptive Coder", IEEE Trans. Communications, Bd. 32, S. 225 bis 232, März 1984, die Idee eines ratengesteuerten Quantisierungsfaktors für Transformationskoeffizienten. Die dabei verwendete Strategie der Ratensteuerung wird gewöhnlich bei Bild- und Videokompressionsalgorithmen angewendet, um die variable Bitrate, die beim Codieren erzeugt wird, an einen Kanal mit konstanter Bitrate anzupassen. Weitere Einzelheiten zu derartigen Techniken sind in dem oben angeführten Buchkapitel TESCHER 1979 angegeben.
  • Obwohl sich der Artikel von CHEN und PRATT von 1984 mit der Bildcodierung beschäftigt, könnten die darin dargestellten Ideen ebenso auf die Videocodierung angewendet werden. Es gibt jedoch keinen Mechanismus zum Anpassen des Quantisierungsfaktors auf das Wesen der Bilder selbst.
  • C-T. CHEN und D. J. LeGALL beschreiben in ihrem Artikel "A K-th Order Adaptive Transform Coding Algorithm for Image Data Compression", SPIE Bd. 1153, Applications of Digital Image Processing XII, Bd. 1153, S. 7 bis 18, 1989, ein adaptives Verfahren zum Auswählen des Quantisierungsfaktors anhand der Größe des DCT-Koeffizienten, der größenmäßig an k-ter Stelle steht, in jedem Block.
  • H. LOHSCHELLER schlägt in "A Subjectively Adapted Image Communication System", IEEE Trans. Communications, Bd. COM-32, S. 1316 bis 1322, Dezember 1984, eine Technik zum Klassifizieren von Blöcken vor. Diese Technik bezieht sich auf eine adaptive Zonenabtastung und eine adaptive Vektorquantisierung.
  • K. N. NGAN, K. S. LEONG und H. SINGH schlagen in "A HVS-weighted Cosine Transform Coding Scheme with Adaptive Quantization", SPIE Bd. 1001, Visual Communications and Image Processing, Bd. 1001, S. 702 bis 708, 1988, ein Bildcodierungsverfahren mit adaptiver Quantisierungstransformation vor, bei dem ein Puffer zur Ratensteuerung und der Unterschied des DC-Terms jedes Blocks in Bezug auf seinen nächsten Nachbarblock in der Rasterabtastreihenfolge in Kombination verwendet werden, um den Quantisierungsfaktor anzupassen.
  • H. Hoelzlwimmer erläutert in "Rate Control in Variable Transmission Rate Image Coders", SPIE Bd. 1153 Applications of Digital Image Processing XH, Bd. 1153, S. 77 bis 89, 1989, eine kombinierte Bitraten- und Qualitäts-Steuereinheit. Es werden zwei Parameter verwendet, um den Rekonstruktionsfehler und die Bitrate, die Schrittgröße der Quantisierungseinrichtung und die räumliche Auflösung zu steuern. Eine Messung des räumlich gewichteten mittleren quadratischen Fehlers wird verwendet, um die Parameter zu steuern.
  • Die gleichzeitig anhängige Anmeldung US Nr. 705 234, die am 24. Mai 1991 durch die vorliegenden Erfinder eingereicht wurde, widmet sich dem Problem der adaptiven Quantisierung. Die darin offenbarten Techniken können als eines der Teilsysteme in der vorliegenden Erfindung, d.h. als der Bildcodierer mit durch adaptive Quantisierung gesteuerter Rate (AQ/RC), verwendet werden.
  • Die europäische Patentschrift EP 0 449 555 offenbart eine Bildcodiervorrichtung, die eine Bereichserfassungsschaltung, um einen speziellen Bereich aus eingegebenen Bildsignalen zu erfassen und das den Bereich spezifizierende Signal auszugeben, um den speziellen Bereich von anderen Bereichen zu unterscheiden, ein Tiefpassfilter zum selektiven Filtern und Ausgeben von Bildsignalen der Bereiche, die sich von dem speziellen Bereich in den eingegebenen Bildsignalen unterscheiden, und eine Codierungsschaltung zum Codieren des von dem Tiefpassfilter ausgegebenen Bildsignals umfasst.
  • Die europäische Patentschrift EP 0 444 912 A2 offenbart eine Datenkompressionsvorrichtung, bei der eingegebene Daten einem vorgegebenen Filterungsprozess unterzogen werden. Eine vorgegebene Berechnung wird an Daten, die sich aus dem Filterungsprozess ergeben, ausgeführt. Die vorgegebene Berechnung enthält wenigstens eine Addition. Das Ergebnis der vorgegebenen Berechnung wird in eine entsprechende vorhergesagte Codemenge umgesetzt. Eine Soll-Codemenge wird gesetzt. Eine Differenz zwischen der vorhergesagten Codemenge und der Soll-Codemenge wird abgeleitet, und eine Quantisierungsschrittgröße wird entsprechend der Differenz erzeugt. Die eingegebenen Daten, die sich aus der orthogonalen Transformation ergeben, werden mit der erzeugten Quantisierungsschrittgröße quantisiert.
  • Die europäische Patentanmeldung EP 0 424 060 offenbart ein Verfahren und eine Vorrichtung zum Codieren von Videodaten, um die Menge der Daten, die übertragen werden müssen, zu verringern, und die das Ausführen einer diskreten Kosinustransformation eines Rahmens von Daten, das erneute Quantisieren der transformierten Daten mit einem variablen Quantisierungsschritt und das Aufzeichnen der neu quantisierten Daten mit variabler Codierungslänge enthalten. Die Größe des Quantisierungsschrittes wird gemäß den Charakteristiken der Daten gesteuert.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein System und Techniken für eine adaptive Quantisierung von Transformationskoeffizienten in verschiedenen Bereichen eines Bilds in einer Videobildfolge bereitzustellen, um diesem Bild eine feste Anzahl von Bits optimal zuzuordnen, sowie Techniken zur Rückführung des Bitratenfehlers bereitzustellen, um sicherzustellen, dass die tatsächliche Anzahl von verwendeten Bits nahe bei der Anzahl von Bits liegt, die dem Bild zugeordnet sind. Dieses System kann im Prinzip in einem Codierer mit variabler Bitrate sowie kompatibel in einem Codierer mit fester Bitrate verwendet werden.
  • Zusammenfassung der Erfindung
  • Die vorliegende Erfindung enthält ein System und ein Verfahren für die Kompressionscodierung einer Folge von sich bewegenden Videobildern, wobei die Bilder dieser Folge jeweils durch digitale Datensignale dargestellt werden, die die räumlichen Bereiche, aus denen die Bilder aufgebaut sind, angeben, wobei das System umfasst:
    ein Mittel zum Kennzeichnen jedes Bilds, das kompressionscodiert werden soll, als einen von drei Typen I, P oder B;
    ein Mittel zum Empfangen eines Bitzuordnungssignals für jedes Bild, das die Anzahl der Bits angibt, die zugewiesen werden, um an dem Bild eine Kompressionscodierung auszuführen; und
    Mittel für die Kompressionscodierung jedes Bilds in der Folge, wobei die Mittel für die Kompressionscodierung umfassen:
    ein Mittel zum Klassifizieren jedes räumlichen Bereichs eines zu codierenden Bilds auf der Grundlage der Pixeldaten oder Pixeldifferenzdaten des räumlichen Bereichs;
    ein Mittel zum Festlegen einer Quantisierungsschrittgröße, die verwendet werden soll, um jeden räumlichen Bereich des Bilds auf der Grundlage der Klassifizierung des räumlichen Bereichs und der Klassifizierung anderer räumlicher Bereiche in dem Bild sowie des Bitzuordnungssignals für das Bild zu codieren;
    ein Mittel zum Unterteilen des Bilds in Gruppen räumlicher Bereiche und Zuordnen von Bits aus der Anzahl von Bits, die in diesen Gruppen zugewiesen wurden, um an dem Bild eine Kompressionscodierung auszuführen;
    ein Mittel, um an den Gruppen räumlicher Bereiche unter Verwendung der festgelegten Quantisierungsschrittgrößen nacheinander eine Kompressionscodierung auszuführen; und
    ein Mittel, um nach der Kompressionscodierung jeder Gruppe räumlicher Bereiche die Quantisierungsschrittgrößen einzustellen, die bei den restlichen uncodierten räumlichen Bereichen in dem Bild angewendet werden sollen, wenn die Anzahl von Bits, die für das Codieren der bereits codierten Gruppen verwendet wird, von der an die bereits codierten Gruppen zugewiesenen Bitzuordnung abweicht.
  • Kurzbeschreibung der Zeichnungen
  • Die 14 veranschaulichen Schichten von komprimierten Daten in der Videokompressionsschicht des MPEG-Datenstroms, d.h., 1 zeigt eine beispielhafte Menge von Gruppen aus Bildern (GOPs), 2 zeigt eine beispielhafte Makroblock-(MB)Unterteilung eines Bilds. 3 zeigt eine beispielhafte Scheiben-Unterteilung eines Rahmens oder Bilds, und 4 zeigt eine Blockunterteilung eines Makroblocks.
  • 5 veranschaulicht eine Zwei-Ebenen-Bewegungskompensation bei Bildern in einer GOP, die bei MPEG verwendet wird.
  • 6 ist ein Blockschaltplan eines MPEG-Codierers, der ein aus drei Komponenten bestehendes Teilsystem zum Ausführen von Techniken gemäß der vorliegenden Erfindung enthält.
  • 7 zeigt die Codierungs-Schwierigkeitsfaktoren für die gesamte Folge von Bildern in einer Videobildfolge, die zwei bei dem Versuch nach MPEG-Norm verwendete Prüfbildfolgen enthält, die die ersten 60 Vollbilder der Blumengarten-Bildfolge enthalten, gefolgt von den ersten 60 Vollbildern der Tischtennis-Bildfolge, gefolgt von 30 Wiederholungen des 61. Vollbildes der Tischtennis-Bildfolge (um eine Standbildszene zu simulieren), und die in der gesamten Beschreibung verwendet werden, um die Verfahren der Erfindung zu veranschaulichen.
  • 8 zeigt die Bitzuordnung, die für jedes Bild der Bildfolge von 7 berechnet wurde.
  • 9 zeigt die Soll- und die Ist-Bitrate für jedes Bild der Bildfolge von 7.
  • 10 ist eine Darstellung der Quantisierungsfaktoren (QP-Faktoren), die verwendet werden, um die Bildfolge von 7 zu codieren.
  • 11 ist ein Blockschaltplan, der das AQ/RC-Bildcodierer-Teilsystem von 6 genauer zeigt.
  • 12 zeigt typische Klassenverteilungen für I- und P-Bilder, die sich sowohl aus der Blumengarten- als auch aus der Tischtennis-Bildfolge der MPEG-Prüfbildfolgen ergeben.
  • Die 13 und 14 zeigen die Leistungsfähigkeit der QP-Zuweisungs- und der Aktualisierungsstrategien bei der Bitratensteuerung gemäß der Erfindung, wobei 13 den Wert QPlow und den mittleren Wert von QP in jeder Zeile der Vollbilder 16, 21, 61 und 67 einer Prüfbildfolge zeigt und 14 die erzeugten Bits gegenüber den Sollwerten zeilenweise zeigt.
  • Genaue Beschreibung der bevorzugten Ausführungsformen
  • Als einleitende Anmerkung besteht, wie oben angemerkt wurde, ein wichtiges Merkmal der ISO/IEC MPEG-Norm darin, dass lediglich die Syntax des komprimierten Bitstroms und das Verfahren der Codierung genau spezifiziert sind. Es ist deshalb möglich, verschiedene Codierer zu haben, die jeweils Bitströme erzeugen, die mit der Syntax der Norm kompatibel sind, die jedoch eine unterschiedliche Komplexität besitzen und unterschiedliche Grade der visuellen Qualität bei einer vorgegebenen Bitrate zur Folge haben. Die MPEG-Norm wird hauptsächlich, jedoch nicht ausschließlich, bei Situationen angewandt, bei denen die mittlere Bitrate des komprimierten Bitstroms feststehend ist. Die MPEG-Spezifikation enthält eine genaue Definition des Terms "feststehende Bitrate". Obwohl die mittlere Rate konstant sein muss, ist es jedoch nicht erforderlich, dass die Anzahl von Bits, die in einer MPEG-Videobildfolge jedem Bild zugewiesen ist, für alle Bilder gleich ist. Ferner muss die Zuordnung von Bits in einem Bild nicht gleichmäßig sein. Ein Teil der Herausforderung beim Entwerfen eines Codierers, der hochwertige Bildfolgen bei geringen Bitraten erzeugt, besteht in der Entwicklung einer Technik, um alle zur Verfügung stehenden Bits auf die Bilder und innerhalb eines Bilds zuzuweisen.
  • Außerdem ist ein weiteres wichtiges Codierungsmerkmal der MPEG-Norm zu berücksichtigen, nämlich die adaptive Quantisierung (AQ). Diese Technik ermöglicht, dass verschiedene Bereiche jedes Bilds mit einem veränderlichen Grad der Wiedergabetreue codiert werden können und kann bei der Bildkompression und der Kompression von sich bewegenden Bildern verwendet werden, um zu versuchen, die visuelle Qualität in jedem Bild sowie von Bild zu Bild auszugleichen (und zu optimieren). Obwohl die MPEG-Norm die adaptive Quantisierung zulässt, werden in der Norm keine Algorithmen beschrieben, die Regeln für die Verwendung der AQ zur Verbesserung der visuellen Qualität enthalten.
  • Ein weitere umfangreiche Klasse von Techniken, die in einem MPEG-Codierer oder einem ähnlichen Codierer angewendet werden können, wird im Allgemeinen als Vorverarbeitung bezeichnet. Jede Art der Vorverarbeitung einer digitale Videobildfolge, die die grundlegende räumliche Beziehung der Abtastwerte untereinander nicht ändert, kann in einem MPEG-kompatiblen Codierer für den Zweck der Verbesserung der visuellen Qualität der komprimierten Bildfolge enthalten sein. Zu Beispielen dafür zählen die lineare oder nichtlineare Vorfilterung.
  • Bei der Erfindung ist in 6 ein Blockschaltplan eines MPEG-Codierers, der ein aus drei Komponenten bestehendes Teilsystem zum Ausführen der oben erwähnten Techniken gemäß der vorliegenden Erfindung enthält, gezeigt. Wie in der Figur zu sehen ist, werden anfangs Bilddaten Pk, die das k-te Bild in einer Bildfolge darstellen, in ein Teilsystem, den QP-adaptiven Vorprozessor 3, eingegeben, in dem bei Bedarf die Vorverarbeitung stattfindet. Die Art der Vorverarbeitung wird durch Quantisierungspegel (QPprev) von zuvor codierten Bildern gesteuert, die zuvor vom Bildcodierer 1 mit durch adaptive Quantisierung gesteuerter Rate (AQ/RC) an das Teilsystem 3 in Verlauf der Codierung der Datenfolge übertragen worden sind. Die möglicherweise vorverarbeiteten Bilddaten Fk, die vom Teilsystem 3 ausgegeben werden, werden in das nächste Teilsystem, den AQ/RC-Bildcodierer 1, eingegeben, in dem die Bewegungsabschätzung und die MB-Klassifizierung stattfinden.
  • Einige Ergebnisse dieser Operationen in dem AQ/RC-Bildcodierer 1 (Dk) werden zu dem verbleibenden Teilsystem, dem Bild-Bitzuordnungs-Teilsystem 2, weitergeleitet, und eine Sollanzahl von Bits für die Bilddaten Fk wird an den AQ/RC-Bildcodierer 1 zurückgegeben (Ak, Sk und Ck). Die Codierung wird dann fortgesetzt, wie später genauer beschrieben wird. Schließlich werden komprimierte Daten CDk für die Bilddaten Fk vom AQ/RC-Bildcodierer 1 ausgegeben. Außerdem werden Daten, die die Anzahl der benötigten Bits betreffen, die zum Codieren von Fk (Bk) benötigt werden, und der Rekonstruktionsfehler (Ek) an das Bildbitzuordnungs-Teilsystem 2 weitergeleitet, und der vorherige Quantisierungspegel QPprev, der ein mittlerer Wert QPavg sein kann, wird zu dem QP-adaptiven Vorprozessor-Teilsystem 3 zur Verwendung bei der Verarbeitung zukünftiger Rahmen geleitet.
  • Für die Zwecke der Funktionsbeschreibung der drei Teilsysteme wird die Funktionsweise des Teilsystems 2 zur bildweisen Bitzuordnung zuerst erläutert, gefolgt von einer Erläuterung der Funktionsweise des AQ/RC-Bildcodierer-Teilsystems 1, und dann wird das Teilsystem 3 des QP-adaptiven Vorprozessors 3 beschrieben. Für ein vollständiges Verständnis der Beziehung der Erfindung zu dem MPEG-Videokompressionsalgorithmus kann es nützlich sein, die oben angeführten Dokumente MPEG CD-11172 und auf ISO/IEC JTCI/SC2/WG11 MPEG 91/74, MPEG Video Report Draft, 1991 oder D. LcGALL, "MPEG: A Video Compression Standard for Multimedia Applications", Communications of the ACM, Bd. 34, April 1991, heranzuziehen.
  • Bildweise Bitzuordnung
  • Videobild-Kompressionsalgorithmen verwenden die Bewegungskompensation, um die Menge der Daten zu verringern, die für die Darstellung jedes Bilds in einer Videobildfolge benötigt werden. Obwohl Kompressionsalgorithmen mit feststehender Bitrate eine mittlere Gesamtbitrate nahe an einem spezifizierten Sollwert aufrechterhalten müssen, besitzen sie häufig eine gewisse Freiheit bei der Anzahl von Bits, die einem einzelnen Bild zugeordnet werden. Das Zuweisen einer genau gleichen Anzahl von Bits an jedes Bild erzeugt eine komprimierte Bildfolge, deren Qualität zeitlich schwankt, ein Phänomen, das den Betrachter visuell ablenkt. Das Bildbitzuordnungs-Teilsystem 2 enthält Prozeduren zum Zuordnen von Bits zu komprimierten Bildern in einer Videobildfolge. Es ist insbesondere anwendbar bei Video-Kompressionsalgorithmen, die für die Erzeugung eines komprimierten Datenstrom mit feststehender Bitrate gedacht sind und bei denen Bewegungskompensation verwendet wird, z.B. die ISO/IEC MPEG-Videokompressionsnorm.
  • Im Idealfall würde ein Bildbitzuordnungssystem jedem Bild eine Anzahl von Bits so zuweisen, dass die wahrgenommene visuelle Qualität der codierten Bildfolge von Bild zu Bild gleichmäßig und gleich dem Optimum ist, das bei einer vorgegebenen Bitrate erreicht werden kann, die durch Bitzuordnungseinschränkungen, die durch Regeln der feststehenden Bitrate aufgestellt werden, beeinflusst ist. Ein derartiges System würde im Allgemeinen die Kenntnis des Inhalts der gesamten Bildfolge vor der Codierung des ersten Vollbildes erfordern. Es würde außerdem von vornherein eine Kenntnis der visuellen Qualität erfordern, die rekonstruierte Bilder besitzen würden, wenn sie unter Verwendung einer vorgegebenen Bitzuordnung codiert werden. Die erste Forderung ist wegen der potenziell großen Speichereinrichtung und der damit einhergehenden Verzögerung unmöglich. Die zweite Forderung ist gegenwärtig sehr schwierig, da kein mathematisch lenkbares Modell der wahrgenommenen visuellen Qualität der codierten Bilddaten bekannt ist, selbst wenn das codierte und das ursprüngliche Bild zur Verfügung stehen.
  • Das Bildbitzuordnungs-Teilsystem der vorliegenden Erfindung stellt eine praktische Lösung dieses Problems bereit, indem es eine Angabe der Schwierigkeit bei der Codierung von Bildern jedes Typs in der unmittelbaren Vergangenheit beobachtet. Diese Angabe, die als die Codierungsschwierigkeit bezeichnet wird, hängt von der räumlichen Komplexität eines Bilds und dem Grad ab, wie die Bewegungskompensation in der Lage ist, den Inhalt eines Bilds vorherzusagen. Bits werden den drei Bildtypen in Mengen zugeordnet, die von den relativen Codierungsschwierigkeiten der drei Typen abhängen. Außerdem sind die drei Zuordnungen, die bei jedem Bild berechnet werden (jeweils eine für jeden Bildtyp) derart, dass dann, wenn eine vollständige Gruppe von Bildern (GOP) unter Verwendung dieser Zuordnungen codiert wird, die Anzahl der benötigten Bits gleich der Soll-Bitrate sein würde.
  • In 6 ermittelt das Bildbitzuordnungs-Teilsystem 2, wie viele Bits dem Bild k zuzuordnen sind, nachdem die Daten Fk für das Bild in dem AQ/RC-Bildcodierer 1 analysiert wurden und der Codierungsschwierigkeitsfaktor des Bilds von dem AQ/RC-Bildcodierer 1 an das Bildbitzuordnungs-Teilsystem 2 geleitet wurde, jedoch vor der Codierung des Bilds. Das Bildbitzuordnungs-Teilsystem 2 verwendet außerdem Informationen, die vorher codierte Bilder betreffen, wobei angenommen wird, dass der AQ/RC-Bildcodierer 1 diese Informationen bereits an das Bildbitzuordnungs-Teilsystem 2 weitergeleitet hat. Diese Informationen enthalten im Einzelnen Bk, die Anzahl von Bits, die zum Codieren des letzten Bilds jedes Typs verwendet wurden (unterteilt in Transformationskoeffizienten-Bits und Zusatzbits) und Er, der Rekonstruktionsfehler der beiden letzten Fixpunktbilder. Wenn die Anzahl von Bits abgeschätzt wird, die einem bestimmten Bild zuzuordnen sind, ist es zuerst erforderlich, eine feste Anzahl von aufeinander folgenden Bildern in der unmittelbaren Zukunft auszuwählen und zu betrachten, d.h. eine Menge von Bildern in der Bildfolge, die noch codiert werden soll, und eine feststehende Anzahl von I-Bildern (nI), P-Bildern (nP) und B-Bildern (nB) umfasst. Es ist vorteilhaft, jedoch nicht notwendig, dass die Anzahl und die Zusammensetzung der Bilder in der Menge, die für die Betrachtung dieses Schritts ausgewählt ist, gleich jenen sind, die für die Bildbitzuordnungsprozedur verwendet werden, die in der Bildfolge bildweise ausgeführt wird. Es ist jedoch erforderlich, dass der zeitliche Mittelwert der sich ergebenden Bildbitzuordnungen gleich der mittleren Soll-Bildbitzuordnung ist.
  • Die Zuordnungsoperation, die beschrieben werden soll, beginnt durch die Betrachtung einer Zuordnung für die ausgewählte Menge von Bildern, obwohl es als Endergebnis drei Bildbitzuordnungen sein werden, jeweils eine für jeden Bildtyp, wobei lediglich die Bildbitzuordnung für den Bildtyp, der dem Typ des zu codierenden Bilds entspricht, verwendet wird. Somit beginnt der Prozess mit der Berechnung einer Gesamtbitzuordnung Bset für die Menge von Bildern, die gleich der mittleren Bitzuordnung ist, die mit der Soll-Bitrate übereinstimmt: Bset = (n1 + np + nB) × Bavg wobei Bavg die mittlere Bildbitzuordnung ist, die mit der Soll-Bitrate übereinstimmt. In der bevorzugten Ausführungsform, die in diesem gesamten Abschnitt der Beschreibung als ein Beispiel verwendet wird, gehören die Bits, die der Menge von Bildern zugeordnet sind, und jene Bits, die jedem Bild zugeordnet sind, zwei Klassen an: Zusatzbits (S) und Koeffizientenbits (C). Dabei soll S alle codierten Daten außer den Daten der codierten Transformationskoeffizienten enthalten. Durch Subtraktion von der Gesamtbitzuordnung Bset werden ein Schätzwert Sset der Anzahl von Bits, die zum Codieren von Zusatzinformationen in der Menge von Bildern (Bset) erforderlich sind, und eine Transformationskoeffizienten-Bitzuordnung Cset für die Menge von Bildern erhalten. Die Anzahl von Bits, die zum Codieren der Transformationskoeffizienten des zu codierenden Bilds zugeordnet werden, ist dann ein Bruchteil von Cset, wobei die Größe des Bruchteils von dem Schätzwert der Codierungsschwierigkeit, die mit diesem Bild verbunden ist, abhängt. Eine beispielhafte Technik zum Berechnen der Zuordnung unter Verwendung der Informationen der Codierungsschwierigkeit wird nun im Einzelnen beschrieben.
  • Zuordnung von Transformationskoeffizienten und Zusatzinformationen
  • Zusatzbits werden so zugewiesen, dass sie Bild-Kopfabschnitt-Informationen und alle Zusatzinformationen enthalten: z.B. Informationen der Betriebsart der Bewegungskompensation, Bewegungsvektoren und Daten der adaptiven Quantisierung.
  • Koeffizienteninformationen sind lediglich in den Bits enthalten, die zum Codieren der Transformationskoeffizienten der eigentlichen Pixeldaten (bei I-Bildern) oder der Pixel-Differenzdaten (bei P- und B-Bildern) verwendet werden. AI, AP und AB sollen die Bitzuordnung für I-, P- bzw. B-Bilder sein, wobei gilt : Ar = SI + CI, AP = SP + CP und AB = SB + CB (wobei S und C Zusatz- bzw. Koeffizientenbits angeben). In der bevorzugten Ausführungsform wird die Zusatzinformationen-Bitzuordnung für das nächste zu codierende Bild so eingestellt, dass sie gleich der tatsächlichen Anzahl von Bits ist, die zum Codieren der Zusatzinformationen in dem letzten Bild des gleichen Typs in der Bildfolge erforderlich sind. Ein alternatives Verfahren der Berechnung der Zusatzbitinformationszuordnung besteht darin, einen Mittelwert der tatsächlichen Anzahlen von Bits zu verwenden, die erforderlich sind, um mehrere oder alle letzten Bilder des selben Typs in der Bildfolge zu codieren. Es ist außerdem möglich, die Zusatzinformationszuordnung in dieser Prozedur zu ignorieren und die Bildbitzuordnung lediglich auf der Grundlage der Bitzuordnung der Transformationskoeffizienten zu berechnen. Diese letztere Lösung kann im Kontext der folgenden Erläuterung ausgeführt werden, wobei angenommen wird, dass alle Zusatzzuordnungsvariablen Sx 0 sind.
  • Ein beispielhaftes Mittel zum Berechnen des Codierungsschwierigkeitsfaktors, der einem Bild zugehörig ist, wird nachfolgend beschrieben, für die Zwecke der Beschreibung sollte jedoch vorher klar sein, dass der Codierungsschwierigkeitsfaktor, nachdem er für die letzten Bilder jedes Typs berechnet wurde, in dem Bildbitzuordnungs-Teilsystem 2 gespeichert wird, wobei die folgende Prozedur verwendet wird, um die Transformationskoeffizientenzuordnung für das aktuelle Bild zu berechnen. Zuerst wird die Zusatzinformationszuordnung für die Menge von Bildern abgeschätzt durch: (Sset = nISI + nPSP + nBSB). Diese Größe wird von der Gesamtzahl von Bits Bset, die der Menge zugeordnet sind, subtrahiert, wodurch die Menge der Bilder-Transformationskoeffizientenzuordnung erhalten werden: Cset = Bset – Sset
  • Dann werden CI, CP und CB als die eindeutige Lösung der folgenden Gleichungen ermittelt:
    Figure 00300001
  • Die erste Gleichung (für Cset) in dieser Menge stellt sicher, dass der Gesamtmengendurchschnitt korrekt ist. Er' ist der Mittelwert des mittleren absoluten Fehlers der in der Vergangenheit und in der Zukunft rekonstruierten Fixpunktbilder, und die Gewichtungsterme wP und wB dienen dazu, um die P- und die B-Bildzuordnung in Bezug auf die anderen hervorzuheben. Die Werte von wP = 1,0 und wB = 0,5 werden in der bevorzugten Ausführungsform verwendet. Außer diesen Gewichtungen weisen die letzten beiden Gleichungen (für CP und CB) Bits den P- und B-Bildern proportional zu dem Grad zu, wie ihre Schwierigkeit den mittleren absoluten Fehler in dem (rekonstruierten) Vorhersagebild bzw. den Vorhersagebildern übersteigt.
  • Weitere Bitzuordnungsregeln, die auf den Codierungsschwierigkeiten der unterschiedlichen Bildtypen basieren, sind möglich. Das vorhergehende beispielhafte Verfahren ist nützlich, da es die räumliche Komplexität der Folge durch die drei Codierungsschwierigkeitsfaktoren DI, DP und DB, den Erfolg der Bewegungskompensation durch DP und DB, die Soll-Bitrate durch die Forderung der ersten Gleichung für Cset und die Qualität von zuletzt codierten Bildern durch Er und Er' berücksichtigt.
  • Gelegentlich hat die obige Bitzuordnungsstrategie eine Zuordnung zur Folge, die UVBV übersteigt oder unter LVBV fällt. Die Häufigkeit, mit der das vorkommt, hängt von der Größe des VBV-Puffers und der Art der Bildfolge ab. Ein typisches Szenario liegt vor, wenn der VBV-Puffer verhältnismäßig klein ist (z.B. sechs mittlere Bilder oder weniger) und die Bewegungskompensation sehr erfolgreich ist. In einer derartigen Situation versucht die Zuordnungsstrategie, praktisch alle Transformationsbits für eine Menge an die I-Bilder zu geben, was eine Zuordnung für ein einzelnes Bild zur Folge hat, die größer als die VBV-Puffergröße ist. In der bevorzugten Ausführungsform wird die I-Bild-Zuordnung dann, wenn das eintritt, so verändert, dass eine kleine Menge in die entsprechende VBV-Begrenzung fällt, und die Bits, die von dem I-Bild entnommen wurden, werden dem P-Bild neu zugeordnet. Dieser letztere Schritt ist wichtig, da dann, wenn keine explizite Neuzuordnung erfolgt, die mittlere Bitrate abfällt. Das hat schließlich VBV-Überlaufprobleme zur Folge, gewöhnlich dann, wenn LVBV beginnt, die B-Bild-Zuordnungen zu übersteigen. Das Endergebnis ist eine implizite Neuzuordnung an B-Bilder, die im Allgemeinen eine schlechtere Gesamtbildqualität zur Folge hat. Ein zusätzlicher Vorteil der Technik der expliziten P-Bild-Neuzuordnung ist die schnellere Konvergenz auf eine sehr hohe Bildqualität bei Standbildszenen. Wenn eine P-Bild- oder B-Bild-Zuordnung außerhalb der VBV-Begrenzungen liegt, erfolgt keine Neuzuordnung von Bits.
  • Es wird angemerkt, dass die Zuordnungsstrategie dann angewendet werden kann, wenn keine B-Bilder vorhanden sind, indem einfach nB = 0 gesetzt wird und die Gleichung, die CB festlegt, bei der Berechnung von Zuordnungen ignoriert wird. Das kann gleichfalls dann angewendet werden, wenn keine P-Bilder vorhanden sind. Außerdem kann die Unterscheidung zwischen Koeffizienten und Zusatzinformationen ignoriert werden, indem der Schätzwert der Codierungsschwierigkeit verwendet wird, um alle Bits für ein Bild zuzuordnen. Dabei könnte der Schätzwert der Codierungsschwierigkeit die Schwierigkeit zum Codieren von Zusatzinformationen direkt einschließen oder Zusatzinformationen vollkommen ignorieren.
  • Zwei Prüfbildfolgen, die Blumengarten-Bildfolge und die Tischtennis-Bildfolge, die in dem Versuch der MPEG-Norm zum Einsatz kommen, wurden verwendet, um die Wirksamkeit der Techniken der Erfindung zu prüfen. Im Einzelnen wird eine Videobildfolge, die die ersten 60 Vollbilder der Blumengarten-Bildfolge enthält, gefolgt von den ersten 60 Vollbildern der Tischtennis-Bildfolge, gefolgt von 30 Wiederholungen des 61. Vollbildes der Tischtennis-Bildfolge (um eine Standbildszene zu simulieren) enthält, in der gesamten Beschreibung verwendet, um die Verfahren zu veranschaulichen. Diese Bildfolgen sind YUV-Prüfbildfolgen mit 352 × 240 Pixeln. Die Codierung erfolgte bei 1,15 Mbit/s bei einem I-Bildabstand von N = 15 und einem Fixpunktbildabstand von M = 3. 7 zeigt die Codierungsschwierigkeitsfaktoren für die gesamte Folge und 8 stellt die Bitzuordnungen da, die für jedes Bild berechnet wurden.
  • Es sollte angemerkt werden, dass die drei Bitzuordnungen, die für jedes Bild in der Bildfolge gezeigt sind, die Bitzuordnungen unmittelbar vor der Codierung dieses Bilds sind, dass jedoch lediglich eine dieser Zuordnungen tatsächlich verwendet wird. Die Soll-Bitrate, die sich aus diesem Zuordnungsverfahren ergibt, ist in 9 zusammen mit den eigentlichen Bitraten für die Bildfolge gezeigt.
  • Die Stabilität bei der Szenenänderung (Vollbild 61) und die Konvergenz der eigentlichen Bitrate für P- und B-Bilder auf fast null wird in dem Standbildabschnitt (Vollbilder 121 bis 151) beobachtet. Die Quantisierungsfaktoren (QP), die zum Codieren der Folge verwendet werden, sind in 10 dargestellt. Es wird außerdem angemerkt, dass die I- und P-Bilder im Allgemeinen mit einer feineren Schrittgröße codiert werden als die B-Bilder.
  • AQ/RC-Bildcodierer
  • In Bezug auf den AQ/RC-Bildcodierer 1 enthält dieses Teilsystem Prozeduren für die adaptive Quantisierung (AQ) der aufeinander folgenden Bilder einer Videobildfolge, um eine bessere visuelle Qualität zu erreichen, während sichergestellt ist, dass die Anzahl von Bits, die zum Codieren jedes Bilds verwendet werden, nahe bei einem vorgegebenen Sollwert liegt. Prozeduren werden für I-Bilder, P-Bilder und B-Bilder ausgeführt. Diese Prozeduren enthalten die Behandlung der räumlichen Bereiche, aus denen ein Bild aufgebaut sind, unter Verwendung einer Bereichsklassifizierungsstrategie, die zusammenwirkt mit:
    einer Bewegungsabschätzung;
    einem adaptiven Modell der Anzahl von Bits, die zum Codieren eines Bildbereichs erforderlich sind, als eine Funktion des Quantisierungsfaktors QP und gemessener Charakteristiken des Bereichs; und
    einem Verfahren zum Anpassen des Quantisierungspegels, wenn ein Bild codiert wird, um sicherzustellen, dass die Gesamtzahl der erzeugten Bits nahe an dem vorgegebenen Sollwert liegt.
  • Obwohl die räumlichen Bereiche an dieser Stelle für die Zwecke der Beschreibung als MPEG-Makroblöcke (MB) behandelt werden, sollte klar sein, dass die beschriebenen Prozeduren bei Bereichen mit anderen Größen und Formen angewendet werden können.
  • 11 veranschaulicht im Allgemeinen die Komponenten des AQ/RC-Bildcodierers 1. Die Funktionsweise dieses Teilsystems hängt von dem Typ des zu codierenden Bilds ab. Wie in der Figur zu sehen ist, wird ein Videobildsignal Fk für ein Bild k, das möglicherweise in dem QP-adaptiven Vorprozessor 3 vorverarbeitet wurde, in eine Bewegungsabschätzungs- und MB-Klassifizierungseinheit 14 des AQ/RC-Bildcodierers 1 eingegeben. Dort wird das Signal analysiert, und jeder MB wird gemäß den nachfolgend beschriebenen Prozeduren klassifiziert. Wenn das Bild ein P-Bild oder ein B-Bild ist, wird außerdem eine Bewegungsabschätzung ausgeführt. Ergebnisse dieser Operationen in der Form eines Codierungsschwierigkeitsfaktors Dk werden zu dem Bildbitzuordnungs-Teilsystem 2 für die oben genauer beschriebene Verwendung geleitet. Das Bildbitzuordnungs-Teilsystem 2 sendet dann ein Bitzuordnungssignal Ck für das Bild k zurück. Dieses Bitzuordnungssignal wird von einer QP-Pegel-Festlegungseinheit 15 gemeinsam mit einer Menge von Informationen, die von der Bewegungsabschätzungs- und MB-Klassifizierungseinheit 14 gesendet werden, verwendet, um Anfangswerte des Quantisierungsfaktors QP zu bestimmen, die beim Codieren jedes MB zu verwenden sind. Außerdem berechnet die QP-Pegel-Festlegungseinheit 15 einen Schätzwert der Anzahl von Bits, die zum Codieren jeder Zeile von MBs in dem Bild benötigt werden. Diese Quantisierungsfaktoren und Zeilen-Sollwerte werden zurück zu der ratengesteuerten Bildcodierer-Einheit 16 geleitet, die das Codieren des Bilds vornimmt, wobei sie außerdem Informationen verwendet, die von der Bewegungsabschätzungs- und MB-Klassifizierungseinheit 14 gesendet werden. Da die Funktionsweise des AQ/RC-Bildcodierers 1 auf drei Untereinheiten aufgeteilt ist, erfolgt die folgende Beschreibung in der gleichen Aufteilung, während hauptsächlich Bezug auf 11 genommen wird.
  • Bewegungsabschätzungs- und MB-Klassifizierungseinheit
  • Eine der Hauptaufgaben der Bewegungsabschätzungs- und MB-Klassifizierungseinheit 14 besteht darin zu bestimmen, welche Codierungsbetriebsart m(r,c) zum Codieren jedes MB in einem Bild verwendet wird. Diese Funktion wird lediglich für bewegungskompensierte Bilder verwendet, da es lediglich eine Betriebsart für MBs in I-Bildern gibt: Intramode. Die Betriebsartentscheidung basiert auf einem Bewegungsabschätzungsprozess, der außerdem Bewegungsvektoren und bewegungskompensierte Differenz-MBs erzeugt. Eine weitere wichtige Funktion der Bewegungsabschätzungs- und MB-Klassifizierungseinheit 14 besteht darin, jeden MB zu klassifizieren. Die Klasse cl(r,c) eines MB(r,c) wird schließlich den Wert des Quantisierungsfaktors QP(r,c), der zum Codieren dieses MB verwendet wird, bestimmen. Die Betriebsarten und Klassen werden durch Analysieren jedes Bilds und die Abschätzung der Bewegung zwischen dem zu codierenden Bild und dem vorhergehenden Bild (bzw. Bildern) bestimmt. Die gleichen Informationen werden außerdem verwendet, um den Codierungsschwierigkeitsfaktor Dk zu berechnen, der an das Bildbitzuordnungs-Teilsystem 2 gesendet wird.
  • Die Zielsetzung der Bewegungsabschätzung in dem MPEG-Videobild-Codierungsalgorithmus besteht darin, einen Bewegungsvektor mv(r,c) und den zugehörigen bewegungskompensierten Differenz-MB zu erhalten. Der bewegungskompensierte Differenz-MB ist die pixelweise Differenz zwischen dem aktuellen MB, der betrachtet wird, und dem vorhergehenden MB. Das genaue Verfahren zum Bilden des Vorhersage-MB hängt von der verwendeten Betriebsart der Bewegungskompensation ab und ist in dem oben erwähnten Dokument ISO-IEC JTC1/SC2/WG11 MPEG CD-11172, MPEG Committee Draft, 1991, genau beschrieben. Der Bewegungsvektor sollte in gewisser Hinsicht eine Angabe der echten Bewegung des Bildabschnitts, dem er zugeordnet ist, sein. Einzelheiten von Bewegungsabschätzungstechniken sind in A. N. NETRAVALI und B. G. HASKELL, Digital Pictures: Representation and Compression, New York, NY: Plenum Press, 1988, angegeben.
  • Für die Zwecke der vorliegenden Beschreibung wird angenommen, dass ein Vollsuche-Bewegungsabschätzungsalgorithmus verwendet wurde, der einen Bereich von ±7 × n Pixeln in der horizontalen und der vertikalen Richtung abdeckt, wobei n der Abstand in Pixelintervallen zwischen dem Bild, das analysiert wird, und dem Vorhersagebild ist und die Bewegungsvektoren die Genauigkeit eines halben Pixels besitzen. Die vorliegende Erfindung enthält Techniken zum Verwenden der Ergebnisse der Bewegungsabschätzung, um Videobildfolgen zu codieren, sie ist jedoch nicht auf eine Verwendung mit speziellen Bewegungsabschätzungstechniken beschränkt und kann mit einem beliebigen Bewegungsabschätzungsverfahren verwendet werden, vorausgesetzt, dass eine Angabe des Erfolgs der Bewegungskompensation (Bewegungskompensationsfehler), die angibt, wie gut die Übereinstimmung zwischen dem MB, der kompensiert wird, und dem Vorhersagebereich, auf den der Bewegungsvektor zeigt, ist, zur Verfügung gestellt werden kann. Es wird daran erinnert, dass es für P-Bilder lediglich einen Typ der Bewegungsabschätzung (zeitlich vorwärts) gibt, wobei es für B-Bilder drei Typen (zeitlich vorwärts, zeitlich rückwärts und zeitlich interpolierend) gibt. Der Vorwärts-Bewegungsvektor für MB(r,c) kann als mvf(r,c) bezeichnet werden, und der Rückwärts-Bewegungsvektor kann als mvr(r,c) bezeichnet werden. Die Interpolationsbetriebsart verwendet sowohl den Vorwärts- als auch den Rückwärts-Vektor. Der Vorwärts-, der Rückwärts- und der Interpolations-Bewegungsvektorfehler können als Δmc,f(r,c), Δmc,r(r,c) bzw. Δmc,i(r,c) bezeichnet werden.
  • Außer dem Bewegungskompensationsfehler (bzw. Bewegungskompensationsfehlern) wird eine Angabe der räumlichen Komplexität jedes MB benötigt. Diese Angabe wird als Δ(r,c) bezeichnet. Es ist wichtig, dass Δ(r,c), Δmc,f(r,c), Δmc,r(r,c) und Δmc,i(r,c) dahingehend gleiche Angaben sind, dass ein numerischer Vergleich zwischen ihnen sinnvoll ist. In der bevorzugten Ausführungsform sind diese Angaben alle durch mittlere absolute Größen definiert, wie später angegeben ist. Wenn jeder MB durch seine Zeilen- und Spaltenkoordinaten (r,c) angegeben wird, werden die Luminanzwerte der vier 8 × 8-Blöcke im MB(r,c) durch yk(r,c) angegeben, wobei i = 0, ..., 7, j = 0, ..., 7; k = 0, ..., 3, und der mittlere Wert jedes 8 × 8-Blocks wird durch dck angegeben. Die Angabe der räumlichen Komplexität für den MB(r,c) ist dann die mittlere absolute Differenz von DC und ist gegeben durch:
  • Figure 00380001
  • Der wahrscheinliche Bewegungskompensationsfehler ist der mittlere absolute Fehler. Werden die vier 8 × 8-Blöcke im vorhergehenden Vorhersage-MB als pk(i,j) bezeichnet, wobei i = 0, ..., 7, j = 0, ..., 7; k = 0, ..., 3, wird dieser definiert durch:
  • Figure 00380002
  • In der bevorzugten Ausführungsform der Erfindung basieren die Codierungsschwierigkeitsfaktoren, die zu dem Bildbitzuordnungs-Teilsystem 2 geleitet werden, vollständig auf den oben genannten Angaben der räumlichen Komplexität und des Bewegungskompensationsfehlers. Für I-Bilder lautet der Gesamtschwierigkeitsfaktor
  • Figure 00390001
  • Für P-Bilder und B-Bilder wird zuerst die Codierungsbetriebsart festgelegt, und die Angabe, die dieser Betriebsart zugeordnet ist, wird bei einer Summenbildung, die der obigen Summenbildung ähnlich ist, verwendet. Die folgenden Betriebsarten sind möglich:
    Intramode: m(r,c) = I,
    Vorwärts-Bewegungskompensation: m(r,c) = mcf,
    Rückwärts-Bewegungskompensation: m(r,c) = mcb,
    Interpolations-Bewegungskompensation: m(r,c) = mci.
  • Die Schwierigkeitsfaktoren werden berechnet durch:
  • Figure 00390002
  • Es können viele mögliche Regeln verwendet werden, um zu entscheiden, welche Betriebsart verwendet werden soll. In der bevorzugten Ausführungsform wird die folgende Regel für I-Bilder verwendet:
  • Figure 00390003
  • Ein Wert von β = 1,0 wird verwendet. In der bevorzugten Ausführungsform lautet die Betriebsart-Auswahlregel, die für B-Bilder verwendet wird: die Betriebsart mit dem kleinsten Wert Δ(r,c) wird verwendet, um den MB zu codieren. Obwohl in der bevorzugten Ausführungsform mittlere absolute Größen als die Angabe der Schwierigkeit verwendet werden, sollte anerkannt werden, dass außerdem jede ähnliche Angabe (z.B. mittlere quadratische Größen) verwendet werden kann.
  • Es ist vorgesehen, dass die Angaben, die zum Festlegen der MB-Betriebsarten und zum Berechnen der Codierungsschwierigkeiten verwendet werden, Nebenprodukte der Bewegungsabschätzungsprozedur sein können. Das ist teilweise möglich, da die oben beschriebenen Angaben häufig verwendet werden, um den besten Bewegungsvektor in Bewegungsabschätzungsprozeduren zu finden.
  • Diese Angaben werden außerdem zum Klassifizieren von Makroblöcken verwendet. In der bevorzugten Ausführungsform werden die MBs folgendermaßen klassifiziert. Die Klasse aller Intramode-MBs wird berechnet, indem der minimale Wert von Δk(r,c) für diesen MB quantisiert wird. Wird ein Schwellenwert t definiert, ist die Klasse cl(r,c) des MB(r,c) gegeben durch
  • Figure 00400001
  • Nachdem eine Betriebsart der Bewegungskompensation für bewegungskompensierte MBs ausgewählt wurde, werden sie klassifiziert gemäß:
  • Figure 00410001
  • In der bevorzugten Ausführungsform wird ein Wert von t = 2 verwendet. Es wird angemerkt, dass sowohl Intramode-Angaben als auch bewegungskompensierte Angaben verwendet werden, um bewegungskompensierte MBs zu klassifizieren. Die Betriebsart und die Klasseninformationen werden gemeinsam mit den zu Grunde liegenden Angaben von der QP-Pegel-Festlegungseinheit 15 zur Bestimmung eines anfänglichen Quantisierungspegels sowie von dem RC-Bildcodierer 16 während des Codierens verwendet.
  • Typische Klassenverteilungen für I- und P-Bilder, die sowohl von dem Blumengarten- als auch von dem Tischtennis-Abschnitt der Bildfolge gewonnen werden, sind in 12 gezeigt.
  • Um die Berechnungskomplexität in der bevorzugten Ausführungsform gering zu halten, werden MBs von B-Bildern nicht klassifiziert, die Q-Pegel-Festlegungseinheit 15 wird nicht verwendet, und das in der RC-Bildcodierereinheit 16 verwendete Codierungsverfahren ist einfacher als das Verfahren, das für I-Bilder und P-Bilder verwendet wird.
  • QP-Pegel-Festlegungseinheit
  • Die Funktion der QP-Pegel-Festlegungseinheit 15 besteht darin, einen Anfangswert für die Quantisierungsschrittgröße für jede Klasse zu berechnen. Allen MBs in einer vorgegebenen Klasse wird die gleiche Quantisierungsschrittgröße zugewiesen. In der bevorzugten Ausführungsform wird die Quantisierungsschrittgröße für jede Klasse relativ zu einer allgemeinen minimalen Schrittgröße zugewiesen gemäß: QP(r,c) = QPlow + ΔQP × cl(r,c).
  • Die Werte von ΔQP, die in der bevorzugten Ausführungsform verwendet wurden, sind 5 und 6. Es wird angemerkt, dass der zulässige Bereich für QPlow in der bevorzugten Ausführungsform –31, ..., 31 lautet, obwohl MPEG lediglich ganzzahlige Werte von QP(r,c) im Bereich 1, ..., 31 zulässt. Deswegen wird dann, wenn die obige Formel einen Wert über 31 gesetzt, dieser auf 31 gekürzt, und alle Werte unter 1 werden auf 1 gesetzt. Es ist vorteilhaft zuzulassen, dass QPlow kleiner als 1 ist, um sicherzustellen, dass der feinste Quantisierungsschritt auf MBs aller Klassen angewendet werden kann, wenn die Bitrate dies rechtfertigt. Der Prozess zum Auswählen des Anfangswerts
    Figure 00420001
    von QPlow wird später erläutert.
  • Das zu Grunde liegende Modell der menschlichen Wahrnehmung von Codierungsfehlern, das in der bevorzugten Ausführungsform verwendet wird und sich in dem Verfahren zum Berechnen der Klasse cl(r,c) jedes MB und zum Berechnen von QP(r,c) bei vorgegebenem Wert cl(r,c) widerspiegelt, besteht darin, dass wahrscheinliche Größenfehler in weniger aktiven Bereichen eines Bilds stärker sichtbar sind. Obwohl dieses Modell eindeutig eine zu starke Vereinfachung darstellt, ist es ein annehmbarer Kompromiss zwischen der visuellen Qualität und der Berechnungslast. Der Grund, warum der minimale Wert Δ bei den vier Luminanzblöcken in dem MB für die Klassifikation an Stelle des Werts Δ für den gesamten Block verwendet wird, besteht darin, dass MBs mit irgendwelchen gleichmäßigen Bereichen einer kleineren Quantisierungsschrittgröße zugewiesen werden sollten.
  • Die MB-Betriebsarten m(r,c) und die Klassen cl(r,c) werden gemeinsam mit Δ(r,c) und Δmc(r,c) und der Soll-Bitrate für die Bild-Transformationskoeffizienten verwendet, um den anfänglichen niedrigen Quantisierungswert QPlow einzustellen. Es wurde ein Modell in Übereinstimmung mit der Erfindung entwickelt, das die Anzahl von Bits vorhersagt, die zum Codieren der Transformationskoeffizienten eines MB benötigt werden, wenn der zu verwendende Quantisierungswert und Δ (bei Intramode-MBs) oder Δmc (bei bewegungskompensierten MBs) vorgegeben sind. Experimentelle Daten führen zu einem Modell der folgenden Form
    Figure 00430001
    für Intramode-MBs und
    Figure 00430002
    für bewegungskompensierte MBs. Die Exponenten lauten bI = –0,75 und bP = –1,50. Diese Werte hängen jedoch stark von den speziellen Quantisierungsgewichtungswerten wmn ab, die verwendet werden, und sollten optimiert werden, damit sie diesen entsprechen.
  • Um geeignete Werte für die Parameter a und b zu schätzen, ist die folgende experimentelle Lösung gewählt worden. Es wird der Fall eines I-Bild-Modells betrachtet, für das aI und bI geschätzt werden sollen. Da die Parameter des Modells angepasst werden müssen, damit sie Änderungen verfolgen, die von Bild zu Bild auftreten, liegt das Hauptinteresse auf der Modellgenauigkeit in Bezug auf ein einzelnes Bild und nicht in Bezug auf ein Ensemble von Bildern. Demzufolge wird ein repräsentatives Bild mehrmals codiert, wobei für jeden Durchlauf ein anderer Wert der QP-Quantisierungsschrittgröße verwendet wird. Die Anzahl von Bits, die zum Codieren jedes MB bei jedem Wert von QP benötigt werden, wird gemessen. Anschließend wird für jeden Wert von QP die Anzahl von Bits, die zum Codieren aller MBs, die einen vorgegebenen Wert Δ aufweisen, benötigt werden, gemittelt. Das Ergebnis ist eine zweidimensionale Datenmenge, die die mittlere Anzahl von Bits, die zum Codieren von MBs benötigt werden, als eine Funktion des Δ-Werts des MB und der für seine Codierung verwendeten QP-Schrittgröße angibt. Dieser mittlere Wert kann als Bij = B(QPi, Δj) bezeichnet werden. Diese gemessenen Werte sollten in eine Gleichung der folgenden Form eingesetzt werden:
  • Figure 00440001
  • Das ist eine überbestimmte Menge von nichtlinearen Gleichungen in aI und bI und kann gelöst werden, indem nichtlineare Verfahren der kleinsten Quadrate verwendet werden. Um das Problem linear zu machen, wird auf beiden Seiten der Gleichung der Logarithmus gebildet. Das ergibt ein einfach zu lösendes lineares Problem der kleinsten Quadrate in log(aI) und log(bI).
  • Die linearen Parameter aI und aP sollten nach dem Codieren jedes I- oder P-Bilds eingestellt werden, damit sie die sich dynamisch verändernden Charakteristiken der Videobildfolge verfolgen. Das kann gemäß einem Verfahren erfolgen, das später in der Beschreibung der RC-Bildcodierereinheit 16 dargelegt wird. (Bei Intramode-MBs kann dieses Modell verbessert werden, indem ein zusätzlicher Term angefügt wird, um die Anzahl von Bits zu berücksichtigen, die zum Codieren des DC-Terms in dem MB benötigt werden, da die Codierung für DC-Koeffizienten separat abgewickelt wird.)
  • Die vorhergesagte Anzahl von Bits, die zum Codieren der Transformationskoeffizienten für das gesamte Bild gemäß diesen Bitraten-Modellen benötigt werden, lautet
    Figure 00450001
    für I-Bilder und
    Figure 00450002
    für P-Bilder, wobei QP(r,c) gemäß QP(r,c) = QPlow + ΔQP × cl(r,c)berechnet wird.
  • Als Anfangswert für QPlow wird der Wert von QP genommen, für den B(QP) der Bild-Transformationskoeffizientenzuordnung C am nächsten liegt.
  • Figure 00460001
  • In der bevorzugten Ausführungsform wird eine Halbintervall-Suche zwischen –31 und 31 ausgeführt, um
    Figure 00420001
    zu finden. Die Rolle der oberen und der unteren Begrenzung von QP ist in dieser Prozedur raffiniert. Während eine obere Begrenzung von 31 ausreichend ist, um sicherzustellen, dass der Codierer mit der gröbsten Quantisierung betrieben wird, die die Norm zulässt, wird eine größere Begrenzung die Leistungsfähigkeit des Algorithmus der Ratensteuerung verändern, wie später genauer beschrieben wird, indem er auf die Überproduktion von Bits empfindlicher gemacht wird. Ähnliche Eigenschaften gelten für die untere Begrenzung von QP.
  • Wenn QPlow ermittelt wurde, berechnet die QP-Pegel-Festlegungseinheit 15 die erwartete Anzahl von Bits, die zum Codieren der Zeile r der MBs benötigt werden, unter Verwendung von QPlow durch:
    Figure 00460002
    wobei Nrow die Anzahl der Zeilen von MBs ist. Der zweite Term in diesem Ausdruck berücksichtigt die Differenz zwischen der Anzahl von Bits, die durch das Modell bei QPlow vorhergesagt wurde, und der tatsächlichen Transformationskoeffizientenzuordnung C, und der dritte Term berücksichtigt den gemeinsamen Anteil jeder Zeile an der Zusatzinformationszuordnung S. Die Summe der Sollwerte T(r) über alle Zeilen ergibt die Gesamtbildzuordnung Λ. Diese erwarteten Werte werden Soll-Zeilenbitraten für die RC-Bildcodierereinheit 16.
  • Ratengesteuerter Bildcodierer
  • Die Bildcodierung erfolgt, indem die MBs indexiert werden und jeder MB gemäß der Betriebsart und der Quantisierungsschrittgrößen, die in den vorherigen Schritten ermittelt wurden, codiert wird. Wegen Fehlanpassungen in dem Bitratenmodell und der ständigen Änderung des Inhalts einer Bildfolge wird jedoch die tatsächliche Anzahl von erzeugten Bits nicht genau mit der erwarteten Anzahl übereinstimmen. Diese Abweichung sollte gesteuert werden, nicht nur um die tatsächlich erzeugten Bits für das Bild nahe am Sollwert zu halten, sondern auch um eine Verletzung der VBV-Bitratenbegrenzungen zu verhindern. Es ist eine Rückkopplungsstrategie der Ratensteuerung in Übereinstimmung mit der Erfindung entwickelt worden, die am Ende jeder Zeile von MBs den Wert QPlow aktualisiert. Mehrere Faktoren bestimmen die Aktualisierung. Ein Faktor besteht darin, dass wegen der Schwankungen der Werte Δ(r,c) und Δmc(r,c) sowie der zugewiesenen Quantisierungsschrittgrößen nicht erwartet wird, dass verschiedene Zeilen von MBs in einem Bild die gleiche Anzahl von Bits erzeugen. Am Ende jeder Zeile wird die Anzahl der erzeugten Bits mit der erwarteten Anzahl T(r), die in der QP-Pegel-Festlegungseinheit 15 berechnet wird, verglichen. Ein weiterer Faktor, der bei der Aktualisierung von QPlow eine Rolle spielt, ist die Nähe sowohl der Bildzuordnung als auch der tatsächlichen Anzahl der erzeugten Bits zu den VBV-Begrenzungen. Der Gewinn der QPlow-Aktualisierung als eine Funktion der Bitratenabweichungen ist eine Funktion der Nähe der VBV-Begrenzung in Richtung des Fehlers. Geringe Abweichungen von der vorhergesagten Bitrate bewirken eine kleine oder keine Änderung von QPlow, wobei Änderungen, die die Bildbitrate nahe zu der einen oder der anderen VBV-Begrenzung bringen, die maximal mögliche Einstellung von QPlow bewirken. Eine derartige Strategie ist recht erfolgreich bei der Verhinderung von VBV-Verletzungen und vermeidet somit unerwünschte Aktionen wie das Verwerfen von codierten Daten oder das Einschieben von Ausschussbits in den Bitstrom.
  • Die folgenden Gleichungen beschreiben die Aktualisierungsprozedur für QPlow, wie sie in der bevorzugten Ausführungsform ausgeführt wird. Die Gesamtzahl von Bits, die zum Codieren der Zeile m und aller vorhergehenden Zeilen verwendet werden, wird mit B(m) bezeichnet und die Differenz zwischen B(m) und dem kumulativen Sollwert wird als ΔB(m) bezeichnet:
  • Figure 00480001
  • Nach dem Codieren der Zeile m wird QPlow, falls ΔB(m) ≠ 0, folgendermaßen aktualisiert:
    Figure 00480002
    wobei Δu und Δl die Differenzen zwischen der Bildzuordnung A und der oberen bzw. unteren VBV-Begrenzung für das Bild m sind: Δu = UVBV – Λ Δl = max(0,LVBV) – Λ.
  • Diese Strategie aktualisiert QPlow auf der Grundlage des Gesamtbitzuordnungsfehlers bis zur aktuellen Zeile, da sie sich auf den maximalen Fehler bezieht, der gemäß dem VBV-Kriterium zulässig ist.
  • Nachdem alle I- und P-Bilder codiert wurden, werden neue Parameter (aI und aP) des Bitratenmodells berechnet, so dass das Bitratenmodell mit der Anzahl der Transformationskoeffizientenbits, die tatsächlich erzeugt wurden (Ca) übereinstimmt. Um das für das I-Bild zu veranschaulichen, wird im Verlaufs der Codierung jedes Bilds die Summe aller Werte Δ(r,c) für MBs, die mit dem gleichen Wert von QP codiert wurden, erzeugt:
  • Figure 00490001
  • Ein aktualisierter Wert von aI wird berechnet durch
    Figure 00490002
    und aI = (I – α)aI + αa'I.
  • Bei der Ausführung kann ein Wert von α = 0,667 verwendet werden. Eine ähnliche Strategie wird verwendet, um sowohl aI als auch aP nach dem Codieren eines P-Bilds zu aktualisieren. In diesem Fall ist a zu dem Bruchteil von MBs proportional, die in der Betriebsart codiert wurden, die dem aktualisierten Parameter des Bitratenmodells entspricht.
  • Schließlich wird die Anzahl von Bits, die zum Codieren aller Zusatzinformationen für das Bild verwendet werden, für die Verwendung als der Wert der Zusatzinformationszuordnung S für das nächste Bild des gleichen Typs gespeichert.
  • Die Leistungsfähigkeit der QP-Zuweisungs- und Aktualisierungsstrategien ist in 13 dargestellt. 13 zeigt die Werte QPlow und mittlerer QP in jeder Zeile der Vollbilder 16, 22, 61 und 67 der Prüfbildfolge. Es sollte klar sein, dass es dann, wenn die anfänglichen Schätzwerte für QPlow und die Bitratenmodelle exakt wären, keine Änderung von QPlow von Zeile zu Zeile geben würde. QPavg würde jedoch in Abhängigkeit von der räumlichen Aktivität und der Bewegungskompensationsfähigkeit der verschiedenen Zeilen in den Bildern schwanken. Es kann z.B. aus den QP-Werten des I-Bilds leicht erkannt werden, dass die untere Hälfte der Zeilen des Blumengarten-Abschnitts räumlich viel komplexer ist als die obere Hälfte. Die P-Bild-Ergebnisse zeigen, dass die Bewegungskompensation die Schwankung von QPavg verringert, und 14 zeigt zeilenweise die erzeugten Bits gegenüber den Sollwerten. Es kann erkannt werden, dass die Ergebnisse den Sollwerten verhältnismäßig gut nachlaufen.
  • Das Verfahren der Ratensteuerung für B-Bilder unterscheidet sich von dem für die I- und P-Bilder. Es erfolgt keine MB-Klassifikation, und somit wird nicht versucht, die Menge der komprimierten Daten abzuschätzen, die jede Reihe von MBs erzeugen wird. Somit sind alle Sollwerte in einem Bild gleich. Am Anfang jedes Bilds wird der Quantisierungsfaktor auf den Wert gesetzt, den er am Ende des vorherigen B-Bilds hatte. Nach jeder Zeile von MBs wird QP in der gleichen Weise wie für die anderen Bildtypen aktualisiert, wobei jedoch die obere und untere Begrenzung festgelegt sind durch: Δu = max(UVBV – Λ. Λ), Δl =max(0, LVBV) – Λ.
  • Das Voranstehende stellt eine Codierungsprozedur für sich bewegende Videobilder dar, die eine adaptive Bitzuordnung und eine Quantisierung verwendet, um robuste, hochwertig codierte Folgen über einen Bereich des Ausgangsmaterials und von Bitraten bereitzustellen. Die codierten Daten genügen den Anforderungen einer festen Bitrate der ISO/IEC MPEG-Videocodierungsnorm. Die zusätzliche Codiererkomplexität, die erforderlich ist, um die adaptive Technik zu umzusetzen, ist moderat in Bezug auf die Grundoperationen der Bewegungsabschätzung, der diskreten Kosinustransformation, Quantisierung und Huffman-Codierung, die Teil eines grundlegenden Codierers sind. Diese Merkmale macht den Algorithmus für flexible A von Echtzeit-Video-Codecs geeignet.

Claims (2)

  1. Verfahren für die Kompressionscodierung einer Folge von sich bewegenden Videobildern, wobei die Bilder dieser Folge jeweils durch digitale Datensignale dargestellt werden, die die räumlichen Bereiche, aus denen die Bilder aufgebaut sind, angeben, wobei das Verfahren die folgenden Schritte umfasst: Kennzeichnen jedes Bilds, das kompressionscodiert werden soll, als einen von drei Typen I, P oder B; Empfangen eines Bitzuordnungssignals für jedes Bild, das die Anzahl der Bits angibt, die zugewiesen werden, um an dem Bild eine Kompressionscodierung auszuführen; und Kompressionscodieren jedes Bilds in der Folge, wobei die Kompressionscodierung die folgenden Schritte umfasst: Klassifizieren jedes räumlichen Bereichs eines zu codierenden Bilds auf der Grundlage der Pixeldaten oder Pixeldifferenzdaten des räumlichen Bereichs; Festlegen einer Quantisierungsschrittgröße, die verwendet werden soll, um jeden räumlichen Bereich des Bilds auf der Grundlage der Klassifizierung des räumlichen Bereichs und der Klassifizierung anderer räumlicher Bereiche in dem Bild sowie des Bitzuordnungssignals für das Bild zu codieren; Unterteilen des Bilds in Gruppen räumlicher Bereiche und Zuordnen von Bits aus der Anzahl von Bits, die in diesen Gruppen zugewiesen wurden, um an dem Bild eine Kompressionscodierung auszuführen; nacheinander ausgeführte Kompressionscodierung der Gruppen räumlicher Bereiche unter Verwendung der festgelegten Quantisierungsschrittgrößen; und nach der Kompressionscodierung jeder Gruppe räumlicher Bereiche Einstellen der Quantisierungsschrittgrößen, die bei den restlichen uncodierten räumlichen Bereichen in dem Bild angewendet werden sollen, wenn die Anzahl von Bits, die für das Codieren der bereits codierten Gruppen des Bilds verwendet wird, von der an die bereits codierten Gruppen zugewiesenen Bitzuordnung abweicht.
  2. System (1) für die Kompressionscodierung einer Folge sich bewegender Videobilder, wobei die Bilder dieser Folge jeweils durch digitale Datensignale dargestellt werden, die die räumlichen Bereiche, aus denen die Bilder aufgebaut sind, angeben, wobei das System umfasst: ein Mittel (2) zum Kennzeichnen jedes Bilds, das kompressionscodiert werden soll, als einen von drei Typen I, P oder B; ein Mittel (3) zum Empfangen eines Bitzuordnungssignals (Ck) für jedes Bild, das die Anzahl der Bits angibt, die zugewiesen werden, um an dem Bild eine Kompressionscodierung auszuführen; und Mittel für die Kompressionscodierung jedes Bilds in der Folge, wobei die Mittel für die Kompressionscodierung umfassen: ein Mittel (14) zum Klassifizieren jedes räumlichen Bereichs eines zu codierenden Bilds auf der Grundlage der Pixeldaten oder Pixeldifferenzdaten des räumlichen Bereichs; ein Mittel (15) zum Festlegen einer Quantisierungsschrittgröße, die verwendet werden soll, um jeden räumlichen Bereich des Bilds auf der Grundlage der Klassifizierung des räumlichen Bereichs und der Klassifizierung anderer räumlicher Bereiche in dem Bild sowie des Bitzuordnungssignals für das Bild zu codieren; ein Mittel zum Unterteilen des Bilds in Gruppen räumlicher Bereiche und Zuordnen von Bits aus der Anzahl von Bits, die in diesen Gruppen zugewiesen wurden, um an dem Bild eine Kompressionscodierung auszuführen; ein Mittel (16), um an den Gruppen räumlicher Bereiche unter Verwendung der festgelegten Quantisierungsschrittgrößen nacheinander eine Kompressionscodierung auszuführen; und ein Mittel, um nach der Kompressionscodierung jeder Gruppe räumlicher Bereiche die Quantisierungsschrittgrößen einzustellen, die bei den restlichen uncodierten räumlichen Bereichen in dem Bild angewendet werden sollen, wenn die Anzahl von Bits, die für das Codieren der bereits codierten Gruppen verwendet wird, von der an die bereits codierten Gruppen zugewiesenen Bitzuordnung abweicht.
DE69233411T 1991-11-08 1992-10-23 Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung Expired - Lifetime DE69233411T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/789,505 US5231484A (en) 1991-11-08 1991-11-08 Motion video compression system with adaptive bit allocation and quantization
US789505 1991-11-08

Publications (2)

Publication Number Publication Date
DE69233411D1 DE69233411D1 (de) 2004-10-21
DE69233411T2 true DE69233411T2 (de) 2005-09-22

Family

ID=25147833

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69230704T Expired - Lifetime DE69230704T2 (de) 1991-11-08 1992-10-23 Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung
DE69233411T Expired - Lifetime DE69233411T2 (de) 1991-11-08 1992-10-23 Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69230704T Expired - Lifetime DE69230704T2 (de) 1991-11-08 1992-10-23 Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung

Country Status (8)

Country Link
US (1) US5231484A (de)
EP (3) EP0959627B1 (de)
JP (1) JP2818340B2 (de)
KR (1) KR960007264B1 (de)
CN (1) CN1035593C (de)
CA (1) CA2077058C (de)
DE (2) DE69230704T2 (de)
TW (1) TW221085B (de)

Families Citing this family (325)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9405914D0 (en) * 1994-03-24 1994-05-11 Discovision Ass Video decompression
US5317397A (en) * 1991-05-31 1994-05-31 Kabushiki Kaisha Toshiba Predictive coding using spatial-temporal filtering and plural motion vectors
US6005627A (en) * 1991-05-31 1999-12-21 Kabushiki Kaisha Toshiba Video coding apparatus
US5986713A (en) * 1991-05-31 1999-11-16 Kabushiki Kaisha Toshiba Video coding apparatus using inter-field prediction
JP3189861B2 (ja) * 1992-11-13 2001-07-16 ソニー株式会社 動画像符号化装置および方法
US5640208A (en) * 1991-06-27 1997-06-17 Sony Corporation Video signal encoding in accordance with stored parameters
US5539836A (en) * 1991-12-20 1996-07-23 Alaris Inc. Method and apparatus for the realization of two-dimensional discrete cosine transform for an 8*8 image fragment
EP1304884B1 (de) * 1992-01-29 2005-11-02 Mitsubishi Denki Kabushiki Kaisha Videoinformationsaufzeichnungsmedium und Wiedergabevorrichtung
US6870884B1 (en) * 1992-01-29 2005-03-22 Mitsubishi Denki Kabushiki Kaisha High-efficiency encoder and video information recording/reproducing apparatus
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JPH05236427A (ja) * 1992-02-25 1993-09-10 Sony Corp 画像信号の符号化装置及び符号化方法
JPH05268590A (ja) * 1992-03-17 1993-10-15 Nec Corp 動画像符号化復号化回路
KR0150955B1 (ko) * 1992-05-27 1998-10-15 강진구 비트고정을 위한 영상압축방법과 신장방법 및 그 장치
US5291281A (en) * 1992-06-18 1994-03-01 General Instrument Corporation Adaptive coding level control for video compression systems
US5289276A (en) * 1992-06-19 1994-02-22 General Electric Company Method and apparatus for conveying compressed video data over a noisy communication channel
US6263422B1 (en) 1992-06-30 2001-07-17 Discovision Associates Pipeline processing machine with interactive stages operable in response to tokens and system and methods relating thereto
US6067417A (en) 1992-06-30 2000-05-23 Discovision Associates Picture start token
US6079009A (en) 1992-06-30 2000-06-20 Discovision Associates Coding standard token in a system compromising a plurality of pipeline stages
US6330665B1 (en) 1992-06-30 2001-12-11 Discovision Associates Video parser
DE69229338T2 (de) 1992-06-30 1999-12-16 Discovision Associates, Irvine Datenpipelinesystem
US5784631A (en) 1992-06-30 1998-07-21 Discovision Associates Huffman decoder
US6047112A (en) 1992-06-30 2000-04-04 Discovision Associates Technique for initiating processing of a data stream of encoded video information
US5809270A (en) 1992-06-30 1998-09-15 Discovision Associates Inverse quantizer
US6112017A (en) 1992-06-30 2000-08-29 Discovision Associates Pipeline processing machine having a plurality of reconfigurable processing stages interconnected by a two-wire interface bus
US5768561A (en) 1992-06-30 1998-06-16 Discovision Associates Tokens-based adaptive video processing arrangement
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
US5379122A (en) * 1992-10-02 1995-01-03 Xerox Corporation Decompression of standard ADCT-compressed images
US5384598A (en) * 1992-10-20 1995-01-24 International Business Machines Corporation System and method for frame differencing video compression and decompression with frame rate scalability
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
KR100284613B1 (ko) * 1992-11-16 2001-03-15 더블유. 스코트 루이스 확장된 대화형 멀티미디어 정보의 생성 및 전송 방법
JP3240017B2 (ja) * 1993-01-11 2001-12-17 ソニー株式会社 Mpeg信号記録方法およびmpeg信号再生方法
JP3282260B2 (ja) * 1993-01-18 2002-05-13 ソニー株式会社 画像再生装置及び方法
US5786858A (en) * 1993-01-19 1998-07-28 Sony Corporation Method of encoding image signal, apparatus for encoding image signal, method of decoding image signal, apparatus for decoding image signal, and image signal recording medium
US5703646A (en) * 1993-04-09 1997-12-30 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
EP0645930B1 (de) * 1993-04-09 2000-06-14 Sony Corporation Verfahren und vorrichtung zur bildkodierung
KR970000683B1 (ko) * 1993-05-31 1997-01-16 삼성전자 주식회사 해상도 가변 적응적 화상압축/복원방법 및 장치
FR2707070B1 (de) * 1993-06-22 1995-09-08 Centre Nat Etd Spatiales
US5878273A (en) 1993-06-24 1999-03-02 Discovision Associates System for microprogrammable state machine in video parser disabling portion of processing stages responsive to sequence-- end token generating by token generator responsive to received data
US5699544A (en) * 1993-06-24 1997-12-16 Discovision Associates Method and apparatus for using a fixed width word for addressing variable width data
US5861894A (en) 1993-06-24 1999-01-19 Discovision Associates Buffer manager
US5805914A (en) 1993-06-24 1998-09-08 Discovision Associates Data pipeline system and data encoding method
US5812735A (en) * 1993-07-09 1998-09-22 Sony Corporaiton Picture signal decoding method and picture signal decoding apparatus
FR2708168B1 (fr) * 1993-07-20 1995-08-25 Thomson Consumer Electronics Procédé et dispositif d'estimation d'un budget de bits pour encodeurs à longueur de mot variable.
US5598514A (en) * 1993-08-09 1997-01-28 C-Cube Microsystems Structure and method for a multistandard video encoder/decoder
JP2531106B2 (ja) * 1993-08-17 1996-09-04 日本電気株式会社 動画像符号化制御方式
FR2711879B1 (fr) * 1993-10-22 1995-12-15 Thomson Csf Procédé et dispositif de codage inter-trame avec régulation de débit pour l'enregistrement d'images sur magnétoscope.
KR970003789B1 (ko) * 1993-11-09 1997-03-21 한국전기통신공사 비디오 부호기의 전송율을 제어하기 위한 비트 할당 방법
BE1007808A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
BE1007807A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5587708A (en) * 1994-01-19 1996-12-24 Industrial Technology Research Institute Division technique unified quantizer-dequantizer
US5592226A (en) * 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
FR2717029A1 (fr) * 1994-03-02 1995-09-08 Philips Laboratoire Electroniq Procédé et dispositif de codage à longueur variable de signaux numériques.
EP0670663A1 (de) * 1994-03-02 1995-09-06 Laboratoires D'electronique Philips S.A.S. Verfahren und Vorrichtung zur Kodierung von eine Bildsequenz darstellenden digitalen signalen
US5563961A (en) * 1994-03-03 1996-10-08 Radius Inc. Video data compression method and system which measures compressed data storage time to optimize compression rate
US5576765A (en) * 1994-03-17 1996-11-19 International Business Machines, Corporation Video decoder
CA2145363C (en) 1994-03-24 1999-07-13 Anthony Mark Jones Ram interface
CA2145379C (en) * 1994-03-24 1999-06-08 William P. Robbins Method and apparatus for addressing memory
CA2145365C (en) * 1994-03-24 1999-04-27 Anthony M. Jones Method for accessing banks of dram
US5754235A (en) * 1994-03-25 1998-05-19 Sanyo Electric Co., Ltd. Bit-rate conversion circuit for a compressed motion video bitstream
DE69536095D1 (de) * 1994-03-25 2010-09-30 Nec Corp Bildwiedergabevorrichtung
US5541852A (en) * 1994-04-14 1996-07-30 Motorola, Inc. Device, method and system for variable bit-rate packet video communications
JP3265818B2 (ja) * 1994-04-14 2002-03-18 松下電器産業株式会社 動画符号化方法
CN1067203C (zh) * 1994-04-20 2001-06-13 汤姆森消费电子有限公司 利用恒定位率编码器的多路复用系统
US6055270A (en) * 1994-04-20 2000-04-25 Thomson Cosumer Electronics, Inc. Multiplexer system using constant bit rate encoders
JPH09512396A (ja) * 1994-04-20 1997-12-09 トムソン コンシユーマ エレクトロニクス インコーポレイテツド 一定ビットレート・エンコーダを使用したマルチプレクサ・システム
US5650829A (en) * 1994-04-21 1997-07-22 Sanyo Electric Co., Ltd. Motion video coding systems with motion vector detection
DE4416967A1 (de) * 1994-05-13 1995-11-16 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Transcodierung von Bitströmen mit Videodaten
FR2720582B1 (fr) * 1994-05-27 1996-08-14 Sgs Thomson Microelectronics Circuit de détermination du coefficient de quantification dans une chaîne de compression d'image.
FR2721787B1 (fr) * 1994-06-22 1996-07-26 Thomson Consumer Electronics Procédé de quantification des coefficients.
US5767898A (en) * 1994-06-23 1998-06-16 Sanyo Electric Co., Ltd. Three-dimensional image coding by merger of left and right images
JP3050047B2 (ja) * 1994-06-24 2000-06-05 日本ビクター株式会社 動画像符号化装置及び動画像符号化方法
US5651078A (en) * 1994-07-18 1997-07-22 Thomson Consumer Electronics, Inc. Method and apparatus for reducing contouring in video compression
JP3336754B2 (ja) * 1994-08-19 2002-10-21 ソニー株式会社 デジタルビデオ信号の記録方法及び記録装置
JP2882287B2 (ja) * 1994-08-22 1999-04-12 日本電気株式会社 動画像符号化装置
GB9417138D0 (en) 1994-08-23 1994-10-12 Discovision Ass Data rate conversion
JP3911035B2 (ja) * 1994-08-31 2007-05-09 ソニー株式会社 動画像符号化方法及び動画像符号化装置
JP3954656B2 (ja) * 1994-09-29 2007-08-08 ソニー株式会社 画像符号化装置及び方法
JPH08154247A (ja) * 1994-09-29 1996-06-11 Sanyo Electric Co Ltd 圧縮画像データ処理装置及び方法
JP3711572B2 (ja) * 1994-09-30 2005-11-02 ソニー株式会社 画像符号化装置及び方法
US5734419A (en) 1994-10-21 1998-03-31 Lucent Technologies Inc. Method of encoder control
CA2157066C (en) * 1994-10-21 1999-09-21 Nelson Botsford Iii Method for controlling a compressed data buffer
US5889561A (en) * 1994-11-04 1999-03-30 Rca Thomson Licensing Corporation Method and apparatus for scaling a compressed video bitstream
GB9424436D0 (en) * 1994-12-02 1995-01-18 Philips Electronics Video editing buffer management
JPH08163554A (ja) * 1994-12-02 1996-06-21 Electron & Telecommun Res Inst ビデオビット率制御方法
US5710595A (en) * 1994-12-29 1998-01-20 Lucent Technologies Inc. Method and apparatus for controlling quantization and buffering for digital signal compression
EP0720376B1 (de) * 1994-12-29 2001-10-31 Sony Corporation Einrichtung und Verfahren zur Quantisierung
US5646687A (en) * 1994-12-29 1997-07-08 Lucent Technologies Inc. Temporally-pipelined predictive encoder/decoder circuit and method
US5802211A (en) * 1994-12-30 1998-09-01 Harris Corporation Method and apparatus for transmitting and utilizing analog encoded information
FR2729520B1 (fr) * 1995-01-16 1997-06-13 France Telecom Procede de regulation du debit de codage par prediction temporelle et compensation de mouvement, d'un signal numerique de television
US5546336A (en) * 1995-01-19 1996-08-13 International Business Machine Corporation Processor using folded array structures for transposition memory and fast cosine transform computation
US5677969A (en) * 1995-02-23 1997-10-14 Motorola, Inc. Method, rate controller, and system for preventing overflow and underflow of a decoder buffer in a video compression system
JPH08242452A (ja) * 1995-03-02 1996-09-17 Matsushita Electric Ind Co Ltd 映像信号圧縮符号化装置
US5841476A (en) * 1995-03-03 1998-11-24 Kokusai Denshin Denwa Co. Ltd. Coding apparatus for encoding motion picture
US5734677A (en) * 1995-03-15 1998-03-31 The Chinese University Of Hong Kong Method for compression of loss-tolerant video image data from multiple sources
JPH08256341A (ja) * 1995-03-17 1996-10-01 Sony Corp 画像信号符号化方法、画像信号符号化装置、画像信号記録媒体、及び画像信号復号化装置
US6198767B1 (en) * 1995-03-27 2001-03-06 International Business Machines Corporation Apparatus for color component compression
US5668598A (en) * 1995-03-27 1997-09-16 International Business Machines Corporation Motion video compression system with guaranteed bit production limits
JP2809126B2 (ja) * 1995-03-30 1998-10-08 日本電気株式会社 音声信号処理回路および音声信号処理方法
US5729294A (en) * 1995-04-05 1998-03-17 International Business Machines Corporation Motion video compression system with novel adaptive quantization
US5694170A (en) * 1995-04-06 1997-12-02 International Business Machines Corporation Video compression using multiple computing agents
US5612900A (en) * 1995-05-08 1997-03-18 Kabushiki Kaisha Toshiba Video encoding method and system which encodes using a rate-quantizer model
US5819004A (en) * 1995-05-08 1998-10-06 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of previously encoded video frames
US5914712A (en) * 1995-05-08 1999-06-22 Video Jukebox Network, Inc. Interactive video system
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
GB2301970B (en) * 1995-06-06 2000-03-01 Sony Uk Ltd Motion compensated video processing
US6480664B1 (en) * 1995-06-07 2002-11-12 Hou-Chun Ting Trick mode VTR which generates trick play data from a stream of images containing intra-pictures and predictive pictures and selects specific DCT coefficients for intra-pictures
US5860086A (en) * 1995-06-07 1999-01-12 International Business Machines Corporation Video processor with serialization FIFO
KR0153671B1 (ko) * 1995-06-30 1998-11-16 배순훈 고선명 텔레비젼 엔코더의 레이트 콘트롤러
FR2736743B1 (fr) * 1995-07-10 1997-09-12 France Telecom Procede de controle de debit de sortie d'un codeur de donnees numeriques representatives de sequences d'images
JP2795223B2 (ja) * 1995-07-18 1998-09-10 日本電気株式会社 画像信号の符号化方法
EP1357758A3 (de) 1995-08-02 2004-10-27 Matsushita Electric Industrial Co., Ltd. Videokodierungsgerät und -system mit Quantizierungskontrollverfahren und Durchschnittsdurchsatzberechnungsverfahren
JPH0955941A (ja) * 1995-08-16 1997-02-25 Sony Corp 画像符号化方法、画像符号化装置、及び画像符号化データの記録装置
US5910909A (en) * 1995-08-28 1999-06-08 C-Cube Microsystems, Inc. Non-linear digital filters for interlaced video signals and method thereof
JPH0974566A (ja) * 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
US5652629A (en) * 1995-09-12 1997-07-29 International Business Machines Corporation Bidirectional motion estimation in a motion video compression system
GB9519923D0 (en) * 1995-09-29 1995-11-29 Philips Electronics Nv Motion estimation for predictive image coding
US5675384A (en) * 1995-10-03 1997-10-07 Nec Usa, Inc. VBR MPEG video encoding for ATM networks with dynamic bandwidth renegotiation
US6160846A (en) * 1995-10-25 2000-12-12 Sarnoff Corporation Apparatus and method for optimizing the rate control in a coding system
US6192081B1 (en) 1995-10-26 2001-02-20 Sarnoff Corporation Apparatus and method for selecting a coding mode in a block-based coding system
US6571019B1 (en) * 1995-10-26 2003-05-27 Hyundai Curitel, Inc Apparatus and method of encoding/decoding a coded block pattern
GB2306831B (en) * 1995-10-30 2000-05-24 Sony Uk Ltd Video data compression
WO1997016926A1 (en) * 1995-10-31 1997-05-09 Sarnoff Corporation Method and apparatus for determining ambient conditions from an image sequence
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
JPH10513028A (ja) * 1995-11-15 1998-12-08 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビットレート制御方法
US5717464A (en) * 1995-12-18 1998-02-10 Divicom, Inc. Rate control for a video encoder
US5801779A (en) * 1995-12-26 1998-09-01 C-Cube Microsystems, Inc. Rate control with panic mode
US5761398A (en) * 1995-12-26 1998-06-02 C-Cube Microsystems Inc. Three stage hierarchal motion vector determination
US5686963A (en) * 1995-12-26 1997-11-11 C-Cube Microsystems Method for performing rate control in a video encoder which provides a bit budget for each frame while employing virtual buffers and virtual buffer verifiers
US5872598A (en) * 1995-12-26 1999-02-16 C-Cube Microsystems Scene change detection using quantization scale factor rate control
KR970057947A (ko) * 1995-12-28 1997-07-31 배순훈 영상 부호화기에서의 타입 결정 및 버퍼 제어 장치
US6057893A (en) * 1995-12-28 2000-05-02 Sony Corporation Picture encoding method, picture encoding apparatus, picture transmitting method and picture recording medium
EP0784409A3 (de) * 1996-01-11 2001-11-14 Sony Corporation Videokodierung und -multiplex
US5719632A (en) * 1996-01-25 1998-02-17 Ibm Corporation Motion video compression system with buffer empty/fill look-ahead bit allocation
KR0170735B1 (ko) * 1996-01-29 1999-03-20 김광호 정지영상 데이터의 압축장치
US6957350B1 (en) 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5731839A (en) * 1996-02-06 1998-03-24 David Sarnoff Research Center, Inc. Bitstream for evaluating predictive video decoders and a method of generating same
US5731835A (en) * 1996-02-26 1998-03-24 David Sarnoff Research Center, Inc. Dynamic coding rate control in a block-based video coding system
JP3493872B2 (ja) * 1996-02-29 2004-02-03 ソニー株式会社 画像データ処理方法およびその装置
US6100931A (en) * 1996-03-19 2000-08-08 Sony Corporation Method and apparatus for controlling a target amount of code and for compressing video data
US5844607A (en) * 1996-04-03 1998-12-01 International Business Machines Corporation Method and apparatus for scene change detection in digital video compression
CN1116768C (zh) * 1996-04-12 2003-07-30 索尼公司 图像编码装置和方法
US6115421A (en) * 1996-04-25 2000-09-05 Matsushita Electric Industrial Co., Ltd. Moving picture encoding apparatus and method
FR2748623B1 (fr) * 1996-05-09 1998-11-27 Thomson Multimedia Sa Encodeur a debit variable
US6292589B1 (en) * 1996-06-21 2001-09-18 Compaq Computer Corporation Method for choosing rate control parameters in motion-compensated transform-based picture coding scheme using non-parametric technique
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US6026217A (en) * 1996-06-21 2000-02-15 Digital Equipment Corporation Method and apparatus for eliminating the transpose buffer during a decomposed forward or inverse 2-dimensional discrete cosine transform through operand decomposition storage and retrieval
US5805228A (en) * 1996-08-09 1998-09-08 U.S. Robotics Access Corp. Video encoder/decoder system
US6337879B1 (en) 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
US6205253B1 (en) 1996-08-19 2001-03-20 Harris Corporation Method and apparatus for transmitting and utilizing analog encoded information
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
KR100553462B1 (ko) * 1996-08-30 2006-10-11 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오전송시스템및비디오전송방법
JP3864461B2 (ja) * 1996-08-30 2006-12-27 ソニー株式会社 映像データ圧縮装置およびその方法
FR2753330B1 (fr) * 1996-09-06 1998-11-27 Thomson Multimedia Sa Procede de quantification pour codage video
KR100297830B1 (ko) * 1996-11-09 2001-08-07 윤종용 영상단위별 비트발생량 조절 장치 및 방법
US6094455A (en) * 1996-09-25 2000-07-25 Matsushita Electric Industrial Co., Ltd. Image compression/encoding apparatus and system with quantization width control based on bit generation error
US5818535A (en) * 1996-09-30 1998-10-06 Alaris, Inc. Method and apparatus for adaptive hybrid motion video compression and decompression
US5745058A (en) * 1996-10-21 1998-04-28 International Business Machines Corporation Method and system for compressing microcode to be executed within a data processing system
US6037985A (en) * 1996-10-31 2000-03-14 Texas Instruments Incorporated Video compression
EP0840514B1 (de) * 1996-11-04 2003-09-24 Alcatel Verfahren und Vorrichtung zur Vorfilterung von Videobildern
US6512775B1 (en) * 1996-11-08 2003-01-28 The Trustees Of Columbia University In The City Of New York Method and apparatus for a programmable bitstream parser for audiovisual and generic decoding systems
JPH10145773A (ja) * 1996-11-14 1998-05-29 Toshiba Corp 動画像データの暗号化方法およびその方法が適用されるコンピュータシステム並びに動画像データ符号化/復号化装置
US6243417B1 (en) * 1996-12-12 2001-06-05 Sony Corporation Device and method for encoding image data, and image data transmission method
EP0960532B1 (de) * 1997-02-12 2007-01-31 MediaTek Inc. Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
US6272175B1 (en) * 1997-02-13 2001-08-07 Conexant Systems, Inc. Video signal coding systems and processes using adaptive quantization
EP1359766A3 (de) * 1997-02-14 2005-02-16 AT&T Corp. Verfahren zur Erzeugung eines dequantizierten DC-Luminanz oder DC-Chrominanz Koeffizienten
US7269219B1 (en) 1997-02-14 2007-09-11 At&T Corp. Non-linear quantizer for video coding
US6347116B1 (en) * 1997-02-14 2002-02-12 At&T Corp. Non-linear quantizer for video coding
US6553068B1 (en) * 1997-03-12 2003-04-22 Matsushita Electric Industrial Co., Ltd. Video signal coding method and device adapted to control code amounts according to the characteristics of pictures
US6577680B2 (en) * 1997-03-12 2003-06-10 Matsushita Electric Industrial Co., Ltd. Video signal coding method and coding device adapted to control code amounts according to the characteristics of pictures
US6067321A (en) * 1997-04-03 2000-05-23 Lsi Logic Corporation Method and apparatus for two-row macroblock decoding to improve caching efficiency
US6178203B1 (en) * 1997-04-03 2001-01-23 Lsi Logic Corporation Method and apparatus for two-row decoding of MPEG video
JP4061511B2 (ja) * 1997-04-15 2008-03-19 ソニー株式会社 符号化装置及び符号化方法
JP3588970B2 (ja) * 1997-04-30 2004-11-17 ソニー株式会社 信号符号化方法、信号符号化装置、信号記録媒体及び信号伝送方法
US6339616B1 (en) 1997-05-30 2002-01-15 Alaris, Inc. Method and apparatus for compression and decompression of still and motion video data based on adaptive pixel-by-pixel processing and adaptive variable length coding
US6088392A (en) * 1997-05-30 2000-07-11 Lucent Technologies Inc. Bit rate coder for differential quantization
CA2264834C (en) 1997-07-08 2006-11-07 Sony Corporation Video data encoder, video data encoding method, video data transmitter, and video data recording medium
US6023296A (en) * 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system
US6690833B1 (en) 1997-07-14 2004-02-10 Sarnoff Corporation Apparatus and method for macroblock based rate control in a coding system
US6192075B1 (en) * 1997-08-21 2001-02-20 Stream Machine Company Single-pass variable bit-rate control for digital video coding
FR2769453B1 (fr) * 1997-10-06 2000-01-07 Telediffusion Fse Procede d'evaluation de la degradation d'une image video introduite par un systeme de codage et/ou de stockage et/ou de transmission numerique
US6885702B1 (en) 1997-10-06 2005-04-26 Telediffusion De France Method for spatial synchronization of a digitally coded video image and/or for identification of the syntax of a video sequence
US5978029A (en) * 1997-10-10 1999-11-02 International Business Machines Corporation Real-time encoding of video sequence employing two encoders and statistical analysis
US6118822A (en) * 1997-12-01 2000-09-12 Conexant Systems, Inc. Adaptive entropy coding in adaptive quantization framework for video signal coding systems and processes
US6111914A (en) * 1997-12-01 2000-08-29 Conexant Systems, Inc. Adaptive entropy coding in adaptive quantization framework for video signal coding systems and processes
US6366704B1 (en) 1997-12-01 2002-04-02 Sharp Laboratories Of America, Inc. Method and apparatus for a delay-adaptive rate control scheme for the frame layer
WO1999030505A1 (en) * 1997-12-08 1999-06-17 Sony Corporation Encoder and encoding method
GB2337392B (en) * 1997-12-08 2002-04-17 Sony Corp Coding device and method
US6067118A (en) * 1997-12-16 2000-05-23 Philips Electronics North America Corp. Method of frame-by-frame calculation of quantization matrices
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
US6181742B1 (en) * 1998-01-26 2001-01-30 International Business Machines Corporation Single pass target allocation for video encoding
US6459439B1 (en) * 1998-03-09 2002-10-01 Macromedia, Inc. Reshaping of paths without respect to control points
US6278735B1 (en) 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
US6895048B2 (en) * 1998-03-20 2005-05-17 International Business Machines Corporation Adaptive encoding of a sequence of still frames or partially still frames within motion video
JP2002506605A (ja) * 1998-04-30 2002-02-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データ圧縮
US6125147A (en) * 1998-05-07 2000-09-26 Motorola, Inc. Method and apparatus for reducing breathing artifacts in compressed video
US6212232B1 (en) 1998-06-18 2001-04-03 Compaq Computer Corporation Rate control and bit allocation for low bit rate video communication applications
US6804294B1 (en) * 1998-08-11 2004-10-12 Lucent Technologies Inc. Method and apparatus for video frame selection for improved coding quality at low bit-rates
CA2345544C (en) 1998-09-29 2009-07-14 Siemens Aktiengesellschaft Method and arrangement for processing a digitized picture with pixels
CN1174624C (zh) * 1998-09-29 2004-11-03 松下电器产业株式会社 可变比特率编码装置
WO2000040032A1 (en) * 1998-12-23 2000-07-06 Koninklijke Philips Electronics N.V. Adaptive buffer and quantizer regulation scheme for bandwidth scalability of video data
WO2000042772A1 (en) * 1999-01-15 2000-07-20 Koninklijke Philips Electronics N.V. Coding and noise filtering an image sequence
JP2000253397A (ja) * 1999-03-01 2000-09-14 Nec Corp 動画像符号化装置
FR2791211B1 (fr) 1999-03-18 2001-10-19 Cit Alcatel Dispositif de regulation en debit ou en qualite d'un compresseur de donnees numeriques, notamment d'images
KR100390115B1 (ko) * 1999-04-12 2003-07-04 마츠시타 덴끼 산교 가부시키가이샤 화상 처리 방법, 화상 처리 장치 및 데이터 기억 매체
US6633673B1 (en) * 1999-06-17 2003-10-14 Hewlett-Packard Development Company, L.P. Fast fade operation on MPEG video or other compressed data
JP3807157B2 (ja) * 1999-06-25 2006-08-09 日本ビクター株式会社 符号化装置及び符号化方法
JP2001086512A (ja) * 1999-09-14 2001-03-30 Nec Corp 可変ビットレート符号化装置
US6754276B1 (en) * 1999-09-20 2004-06-22 Matsushita Electric Industrial Co., Ltd. System stream creating apparatus which adjusts system clock reference based on total number of pictures to be stored and decoded during certain time period
GB2356510B (en) 1999-11-18 2004-04-21 Sony Uk Ltd Data compression
US6754371B1 (en) * 1999-12-07 2004-06-22 Sony Corporation Method and apparatus for past and future motion classification
US6810082B1 (en) * 1999-12-17 2004-10-26 Koninklijke Philips Electronics N.V. Chroma based adaptive signal peaking
US6678332B1 (en) 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US6792047B1 (en) 2000-01-04 2004-09-14 Emc Corporation Real time processing and streaming of spliced encoded MPEG video and associated audio
US7096481B1 (en) 2000-01-04 2006-08-22 Emc Corporation Preparation of metadata for splicing of encoded MPEG video and audio
FI116819B (fi) * 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
US6600836B1 (en) * 2000-01-28 2003-07-29 Qualcomm, Incorporated Quality based image compression
US6522693B1 (en) 2000-02-23 2003-02-18 International Business Machines Corporation System and method for reencoding segments of buffer constrained video streams
KR100875781B1 (ko) * 2000-03-13 2008-12-24 소니 가부시끼 가이샤 콘텐츠 공급 장치 및 방법과, 기록 매체
US6382331B1 (en) * 2000-04-17 2002-05-07 Noble Drilling Services, Inc. Method of and system for optimizing rate of penetration based upon control variable correlation
US7091985B1 (en) 2000-05-16 2006-08-15 International Business Machines Corporation System and method for compressing color data using expandable color palette
JP2002077917A (ja) * 2000-06-13 2002-03-15 Sony Corp 画像データ処理装置及び画像データ処理方法
KR100341063B1 (ko) * 2000-06-28 2002-06-20 송문섭 실시간 영상 통신을 위한 율제어 장치 및 그 방법
US6771703B1 (en) 2000-06-30 2004-08-03 Emc Corporation Efficient scaling of nonscalable MPEG-2 Video
US6871006B1 (en) 2000-06-30 2005-03-22 Emc Corporation Processing of MPEG encoded video for trick mode operation
US7020205B1 (en) * 2000-07-12 2006-03-28 Thomson Licensing Sending progressive video sequences suitable for MPEG and other data formats
US7424058B1 (en) * 2000-09-28 2008-09-09 Autodesk, Inc. Variable bit-rate encoding
US7751683B1 (en) 2000-11-10 2010-07-06 International Business Machines Corporation Scene change marking for thumbnail extraction
US6937770B1 (en) 2000-12-28 2005-08-30 Emc Corporation Adaptive bit rate control for rate reduction of MPEG coded video
US7023924B1 (en) 2000-12-28 2006-04-04 Emc Corporation Method of pausing an MPEG coded video stream
US8374237B2 (en) 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
US6831947B2 (en) 2001-03-23 2004-12-14 Sharp Laboratories Of America, Inc. Adaptive quantization based on bit rate prediction and prediction error energy
US6907081B2 (en) * 2001-03-30 2005-06-14 Emc Corporation MPEG encoder control protocol for on-line encoding and MPEG data storage
DE60210597T2 (de) * 2001-04-09 2007-01-25 Koninklijke Philips Electronics N.V. Vorrichtung zur adpcdm sprachkodierung mit spezifischer anpassung der schrittwerte
WO2002082426A1 (en) * 2001-04-09 2002-10-17 Koninklijke Philips Electronics N.V. Adpcm speech coding system with phase-smearing and phase-desmearing filters
US7174561B2 (en) * 2001-04-13 2007-02-06 Emc Corporation MPEG dual-channel decoder data and control protocols for real-time video streaming
US9894379B2 (en) * 2001-07-10 2018-02-13 The Directv Group, Inc. System and methodology for video compression
US8111754B1 (en) 2001-07-11 2012-02-07 Dolby Laboratories Licensing Corporation Interpolation of video compression frames
US7266150B2 (en) * 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US20030112863A1 (en) 2001-07-12 2003-06-19 Demos Gary A. Method and system for improving compressed image chroma information
US6914936B1 (en) * 2001-07-19 2005-07-05 Bigband Networks, Inc. Method for allocating media unit sequences among a plurality of output channels
US6980594B2 (en) 2001-09-11 2005-12-27 Emc Corporation Generation of MPEG slow motion playout
US6968091B2 (en) * 2001-09-18 2005-11-22 Emc Corporation Insertion of noise for reduction in the number of bits for variable-length coding of (run, level) pairs
US6959116B2 (en) * 2001-09-18 2005-10-25 Emc Corporation Largest magnitude indices selection for (run, level) encoding of a block coded picture
US6980596B2 (en) * 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
US20030099294A1 (en) * 2001-11-27 2003-05-29 Limin Wang Picture level adaptive frame/field coding for digital video content
US7809203B2 (en) * 2001-11-27 2010-10-05 Samsung Electronics Co., Ltd. Apparatus for encoding and decoding key data and key value data of coordinate interpolator and recording medium containing bitstream into which coordinate interpolator is encoded
US6763068B2 (en) * 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
KR100468726B1 (ko) * 2002-04-18 2005-01-29 삼성전자주식회사 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
AU2003285850A1 (en) 2002-04-23 2004-04-30 Nokia Corporation Method and device for indicating quantizer parameters in a video coding system
US20030202780A1 (en) * 2002-04-25 2003-10-30 Dumm Matthew Brian Method and system for enhancing the playback of video frames
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
KR20040007818A (ko) * 2002-07-11 2004-01-28 삼성전자주식회사 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치
US7769084B1 (en) 2002-07-15 2010-08-03 Apple Inc. Method for implementing a quantizer in a multimedia compression and encoding system
US7418037B1 (en) * 2002-07-15 2008-08-26 Apple Inc. Method of performing rate control for a compression system
US7804897B1 (en) 2002-12-16 2010-09-28 Apple Inc. Method for implementing an improved quantizer in a multimedia compression and encoding system
US7940843B1 (en) * 2002-12-16 2011-05-10 Apple Inc. Method of implementing improved rate control for a multimedia compression and encoding system
FI116016B (fi) * 2002-12-20 2005-08-31 Oplayo Oy Puskurointijärjestely
JP2004274212A (ja) * 2003-03-06 2004-09-30 Renesas Technology Corp 画像符号化装置
US7519115B2 (en) * 2003-03-31 2009-04-14 Duma Video, Inc. Video compression method and apparatus
JP2006525722A (ja) 2003-05-06 2006-11-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化及び復号化方法、並びに対応する符号化及び復号化装置
US7782940B2 (en) * 2003-08-01 2010-08-24 Polycom, Inc. Methods for encoding or decoding in a videoconference system to reduce problems associated with noisy image acquisition
US7430329B1 (en) * 2003-11-26 2008-09-30 Vidiator Enterprises, Inc. Human visual system (HVS)-based pre-filtering of video data
US7889792B2 (en) 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
US7809061B1 (en) 2004-01-22 2010-10-05 Vidiator Enterprises Inc. Method and system for hierarchical data reuse to improve efficiency in the encoding of unique multiple video streams
US7986731B2 (en) 2004-02-06 2011-07-26 Apple Inc. H.264/AVC coder incorporating rate and quality controller
US7453938B2 (en) 2004-02-06 2008-11-18 Apple Inc. Target bitrate estimator, picture activity and buffer management in rate control for video coder
US7869503B2 (en) 2004-02-06 2011-01-11 Apple Inc. Rate and quality controller for H.264/AVC video coder and scene analyzer therefor
US7492820B2 (en) 2004-02-06 2009-02-17 Apple Inc. Rate control for video coder employing adaptive linear regression bits modeling
US20050207501A1 (en) * 2004-03-18 2005-09-22 Sony Corporation Method of and system for video bit allocation for scene cuts and scene changes
US20060062481A1 (en) * 2004-09-21 2006-03-23 Markus Suvanto Apparatuses, computer program product and method for bit rate control of digital image encoder
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
BRPI0518821B8 (pt) * 2004-12-02 2019-08-27 Interdigital Madison Patent Holdings determinação de parâmetro de quantizador para controle de taxa em codificador de vídeo
US20060174296A1 (en) * 2005-01-05 2006-08-03 Parikh Sandip S System and method for evaluating predictive video decoders
US7403562B2 (en) * 2005-03-09 2008-07-22 Eg Technology, Inc. Model based rate control for predictive video encoder
JP4687216B2 (ja) * 2005-04-18 2011-05-25 ソニー株式会社 画像信号処理装置、カメラシステム、および画像信号処理方法
US9667999B2 (en) * 2005-04-25 2017-05-30 Avago Technologies General Ip (Singapore) Pte. Ltd. Method and system for encoding video data
KR101170799B1 (ko) 2005-05-21 2012-08-02 삼성전자주식회사 영상 압축 방법 및 그 장치와 영상 복원 방법 및 그 장치
US20060280242A1 (en) * 2005-06-13 2006-12-14 Nokia Corporation System and method for providing one-pass rate control for encoders
SG130962A1 (en) 2005-09-16 2007-04-26 St Microelectronics Asia A method and system for adaptive pre-filtering for digital video signals
US7809057B1 (en) * 2005-09-27 2010-10-05 Ambarella, Inc. Methods for intra beating reduction in video compression
US7822117B1 (en) * 2005-09-30 2010-10-26 Ambarella, Inc. Video encoder rate control using bit usage measuring and allocating by macroblock classes
US8160156B2 (en) * 2006-02-01 2012-04-17 Verint Systems, Inc. System and method for controlling the long term generation rate of compressed data
EP1995967A4 (de) * 2006-03-16 2009-11-11 Huawei Tech Co Ltd Verfahren und vorrichtung zum realisieren einer adaptiven quantisierung im codierungsprozess
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
US7773672B2 (en) * 2006-05-30 2010-08-10 Freescale Semiconductor, Inc. Scalable rate control system for a video encoder
US8831089B1 (en) * 2006-07-31 2014-09-09 Geo Semiconductor Inc. Method and apparatus for selecting optimal video encoding parameter configurations
JP4358215B2 (ja) * 2006-09-27 2009-11-04 株式会社東芝 動画像符号化装置及びその方法
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8064517B1 (en) 2007-09-07 2011-11-22 Zenverge, Inc. Perceptually adaptive quantization parameter selection
CN101594525B (zh) * 2008-05-31 2011-08-10 华为技术有限公司 量化参数的获取方法、装置及转码器
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
WO2010017166A2 (en) 2008-08-04 2010-02-11 Dolby Laboratories Licensing Corporation Overlapped block disparity estimation and compensation architecture
JP5550032B2 (ja) * 2008-08-05 2014-07-16 株式会社メガチップス トランスコーダ
WO2010022002A1 (en) * 2008-08-19 2010-02-25 Marvell World Trade Ltd Systems and methods for perceptually lossless video compression
US8325796B2 (en) * 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
CN101510950B (zh) * 2008-10-10 2011-05-18 慧帝科技(深圳)有限公司 一种影像处理装置和方法
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US8879623B2 (en) * 2009-09-02 2014-11-04 Sony Computer Entertainment Inc. Picture-level rate control for video encoding a scene-change I picture
JP5484083B2 (ja) * 2010-01-14 2014-05-07 株式会社メガチップス 画像処理装置
TWI421798B (zh) * 2010-04-27 2014-01-01 Novatek Microelectronics Corp 影像壓縮之位元率控制方法及其裝置
US8477050B1 (en) 2010-09-16 2013-07-02 Google Inc. Apparatus and method for encoding using signal fragments for redundant transmission of data
EP2668634B1 (de) 2011-01-24 2019-04-24 Intel Corporation Verfahren und system zur gewinnung, darstellung, komprimierung und übertragung dreidimensionaler daten
US9215466B2 (en) * 2011-01-31 2015-12-15 Apple Inc. Joint frame rate and resolution adaptation
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
US9262670B2 (en) 2012-02-10 2016-02-16 Google Inc. Adaptive region of interest
GB2499843B (en) * 2012-03-02 2014-12-03 Canon Kk Methods for encoding and decoding an image, and corresponding devices
SG11201503954YA (en) * 2013-01-04 2015-06-29 Intel Corp Coding unit bit number limitation
US20140192898A1 (en) * 2013-01-04 2014-07-10 Intel Corporation Coding unit bit number limitation
TWI578763B (zh) * 2013-02-28 2017-04-11 英特爾股份有限公司 編碼單元位元數限制
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
FR3024313B1 (fr) * 2014-07-25 2017-12-08 Allegro Dvt Codeur de video a debit variable
US10419760B2 (en) 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications
KR101631950B1 (ko) * 2014-11-12 2016-06-20 삼성전자주식회사 전처리기법을 이용한 영상 부호화 방법 및 장치
US10264257B2 (en) * 2015-06-30 2019-04-16 Texas Instruments Incorporated Video encoding
US10178390B2 (en) * 2016-03-30 2019-01-08 Sony Interactive Entertainment Inc. Advanced picture quality oriented rate control for low-latency streaming applications
KR102543444B1 (ko) 2017-08-29 2023-06-13 삼성전자주식회사 영상 부호화 장치
US10979747B2 (en) * 2017-12-21 2021-04-13 Arris Enterprises Llc Statistical multiplexing system for variable bit rate encoding with constant bit rate encoder
US10659514B2 (en) * 2018-03-28 2020-05-19 Arlo Technologies, Inc. System for video monitoring with adaptive bitrate to sustain image quality
CA3178565A1 (en) * 2020-05-14 2021-11-18 Abdul REHMAN Perceptual quality assessment metric based content and viewer aware encoding
CN114363624B (zh) * 2020-10-13 2023-03-31 北京大学 一种基于敏感度的码率分配特征压缩方法
CN113011287B (zh) * 2021-03-02 2024-08-23 四川新先达测控技术有限公司 一种提高高斯信号分析精确度的方法及系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3735349A1 (de) * 1986-10-18 1988-04-28 Toshiba Kawasaki Kk Bildpresservorrichtung
SE457402B (sv) * 1987-02-20 1988-12-19 Harald Brusewitz Foerfarande och anordning foer kodning och avkodning av bildinformation
US5051840A (en) * 1988-12-14 1991-09-24 Fuji Photo Film Co., Ltd. Device for coding a picture signal by compression
DE69031198T2 (de) * 1989-06-09 1998-03-19 Matsushita Electric Ind Co Ltd Einrichtung zur orthogonalen Transformationskodierung
JPH03129987A (ja) * 1989-10-14 1991-06-03 Sony Corp 映像信号符号化装置及び映像信号符号化方法
EP0444918B1 (de) * 1990-02-28 1996-06-05 Victor Company Of Japan, Limited Einrichtung zur Datenkompression
US5150432A (en) * 1990-03-26 1992-09-22 Kabushiki Kaisha Toshiba Apparatus for encoding/decoding video signals to improve quality of a specific region
US5038209A (en) * 1990-09-27 1991-08-06 At&T Bell Laboratories Adaptive buffer/quantizer control for transform video coders
JP2514111B2 (ja) * 1990-12-28 1996-07-10 日本ビクター株式会社 フレ―ム間符号化出力デ―タ量制御方式及び画像符号化出力デ―タ量制御方法
US5111292A (en) * 1991-02-27 1992-05-05 General Electric Company Priority selection apparatus as for a video signal processor
JP3187097B2 (ja) * 1991-10-17 2001-07-11 株式会社東芝 動画像符号化における符号量配分方法とこれを用いた動画像符号化方法及び装置

Also Published As

Publication number Publication date
CA2077058A1 (en) 1993-05-09
EP0959627A2 (de) 1999-11-24
EP0959627A3 (de) 2002-01-30
EP0959628A2 (de) 1999-11-24
JPH05252507A (ja) 1993-09-28
CN1035593C (zh) 1997-08-06
TW221085B (de) 1994-02-11
US5231484A (en) 1993-07-27
EP0540961A3 (de) 1994-08-31
EP0959627B1 (de) 2004-09-15
EP0540961B1 (de) 2000-02-23
CA2077058C (en) 1998-05-05
DE69233411D1 (de) 2004-10-21
JP2818340B2 (ja) 1998-10-30
DE69230704D1 (de) 2000-03-30
KR930011724A (ko) 1993-06-24
EP0959628A3 (de) 2002-01-30
CN1072554A (zh) 1993-05-26
KR960007264B1 (ko) 1996-05-29
DE69230704T2 (de) 2000-08-31
EP0540961A2 (de) 1993-05-12

Similar Documents

Publication Publication Date Title
DE69233411T2 (de) Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung
DE69116869T2 (de) Digitale bildkodierung mit einer zufallsabtastung der bilder
DE69810669T2 (de) Verfahren zur rechnerisch graziösen Degradierung in einem audio-visuellen Kompressionssystem
DE10300048B4 (de) Verfahren und Vorrichtung zur Bildcodierung und -decodierung
DE69815159T2 (de) Kodierung von bewegten bildern mit globaler konstanter bitrate
DE3851468T2 (de) Kodierungsverfahren von Bildsignalen.
DE69738264T2 (de) Videokodierungs- und Videodekodierungsvorrichtung
DE4228220B4 (de) Vorrichtung zur hierarchischen Unterteilung von Videosignalen
DE69827548T2 (de) Anordnung zur Vorverarbeitung für MPEG-2-Kodierung
DE69435000T2 (de) Bildkodierungsvorrichtung
DE69620094T2 (de) Videokodierungsvorrichtung
DE69434862T2 (de) Segmentierungs-basiertes entfernen von artefakten aus einem jpeg-bild
DE69837003T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
DE69330620T2 (de) Verfahren und Einrichtung zur Bildkodierung
DE4228221B4 (de) Vorrichtung zur Aufteilung von Videosignalen zwischen zwei Kanälen
DE69624669T2 (de) Videokodierer und -dekodierersystem und -methoden
DE69518226T2 (de) Verfahren und vorrichtung zur bestimmung der bitzuordnung in einem videokompressionssystem
DE19704439C2 (de) Verfahren und Vorrichtung zur Bewegungsschätzung in einem digitalen Videocodierer unter Verwendung von Trajektorien
DE69408838T2 (de) Videoschnittsystem
DE69816875T2 (de) Sequenzadaptive bit-zuordnung zur codierung von bildern
DE69935564T2 (de) Kodiervorrichtung und -verfahren
DE19739266B4 (de) Verfahren und Vorrichtung zum Kodieren binärer Formen
EP0201679A1 (de) Verfahren zur Bilddatenreduktion für digitale Fernsehsignale
DE19743202B4 (de) Verfahren zum Codieren eines Bewegungsvektors
EP1025708B1 (de) Verfahren und vorrichtung zur verarbeitung eines digitalisierten bildes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licences declared (paragraph 23)
8328 Change in the person/name/address of the agent

Representative=s name: DUSCHER, R., DIPL.-PHYS. DR.RER.NAT., PAT.-ANW., 7

R071 Expiry of right

Ref document number: 959627

Country of ref document: EP