DE60023576T2 - Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung - Google Patents

Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung Download PDF

Info

Publication number
DE60023576T2
DE60023576T2 DE60023576T DE60023576T DE60023576T2 DE 60023576 T2 DE60023576 T2 DE 60023576T2 DE 60023576 T DE60023576 T DE 60023576T DE 60023576 T DE60023576 T DE 60023576T DE 60023576 T2 DE60023576 T2 DE 60023576T2
Authority
DE
Germany
Prior art keywords
data
moving picture
data sequence
coding
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60023576T
Other languages
English (en)
Other versions
DE60023576D1 (de
Inventor
Minoru Kawasaki-shi Etoh
Tsutomu Kawasaki-shi Uenoyama
Osamu Iwasaki
Daisaku Komiya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of DE60023576D1 publication Critical patent/DE60023576D1/de
Application granted granted Critical
Publication of DE60023576T2 publication Critical patent/DE60023576T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Umwandlung von Bewegtbildern, die von einem Kodiersystem kodiert wurden, in andere Bewegtbilder die von einem anderen Kodiersystem kodiert wurden.
  • Mit dem Fortschritt von multimedialen Techniken zur gemeinsamen Behandlung von Sprache, Bild und anderen Daten werden konventionelle Informationsmedien wie eine Zeitung, Magazin, Fernsehen, Radio und Telefon, die Transportmittel von Informationen zu Menschen sind, Gegenstand für die Multimedia.
  • Im Allgemeinen besteht Multimedia nicht nur aus Zeichen, sondern ebenso aus weiteren Informationen wie Zeichnungen, Sprache oder besonders Bilder, die gleichzeitig mit den Zeichen verbunden sind. Um die obengenannten Informationsmedien zum Gegenstand von Multimedia zu machen, ist es die wesentliche Bedingung die konventionellen Informationen in einem digitalen Format darzustellen.
  • Die Abschätzung der Kodemenge für einzelne konventionelle Informationsmedien in digitaler Form ergeben 64 kb pro Sekunde für Sprache (Telefonqualität) und mindestens 100 Mb pro Sekunde oder mehr für bewegte Bilder (gegenwärtige Fernsehempfangsqualität), während die Kodemenge für ein Zeichen 1 bis 2 Bytes beträgt. Daher ist es nicht realistisch, solche großen Kodemengen in digitaler Form ohne eine Umwandlung zu bearbeiten.
  • Ein Videokonferenzsystem wird beispielsweise in einem Integrated Service Digital Networks (ISDN) in einem praktischen Anwendungsfall mit einer Übertragungsrate von 64 kbps bis 1,5 Mbps eingesetzt. Es ist jedoch nicht möglich, Fernseh- oder Kamerabilder ohne Umwandlung mittels ISDN direkt zu übertragen.
  • Daher ist eine Technik zur Datenkompression erforderlich. Ein Videokonferenzsystem benutzt beispielsweise eine Technik zur Kompression bewegter Bilder nach dem H.261 Standard und dem H.263 Standard, der von der ITU-T (Telecomunication Standardization Sector der International Telecommunication Union) international standardisiert ist.
  • Weiterhin sind gewöhnliche bewegte Fernsehbilder nach dem internationalen Kompressionsverfahren für den MPEG-Standard auf 2 bis 5 Mbps komprimiert.
  • Dabei bezeichnet MPEG (Moving Picture Expert Group) die Arbeitsgruppe (ISO/IEC JTC1/SC29/WG11) zur Standardisierung der Kodierung von Sprache und bewegten Bildern der ISO (International Organisation for Standardization), MPEG bezeichnet dabei ebenfalls die internationale Standardisierung der Datenkompression, die diese Gruppe gerade definiert. Im Augenblick ist gerade MPEG-4 durch die MPEG standardisiert, das das Kodieren und Verarbeiten auf der Basis von einem Objekt erlaubt, um die neuen Funktionen für die multimediale Technik zu ermöglichen.
  • Für die Kodierung von bewegten Bildern wird eine Vielzahl von Standards verwendet, was zu dem Problem führt, dass die kodierten Daten (im Folgenden als Datenstrom bezeichnet) in diesen Standards nicht zueinander kompatibel sind.
  • Obwohl zum Beispiel ein Dekodierer, der auf Grundlage von MPEG-4 spezifiziert ist, auch einen H.263 Datenstrom dekodieren kann, gibt es keine Kompatibilität der Datenströme zwischen den Kodiersystemen von H.261, H.263, MPEG-2 und MPEG-4 (mit anderen Worten, es ist nicht möglich eine Paar von Kodierer und Dekodierer zu verwenden, das auf unterschiedlichen Kodiersystemem basiert).
  • Diese Bedingung erfordert eine Vorrichtung, die Datenströme der verschiedenen Kodiersysteme ineinander umwandelt (im Folgenden als Transcoder bezeichnet).
  • 1 stellt ein prinzipielles Schaubild eines Transcoders dar. In 1 sind die beiden verschiedenen Kodiersysteme A und B vorhanden. Dekodierer 101 des Systems A und Kodierer 103 des Systems B sind mittels eines Vollbildspeichers und eines Umsetzers 102 miteinander verbunden.
  • System A sei zum Beispiel MPEG-2 (Bildgröße 704 × 480 Bildpunkte) und System B H.263 (Bildgröße 360 × 288 Bildpunkte). Obwohl die Bildgrößen voneinander verschieden sind, ist es möglich eine Umsetzung auszuführen, indem einmal der Datenstrom in ein Bild überführt wird und dann das Bild wieder kodiert wird.
  • Zusätzlich verwenden die H.261, H.263, MPEG-2 und MPEG-4 Kodiersysteme als gemeinsames Verfahren eine bewegungskompensierte diskrete Kosinustransformation (im Folgenden als MC-DCT bezeichnet). In einem MC-DCT Kodiersystem wird ein Bild in Blöcke eingeteilt, die als Microblöcke bezeichnet werden und eine Größe von 16 × 16 Bildpunkte umfassen. Es wird der Betrag eines Versatzes (Bewegungsvektor) berechnet, der den Unterschied zwischen nachfolgenden Bildern (Vollbildern) minimiert. Auf diesem Unterschied wird die diskrete Kosinustransformation (DCT) angewandt.
  • Dieser Vorgang zur Gewinnung eines Bewegungsvektors, der einen minimalen Unterschied zwischen zwei Vollbildern erzielt und damit ein Differenzbild erzeugt, aus dem daraufhin die Redundanz entfernt wird, nennt man Bewegungskompensation.
  • Die DCT wird verwendet, um die verbleibende Redundanz aus dem bewegungskompensierten Bild (Differenzbild) zu entfernen.
  • Zusätzlich wird das erste Vollbild nur durch die DCT kodiert, da eine Differenzkodierung mit einem weiteren Vollbild nicht ausgeführt werden kann. Ein solches Vollbild wird I-Bild genannt. Ein anderes allgemeines Bild, auf das die MC-DCT angewandt wird, wird P-Bild genannt.
  • Wird das oben beschriebene MC-DCT Kodiersystem in den Kodiersystemen A und B verwendet, kann durch die in 1 dargestellte Dekodierung eine zweite Information erhalten werden (im Folgenden als Zusatzinformation bezeichnet), die durch die MC-DCT Kodierung erzeugt wird und sowohl Bewegungsinformationen als auch und eine Quantisierung der DCT Koeffizienten enthält. Es ist zu erwarten, dass die Verwendung der Zusatzinformationen die Effizient von Berechnung und Code während der Aufzeichnung verbessert (Bildqualität und kodierter Inhalt).
  • Ein konventionelles Beispiel eines Transcoders, der Zusatzinformationen in einer Transformationsvorrichtung für bewegte Bilder verwendet, ist in der japanischen Patentanmeldung HEI10-271294 beschrieben.
  • 2 beschreibt das Prinzip dieser Vorrichtung.
  • Für den Fall, dass die Systeme A und B des in 1 dargestellten Transcoders sich auf MPEG-2 und H.263 beziehen, entsprechen die Elemente 101 bis 103 aus 1 den Elementen 202 bis 204 der 2.
  • Da beide Systeme des konventionellen Beispiels als ein gemeinsames Verfahren ein MC-DCT-Kodiersystem besitzen, ist es möglich die Bewegungsvektorsuche in der H.263-Kodierung zu auszulassen, in dem die Bewegungsvektoren aus der MPEG-2 Dekodierung skaliert werden (Transformation des absoluten Wertes durch eine Multiplikation mit dem Verhältnis der Bildgrößen).
  • Bei der Herstellung eines Transkoders in der Praxis gibt es jedoch neben der Weiterverwendung des Bewegungsvektoren noch eine Menge weiterer Dinge zu beachten. In einem operationellen Kodierer ist ein als Mengenanpassung bezeichneter Prozess unvermeidlich, der die Kodemenge des auszugebenden Datenstroms anzupasst.
  • Normalerweise wird ein Ausgabespeicher an der Ausgabeseite installiert, um Variationen der erzeugten Kodemenge abzufangen und die im Ausgabespeicher gespeicherten Daten (im Folgenden als eine in den Speicher geschriebene Kodemenge bezeichnet) entsprechend der erzeugten Kodemenge anzupassen.
  • In einem MC-DCT Kodiersystem wird der zu kodierende Inhalt durch eine variable Quantisierungsgenauigkeit der DCT-Koeffizienten angepasst (eine hohe Genauigkeit verbessert die Bildqualität und erhöht die erzeugte Datenmenge, während eine niedrige Genauigkeit zu dem gegenteiligen Ergebnis führt).
  • 3 zeigt ein schematisches Schaubild mit den wesentlichen Elementes eines Transcoders.
  • Der Ausgabeanschluss des Ausgabespeichers 304 ist mit einem Übertragungspfad oder einem Speichermedium verbunden. Falls der Übertragungspfad eine feste Übertragungsrate besitzt, so wird der Datenstrom mit einer konstanten Rate aus dem Ausgabespeicher ausgegeben. Der Kodierer 303 passt mit dem System B die erzeugte Kodemenge so an, dass die Daten im Speicher 304 nicht ausgehen (Unterlauf) oder zuviel werden (Überlauf). Um die Qualität des aufgezeichneten Bildes zu verbessern, ist es daher notwendig, Zusatzinformationen des Kodierverfahrens wie Quantisierung und Kodiermodus, zu verwenden. Arbeitet der Kodierer des Systems B unabhängig von dem Kodierverfahren des Systems A, so wird normalerweise zu dem Qualitätsverlust der Bildqualität, der von System A kommt, noch ein Bildqualitätsverlust durch von dem System B hinzukommen.
  • Der Datenstrom des Systems A wird zum Beispiel mit einer Rate von 10 Vollbildern/Sekunde kodiert. Wird das reproduzierte Ergebnis unabhängig davon mit einer Rate von 15 Vollbilder/Sekunde kodiert, so fällt nur eines von drei Vollbildern des Systems B mit einem Vollbild des Systems A zusammen. Mit anderen Worten, die Dekodierintervalle der andern beiden Vollbilder fallen nicht mit den ursprünglichen Bildern zusammen. Daher kann trotz einer Erhöhung der Vollbildrate die Bildqualität des Systems A nicht aufrechterhalten werden und die Qualität verschlechtert sich in manchen Fällen sogar noch weiterhin.
  • Das gleiche Phänomen tritt auch bei der Quantisierung der DCT Koeffizienten auf. Es wird angenommen, dass die Quantisierung durch eine Rundung auf ½ ausgeführt wird. Um eine Fehleranhäufung durch eine Neuquantisierung zu vermeiden, wird vorzugsweise die Quantisierung von System B ebenfalls auf ½ gerundet, um einen symmetrischen Kodeinhalt zu erhalten. Die Änderung der Vollbildrate, die Neuquantisierung der DCT-Koeffizienten und die Änderung der Bildgröße sind im weiten Sinne von Bewegtbildern alles Prozesse einer „Neuquantisierung". Für diese Neuquantisierung wird der Kodierer 103 des Systems B vorzugsweise abhängig von dem Dekodierer 301 des Systems A aus 3 betrieben.
  • Wie zuvor beschrieben, wird der Kodierer 303 des Systems B für eine Mengenanpassung vorzugsweise unabhängig von dem Dekodierer 301 betrieben, um die Neuquantisierung zu steuern, während der Füllstand des Ausgabespeichers überwacht wird. Andererseits arbeitet der Kodierer 303 des Systems B abhängig vom dem Dekodierer 301 des Systems A, um im breiten Sinne einer Neuquantisierung die Verschlechterung der Bildqualität zu verringern. Die konventionelle Technik eines Transcoders wird jedoch von dem Standpunkt einer Verbesserung einer effizienten Berechnung unter Zuhilfenahme von Zusatzinformationen entwickelt, beispielsweise zur Aufzeichnung mit skalierten Bewegungsvektoren. Dabei wird aber keine Technik beschrieben, die beides erreicht: eine Mengenanpassung und eine Verringerung der verschlechterten Bildqualität durch eine Neuquantisierung.
  • WO 98/19460 beschreibt einen Transcoder zur Änderung der räumlichen und zeitlichen Auflösung. Um eine einfachen und effiziente Umkodierung zu erzielen, werden die Bewegungsvektoren neu skaliert und direkt zur Kodiereinrichtung des Transcoders übertragen. Die Umkodieroperationen können entweder im Ortsbereich oder im Frequenzbereich ausgeführt werden. Um die räumliche Auflösung zu reduzieren, d.h. um die Vollbildrate zu verringern, wird vorgeschlagen, bidirektional geschätzte Vollbilder (B-Frames) zu verwerfen, da diese Vollbilder mit der geringsten Beeinträchtigung der verbleibenden Bildqualität übersprungen werden können.
  • Eine Modifikation eines Datenstroms wird in EP-A-0 711 077 beschrieben. Um die Datenrate an das Empfangsendgeräte anzupassen, kann die Übertragungsdatenrate erhöht oder verringert werden. Um eine erforderliche Zieldatenrate zu erreichten werden die DCT-Koeffizienten angepasst. Der Unterschied zwischen der erhaltenen Anzahl von Bits und dem Zielwert pro Makroblock wird berechnet und falls erforderlich werden die DCT-Koeffizienten angepasst.
  • In Anbetracht des Voraufgegangenen, ist es das Ziel der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zur Mengenanpassung vorzustellen, womit eine Verschlechterung der Bildqualität im umgewandelnden Bewegtbildkodiersystem vermieden wird.
  • Dies wird durch die Merkmale der unabhängigen Ansprüche erreicht.
  • Der erste Aspekt der vorliegenden Erfindung ist ein Verfahren und eine Vorrichtung zur sequentiellen Umwandlung vom Anfang der Daten einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und einen Interframe-Kodierungsmodus besitzt, in eine zweite Datenfolge, erzeugt von einem zweiten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und eine Interframe-Kodierungsmodus besitzt. Das Verfahren und die Vorrichtung
    • 1. Lesen die Daten eines Vollbildes der ersten Datenfolge, und lesen weiter den Kodiermodus des nachfolgenden Vollbildes; und
    • 2. Entscheiden, falls der vorausgelesene Kodiermodus des nachfolgenden Vollbildes der Intraframe-Kodiermodus ist, ob das gegenwärtige Vollbild kodiert werden soll oder nicht, um die erzeugte Kodemenge der zweiten Datenfolge, die in das zweite Kodiersystem umgeformt wurde, zu reduzieren.
  • Gemäß einem solchen Verfahren und einer solchen Vorrichtung ist es möglich, durch das Vorauslesen des Kodiermodus des nachfolgenden Vollbildes und die Anpassung der Kodemenge des gegenwärtigen Vollbildes entsprechend dem Kodiermodus des nachfolgenden Vollbildes und der Kodemenge des umwandelnden Systems, eine stabile Kodierung durchzuführen, die keinen Überlauf der Kodierung von I-Frames verursacht.
  • Ein zweiter Aspekt der vorliegenden Erfindung ist ein Verfahren und eine Vorrichtung zur Umwandlung einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, in eine zweite Datenfolge, erzeugt von einem zweiten Bewegtbildkodiersystem, wobei man zur sequentiellen Umwandlung der Daten von Anfang ein Bild- oder Vollbildteil durch Teilung des Vollbildes in Kodiereinheiten erhält. Das Verfahren und die Vorrichtung
    • 1. Bestimmen der Kodemenge auf der Basis von kodierten Einheit, in dem die Daten der erster Datenfolge auf der Basis von kodierten Einheiten gelesen werden; und
    • 2. Setzen eines Zielwertes für die erzeugte Kodemenge der zweiten Datenfolge auf einen Wert, dem man durch Multiplikation der bestimmten Kodemenge mit einem vorbestimmten Faktor berechnet, während man die Daten in kodierten Einheiten in das zweite Kodiersystem umformt, und anschließend die Mengenregulierung so ausführt, dass das Verhältnis der Kodemenge auf Basis von kodierten Einheiten der erster Datenfolge, dem Verhältnis der Kodemenge auf Basis der kodierten Einheiten der zweiter Datenfolge, die der ersten Datenfolge entsprechen, nahe kommt.
  • Gemäß einem solchen Verfahren und einer solchen Vorrichtung ist es möglich, die Aufzeichnung genau an die ursprüngliche Mengenregulierung anzupassen und eine Verschlechterung der Bildqualität aufgrund von sich angesammelten Fehler durch eine Neuquantisierung zu unterdrücken. Während die Daten in das zweite Bewegtbildkodiersystem umgeformt werden, wird die Kodemenge des ursprünglichen Vollbildes aufgezeichnet und ein Zielwert wird so eingestellt, dass die erzeugte Kodemenge der zweiten Datenfolge einem Wert entspricht, der durch Multiplikation der aufgezeichneten Kodemenge mit einem vorbestimmten Faktor erhalten wird.
  • Diese und weitere Ziele und Merkmale der Erfindung werden völlig durch die folgenden Beschreibung in Verbindung mit den dazugehörigen Zeichnungen erläutert, wobei die dargestellten Beispiele als Beispiele zu verstehen sind. Dabei:
  • 1 beschreibt ein Prinzipschaubild eines Transcoders;
  • 2 beschreibt ein Schaubild eines beispielhaften konventionellen Transcoders;
  • 3 beschreibt ein Schaubild das die Elemente eines Transcoders darstellt;
  • 4 beschreibt die Datenstruktur eines Bildes nach dem H.261 Standard,
  • 5 beschreibt die Datenstruktur des H.261 Standard;
  • 6 beschreibt die Datenstruktur eines Bildes gemäß eines einfachen MPEG-4 Profils;
  • 7 beschreibt die Datenstruktur eines einfachen MPEG-4 Profils;
  • 8 beschreibt die Zwischendaten in einem Transcoder;
  • 9 ist ein Flussdiagram für den gesamten Prozess des Transcoders;
  • 10 ist ein Flussdiagram zur Steuerung der Intra-Inter-Kodierung während der Umwandlung von H.261 nach MPEG-4;
  • 11 ist ein Flussdiagram für den Wechsel der kodierten Daten auf Makroblockebene zur Mengenregulierung während der Umwandlung von H.261 nach MPEG-4;
  • 12 ist ein Flussdiagram zur Steuerung des Intra-Inter-Kodierungsmodus während der Umwandlung von MPEG4 nach H.261;
  • 13 ist ein Flussdiagram für den Wechsel kodierter Daten auf Makroblockebene für die Mengenanpassung während der Umwandlung von MPEG-4 nach H.261;
  • 14 beschreibt ein Schaubild eines Transcoders der vorliegenden Erfindung;
  • 15 beschreibt ein Schaubild eines Transcoders von H.261 nach MPEG-4; und
  • 16 beschreibt ein Schaubild eines Transcoders von MPEG-4 nach H.261.
  • Die Ausführungsbeispiele beschreiben die Umwandlung eines Datenstroms eines Bewegtbildkodiersystems, der auf der Grundlage der ITU-T Empfehlung H.261 kodiert wurde in einen Datenstrom eines Bewegtbildkodiersystems auf der Grundlage des MPEG-4 Standards und einen weiteren Fall in dem die umgekehrte Umwandlung ausgeführt wird. Beide Systeme sind repräsentative Kodiersysteme, die auf der Grundlage eines MC-DCT-Systems und der hierzu in der ITU-T Empfehlung H.261 (H.261 Empfehlung, Line Transformation of non-telephone Signals 03/1993) beschriebenen Details, sowie der ISO-Standardisierungsdokumente (Dokumentennummer ISO/IEC JTC1/SC29/WG11 N2502 Dokumentenname INFORMATION TECHNOLOGY-GENERIC CODING OF AUDIO-VISUAL OBJECTS Part 2: Visual ISO/IEC 14496-2, veröffentlicht 10/1998). Als eine weitere Referenz eines H.261 Kodierers wird die Beschreibung von Referenzmodellen der Specialist Group on Coding for Visual Telephony, Dokumentnummer 525 vom Juni 1989 verwendet, die nicht durch die CCITT (gegenwärtig ITU-T) SG15 Arbeitsgruppe Teil 15/4 Standardisierung spezifiziert ist Zunächst wird die Datenstruktur des H.261 Standards erläutert.
  • 4 beschreibt die Bilddatenstruktur des H.261 Standards. Ein zu kodierendes Bild wird als QCIF (Quater Image Interface Format) bezeichnet. Es besitzt 176 Bildpunkte in horizontaler Richtung und 144 Bildpunkte in vertikaler Richtung. Das Bild wird in dem H.261 Standard ebenfalls in Makroblöcke mit einer Größe von jeweils 16 × 16 Bildpunkten unterteilt. Die Bewegungskompensation wird auf Makroblockebene durchgeführt, während die DCT- Kodierung auf DCT-Blockebene ausgeführt wird. Ein DCT-Block umfasst 8 × 8 Bildpunkte. Da 4 DCT-Blöcke für die Helligkeitswerte notwendig sind und 2 DCT-Blöcke für die Farbdifferenzwerte (jeweils einer für Cb und Cr) deren Auflösung in horizontaler und vertikaler Richtung halb so groß ist wie die der Helligkeitsinformation, besteht ein Makroblock aus 6 DCT-Blöcken. Ein Block, der drei Zeilen von Makroblöcken umfasst wird als GOB (Group of Blocks/Gruppe von Blöken) bezeichnet.
  • 5 beschreibt die kodierte Datenstruktur auf Grundlage des H.261 Standards. Für die Erklärung wird der Datenstrom in vier Ebenen aufgeteilt. Der Datenstrom besteht aus sich wiederholenden Bildern. Er ist aus einem PSC (Picture Start Code/Bildstartcode), am Anfang, gefolgt von einer Zeitreferenz (temporal reference, TR) und dann einem PTYPE (Picture Type/Bildtyp) zusammengesetzt. Bei H.261 gibt PTYPE die Größe und den Wiederherstellungsmodus an. Es wird nicht angegeben, ob das Vollbild intraframe kodiert (intrakodiert) oder interframe kodiert (interkodiert) wurde. Danach wird die GOB-Ebene wiederholt (im Falle von QCIF dreimal).
  • Der Kopf einer GOB-Ebene beginnt mit einem GBSC (GOB Startcode). Es werden eine GN (GOB Nummer), gefolgt von GBSC und dann GQUANT (Daten zur Charakterisierung der Quantisierung) übertragen. In H.261 wird die Quantisierung der DCT-Koeffizienten durch eine Skalierung des Quantisierung in einen ganze Indices zwischen 1 und 31 für die Interkodierung durchgeführt, während für die Intrakodierung ein einzelner Typ einer solchen Quantisierung entsprechend dem Index 8 ausgeführt wird.
  • Die Quantisierungsaufteilung der DCT-Koeffizienten für eine GOB wird in GQUANT angegeben. Makroblockdaten werden am Ende der GOB-Ebene wiederholt. Die Makroblockdaten beginnen mit einer MBA (Makroblockadresse), die eine relative Position angibt, an der sich gültiger Code befindet. In der MC-DCT-Kodierung wird ein bewegungsloser Bereich in einem Bild wiedergegeben, ohne eine Bewegungsvektor und einen DCT-Koeffizienten zu übertragen.
  • In einem solchen Bereich ist es nicht erforderlich, die Daten des Makroblocks zu übertragen, was als Überspringen von Makroblöcken bezeichnet. Hierzu wird ein MBA verwendet. MTYPE (type data/Typedaten) wird dazu verwendet, um die Kodierung eines Makroblocks als Interframe oder Intraframe anzugeben. Bei der MC-DCT-Kodierung, mit Ausnahme von H.281, wird im Allgemeinen der Wechsel zwischen Intrakodierung und Interkodierung zusätzlich zum Wechsel auf Vollbildebene auch auf der Ebene von Makroblöcken ausgeführt.
  • Der MTYPE beinhaltet weiterhin auch die Information, ob der Makroblock einem Schleifenfilter zugeführt wurde. Ein Schleifenfilter ist eine spezielle Prozessierung in H.261 (nicht in den anderen Standards enthalten), um ein bewegungskompensiert es, vorherbestimmtes Bild durch lokale Filterung zu mitteln. Da die Effizienz der Vorhersage in manchen Fällen gesteigert werden kann, wird das Schleifenfilter adaptiv verwendet. MQUANT (Eigenschaften der Quantisierung) geben die Abstufungen der Quantisierung der DCT-Koeffizienten in einer durch GQUANT bestimmten GOB an und werden übertragen, falls dass die Abstufungen der Quantisierung auf Makroblockebene geändert werden muss. MVD (Motion Vector Data/Bewegungsvektordaten), gibt den für die Bewegungskompensation verwendeten Bewegungsvektor an. CBP (Coded Block Pattern/Muster der kodierten Blöcke) gibt ein kennzeichnendes Blockmuster an.
  • Unter den 6 DCT-Blöcken ist es nicht notwendig, einen Block zu übertragen, dessen DCT-Koeffizienten alle Null sind. Daher werden nur DCT-Koeffizienten übertragen, wenn CBP einen Block mit von Null verschiedenen DCT-Koeffizienten aufweist.
  • Als nächstes wird der MPEG-4 Standard beschrieben.
  • MPEG-4 hat verschiedene Funktionen, die als Profile bezeichnet werden, und die abhängig von den jeweiligen Anwendungen verwendet werden. Die Ausführungsbeispiele verwenden ein möglichst einfaches Profil, das eine Umwandlung betrifft.
  • 6 beschreibt die Bilddatenstruktur von MPEG-4. Die Bildgröße wird durch ein QCIF-Bild mit der doppelten horizontalen und vertikalen Größe wie ein CIF-Bild (Common Interface Format/gemeinsames Schnittstellenformat) definiert. In MPEG-4 ist die Bildgröße jedoch beliebig und auch nicht auf ein Vielfaches von 16 beschränkt. Weiterhin ist in MPEG-4 auch das Bildverhältnis beliebig (das Verhältnis von vertikalen Linien zu horizontalen Linien bei rechteckigen Bildpunkten). Diese Verhältnis ist 4:3 bei H.261.
  • Um die Ausführungen im Folgenden zu vereinfachen, erfüllen die hier betrachteten Bildgrößen alle die H.261-Spezifikationen.
  • Anstelle einer GOB wird in MPEG-4 eine Struktur definiert, die Videopaket genannt wird. Im Gegensatz zur GOB, die man durch unterteilen des Bildes in feste Rechtecke erhält, ist der Startpunkt eines Videopakets für jeden Makroblock beliebig. Die übrigen Strukturen eines DCT-Blocks sind annähernd die gleichen wie bei H.261 und daher in 6 nicht dargestellt.
  • Ein Bild oder Vollbild wird in MPEG-4 als Videoobjektebene (Video Object Plane) bezeichnet (im Folgenden als VOP bezeichnet).
  • Ein Datenstrom beginnt in MPEG-4 mit einem VSC (ein VOP Startcode), gefolgt von VTYPE (der VOP Kodiertyp), der angibt, ob das Vollbild intraframe kodiert (intrakodiert) oder interframe kodiert (interkodiert) ist. Bei H.261 gibt TR (Temporal Reference/Zeitreferenz) als Zeitangabe die Vollbildnummer an. In MPEG-4 dagegen ist die Zeit bezüglich eines Referenzvollbildes direkt in einer MTB (Module Time Base) in Sekunden und in einem VTI (Video Time Incerement) für Einheiten kleiner als eine Sekunde angegeben. Dies ist in den oben genannten Druckschriften detailliert beschrieben und daher wird hierauf nicht weiter eingegangen. Die Daten der Quantisierungseigenschaften zur Beschreibung der Abstufung der Quantisierung werden in VQUANT angegeben, das GQUANT aus H.261 entspricht. Vor dem Paketheader wird eine RSM (Resync Marke/Resynchronisationsmarke) eingefügt, um im Falle von Übertragungsfehlern direkt eine neue Synchronisation durchführen zu können. Der Videopaketheader enthält die Daten bezüglich einer VOP, die nach der Neusynchronisation benötigt werden.
  • Die Daten eines Makroblocks beginnen mit NCD (Not Coded, invalid flag/nicht kodiert, ungültig-Flag). Bei H.261 wird ein ungültiger Makroblock durch Verwendung einer relativen Adresse des nächsten gültigen Makroblocks übersprungen. In MPEG-4 dagegen wird ein ungültiger Makroblock durch ein Flag von einem Bit dargestellt. MCPBC (Makroblocktyp und das kodierte Blockmuster der Farbdifferenz) wird auf die gleiche Weise verwendet wie MTYPE für einen Wechsel zwischen Intrakodierung und Interkodierung.
  • Da MPEG-4 kein Schleifenfilter beinhaltet, enthält MCBPC auch keine Angabe über eine Schleifenfilterung. Dafür gibt MCBPC ein Muster der gültigen/ungültigen DCT-Blöcke des Signals an. Mit anderen Worten, MCBPC beinhaltet neben anderen Daten des CBP aus H.261 auch Daten bezüglich des Farbdifferenzsignals. Hinsichtlich eines Musters für die Gültigkeit/Ungültigkeit der Helligkeitswerte eines DCT-Blocks, umfasst CBPY (signifikantes Blockmuster der Helligkeitsinformation) eine Folge von 4 Helligkeitsblöcken.
  • DQUANT wird für den Wechsel der Quantisierungsabstufung der DCT-Koeffizienten auf Makroblockebene verwendet. Die Erhöhung oder Verringerung des Wertes erstreckt sich, im Unterschied zu MQUANT, auf den Bereich von –2 bis +2. MVD (Motion Vector Data/Bewegungsvektordaten) gibt den zur Bewegungskompensation verwendeten Bewegungsvektor an. Die Genauigkeit ist bei H.261 im Bereich ganzer Bildpunkte, während MPEG-4 eine Genauigkeit von einem halbe Bildpunkt (0,5 Bildpunkte) besitzt. Die Struktur eines DCT-Koeffizientenblocks ist annähernd die gleiche wie bei H.261.
  • Wie oben beschrieben, haben MPEG-4 in seiner einfachsten Struktur und H.261 die gleiche grundlegende Struktur für die MC-DCT. Obwohl die Datenstruktur in MPEG-4 in einer anderen Art (Beschreibung der Kodierung) dargestellt wird als in H.261, gibt es zahlreiche Übereinstimmungen zwischen den beiden Daten. Die wesentlichen Unterschiede zwischen H.261 und MPEG-4 zur Umwandlung der Kodiersysteme sind folgende:
  • Bewegungskompensation
    • H.261: Ganzzahlige Genauigkeit und Schleifenfilter
    • MPEG-4: Genauigkeit von einem halben Bildpunkt Der Suchbereich kann durch eine F-Wert genannte Abstufung verändert werden; und es existiert ein Modus, in dem vier Bewegungsvektoren pro Makroblock vorhanden sind.
  • Quantisierung der DCT-Koeffizienten
    • Lineare Quantisierung mit der gleichen Abstufung der Quantisierung in H.261 und MPEG-4.
  • Bezüglich der Komponenten für den Gleichanteil hat MPEG-4 im Intrakodiermodus zusätzlich einen nichtlinearen Quantisierungsmodus, während die Intrakodierung in H.261 den Quantisierungsindex auf 8 festlegt.
  • Aufgrund der oben genannten Unterschiede kann ein Transcoder eine Konfiguration besitzen, in der die DCT-Koeffizienten direkt übertragen werden. Hierzu existiert eine in 3 dargestellte Konfiguration, in der die Daten auf Grundlage des Systems A (H.261 oder MPEG-4) in Daten auf Grundlage des Systems B (MPEG-4 oder H.261) übertragen werden.
  • Die von System A kodierten Daten werden zunächst dekodiert und das dekodierte Bild wir im Vollbildspeicher 302 gespeichert.
  • In diesem Fall werden Zusatzinformationen berücksichtigt. Diese Zwischendaten für die Kodeumsetzung sind in 8 dargestellt.
  • 8 beschreibt Speicherbereiche im Speicher, in denen die entsprechenden Daten gespeichert werden, wie es in einem späteren Ausführungsbeispiel beschrieben wird.
  • Die Bedeutung der einzelnen Daten ist nachfolgend erläutert. Wie anhand der oben beschriebenen Datenstruktur ersichtlich ist, können diese Daten als Zwischendaten verwendet werden.
    • • Der Kodiermodus des nächsten Vollbildes ist NPTYPE = („I", „P", „U") Durch ein Vorauslesen während der Dekodierung im System A bestimmt. VTYPE in MPEG-4, und „U": unbestimmt in H.261.
    • • Der Inhalt des gegenwärtigen Vollbilds Pcontent (Einheit: kbits) Durch die Dekodierung eines Vollbildes des Systems A erhalten. Wird die Aufzeichnung ausgeführt nachdem das Vollbild vollständig dekodiert wurde, entspricht der Inhalt der Kodemenge der eines Vollbildes. Beginnt die Aufzeichnung mitten während der Dekodierung des ursprünglichen Vollbildes, so ist der Inhalt äquivalent zu der Kodemenge die zu dem Zeitpunkt erhalten wurde an den die Dekodierung ausgesetzt wurde.
    • • Der Kodiermodus des gegenwärtige Vollbilds PTYPE = („I", „P") „I" bezeichnet die Intrakodierung und „P" bezeichnet die Interkodierung. In H.261 bedeutet „1", dass alle Makroblöcke intrakodiert sind und „P" bezeichnet alle übrigen Fälle, mit Ausnahme des oben genannten. Dies wird im Folgenden durch PREDi,j beschrieben.
    • • Nummer des gegenwärtigen Vollbildes TR (ganze Zahl) Wird in MPEG-4 durch MTB und VTI erhalten.
    • • Gültig/ungültig Flag CD i,j = [0, 1, „U"] Dieses Flag kennzeichnet einen Makroblock mit gültig:0 oder ungültig:1. I und j kennzeichnen die entsprechende horizontale und vertikale Position den Makroblocks. „U" steht für "unbestimmt". Beispielsweise wird der Fall eines neu zu kodierendes P-Bildes des Systems A, um ein 1-Bild im System B zu erhalten mit „unbestimmt" bezeichnet.
    • • Block gültig/ungültig Flag CPB i,j,k = [0, 1, „U"] Dieses Flag gibt für einen DCT-Block gültig oder ungültig an. In MPEG-4 wird dies durch MCBPC und CBPY bestimmt. Da Y × 4, Cr × 1 und Cb × 1, nimmt k Werte zwischen 0 und 5 an.
    • • Abstufung der Quantisierung QUANT i,j = (1, –,31, „U"] Dieser Index gibt die Abstufung der Quantisierung auf Makroblockebene an.
    • • Kodiermodus MTYPE i,j = ["I", "P", „U"] Gibt den Intra- oder Interkodiermodus auf Makroblockebene an. „U" steht für „unbestimmt".
    • • Bewegunsvektor (MVXi,j, MVYi,j) Der Wertebereich ist [–15, –, 15, „U"] Die absoluten horizontalen und vertikalen Werte des Bewegungsvektors mit ganzzahliger Genauigkeit, um eine Übereinstimmung mit H.261 zu erreichen, das ebenfalls ganzzahlige Genauigkeit verwendet.
    • • Intraperiode PERIOD i,j = ganze Zahl zwischen [0, 99] In einem MC-DCT-System addieren sich aufgrund der Abweichungen zwischen Kodierung und Dekodierung die Ungenauigkeiten der DCT Berechnungen. Um damit fertig zu werden, soll ein Makroblock innerhalb einer Periode von 132 Vollbildern intrakodiert werden. Diese Operation wird „Intra-refreshing" genannt. PERIOD ist ein Zähler, um das Intra refreshing regelmäßig auszuführen. Der Standardwert ist 0.
    • • Bewegungsbereich Flag MOVi,j = [0, 1, „U"] Dieses Flag gibt an, ob eine Makroblock einen Bereich mit Bewegung enthält. „1" weist auf einen Bereich mit Bewegung hin. In diesem Ausführungsbeispiel weist ein absoluter Wert eines der Elemente (MVX1,j, MVYi,j) von 1 oder größer auf eine Bereich mit Bewegung hin.
  • Die Datenstruktur von H.261 und MPEG-4 wurden oben beschrieben. Im Folgenden wird nun ein gemeinsames Flussdiagramm des ersten und zweiten Ausführungsbeispiels beschrieben.
  • Während der Initialisierung werden zunächst alle i und j von PERIODi,j zu Null gesetzt. Diese Daten betreffen die Steuerung der Intra-Inter-Kodierung auf Makroblockebene.
  • Als nächstes werden entsprechende den Schritten für die Rekonstruktion eines Bildes aus dem System A (H.261 oder MPEG-4) und die Generierung der Zwischendaten, das rekonstruierte Bild und die Zwischendaten PTYPE, TR, CDi,j, CBPi,j,k, QUNATi,j, MTYPEi,j, (MVXi,j, MVYi,j) und MOVi,j erzeugt.
  • Daraufhin gelten folgende Grundprinzipien eines Transcoders:
    • Grundprinzip 1: Die in System A erzeugten Zusatzinformationen PTYPE, TR, CD i,j, CBP i,j,k, QUANT i,j und MTYPE i,j werden zur Weiterverwendung an das System B weitergeleitet. Durch eine Neuquantisierung kann eine durch sich ansammelnde Fehler verschlechternde Bildqualität vermieden werden. Weiterhin werden einige der in System A erzeugten Zusatzinformationen zur Mengenanpassung geändert. Das zur Änderung angewandte Verfahren wird weiter unten beschrieben.
    • Grundprinzip 2: Die Daten der Bewegungsvektoren (MVXi,j und MVYi,j) werden als Referenzdaten für die Aufzeichnung im System B verwendet. Mit anderen Worten, hat der Bewegungsvektor einen fest Wert, so wird in der Nachbarschaft dieses festen Wertes eine neue Position gesucht, so dass der Bewegungsvektor eine Differenz minimiert.
  • In 9 bezeichnet sich das Flussdiagramm, nachdem die Zwischendaten erzeugt wurden. Falls der Kodiermodus des gegenwärtigen Vollbildes der Interkodier-Modus ist, der Kodiermodus des nachfolgenden Bildes der Intrakodiermodus ist und die in den Speicher geschriebene Kodemenge folgende Bedingung erfüllt:
    Pcontent (Angesammelte Kodemenge des Vollbildes) > halbe Speicherkapazität,
    so wird das gegenwärtige Vollbild verworfen, die Kodierung des Bildes wird abgebrochen und das nachfolgende Vollbild wird intrakodiert.
  • Weiterhin wird der gleiche, oben beschriebene Vorgang ebenfalls ausgeführt, wenn die Seite des Dekodierers eine Intrakodierung für das nächste Vollbild erzwingt.
  • In einer MC-DCT-Kodierung ist ein intrakodiertes Vollbild, I-Bild genannt, wichtig, da die Vollbilder, die einem I-Bild folgen ohne das I-Bild nicht dekodiert werden können. Wenn die verbleibende Kapazität die Ausgabespeichers relativ gering ist, besteht die Gefahr, dass es durch eine Aufzeichnung nach dem oben genannten Grundprinzip 1 in dem Ausgabespeicher zu einem Datenüberlauf während der Aufzeichnung eines I-Bildes kommt. Wird ein I-Bild aufgrund eines Überlaufs nicht kodiert, so verschlechtert sich die Bildqualität. Daraufhin wird NPTYPE des nachfolgenden Vollbildes vorausgelesen und das Kodierverfahren des Systems B wird entsprechend von NPTYPE des nachfolgenden Vollbildes und des gegenwärtigen Füllstandes des Speichers (Bcontent) angepasst. Mit anderen Worten, wenn das nachfolgende Vollbild ein I-Bild ist und die Möglichkeit eines Datenüberlaufs im Ausgabespeichers während de Aufzeichnung des I-Bildes besteht, wird das gegenwärtige Vollbild (P-Bild) verworfen. Dadurch wird sichergestellt, dass die Kapazität des Ausgabespeichers für das I-Bild ausreicht, das das nächste aufzuzeichnende Vollbild ist. Dieses Konzept ist in 9 dargestellt.
  • Das eine Angabe über Intra- oder Interkodierung in H.261 nicht im Header des Vollbildes enthalten ist, ist die bedingte Verzweigung in 9 nur bei einer Transformation von MPEG-4 nach H.261 anwendbar.
  • Im Falle von „nein" in der verzweigten Bedingung aus 9 (immer „nein" bei einer Transformation von H.261 nach MPEG-4) wird zur Steuerung der Intra-Inter-Kodierung verzweigt. Zur Weiterverarbeitung nach dieser Steuerung beschreibt das erste Ausführungsbeispiel ein Umsetzungsverfahren von H.261 nach MPEG-4 und das zweite Ausführungsbeispiel beschreibt ein Transformationsverfahren von MPEG-4 nach H.261.
  • Im ersten Ausführungsbeispiel wird eine Transformation gemäß den Flussdiagrammen der 9 bis 11 ausgeführt. In den fett umrandeten Schritten aus 9 wird eine Steuerung (S10) des Intra-Inter-Kodiermodus ausgeführt, wie sie in 10 dargestellt ist. Ferner wird ein Wechsel der kodierten Daten auf Makroblockebene zur Mengenregelung durchgeführt, wie sie in dem Flussdiagram in 11 dargestellt ist.
  • Dabei wird für den Fall einer Mengenanpassung angenommen, dass die Kodierrate in H.261 64 kbps ist, und die Kodierrate in MPEG-4 ebenfalls 64 kbps ist. Die Speichergröße des Ausgabespeichers sei 6,4 kbit.
  • 10 stellten eine Steuerung des Intra-Inter-Kodiermodus dar.
  • Wird eine H.261 Datenfolge in eine MPEG-4 Datenfolge transformiert, so wird eine vorbestimme Anzahl von Makroblöcken (in diesem Ausführungsbeispiel 3) in absteigender Reihenfolge aus den zu dem Bereich der Bewegung gehörenden Makroblöcken ausgewählt, und als Kodiermodus der ausgewählten Makroblöcke wird der Intra-Kodiermodus erzwungen.
  • Gemäß dem oben beschriebenen Vorgehen werden die fehlerbeständigen Eigenschaften des MPEG-4 Datenstroms verbessert, da eine Intra-Kodierung der Makroblöcke hauptsächlich in den Bereich der Bewegung ausgeführt wird. Dies liegt daran, dass ein Übertragungsfehler, der en einem unbewegten Bereich auftritt auch den Bereich der Bewegung verschlechtert, da das Ergebnis des vorherigen Vollbilds erneut kopiert wird.
  • 11 beschreibt die Prozessierungschritte für die Aufzeichnung von Makroblöcken des Interkodiermodus. Als Bewegungsvorhersage wird das im Grundprinzip 2 des Transcoders aufgezeigte Vorgehen ausgeführt.
  • Zu diesem Zeitpunkt werden VAR und VAROR berechnet.
  • VAR ist dabei das mittlere Quadrat der bewegungskompensierten Interblock-Differenzbildpunkte (Helligkeitsvarianz) und beschreibt die Energie des Interframe-Differenzsignals. VAROR gibt das mittlere Quadrat eines Intrablock-Bildpunktes des Eingangssignals an (Helligkeitsvarianz) und stellt die Energie des Intraframe-Signals dar. RM8 (in der oben zitierten Druckschrift beschrieben) als ein typisches Beispiel eines H.261-Kodierers bestimmt mittels VAR und VAROR, ob der Kodiermodus eines Makroblocks der Inter- oder Intra-Kodiermodus ist. Im Besonderen wird die Interkodierung ausgeführt, wenn VAR < 64, d.h. das Energieniveau des Interframe-Differenzsignals absolut klein ist, oder VAR < VAROR, d.h das Energieniveau des Interframe-Differenzsignals ist kleiner als das Energieniveau des Interaframe-Signals.
  • Für die Interkodierung wird die Mengenanpassung ausgeführt, um die erzeugte Kodemenge so anzupassen, dass die Kodemenge im Speicher (Bcontent) nahe an die festgelegte Kodemenge herankommt. In diesem Ausführungsbeispiel, wird die festgelegte Kodemenge auf der Grundlage folgender Gleichung berechnet: festgelegte Kodermenge = Pcontent × (MPEG-4 Kodierrate/H.261 Kodierrate) × Anzahl der gerade prozessierten Makroblöcke/Gesamtzahl der Makroblöcke
  • In diesem Ausführungsbeispiel sind die beiden Kodierraten 64 kbps, (MPEG-4 Kodierrate/H.261 Kodierrate) ist 1 (= 1).
  • Da die festgelegte Kodemenge (mit anderen Worten der erzeugte kodierte Inhalt) auf der Grundlage von Pcontent berechnet wird, ist es möglich die ursprünglich ausgeführte Mengenanpassung zu erzielen, während die Quantisierungskontrolle von H.261 so weit wie möglich beibehalten wird. Beispielsweise kann die Mengenregulierung so ausgeführt werden, dass das Verhältnis der Kodemengen auf Basis der kodierten Einheiten der Datenfolge aus System A nahe an das Verhältnis der Kodemenge auf Basis der kodierten Einheiten der Datenfolge aus System B kommt.
  • Zusätzlich wird ein Faktor „r" mit dem VAR multipliziert wird, wie folgt berechnet: r = max (1,0, festgelegte Kodemenge/erzeugte Kodemenge)
  • Folglich ist VAR größer als 1 falls die erzeugte Kodemenge kleiner als die festgelegte Kodemenge ist. Dementsprechend wird VAR = VAR·r gesetzt, um VAR zu erhöhen, für den Fall, dass die verbleibende Kapazität des Ausgabespeichers relativ groß ist (die erzeugte Kodemenge ist kleiner als die festgelegte Kodemenge), so dass öfter der Intra-Kodiermodus gewählt wird. Hierdurch wird der Modus gesteuert.
  • Für die allgemeine Steuerung eines Kodierers werden zur Verbesserung der Bildqualität die Quantisierungsstufen verkeinert, wenn die Datenrate relativ groß ist. In einer systemumsetzenden Kodierung gemäß der vorliegenden Erfindung dagegen, die, wie oben beschrieben, vorzugsweise die Quantisierungsmerkmale möglichst nicht ändert, wird die Anzahl der Vollbilder des Intra-Kodiermodus (1-Bilder) erhöht, damit die Änderungen der Quantisierungsstufen minimiert wird. Diese Prozessierung verbessert die fehlerbeständigen Eigenschaften hinsichtlich Übertragungsfehler, wie den Verlust eines Paketes. Da angenommen werden kann, dass MPEG-4 eine höhere Effizienz der Kodierung erzielt als H.261, wird für eine Umsetzung mit der gleichen Datenrate im Allgemeinen der oben beschriebene Vorteil erreicht, in dem die Steuerung öfter den intra-kodierten Modus wählt, solange noch Kapazität im Ausgabespeicher übrig ist.
  • Zusätzlich ist der letzte Schritt in dem in 11 dargestellten Flussdiagramm die Steuerung von QUANT i,j. In RM8 erhält man die Abstufung der Quantisierung für den Fall von 64 bkps, durch die folgende Gleichung: Quantisierungsabstufung = 2 × int(Kodemenge im Speicher[bit]/200 + 2
  • Die Anpassung der Abstufung der Quantisierung auf Grundlage der oben genannten Gleichung erhält eine Rückmeldung, dass die Quantisierungsabstufung vergrößert wird, falls sich die Kodemenge im Speicher erhöht. Damit wird die erzeugte Kodemenge verringert.
  • Unter Berücksichtigung der Beziehung zwischen den sich angesammelten Quantisierungsfehlern und dem erzeugten binären Inhalt, wird die Abstufung der Quantisierung in diesem Ausführungsbeispiel wie folgt geändert:
    Kodemenge im Speicher > 70% der Speicherkapazität
    Quantisierungsabstufung = QUANT i,j × 2
    Kodemenge im Speicher > 80% der Speicherkapazität
    Quantisierungsabstufung = QUANT i,j × 3
    Kodemenge im Speicher > 90% der Speicherkapazität
    Quantisierungsabstufung = QUANT i,j × 4
  • Da bei MPEG-4 der Wert von QUANT i,j zwischen benachbarten Makroblöcken nur um maximal 2 verändert werden darf, ist die Änderung der Abstufung zusätzlich auf maximal 2 beschränkt.
  • Daher wird zuerst die Kodiermodus so gesteuert, dass die Kodemenge im Speicher nahe an den Zielwert für den kodierten Inhalt kommt. Wenn es weiterhin notwendig ist die Quantisierungseigenschaften (Abstufung der Quantisierung) zu ändern, wird die Quantisierungsabstufung des Systems B auf ein ganzzahliges Vielfaches der Abstufung der Quantisierung des Systems A gesetzt.
  • Wie oben beschrieben, ist das erste Ausführungsbeispiel ein Beispiel für eine Verfahren zur Mengenanpassung unter Beibehaltung der Eigenschaften der Quantisierung vor der Umwandlung des Systems.
  • Falls die verbleibende Kapazität im Ausgabespeicher relativ groß ist, wird in diesem Ausführungsbeispiel zusätzlich die Anzahl der Makroblöcke, die intra-kodiert werden sollen erhöht, indem der Wert VAR neu definiert wird. Es ist jedoch auch möglich, einen Wert N, der die Intra-Wiederholrate eines zu einem Bewegungsbereich gehörenden Makroblocks beschreibt, zu erhöhen oder zu erniedrigen.
  • Als nächstes wird das zweite Ausführungsbeispiel beschrieben.
  • Das zweite Ausführungsbeispiel beschreibt ein Umwandlungsverfahren von MPEG-4 nach H.261. Die Umwandlungsoperationen diese Ausführungsbeispiels werden entsprechend den in den 9, 12 und 13 dargestellten Ablaufdiagrammen ausgeführt.
  • Zwischen den fett umrandeten Schritten wird eine Steuerung der Intra-Inter-Kodierung entsprechend des Ablaufdiagrams aus 12 und eine Änderung der Kodierdaten auf Makroblockebene entsprechend des Ablaufdiagramms aus 13 ausgeführt.
  • Um die Beschreibung zu vereinfachen, werden hauptsächlich die Unterschiede zum ersten Ausführungsbeispiel erläutert.
  • Dabei wird angenommen, dass zur Verbesserung der Fehlerbeständigkeit mehr Makroblöcke als erforderlich intra-kodiert werden, obwohl MPEG-4 eine bessere Kodeeffizienz als H.261 besitzt.
  • Die in 12 dargestellte Steuerung des Intra-Inter-Kodiermodus setzt mit Ausnahme von Makroblöcken mit einer maximalen PERIODi,j, oder einem Makroblock dessen PERIODi,j die gesamte Anzahl von Makroblöcken (99) übersteigt den Kodiermodus der intrakodierten Makroblöcken zu „U" (unbestimmt). Somit verbleiben selbst in dem Fall, dass das gegenwärtige Vollbild sich im Inter-Frame Kodiermodus befindet, nur eine minimale Zahl von intra-kodierte Makroblöcke, und der Kodiermodus der übrigen intra-kodierten Makroblöcke ist zu „U" (unbestimmt) gesetzt. Folglich tritt der Fall auf, dass die übrigen intra-kodierten Makroblöcke im nächsten Schritt (13) nochmals inter-kodiert werden.
  • Für den Fall, dass die Daten von einem System B mit einer hohen Kodiereffizient in ein System A mit einer niedrigen Kodiereffizienz umgewandelt werden, besteht die Möglichkeit eines Datenüberlaufs im Ausgabespeicher, wenn I-Bilder (intra-kodierte Bilder) aus der Datenfolge B des Systems B alle in die Datenfolge A des Systems A umgewandelt werden, da die Kodemenge eines I-Bildes größer ist als die eines P-Bildes (inter-kodiertes Bild). In diesem Ausführungsbeispiel wird die Anzahl der Makroblöcke, die intra-kodiert werden verringert, um einen Überlauf des Speichers vorzubeugen, ohne die Abstufung der Quantisierung zu verändern. Mit anderen Worten, die Anzahl der Makroblöcke die interkodiert werden sollen wird relativ erhöht.
  • Die in 13 dargestellte Entscheidung der Intra-Inter-Kodierung ist ein allgemeines Entscheidungsverfahren aufgrund der in RM8 beschriebenen Werte VAR und VAROR. Die Kontrolle von QUANT i,j als letzten Schritt in 13 ist die gleiche wie in dem ersten Ausführungsbeispiel und wird daher nicht weiter erläutert.
  • Gemäß des zweiten Ausführungsbeispiels, in dem eine Umwandlung in das H.261 System erfolgt, und das im Allgemeinen eine Kodiereffizienz besitzt, die geringer ist als die von MPEG-4, wird der Kodiermodus geändert indem intra-kodierte Makroblöcke in inter-kodierte Makroblöcke umgewandelt werden. Hierdurch kann ein Überlauf des Speichers verhindert werden, ohne dabei die Abstufung der Quantisierung anderer Makroblöcke zu beeinflussen. Als nächstes werden zwei Ausführungsbeispiele einer Vorrichtung zur Umwandlung der Bildkodierung beschrieben. 14 stellt das Konzept-Schaubild eines Codeumwandlers dar, wie er dem dritten und vierten Ausführungsbeispiel gemeinsam zu Grunde liegt und der das Verfahren nach 9 ausführt.
  • Die in 8 beschriebenen Zwischendaten werden im dem Vollbild-Kodiermodus-Speicher 406, dem Bewegungsvektor-Speicher 407, dem Makroblock-Kodierspeicher 408 und dem Mengenanpassungs-Informationsspeicher 409 gespeichert. Der Kodiersteuerabschnitt 405 führt die in 9 beschriebene Steuerung aus. Der Abschnitt für den Wechsel des Vollbild-Kodiermodus 410 und der Abschnitt für den Wechsel des Makroblock-Kodiermodus führen jeweils einen Wechsel als Antwort auf das Steuersignal durch.
  • 14 stellt einen Aufbau dar, in dem die Daten PTYPE, TR, CDi,j, CBPi,j,k, QUANT i,j und MTYPEi,j unverändert zum Kodierer des Systems B gelangen, solange der Kodier-Controller 405 kein Steuersignal überträgt.
  • Die Einzelheiten von 14 sind in 15 dargestellt, die eine Vorrichtung entsprechend dem Verfahren des ersten und des dritten Ausführungsbeispiels darstellt. 15 zeigt einen H.216 Dekodierer wobei 501 der Abschnitt der variablen Längenkodierung, 502 der Anschnitt der eine inverse Quantisierung zur Ausführung der inversen Quantisierung, 503 der Abschnitt einer inversen DCT, der eine inverse DCT ausführt, 504 ein Addierer, 505 ein Vollbildspeicher, 506 ein Abschnitt zur Bewegungskompensation, der eine Bewegungskompensation ausführt und 507 ein Schleifenfilter ist. Das dekodierte Bild wird über den Vollbildspeicher 505 an den MPEG-4-Kodierer geleitet.
  • Der MPEG-4 Kodierer setzt sich zusammen aus einem Subtrahierer 508, einem DCT-Abschnitt 509, der eine DCT-Berechnung ausführt, einem Quantisierungsabschnitt 510, der DCT-Koeffizienten quantisiert, einem Addierer 513, einem Vollbildspeicher 514, einem Abschnitt 515 zur Bewegungsvorhersage und Bewegungskompensation, der ein Bewegungsvorhersage und eine Bewegungskompensation ausführt, einem Abschnitt 516 zur variablen Längenkodierung und einem Ausgabespeicher 517.
  • 518 ist ein Abschnitt zur Mengenanpassung für MPEG-4, der die Steuerung wie in den 9, 10 und 11 ausführt. Die Zwischendaten sind in dem Mengenanpassungsspeicher 519, dem Speicher 520 für den Kodiermodus des Makroblocks und den Speicher 521 für den Kodiermodus des Vollbildes gespeichert. Der MPEG-4 Kodierer wird überwacht, während er aus dem Zwischendaten die Daten für PTYPE, TR, CD i,j, CBP i,j,k, QUANT i,j und MTYPE i,j empfängt. Im Einzelnen wechselt der Abschnitt 522 für den Wechsel des Blockmodus den Kodiermodus eines Makroblocks und der Abschnitt zum Wechsel des Intra-Inter-Modus steuert die vorhersagbare Kodierung aufgrund der Daten von PTYPE und MTYPE.
  • Zusätzlich werden in dem Abschnitt 516 der variablen Längenkodierung die Modusdaten gemultiplext, um sie an den Ausgabespeicher auszugeben, der in der vereinfachten Abbildung nicht dargestellt ist.
  • Als nächstes wird das vierte Ausführungsbeispiel anhand von 16 erläutert.
  • Die Vorrichtung des vierten Ausführungsbeispiels führt, umgekehrt zu der Vorrichtung des dritten Ausführungsbeispiels, eine Umwandlung von MPEG-4 nach H.261 durch. Der MPEG-4 Dekodierer in 16 besteht aus einem Abschnitt 601 für die variable Längenkodierung, einem Abschnitt 602 für die inverse Quantisierung, einem Anschnitt 603 für die inverse DCT, einem Addierer 604, einem Vollbildspeicher 605 und einem Abschnitt zur Bewegungskompensation.
  • Das dekodierte Bild wird über den Vollbildspeicher 605 an den H-261 Kodierer geleitet.
  • Der H.261 Kodierer beseht aus dem Subtrahierer 607, dem DCT Abschnitt 608, dem Quantisierungsabschnitt 609, dem inversen Quantisierungsabschnitt 610, dem inversen Quantisierungsabschnitt 611, dem Addierer 612, dem Vollbildspeicher 613, dem Abschnitt 614 zur Bewegungsvorhersage und Bewegungskompensation, dem Schleifenfilter 615, dem Abschnitt 616 zur variablen Längenkompensation und dem Ausgabespeicher 617. 618 ist der Abschnitt zur H.261 Mengenanpassung und führt die Steuerung wie in 9, 12 und 13 beschrieben aus. Die Zwischendaten werden in dem Speicher 619 zur Mengenanpassung, dem Speicher 620 für den Kodiermodus, dem Makroblocks und dem Speicher 621 für den Kodiermodus des Vollbildes gespeichert. Der H.261 Kodierer wird überwacht, während er aus den Zwischendaten PTYPE, TR, CD i,j, CBP i,j, und MTYPE i,j empfängt. Im Einzelnen wechselt der Abschnitt für den Wechsel des Blockmodus den Kodiermodus eines Makroblocks und der Abschnitt zum Wechsel des Intra-Inter-Modus steuert die vorhersagbare Kodierung aufgrund der Daten PTYPE und MTYPE. Zusätzlich werden in dem Abschnitt 623 für die variablen Längenkodierung die Modusdaten gemultiplext, um sie an den Ausgabespeicher auszugeben, der in der vereinfachten Abbildung nicht dargestellt ist.
  • Der Umfang der vorliegenden Erfindung beinhaltet ein Computerprogrammprodukt in Form eines Aufzeichnungsmediums auf dem ein von einem Computer ladbares Programm gespeichert ist, mit dem die vorliegenden Erfindung ausgeführt werden kann. Die Aufzeichnungsmedien umfassen Medien wie Disketten, optischen Medien, CD-ROM und magnetische Medien, ROM, RAM, EPROM, EEPROM und magnetischen und optischen Karten. Die vorliegende Erfindung ist jedoch nicht auf solche Medien beschränkt. Weiterhin ist es auch möglich das Programm auf einem Aufzeichnungsmedium zu speichern und weltweit zu einem Terminal zu versenden, oder das Programm (in verschlüsselter Form vertrieben) über einen Kommunikationskanal, wie das Internet weiterzuleiten und dadurch die vorliegende Erfindung auf einem Computer oder einem tragbaren Informationsterminal auszuführen.

Claims (7)

  1. Verfahren zur Codeumsetzung einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und einen Interframe-Kodierungsmodus besitzt, in eine zweite Datenfolge, erzeugt von einem zweiten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und eine Interframe-Kodierungsmodus besitzt, bestehend aus den Schritten: Ausführen einer Mengenregelung zur Regelung der Codemenge der zweiten Datenfolge; Kodierung des gegenwärtigen Vollbildes durch das zweite Bewegtbildkodiersystem; gekennzeichnet durch Vorauslesen des Kodiermodus des nachfolgenden Vollbildes, das in der ersten Datenfolge dem gegenwärtigen Vollbild folgt; Entscheiden, ob der vorausgelesene Kodiermodus des nachfolgenden Vollbildes der Intraframe-Kodiermodus ist oder nicht; Bestimmen, ob das gegenwärtige Vollbild durch das zweite Bewegtbildkodiersystem kodiert wird oder nicht, aufgrund der Entscheidung für das nachfolgende Vollbild und der erzeugten Codemenge der zweiten Datenfolge; und gemäß dieser Bestimmung, entweder Verwerfen des gegenwärtigen Vollbilds, wenn die erzeugte Codemenge der zweiten Datenfolge einen vorbestimmten Wert übersteigt und als Ergebnis für das nachfolgende Vollbild der Intraframe-Kodiermodus entschieden wurde; oder andernfalls Kodieren des gegenwärtigen Vollbilds.
  2. Verfahren nach Anspruch 1, das des Weiteren einen Schritt umfasst, der die zweite Datenfolge, die von dem zweiten Bewegtbildkodiersystem erzeugte wurde, in einen Ausgabespeicher (404) schreibt, wobei die in den Speicher des Ausgabespeichers (404) geschriebene Codemenge als die Codemenge der zweiten Datenfolge verwendet wird.
  3. Verfahren nach den Ansprüchen 1 oder 2, das des Weiteren die Schritte umfasst: Bestimmen der Codemenge auf der Basis von kodierten Einheit, in dem die Daten der erster Datenfolge auf der Basis von kodierten Einheiten gelesen werden; Berechnen eines Zielwertes für die Codemenge der zweiten Datenfolge auf Basis von kodierten Einheiten, wobei der Zielwert durch Multiplikation der bestimmten Codemenge mit einem Faktor berechnet wird; und Ausführen einer Mengenregelung so, dass die erzeugte Codemenge der zweiten Datenfolge dem Zielwert nahe kommt, indem das zweite Bewegtbildkodiersystem die zweite Datenfolge aus der ersten Datenfolge auf Basis von kodierten Einheiten erzeugt; wobei das Verhältnis der Codemenge auf Basis von kodierten Einheiten der erster Datenfolge, dem Verhältnis der Codemenge auf Basis der kodierten Einheiten der zweiter Datenfolge, die der ersten Datenfolge entsprechen, nahe kommt.
  4. Verfahren nach einem der Ansprüche 1 bis 3, das des Weiteren die Schritte umfasst: Ermitteln einer Quantisierungsabstufung, die in dem ersten Bewegtbildkodiersystem zur Quantisierung von Daten benutzt wird, während die Daten der ersten Datenfolge gelesen werden; und Ändern der Quantisierungsabstufung des zweitem Bewegtbildkodiersystem in ein ganzzahliges Vielfaches der ermittelten Quantisierungsabstufung, falls die Codemenge der zweiter Datenfolge durch eine Kodierung des gegenwärtigen Vollbilds durch das zweite Bewegtbildkodiersystem angepasst wird.
  5. Verfahren nach einem der Ansprüche 1 bis 3, das des Weiteren einen Schritt umfasst, der die Quantisierungsabstufung des zweiten Bewegtbildkodiersystems ändert, falls das Vollbild durch das zweite Bewegtbildkodiersystem kodiert wird und die erzeugte Codemenge der zweiten Datenfolge angepasst wird.
  6. Vorrichtung zur Codeumsetzung einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, das einen Intraframe-Kodiermodus und einen Intraframe-Kodiermodus besitz, in eine zweite Datenfolge, erzeugt durch ein zweites Bewegtbildkodiersystem, das einen Intraframe-Kodiermodus und einen Interframe-Kodiermodus besitz, umfassend: Einrichtung zum Ausführen einer Mengenregelung zur Regelung der Codemenge der zweiter Datenfolge; und Kodiereinrichtung (103) zur Kodierung des gegenwärtigen Vollbilds durch das zweite Bewegtbildkodiersystem; gekennzeichnet durch Einrichtung zum Vorauslesen eines Kodiermodus des nachfolgenden Vollbilds, das in der ersten Datenfolge dem gegenwärtigen Vollbild nachfolgt; Einrichtung zur Entscheidung, ob der vorausgelesener Kodiermodus der Intraframe-Kodiermodus ist oder nicht, Einrichtung zur Bestimmung, ob ein gegenwärtiges Vollbild durch das zweite Bewegtbildkodiersystem kodiert wird oder nicht, aufgrund des Ergebnisses der Entscheidungseinrichtung für das nachfolgende Vollbild und der erzeugten Codemenge der zweiten Datenfolge; und basierend auf diesem bestimmten Ergebnis, entweder Einrichtung zum Verwerfen, die das gegenwärtige Vollbild verwirft, wenn die erzeugte Codemenge der zweiten Datenfolge einen vorbestimmten Wert überschreiten und die Entscheidungseinrichtung als Ergebnis für das nachfolgende Vollbild den Intraframe-Kodiermodus anzeigt; oder andernfalls die Kodiereinrichtung das gegenwärtige Vollbild kodiert.
  7. Rechnerprogrammprodukt, das ein Aufzeichnungsmedium umfasst, das computerlesbaren Programmcode beinhaltet, der Programmcode ist geeignet alle Schritte eines der Ansprüche 1 bis 5 auszuführen.
DE60023576T 1999-02-25 2000-02-24 Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung Expired - Fee Related DE60023576T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP4761399 1999-02-25
JP4761399 1999-02-25

Publications (2)

Publication Number Publication Date
DE60023576D1 DE60023576D1 (de) 2005-12-08
DE60023576T2 true DE60023576T2 (de) 2006-05-24

Family

ID=12780089

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60023576T Expired - Fee Related DE60023576T2 (de) 1999-02-25 2000-02-24 Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung

Country Status (5)

Country Link
US (3) US6625211B1 (de)
EP (2) EP1032214B1 (de)
CN (1) CN1236616C (de)
AT (1) ATE308859T1 (de)
DE (1) DE60023576T2 (de)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998042134A1 (en) * 1997-03-17 1998-09-24 Mitsubishi Denki Kabushiki Kaisha Image encoder, image decoder, image encoding method, image decoding method and image encoding/decoding system
US6625211B1 (en) * 1999-02-25 2003-09-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for transforming moving picture coding system
US6647061B1 (en) 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
JP3561485B2 (ja) * 2000-08-18 2004-09-02 株式会社メディアグルー 符号化信号分離・合成装置、差分符号化信号生成装置、符号化信号分離・合成方法、差分符号化信号生成方法、符号化信号分離・合成プログラムを記録した媒体および差分符号化信号生成プログラムを記録した媒体
JP2002209215A (ja) * 2001-01-09 2002-07-26 Sony Corp 符号量制御装置及び方法、並びに画像情報変換装置及び方法
JP2004518342A (ja) * 2001-01-12 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルビデオトランスコーディング方法及び装置
JP3641214B2 (ja) * 2001-02-28 2005-04-20 株式会社東芝 動画像符号化装置および動画像符号化方法
GB2369952B (en) * 2001-03-10 2002-12-04 Ericsson Telefon Ab L M Transcoding of video signals
US7602847B1 (en) 2001-03-27 2009-10-13 Vixs Systems, Inc. Device and method for compression of a video stream
US8107524B2 (en) 2001-03-30 2012-01-31 Vixs Systems, Inc. Adaptive bandwidth footprint matching for multiple compressed video streams in a fixed bandwidth network
US7054362B1 (en) * 2001-05-29 2006-05-30 Cisco Technology, Inc. Methods and apparatus for updating a reduction ratio
JP2003087785A (ja) * 2001-06-29 2003-03-20 Toshiba Corp 動画像符号化データの形式変換方法及び装置
US6959348B1 (en) 2001-07-30 2005-10-25 Vixs Systems, Inc. Method and system for accessing data
US7675972B1 (en) 2001-07-30 2010-03-09 Vixs Systems, Inc. System and method for multiple channel video transcoding
JP4574090B2 (ja) * 2001-09-21 2010-11-04 三菱電機株式会社 動画データ変換装置および動画データ変換プログラム
FR2830159A1 (fr) * 2001-09-24 2003-03-28 Thomson Licensing Sa Procede de codage selon la norme mpeg
CN101399986B (zh) * 2001-10-17 2010-12-22 松下电器产业株式会社 动态图像解码方法及装置
US7139330B1 (en) 2001-10-31 2006-11-21 Vixs Systems, Inc. System for signal mixing and method thereof
US7596127B1 (en) 2001-10-31 2009-09-29 Vixs Systems, Inc. System for allocating data in a communications system and method thereof
US7106715B1 (en) 2001-11-16 2006-09-12 Vixs Systems, Inc. System for providing data to multiple devices and method thereof
US7356079B2 (en) 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding
US7403564B2 (en) 2001-11-21 2008-07-22 Vixs Systems, Inc. System and method for multiple channel video transcoding
US7165180B1 (en) 2001-11-27 2007-01-16 Vixs Systems, Inc. Monolithic semiconductor device for preventing external access to an encryption key
JP4130780B2 (ja) 2002-04-15 2008-08-06 松下電器産業株式会社 画像符号化方法および画像復号化方法
JP4193406B2 (ja) * 2002-04-16 2008-12-10 三菱電機株式会社 映像データ変換装置および映像データ変換方法
US7310679B1 (en) 2002-04-29 2007-12-18 Vixs Systems Inc. Method and system for transmitting video content while preventing other transmissions in a contention-based network
US7120253B2 (en) 2002-05-02 2006-10-10 Vixs Systems, Inc. Method and system for protecting video data
US7319754B2 (en) * 2002-06-28 2008-01-15 Stmicroelectronics S.A. Insertion of binary messages in video pictures
AU2003275087A1 (en) * 2002-09-19 2004-04-08 Image Stream Medical, Llc Streaming digital recording system
US7463686B2 (en) * 2002-10-16 2008-12-09 Lg Electronics Inc. Method for determining motion vector and macroblock type
JP2004221836A (ja) * 2003-01-14 2004-08-05 Ricoh Co Ltd 画像処理装置、プログラム、記憶媒体及び符号伸長方法
US7408989B2 (en) 2003-01-16 2008-08-05 Vix5 Systems Inc Method of video encoding using windows and system thereof
US7133452B1 (en) 2003-02-24 2006-11-07 Vixs Systems, Inc. Method and system for transcoding video data
US7327784B2 (en) 2003-02-24 2008-02-05 Vixs Systems, Inc. Method and system for transcoding video data
US7606305B1 (en) 2003-02-24 2009-10-20 Vixs Systems, Inc. Method and system for transcoding video data
US7130350B1 (en) 2003-02-28 2006-10-31 Vixs Systems, Inc. Method and system for encoding and decoding data in a video stream
US7739105B2 (en) 2003-06-13 2010-06-15 Vixs Systems, Inc. System and method for processing audio frames
US7668396B2 (en) 2003-09-29 2010-02-23 Vixs Systems, Inc. Method and system for noise reduction in an image
US7277101B2 (en) 2003-09-29 2007-10-02 Vixs Systems Inc Method and system for scaling images
US7391809B2 (en) * 2003-12-30 2008-06-24 Microsoft Corporation Scalable video transcoding
US7406598B2 (en) 2004-02-17 2008-07-29 Vixs Systems Inc. Method and system for secure content distribution
JP4877449B2 (ja) * 2004-11-04 2012-02-15 カシオ計算機株式会社 動画像符号化装置および動画像符号化処理プログラム
KR100677548B1 (ko) * 2004-12-31 2007-02-02 삼성전자주식회사 복호된 영상의 오류 재은닉 방법 및 그 장치
US7830960B2 (en) * 2005-01-13 2010-11-09 Qualcomm Incorporated Mode selection techniques for intra-prediction video encoding
US7421048B2 (en) 2005-01-20 2008-09-02 Vixs Systems, Inc. System and method for multimedia delivery in a wireless environment
US7609766B2 (en) 2005-02-08 2009-10-27 Vixs Systems, Inc. System of intra-picture complexity preprocessing
US8949920B2 (en) 2005-03-17 2015-02-03 Vixs Systems Inc. System and method for storage device emulation in a multimedia processing system
US7400869B2 (en) 2005-03-22 2008-07-15 Vixs Systems Inc. System and method for adaptive DC offset compensation in wireless transmissions
TWI284855B (en) * 2005-04-29 2007-08-01 Sunplus Technology Co Ltd Image processing method and method for detecting difference between different image macro-blocks
JP4641892B2 (ja) * 2005-07-27 2011-03-02 パナソニック株式会社 動画像符号化装置、方法、及びプログラム
US7707485B2 (en) 2005-09-28 2010-04-27 Vixs Systems, Inc. System and method for dynamic transrating based on content
US8131995B2 (en) 2006-01-24 2012-03-06 Vixs Systems, Inc. Processing feature revocation and reinvocation
CN101009838B (zh) * 2006-01-25 2010-06-16 松下电器产业株式会社 可抑制漂移误差的比特率转换编码方法,转换编码器,及集成电路
JP4925697B2 (ja) 2006-03-23 2012-05-09 ソニー株式会社 ネットワーク伝送用の映像信号符号化システム及び映像信号符号化方法,信号変換装置
JP4624321B2 (ja) * 2006-08-04 2011-02-02 株式会社メガチップス トランスコーダおよび符号化画像変換方法
US8594176B2 (en) * 2007-03-06 2013-11-26 Microsoft Corporation Streaming media codec with transform coefficient bounding
JP5173613B2 (ja) * 2007-07-03 2013-04-03 キヤノン株式会社 動画像符号化装置及びその制御方法
JP4915317B2 (ja) * 2007-09-05 2012-04-11 ソニー株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
KR20090072510A (ko) * 2007-12-28 2009-07-02 삼성전자주식회사 디스플레이장치 및 그 제어방법
US8462841B2 (en) * 2007-12-31 2013-06-11 Netlogic Microsystems, Inc. System, method and device to encode and decode video data having multiple video data formats
US9078009B2 (en) * 2010-02-19 2015-07-07 Skype Data compression for video utilizing non-translational motion information
US8913661B2 (en) * 2010-02-19 2014-12-16 Skype Motion estimation using block matching indexing
US9819358B2 (en) * 2010-02-19 2017-11-14 Skype Entropy encoding based on observed frequency
US9609342B2 (en) * 2010-02-19 2017-03-28 Skype Compression for frames of a video signal using selected candidate blocks
US9313526B2 (en) 2010-02-19 2016-04-12 Skype Data compression for video
US9049455B2 (en) * 2010-12-28 2015-06-02 Panasonic Intellectual Property Corporation Of America Image coding method of coding a current picture with prediction using one or both of a first reference picture list including a first current reference picture for a current block and a second reference picture list including a second current reference picture for the current block
US8730930B2 (en) * 2011-05-31 2014-05-20 Broadcom Corporation Polling using B-ACK for occasional back-channel traffic in VoWIFI applications
US9113227B2 (en) * 2012-03-12 2015-08-18 Broadcom Corporation Reduced complexity transcoding
US9544587B2 (en) 2012-05-14 2017-01-10 Google Technology Holdings LLC Scalable video coding with enhanced base layer

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US206588A (en) * 1878-07-30 Improvement in wine and oil boxes
US5640208A (en) * 1991-06-27 1997-06-17 Sony Corporation Video signal encoding in accordance with stored parameters
NL9301358A (nl) * 1993-08-04 1995-03-01 Nederland Ptt Transcodeerinrichting.
US5940130A (en) * 1994-04-21 1999-08-17 British Telecommunications Public Limited Company Video transcoder with by-pass transfer of extracted motion compensation data
DE4416967A1 (de) * 1994-05-13 1995-11-16 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Transcodierung von Bitströmen mit Videodaten
DE69535228T2 (de) * 1994-06-08 2007-09-13 Matsushita Electric Industrial Co., Ltd., Kadoma Bildumsetzungsvorrichtung
US5687095A (en) * 1994-11-01 1997-11-11 Lucent Technologies Inc. Video transmission rate matching for multimedia communication systems
US5623312A (en) * 1994-12-22 1997-04-22 Lucent Technologies Inc. Compressed-domain bit rate reduction system
US5929916A (en) * 1995-12-26 1999-07-27 Legall; Didier J. Variable bit rate encoding
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system
SE515535C2 (sv) * 1996-10-25 2001-08-27 Ericsson Telefon Ab L M En transkoder
JP2933561B2 (ja) 1997-03-26 1999-08-16 日本電気通信システム株式会社 動画符号変換装置
EP0953253B1 (de) * 1997-11-17 2006-06-14 Koninklijke Philips Electronics N.V. Bewegungskompensierte prädiktive bildcodierung und -decodierung
US6167088A (en) * 1998-04-03 2000-12-26 Sarnoff Corporation Method and apparatus for performing adaptive encoding rate control of a video information stream including 3:2 pull-down video information
GB9817292D0 (en) * 1998-08-07 1998-10-07 Nokia Mobile Phones Ltd Digital video coding
US6310915B1 (en) * 1998-11-20 2001-10-30 Harmonic Inc. Video transcoder with bitstream look ahead for rate control and statistical multiplexing
US6526097B1 (en) * 1999-02-03 2003-02-25 Sarnoff Corporation Frame-level rate control for plug-in video codecs
US6625211B1 (en) * 1999-02-25 2003-09-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for transforming moving picture coding system
JP3840020B2 (ja) * 1999-12-14 2006-11-01 株式会社東芝 動画像符号化装置

Also Published As

Publication number Publication date
US20030215012A1 (en) 2003-11-20
EP1032214A3 (de) 2004-05-06
EP1596605A3 (de) 2007-05-23
EP1032214A2 (de) 2000-08-30
ATE308859T1 (de) 2005-11-15
US7292632B2 (en) 2007-11-06
DE60023576D1 (de) 2005-12-08
EP1596605A2 (de) 2005-11-16
US20030206588A1 (en) 2003-11-06
CN1264988A (zh) 2000-08-30
US6625211B1 (en) 2003-09-23
CN1236616C (zh) 2006-01-11
EP1032214B1 (de) 2005-11-02
US7321622B2 (en) 2008-01-22

Similar Documents

Publication Publication Date Title
DE60023576T2 (de) Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung
DE69435000T2 (de) Bildkodierungsvorrichtung
DE60220106T2 (de) Verfahren und Vorrichtung zur Reduzierung von Störungen in dekodierten Bildern mit Nachfilterung
DE69913990T2 (de) System zum editieren komprimierter bildsequenzen
DE60032841T2 (de) Signalprozessor zum nahtlosen Zusammenfügen von MPEG-2 Bitströmen in einem Videokoder
DE10190285B4 (de) Verfahren und System zur Verarbeitung von komprimierten Videosignalen
DE60026241T2 (de) Umschalten zwischen bitratenreduzierten Signalen
DE60123317T2 (de) Kodiersystem und Kodierverfahren
DE69736537T2 (de) Ratenregelung für stereoskopische digitale Videokodierung
DE69938093T2 (de) Steuerung der Datenrate für einen MPEG-Transcoder ohne a-priori Kenntnis des Bildtyps
EP2198610B1 (de) Verfahren und vorrichtung zum erstellen eines kodierten ausgangsvideostroms aus mindestens zwei kodierten eingangsvideoströmen, sowie verwendung der vorrichtung
DE69735756T2 (de) Dynamische steuerung der kodierrate in einem blockbasierten videokodierungssystem
DE10048735A1 (de) Verfahren zur Codierung und Decodierung von Bildsequenzen sowie Einrichtungen hierzu
DE602004008763T2 (de) Videotranskodierung
DE69838639T2 (de) Prädiktives kodierungs- und dekodierungsverfahren für dynamische bilder
DE69233411T2 (de) Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung
DE69921108T2 (de) Verfahren und vorrichtung zur adaptiven codierung eines videodatenstroms
DE60027495T2 (de) Video-codierverfahren und video-codiervorrichtung
DE69916027T2 (de) Videokompressionssystem welches auch codierungsentscheidungsdaten komprimiert
EP1025708B1 (de) Verfahren und vorrichtung zur verarbeitung eines digitalisierten bildes
DE69816875T2 (de) Sequenzadaptive bit-zuordnung zur codierung von bildern
DE69834901T2 (de) Bewegungskompensierte prädiktive bildcodierung und -decodierung
DE602005005321T2 (de) Verfahren und vorrichtung zur codierung einer bildsequenz unter verwendung von vorhergesagten und nicht vorhergesagten bildern, die jeweils mehrere makroblöcke enthalten
DE69919205T2 (de) Verfahren und gerät für die mpeg-bildkodierung von eingefügten bildern
DE60312960T2 (de) Kodierungsverfahren und Dekodierungsverfahren für bewegliche Bilder

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee