DE60023576T2

DE60023576T2 - Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung

Info

Publication number: DE60023576T2
Application number: DE60023576T
Authority: DE
Inventors: Minoru Kawasaki-shi Etoh; Tsutomu Kawasaki-shi Uenoyama; Osamu Iwasaki; Daisaku Komiya
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-02-25
Filing date: 2000-02-24
Publication date: 2006-05-24
Anticipated expiration: 2020-02-25
Also published as: US20030215012A1; EP1032214A3; EP1596605A3; EP1032214A2; ATE308859T1; US7292632B2; DE60023576D1; EP1596605A2; US20030206588A1; CN1264988A; US6625211B1; CN1236616C; EP1032214B1; US7321622B2

Description

Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur Umwandlung von Bewegtbildern, die von einem Kodiersystem kodiert wurden, in andere Bewegtbilder die von einem anderen Kodiersystem kodiert wurden.
Mit dem Fortschritt von multimedialen Techniken zur gemeinsamen Behandlung von Sprache, Bild und anderen Daten werden konventionelle Informationsmedien wie eine Zeitung, Magazin, Fernsehen, Radio und Telefon, die Transportmittel von Informationen zu Menschen sind, Gegenstand für die Multimedia.
Im Allgemeinen besteht Multimedia nicht nur aus Zeichen, sondern ebenso aus weiteren Informationen wie Zeichnungen, Sprache oder besonders Bilder, die gleichzeitig mit den Zeichen verbunden sind. Um die obengenannten Informationsmedien zum Gegenstand von Multimedia zu machen, ist es die wesentliche Bedingung die konventionellen Informationen in einem digitalen Format darzustellen.
Die Abschätzung der Kodemenge für einzelne konventionelle Informationsmedien in digitaler Form ergeben 64 kb pro Sekunde für Sprache (Telefonqualität) und mindestens 100 Mb pro Sekunde oder mehr für bewegte Bilder (gegenwärtige Fernsehempfangsqualität), während die Kodemenge für ein Zeichen 1 bis 2 Bytes beträgt. Daher ist es nicht realistisch, solche großen Kodemengen in digitaler Form ohne eine Umwandlung zu bearbeiten.
Ein Videokonferenzsystem wird beispielsweise in einem Integrated Service Digital Networks (ISDN) in einem praktischen Anwendungsfall mit einer Übertragungsrate von 64 kbps bis 1,5 Mbps eingesetzt. Es ist jedoch nicht möglich, Fernseh- oder Kamerabilder ohne Umwandlung mittels ISDN direkt zu übertragen.
Daher ist eine Technik zur Datenkompression erforderlich. Ein Videokonferenzsystem benutzt beispielsweise eine Technik zur Kompression bewegter Bilder nach dem H.261 Standard und dem H.263 Standard, der von der ITU-T (Telecomunication Standardization Sector der International Telecommunication Union) international standardisiert ist.
Weiterhin sind gewöhnliche bewegte Fernsehbilder nach dem internationalen Kompressionsverfahren für den MPEG-Standard auf 2 bis 5 Mbps komprimiert.
Dabei bezeichnet MPEG (Moving Picture Expert Group) die Arbeitsgruppe (ISO/IEC JTC1/SC29/WG11) zur Standardisierung der Kodierung von Sprache und bewegten Bildern der ISO (International Organisation for Standardization), MPEG bezeichnet dabei ebenfalls die internationale Standardisierung der Datenkompression, die diese Gruppe gerade definiert. Im Augenblick ist gerade MPEG-4 durch die MPEG standardisiert, das das Kodieren und Verarbeiten auf der Basis von einem Objekt erlaubt, um die neuen Funktionen für die multimediale Technik zu ermöglichen.
Für die Kodierung von bewegten Bildern wird eine Vielzahl von Standards verwendet, was zu dem Problem führt, dass die kodierten Daten (im Folgenden als Datenstrom bezeichnet) in diesen Standards nicht zueinander kompatibel sind.
Obwohl zum Beispiel ein Dekodierer, der auf Grundlage von MPEG-4 spezifiziert ist, auch einen H.263 Datenstrom dekodieren kann, gibt es keine Kompatibilität der Datenströme zwischen den Kodiersystemen von H.261, H.263, MPEG-2 und MPEG-4 (mit anderen Worten, es ist nicht möglich eine Paar von Kodierer und Dekodierer zu verwenden, das auf unterschiedlichen Kodiersystemem basiert).
Diese Bedingung erfordert eine Vorrichtung, die Datenströme der verschiedenen Kodiersysteme ineinander umwandelt (im Folgenden als Transcoder bezeichnet).
1 stellt ein prinzipielles Schaubild eines Transcoders dar. In 1 sind die beiden verschiedenen Kodiersysteme A und B vorhanden. Dekodierer 101 des Systems A und Kodierer 103 des Systems B sind mittels eines Vollbildspeichers und eines Umsetzers 102 miteinander verbunden.
System A sei zum Beispiel MPEG-2 (Bildgröße 704 × 480 Bildpunkte) und System B H.263 (Bildgröße 360 × 288 Bildpunkte). Obwohl die Bildgrößen voneinander verschieden sind, ist es möglich eine Umsetzung auszuführen, indem einmal der Datenstrom in ein Bild überführt wird und dann das Bild wieder kodiert wird.
Zusätzlich verwenden die H.261, H.263, MPEG-2 und MPEG-4 Kodiersysteme als gemeinsames Verfahren eine bewegungskompensierte diskrete Kosinustransformation (im Folgenden als MC-DCT bezeichnet). In einem MC-DCT Kodiersystem wird ein Bild in Blöcke eingeteilt, die als Microblöcke bezeichnet werden und eine Größe von 16 × 16 Bildpunkte umfassen. Es wird der Betrag eines Versatzes (Bewegungsvektor) berechnet, der den Unterschied zwischen nachfolgenden Bildern (Vollbildern) minimiert. Auf diesem Unterschied wird die diskrete Kosinustransformation (DCT) angewandt.
Dieser Vorgang zur Gewinnung eines Bewegungsvektors, der einen minimalen Unterschied zwischen zwei Vollbildern erzielt und damit ein Differenzbild erzeugt, aus dem daraufhin die Redundanz entfernt wird, nennt man Bewegungskompensation.
Die DCT wird verwendet, um die verbleibende Redundanz aus dem bewegungskompensierten Bild (Differenzbild) zu entfernen.
Zusätzlich wird das erste Vollbild nur durch die DCT kodiert, da eine Differenzkodierung mit einem weiteren Vollbild nicht ausgeführt werden kann. Ein solches Vollbild wird I-Bild genannt. Ein anderes allgemeines Bild, auf das die MC-DCT angewandt wird, wird P-Bild genannt.
Wird das oben beschriebene MC-DCT Kodiersystem in den Kodiersystemen A und B verwendet, kann durch die in 1 dargestellte Dekodierung eine zweite Information erhalten werden (im Folgenden als Zusatzinformation bezeichnet), die durch die MC-DCT Kodierung erzeugt wird und sowohl Bewegungsinformationen als auch und eine Quantisierung der DCT Koeffizienten enthält. Es ist zu erwarten, dass die Verwendung der Zusatzinformationen die Effizient von Berechnung und Code während der Aufzeichnung verbessert (Bildqualität und kodierter Inhalt).
Ein konventionelles Beispiel eines Transcoders, der Zusatzinformationen in einer Transformationsvorrichtung für bewegte Bilder verwendet, ist in der japanischen Patentanmeldung HEI10-271294 beschrieben.
2 beschreibt das Prinzip dieser Vorrichtung.
Für den Fall, dass die Systeme A und B des in 1 dargestellten Transcoders sich auf MPEG-2 und H.263 beziehen, entsprechen die Elemente 101 bis 103 aus 1 den Elementen 202 bis 204 der 2.
Da beide Systeme des konventionellen Beispiels als ein gemeinsames Verfahren ein MC-DCT-Kodiersystem besitzen, ist es möglich die Bewegungsvektorsuche in der H.263-Kodierung zu auszulassen, in dem die Bewegungsvektoren aus der MPEG-2 Dekodierung skaliert werden (Transformation des absoluten Wertes durch eine Multiplikation mit dem Verhältnis der Bildgrößen).
Bei der Herstellung eines Transkoders in der Praxis gibt es jedoch neben der Weiterverwendung des Bewegungsvektoren noch eine Menge weiterer Dinge zu beachten. In einem operationellen Kodierer ist ein als Mengenanpassung bezeichneter Prozess unvermeidlich, der die Kodemenge des auszugebenden Datenstroms anzupasst.
Normalerweise wird ein Ausgabespeicher an der Ausgabeseite installiert, um Variationen der erzeugten Kodemenge abzufangen und die im Ausgabespeicher gespeicherten Daten (im Folgenden als eine in den Speicher geschriebene Kodemenge bezeichnet) entsprechend der erzeugten Kodemenge anzupassen.
In einem MC-DCT Kodiersystem wird der zu kodierende Inhalt durch eine variable Quantisierungsgenauigkeit der DCT-Koeffizienten angepasst (eine hohe Genauigkeit verbessert die Bildqualität und erhöht die erzeugte Datenmenge, während eine niedrige Genauigkeit zu dem gegenteiligen Ergebnis führt).
3 zeigt ein schematisches Schaubild mit den wesentlichen Elementes eines Transcoders.
Der Ausgabeanschluss des Ausgabespeichers 304 ist mit einem Übertragungspfad oder einem Speichermedium verbunden. Falls der Übertragungspfad eine feste Übertragungsrate besitzt, so wird der Datenstrom mit einer konstanten Rate aus dem Ausgabespeicher ausgegeben. Der Kodierer 303 passt mit dem System B die erzeugte Kodemenge so an, dass die Daten im Speicher 304 nicht ausgehen (Unterlauf) oder zuviel werden (Überlauf). Um die Qualität des aufgezeichneten Bildes zu verbessern, ist es daher notwendig, Zusatzinformationen des Kodierverfahrens wie Quantisierung und Kodiermodus, zu verwenden. Arbeitet der Kodierer des Systems B unabhängig von dem Kodierverfahren des Systems A, so wird normalerweise zu dem Qualitätsverlust der Bildqualität, der von System A kommt, noch ein Bildqualitätsverlust durch von dem System B hinzukommen.
Der Datenstrom des Systems A wird zum Beispiel mit einer Rate von 10 Vollbildern/Sekunde kodiert. Wird das reproduzierte Ergebnis unabhängig davon mit einer Rate von 15 Vollbilder/Sekunde kodiert, so fällt nur eines von drei Vollbildern des Systems B mit einem Vollbild des Systems A zusammen. Mit anderen Worten, die Dekodierintervalle der andern beiden Vollbilder fallen nicht mit den ursprünglichen Bildern zusammen. Daher kann trotz einer Erhöhung der Vollbildrate die Bildqualität des Systems A nicht aufrechterhalten werden und die Qualität verschlechtert sich in manchen Fällen sogar noch weiterhin.
Das gleiche Phänomen tritt auch bei der Quantisierung der DCT Koeffizienten auf. Es wird angenommen, dass die Quantisierung durch eine Rundung auf ½ ausgeführt wird. Um eine Fehleranhäufung durch eine Neuquantisierung zu vermeiden, wird vorzugsweise die Quantisierung von System B ebenfalls auf ½ gerundet, um einen symmetrischen Kodeinhalt zu erhalten. Die Änderung der Vollbildrate, die Neuquantisierung der DCT-Koeffizienten und die Änderung der Bildgröße sind im weiten Sinne von Bewegtbildern alles Prozesse einer „Neuquantisierung". Für diese Neuquantisierung wird der Kodierer 103 des Systems B vorzugsweise abhängig von dem Dekodierer 301 des Systems A aus 3 betrieben.
Wie zuvor beschrieben, wird der Kodierer 303 des Systems B für eine Mengenanpassung vorzugsweise unabhängig von dem Dekodierer 301 betrieben, um die Neuquantisierung zu steuern, während der Füllstand des Ausgabespeichers überwacht wird. Andererseits arbeitet der Kodierer 303 des Systems B abhängig vom dem Dekodierer 301 des Systems A, um im breiten Sinne einer Neuquantisierung die Verschlechterung der Bildqualität zu verringern. Die konventionelle Technik eines Transcoders wird jedoch von dem Standpunkt einer Verbesserung einer effizienten Berechnung unter Zuhilfenahme von Zusatzinformationen entwickelt, beispielsweise zur Aufzeichnung mit skalierten Bewegungsvektoren. Dabei wird aber keine Technik beschrieben, die beides erreicht: eine Mengenanpassung und eine Verringerung der verschlechterten Bildqualität durch eine Neuquantisierung.
WO 98/19460 beschreibt einen Transcoder zur Änderung der räumlichen und zeitlichen Auflösung. Um eine einfachen und effiziente Umkodierung zu erzielen, werden die Bewegungsvektoren neu skaliert und direkt zur Kodiereinrichtung des Transcoders übertragen. Die Umkodieroperationen können entweder im Ortsbereich oder im Frequenzbereich ausgeführt werden. Um die räumliche Auflösung zu reduzieren, d.h. um die Vollbildrate zu verringern, wird vorgeschlagen, bidirektional geschätzte Vollbilder (B-Frames) zu verwerfen, da diese Vollbilder mit der geringsten Beeinträchtigung der verbleibenden Bildqualität übersprungen werden können.
Eine Modifikation eines Datenstroms wird in EP-A-0 711 077 beschrieben. Um die Datenrate an das Empfangsendgeräte anzupassen, kann die Übertragungsdatenrate erhöht oder verringert werden. Um eine erforderliche Zieldatenrate zu erreichten werden die DCT-Koeffizienten angepasst. Der Unterschied zwischen der erhaltenen Anzahl von Bits und dem Zielwert pro Makroblock wird berechnet und falls erforderlich werden die DCT-Koeffizienten angepasst.
In Anbetracht des Voraufgegangenen, ist es das Ziel der vorliegenden Erfindung, ein Verfahren und eine Vorrichtung zur Mengenanpassung vorzustellen, womit eine Verschlechterung der Bildqualität im umgewandelnden Bewegtbildkodiersystem vermieden wird.
Dies wird durch die Merkmale der unabhängigen Ansprüche erreicht.
Der erste Aspekt der vorliegenden Erfindung ist ein Verfahren und eine Vorrichtung zur sequentiellen Umwandlung vom Anfang der Daten einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und einen Interframe-Kodierungsmodus besitzt, in eine zweite Datenfolge, erzeugt von einem zweiten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und eine Interframe-Kodierungsmodus besitzt. Das Verfahren und die Vorrichtung

1. Lesen die Daten eines Vollbildes der ersten Datenfolge, und lesen weiter den Kodiermodus des nachfolgenden Vollbildes; und
2. Entscheiden, falls der vorausgelesene Kodiermodus des nachfolgenden Vollbildes der Intraframe-Kodiermodus ist, ob das gegenwärtige Vollbild kodiert werden soll oder nicht, um die erzeugte Kodemenge der zweiten Datenfolge, die in das zweite Kodiersystem umgeformt wurde, zu reduzieren.

Gemäß einem solchen Verfahren und einer solchen Vorrichtung ist es möglich, durch das Vorauslesen des Kodiermodus des nachfolgenden Vollbildes und die Anpassung der Kodemenge des gegenwärtigen Vollbildes entsprechend dem Kodiermodus des nachfolgenden Vollbildes und der Kodemenge des umwandelnden Systems, eine stabile Kodierung durchzuführen, die keinen Überlauf der Kodierung von I-Frames verursacht.
Ein zweiter Aspekt der vorliegenden Erfindung ist ein Verfahren und eine Vorrichtung zur Umwandlung einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, in eine zweite Datenfolge, erzeugt von einem zweiten Bewegtbildkodiersystem, wobei man zur sequentiellen Umwandlung der Daten von Anfang ein Bild- oder Vollbildteil durch Teilung des Vollbildes in Kodiereinheiten erhält. Das Verfahren und die Vorrichtung

1. Bestimmen der Kodemenge auf der Basis von kodierten Einheit, in dem die Daten der erster Datenfolge auf der Basis von kodierten Einheiten gelesen werden; und
2. Setzen eines Zielwertes für die erzeugte Kodemenge der zweiten Datenfolge auf einen Wert, dem man durch Multiplikation der bestimmten Kodemenge mit einem vorbestimmten Faktor berechnet, während man die Daten in kodierten Einheiten in das zweite Kodiersystem umformt, und anschließend die Mengenregulierung so ausführt, dass das Verhältnis der Kodemenge auf Basis von kodierten Einheiten der erster Datenfolge, dem Verhältnis der Kodemenge auf Basis der kodierten Einheiten der zweiter Datenfolge, die der ersten Datenfolge entsprechen, nahe kommt.

Gemäß einem solchen Verfahren und einer solchen Vorrichtung ist es möglich, die Aufzeichnung genau an die ursprüngliche Mengenregulierung anzupassen und eine Verschlechterung der Bildqualität aufgrund von sich angesammelten Fehler durch eine Neuquantisierung zu unterdrücken. Während die Daten in das zweite Bewegtbildkodiersystem umgeformt werden, wird die Kodemenge des ursprünglichen Vollbildes aufgezeichnet und ein Zielwert wird so eingestellt, dass die erzeugte Kodemenge der zweiten Datenfolge einem Wert entspricht, der durch Multiplikation der aufgezeichneten Kodemenge mit einem vorbestimmten Faktor erhalten wird.
Diese und weitere Ziele und Merkmale der Erfindung werden völlig durch die folgenden Beschreibung in Verbindung mit den dazugehörigen Zeichnungen erläutert, wobei die dargestellten Beispiele als Beispiele zu verstehen sind. Dabei:
1 beschreibt ein Prinzipschaubild eines Transcoders;
2 beschreibt ein Schaubild eines beispielhaften konventionellen Transcoders;
3 beschreibt ein Schaubild das die Elemente eines Transcoders darstellt;
4 beschreibt die Datenstruktur eines Bildes nach dem H.261 Standard,
5 beschreibt die Datenstruktur des H.261 Standard;
6 beschreibt die Datenstruktur eines Bildes gemäß eines einfachen MPEG-4 Profils;
7 beschreibt die Datenstruktur eines einfachen MPEG-4 Profils;
8 beschreibt die Zwischendaten in einem Transcoder;
9 ist ein Flussdiagram für den gesamten Prozess des Transcoders;
10 ist ein Flussdiagram zur Steuerung der Intra-Inter-Kodierung während der Umwandlung von H.261 nach MPEG-4;
11 ist ein Flussdiagram für den Wechsel der kodierten Daten auf Makroblockebene zur Mengenregulierung während der Umwandlung von H.261 nach MPEG-4;
12 ist ein Flussdiagram zur Steuerung des Intra-Inter-Kodierungsmodus während der Umwandlung von MPEG4 nach H.261;
13 ist ein Flussdiagram für den Wechsel kodierter Daten auf Makroblockebene für die Mengenanpassung während der Umwandlung von MPEG-4 nach H.261;
14 beschreibt ein Schaubild eines Transcoders der vorliegenden Erfindung;
15 beschreibt ein Schaubild eines Transcoders von H.261 nach MPEG-4; und
16 beschreibt ein Schaubild eines Transcoders von MPEG-4 nach H.261.
Die Ausführungsbeispiele beschreiben die Umwandlung eines Datenstroms eines Bewegtbildkodiersystems, der auf der Grundlage der ITU-T Empfehlung H.261 kodiert wurde in einen Datenstrom eines Bewegtbildkodiersystems auf der Grundlage des MPEG-4 Standards und einen weiteren Fall in dem die umgekehrte Umwandlung ausgeführt wird. Beide Systeme sind repräsentative Kodiersysteme, die auf der Grundlage eines MC-DCT-Systems und der hierzu in der ITU-T Empfehlung H.261 (H.261 Empfehlung, Line Transformation of non-telephone Signals 03/1993) beschriebenen Details, sowie der ISO-Standardisierungsdokumente (Dokumentennummer ISO/IEC JTC1/SC29/WG11 N2502 Dokumentenname INFORMATION TECHNOLOGY-GENERIC CODING OF AUDIO-VISUAL OBJECTS Part 2: Visual ISO/IEC 14496-2, veröffentlicht 10/1998). Als eine weitere Referenz eines H.261 Kodierers wird die Beschreibung von Referenzmodellen der Specialist Group on Coding for Visual Telephony, Dokumentnummer 525 vom Juni 1989 verwendet, die nicht durch die CCITT (gegenwärtig ITU-T) SG15 Arbeitsgruppe Teil 15/4 Standardisierung spezifiziert ist Zunächst wird die Datenstruktur des H.261 Standards erläutert.
4 beschreibt die Bilddatenstruktur des H.261 Standards. Ein zu kodierendes Bild wird als QCIF (Quater Image Interface Format) bezeichnet. Es besitzt 176 Bildpunkte in horizontaler Richtung und 144 Bildpunkte in vertikaler Richtung. Das Bild wird in dem H.261 Standard ebenfalls in Makroblöcke mit einer Größe von jeweils 16 × 16 Bildpunkten unterteilt. Die Bewegungskompensation wird auf Makroblockebene durchgeführt, während die DCT- Kodierung auf DCT-Blockebene ausgeführt wird. Ein DCT-Block umfasst 8 × 8 Bildpunkte. Da 4 DCT-Blöcke für die Helligkeitswerte notwendig sind und 2 DCT-Blöcke für die Farbdifferenzwerte (jeweils einer für Cb und Cr) deren Auflösung in horizontaler und vertikaler Richtung halb so groß ist wie die der Helligkeitsinformation, besteht ein Makroblock aus 6 DCT-Blöcken. Ein Block, der drei Zeilen von Makroblöcken umfasst wird als GOB (Group of Blocks/Gruppe von Blöken) bezeichnet.
5 beschreibt die kodierte Datenstruktur auf Grundlage des H.261 Standards. Für die Erklärung wird der Datenstrom in vier Ebenen aufgeteilt. Der Datenstrom besteht aus sich wiederholenden Bildern. Er ist aus einem PSC (Picture Start Code/Bildstartcode), am Anfang, gefolgt von einer Zeitreferenz (temporal reference, TR) und dann einem PTYPE (Picture Type/Bildtyp) zusammengesetzt. Bei H.261 gibt PTYPE die Größe und den Wiederherstellungsmodus an. Es wird nicht angegeben, ob das Vollbild intraframe kodiert (intrakodiert) oder interframe kodiert (interkodiert) wurde. Danach wird die GOB-Ebene wiederholt (im Falle von QCIF dreimal).
Der Kopf einer GOB-Ebene beginnt mit einem GBSC (GOB Startcode). Es werden eine GN (GOB Nummer), gefolgt von GBSC und dann GQUANT (Daten zur Charakterisierung der Quantisierung) übertragen. In H.261 wird die Quantisierung der DCT-Koeffizienten durch eine Skalierung des Quantisierung in einen ganze Indices zwischen 1 und 31 für die Interkodierung durchgeführt, während für die Intrakodierung ein einzelner Typ einer solchen Quantisierung entsprechend dem Index 8 ausgeführt wird.
Die Quantisierungsaufteilung der DCT-Koeffizienten für eine GOB wird in GQUANT angegeben. Makroblockdaten werden am Ende der GOB-Ebene wiederholt. Die Makroblockdaten beginnen mit einer MBA (Makroblockadresse), die eine relative Position angibt, an der sich gültiger Code befindet. In der MC-DCT-Kodierung wird ein bewegungsloser Bereich in einem Bild wiedergegeben, ohne eine Bewegungsvektor und einen DCT-Koeffizienten zu übertragen.
In einem solchen Bereich ist es nicht erforderlich, die Daten des Makroblocks zu übertragen, was als Überspringen von Makroblöcken bezeichnet. Hierzu wird ein MBA verwendet. MTYPE (type data/Typedaten) wird dazu verwendet, um die Kodierung eines Makroblocks als Interframe oder Intraframe anzugeben. Bei der MC-DCT-Kodierung, mit Ausnahme von H.281, wird im Allgemeinen der Wechsel zwischen Intrakodierung und Interkodierung zusätzlich zum Wechsel auf Vollbildebene auch auf der Ebene von Makroblöcken ausgeführt.
Der MTYPE beinhaltet weiterhin auch die Information, ob der Makroblock einem Schleifenfilter zugeführt wurde. Ein Schleifenfilter ist eine spezielle Prozessierung in H.261 (nicht in den anderen Standards enthalten), um ein bewegungskompensiert es, vorherbestimmtes Bild durch lokale Filterung zu mitteln. Da die Effizienz der Vorhersage in manchen Fällen gesteigert werden kann, wird das Schleifenfilter adaptiv verwendet. MQUANT (Eigenschaften der Quantisierung) geben die Abstufungen der Quantisierung der DCT-Koeffizienten in einer durch GQUANT bestimmten GOB an und werden übertragen, falls dass die Abstufungen der Quantisierung auf Makroblockebene geändert werden muss. MVD (Motion Vector Data/Bewegungsvektordaten), gibt den für die Bewegungskompensation verwendeten Bewegungsvektor an. CBP (Coded Block Pattern/Muster der kodierten Blöcke) gibt ein kennzeichnendes Blockmuster an.
Unter den 6 DCT-Blöcken ist es nicht notwendig, einen Block zu übertragen, dessen DCT-Koeffizienten alle Null sind. Daher werden nur DCT-Koeffizienten übertragen, wenn CBP einen Block mit von Null verschiedenen DCT-Koeffizienten aufweist.
Als nächstes wird der MPEG-4 Standard beschrieben.
MPEG-4 hat verschiedene Funktionen, die als Profile bezeichnet werden, und die abhängig von den jeweiligen Anwendungen verwendet werden. Die Ausführungsbeispiele verwenden ein möglichst einfaches Profil, das eine Umwandlung betrifft.
6 beschreibt die Bilddatenstruktur von MPEG-4. Die Bildgröße wird durch ein QCIF-Bild mit der doppelten horizontalen und vertikalen Größe wie ein CIF-Bild (Common Interface Format/gemeinsames Schnittstellenformat) definiert. In MPEG-4 ist die Bildgröße jedoch beliebig und auch nicht auf ein Vielfaches von 16 beschränkt. Weiterhin ist in MPEG-4 auch das Bildverhältnis beliebig (das Verhältnis von vertikalen Linien zu horizontalen Linien bei rechteckigen Bildpunkten). Diese Verhältnis ist 4:3 bei H.261.
Um die Ausführungen im Folgenden zu vereinfachen, erfüllen die hier betrachteten Bildgrößen alle die H.261-Spezifikationen.
Anstelle einer GOB wird in MPEG-4 eine Struktur definiert, die Videopaket genannt wird. Im Gegensatz zur GOB, die man durch unterteilen des Bildes in feste Rechtecke erhält, ist der Startpunkt eines Videopakets für jeden Makroblock beliebig. Die übrigen Strukturen eines DCT-Blocks sind annähernd die gleichen wie bei H.261 und daher in 6 nicht dargestellt.
Ein Bild oder Vollbild wird in MPEG-4 als Videoobjektebene (Video Object Plane) bezeichnet (im Folgenden als VOP bezeichnet).
Ein Datenstrom beginnt in MPEG-4 mit einem VSC (ein VOP Startcode), gefolgt von VTYPE (der VOP Kodiertyp), der angibt, ob das Vollbild intraframe kodiert (intrakodiert) oder interframe kodiert (interkodiert) ist. Bei H.261 gibt TR (Temporal Reference/Zeitreferenz) als Zeitangabe die Vollbildnummer an. In MPEG-4 dagegen ist die Zeit bezüglich eines Referenzvollbildes direkt in einer MTB (Module Time Base) in Sekunden und in einem VTI (Video Time Incerement) für Einheiten kleiner als eine Sekunde angegeben. Dies ist in den oben genannten Druckschriften detailliert beschrieben und daher wird hierauf nicht weiter eingegangen. Die Daten der Quantisierungseigenschaften zur Beschreibung der Abstufung der Quantisierung werden in VQUANT angegeben, das GQUANT aus H.261 entspricht. Vor dem Paketheader wird eine RSM (Resync Marke/Resynchronisationsmarke) eingefügt, um im Falle von Übertragungsfehlern direkt eine neue Synchronisation durchführen zu können. Der Videopaketheader enthält die Daten bezüglich einer VOP, die nach der Neusynchronisation benötigt werden.
Die Daten eines Makroblocks beginnen mit NCD (Not Coded, invalid flag/nicht kodiert, ungültig-Flag). Bei H.261 wird ein ungültiger Makroblock durch Verwendung einer relativen Adresse des nächsten gültigen Makroblocks übersprungen. In MPEG-4 dagegen wird ein ungültiger Makroblock durch ein Flag von einem Bit dargestellt. MCPBC (Makroblocktyp und das kodierte Blockmuster der Farbdifferenz) wird auf die gleiche Weise verwendet wie MTYPE für einen Wechsel zwischen Intrakodierung und Interkodierung.
Da MPEG-4 kein Schleifenfilter beinhaltet, enthält MCBPC auch keine Angabe über eine Schleifenfilterung. Dafür gibt MCBPC ein Muster der gültigen/ungültigen DCT-Blöcke des Signals an. Mit anderen Worten, MCBPC beinhaltet neben anderen Daten des CBP aus H.261 auch Daten bezüglich des Farbdifferenzsignals. Hinsichtlich eines Musters für die Gültigkeit/Ungültigkeit der Helligkeitswerte eines DCT-Blocks, umfasst CBPY (signifikantes Blockmuster der Helligkeitsinformation) eine Folge von 4 Helligkeitsblöcken.
DQUANT wird für den Wechsel der Quantisierungsabstufung der DCT-Koeffizienten auf Makroblockebene verwendet. Die Erhöhung oder Verringerung des Wertes erstreckt sich, im Unterschied zu MQUANT, auf den Bereich von –2 bis +2. MVD (Motion Vector Data/Bewegungsvektordaten) gibt den zur Bewegungskompensation verwendeten Bewegungsvektor an. Die Genauigkeit ist bei H.261 im Bereich ganzer Bildpunkte, während MPEG-4 eine Genauigkeit von einem halbe Bildpunkt (0,5 Bildpunkte) besitzt. Die Struktur eines DCT-Koeffizientenblocks ist annähernd die gleiche wie bei H.261.
Wie oben beschrieben, haben MPEG-4 in seiner einfachsten Struktur und H.261 die gleiche grundlegende Struktur für die MC-DCT. Obwohl die Datenstruktur in MPEG-4 in einer anderen Art (Beschreibung der Kodierung) dargestellt wird als in H.261, gibt es zahlreiche Übereinstimmungen zwischen den beiden Daten. Die wesentlichen Unterschiede zwischen H.261 und MPEG-4 zur Umwandlung der Kodiersysteme sind folgende:
Bewegungskompensation

H.261: Ganzzahlige Genauigkeit und Schleifenfilter
MPEG-4: Genauigkeit von einem halben Bildpunkt Der Suchbereich kann durch eine F-Wert genannte Abstufung verändert werden; und es existiert ein Modus, in dem vier Bewegungsvektoren pro Makroblock vorhanden sind.

Quantisierung der DCT-Koeffizienten

Lineare Quantisierung mit der gleichen Abstufung der Quantisierung in H.261 und MPEG-4.

Bezüglich der Komponenten für den Gleichanteil hat MPEG-4 im Intrakodiermodus zusätzlich einen nichtlinearen Quantisierungsmodus, während die Intrakodierung in H.261 den Quantisierungsindex auf 8 festlegt.
Aufgrund der oben genannten Unterschiede kann ein Transcoder eine Konfiguration besitzen, in der die DCT-Koeffizienten direkt übertragen werden. Hierzu existiert eine in 3 dargestellte Konfiguration, in der die Daten auf Grundlage des Systems A (H.261 oder MPEG-4) in Daten auf Grundlage des Systems B (MPEG-4 oder H.261) übertragen werden.
Die von System A kodierten Daten werden zunächst dekodiert und das dekodierte Bild wir im Vollbildspeicher 302 gespeichert.
In diesem Fall werden Zusatzinformationen berücksichtigt. Diese Zwischendaten für die Kodeumsetzung sind in 8 dargestellt.
8 beschreibt Speicherbereiche im Speicher, in denen die entsprechenden Daten gespeichert werden, wie es in einem späteren Ausführungsbeispiel beschrieben wird.
Die Bedeutung der einzelnen Daten ist nachfolgend erläutert. Wie anhand der oben beschriebenen Datenstruktur ersichtlich ist, können diese Daten als Zwischendaten verwendet werden.

• Der Kodiermodus des nächsten Vollbildes ist NPTYPE = („I", „P", „U") Durch ein Vorauslesen während der Dekodierung im System A bestimmt. VTYPE in MPEG-4, und „U": unbestimmt in H.261.
• Der Inhalt des gegenwärtigen Vollbilds Pcontent (Einheit: kbits) Durch die Dekodierung eines Vollbildes des Systems A erhalten. Wird die Aufzeichnung ausgeführt nachdem das Vollbild vollständig dekodiert wurde, entspricht der Inhalt der Kodemenge der eines Vollbildes. Beginnt die Aufzeichnung mitten während der Dekodierung des ursprünglichen Vollbildes, so ist der Inhalt äquivalent zu der Kodemenge die zu dem Zeitpunkt erhalten wurde an den die Dekodierung ausgesetzt wurde.
• Der Kodiermodus des gegenwärtige Vollbilds PTYPE = („I", „P") „I" bezeichnet die Intrakodierung und „P" bezeichnet die Interkodierung. In H.261 bedeutet „1", dass alle Makroblöcke intrakodiert sind und „P" bezeichnet alle übrigen Fälle, mit Ausnahme des oben genannten. Dies wird im Folgenden durch PREDi,j beschrieben.
• Nummer des gegenwärtigen Vollbildes TR (ganze Zahl) Wird in MPEG-4 durch MTB und VTI erhalten.
• Gültig/ungültig Flag CD i,j = [0, 1, „U"] Dieses Flag kennzeichnet einen Makroblock mit gültig:0 oder ungültig:1. I und j kennzeichnen die entsprechende horizontale und vertikale Position den Makroblocks. „U" steht für "unbestimmt". Beispielsweise wird der Fall eines neu zu kodierendes P-Bildes des Systems A, um ein 1-Bild im System B zu erhalten mit „unbestimmt" bezeichnet.
• Block gültig/ungültig Flag CPB i,j,k = [0, 1, „U"] Dieses Flag gibt für einen DCT-Block gültig oder ungültig an. In MPEG-4 wird dies durch MCBPC und CBPY bestimmt. Da Y × 4, Cr × 1 und Cb × 1, nimmt k Werte zwischen 0 und 5 an.
• Abstufung der Quantisierung QUANT i,j = (1, –,31, „U"] Dieser Index gibt die Abstufung der Quantisierung auf Makroblockebene an.
• Kodiermodus MTYPE i,j = ["I", "P", „U"] Gibt den Intra- oder Interkodiermodus auf Makroblockebene an. „U" steht für „unbestimmt".
• Bewegunsvektor (MVXi,j, MVYi,j) Der Wertebereich ist [–15, –, 15, „U"] Die absoluten horizontalen und vertikalen Werte des Bewegungsvektors mit ganzzahliger Genauigkeit, um eine Übereinstimmung mit H.261 zu erreichen, das ebenfalls ganzzahlige Genauigkeit verwendet.
• Intraperiode PERIOD i,j = ganze Zahl zwischen [0, 99] In einem MC-DCT-System addieren sich aufgrund der Abweichungen zwischen Kodierung und Dekodierung die Ungenauigkeiten der DCT Berechnungen. Um damit fertig zu werden, soll ein Makroblock innerhalb einer Periode von 132 Vollbildern intrakodiert werden. Diese Operation wird „Intra-refreshing" genannt. PERIOD ist ein Zähler, um das Intra refreshing regelmäßig auszuführen. Der Standardwert ist 0.
• Bewegungsbereich Flag MOVi,j = [0, 1, „U"] Dieses Flag gibt an, ob eine Makroblock einen Bereich mit Bewegung enthält. „1" weist auf einen Bereich mit Bewegung hin. In diesem Ausführungsbeispiel weist ein absoluter Wert eines der Elemente (MVX1,j, MVYi,j) von 1 oder größer auf eine Bereich mit Bewegung hin.

Die Datenstruktur von H.261 und MPEG-4 wurden oben beschrieben. Im Folgenden wird nun ein gemeinsames Flussdiagramm des ersten und zweiten Ausführungsbeispiels beschrieben.
Während der Initialisierung werden zunächst alle i und j von PERIODi,j zu Null gesetzt. Diese Daten betreffen die Steuerung der Intra-Inter-Kodierung auf Makroblockebene.
Als nächstes werden entsprechende den Schritten für die Rekonstruktion eines Bildes aus dem System A (H.261 oder MPEG-4) und die Generierung der Zwischendaten, das rekonstruierte Bild und die Zwischendaten PTYPE, TR, CDi,j, CBPi,j,k, QUNATi,j, MTYPEi,j, (MVXi,j, MVYi,j) und MOVi,j erzeugt.
Daraufhin gelten folgende Grundprinzipien eines Transcoders:

Grundprinzip 1: Die in System A erzeugten Zusatzinformationen PTYPE, TR, CD i,j, CBP i,j,k, QUANT i,j und MTYPE i,j werden zur Weiterverwendung an das System B weitergeleitet. Durch eine Neuquantisierung kann eine durch sich ansammelnde Fehler verschlechternde Bildqualität vermieden werden. Weiterhin werden einige der in System A erzeugten Zusatzinformationen zur Mengenanpassung geändert. Das zur Änderung angewandte Verfahren wird weiter unten beschrieben.
Grundprinzip 2: Die Daten der Bewegungsvektoren (MVXi,j und MVYi,j) werden als Referenzdaten für die Aufzeichnung im System B verwendet. Mit anderen Worten, hat der Bewegungsvektor einen fest Wert, so wird in der Nachbarschaft dieses festen Wertes eine neue Position gesucht, so dass der Bewegungsvektor eine Differenz minimiert.

In 9 bezeichnet sich das Flussdiagramm, nachdem die Zwischendaten erzeugt wurden. Falls der Kodiermodus des gegenwärtigen Vollbildes der Interkodier-Modus ist, der Kodiermodus des nachfolgenden Bildes der Intrakodiermodus ist und die in den Speicher geschriebene Kodemenge folgende Bedingung erfüllt:
Pcontent (Angesammelte Kodemenge des Vollbildes) > halbe Speicherkapazität,
so wird das gegenwärtige Vollbild verworfen, die Kodierung des Bildes wird abgebrochen und das nachfolgende Vollbild wird intrakodiert.
Weiterhin wird der gleiche, oben beschriebene Vorgang ebenfalls ausgeführt, wenn die Seite des Dekodierers eine Intrakodierung für das nächste Vollbild erzwingt.
In einer MC-DCT-Kodierung ist ein intrakodiertes Vollbild, I-Bild genannt, wichtig, da die Vollbilder, die einem I-Bild folgen ohne das I-Bild nicht dekodiert werden können. Wenn die verbleibende Kapazität die Ausgabespeichers relativ gering ist, besteht die Gefahr, dass es durch eine Aufzeichnung nach dem oben genannten Grundprinzip 1 in dem Ausgabespeicher zu einem Datenüberlauf während der Aufzeichnung eines I-Bildes kommt. Wird ein I-Bild aufgrund eines Überlaufs nicht kodiert, so verschlechtert sich die Bildqualität. Daraufhin wird NPTYPE des nachfolgenden Vollbildes vorausgelesen und das Kodierverfahren des Systems B wird entsprechend von NPTYPE des nachfolgenden Vollbildes und des gegenwärtigen Füllstandes des Speichers (Bcontent) angepasst. Mit anderen Worten, wenn das nachfolgende Vollbild ein I-Bild ist und die Möglichkeit eines Datenüberlaufs im Ausgabespeichers während de Aufzeichnung des I-Bildes besteht, wird das gegenwärtige Vollbild (P-Bild) verworfen. Dadurch wird sichergestellt, dass die Kapazität des Ausgabespeichers für das I-Bild ausreicht, das das nächste aufzuzeichnende Vollbild ist. Dieses Konzept ist in 9 dargestellt.
Das eine Angabe über Intra- oder Interkodierung in H.261 nicht im Header des Vollbildes enthalten ist, ist die bedingte Verzweigung in 9 nur bei einer Transformation von MPEG-4 nach H.261 anwendbar.
Im Falle von „nein" in der verzweigten Bedingung aus 9 (immer „nein" bei einer Transformation von H.261 nach MPEG-4) wird zur Steuerung der Intra-Inter-Kodierung verzweigt. Zur Weiterverarbeitung nach dieser Steuerung beschreibt das erste Ausführungsbeispiel ein Umsetzungsverfahren von H.261 nach MPEG-4 und das zweite Ausführungsbeispiel beschreibt ein Transformationsverfahren von MPEG-4 nach H.261.
Im ersten Ausführungsbeispiel wird eine Transformation gemäß den Flussdiagrammen der 9 bis 11 ausgeführt. In den fett umrandeten Schritten aus 9 wird eine Steuerung (S10) des Intra-Inter-Kodiermodus ausgeführt, wie sie in 10 dargestellt ist. Ferner wird ein Wechsel der kodierten Daten auf Makroblockebene zur Mengenregelung durchgeführt, wie sie in dem Flussdiagram in 11 dargestellt ist.
Dabei wird für den Fall einer Mengenanpassung angenommen, dass die Kodierrate in H.261 64 kbps ist, und die Kodierrate in MPEG-4 ebenfalls 64 kbps ist. Die Speichergröße des Ausgabespeichers sei 6,4 kbit.
10 stellten eine Steuerung des Intra-Inter-Kodiermodus dar.
Wird eine H.261 Datenfolge in eine MPEG-4 Datenfolge transformiert, so wird eine vorbestimme Anzahl von Makroblöcken (in diesem Ausführungsbeispiel 3) in absteigender Reihenfolge aus den zu dem Bereich der Bewegung gehörenden Makroblöcken ausgewählt, und als Kodiermodus der ausgewählten Makroblöcke wird der Intra-Kodiermodus erzwungen.
Gemäß dem oben beschriebenen Vorgehen werden die fehlerbeständigen Eigenschaften des MPEG-4 Datenstroms verbessert, da eine Intra-Kodierung der Makroblöcke hauptsächlich in den Bereich der Bewegung ausgeführt wird. Dies liegt daran, dass ein Übertragungsfehler, der en einem unbewegten Bereich auftritt auch den Bereich der Bewegung verschlechtert, da das Ergebnis des vorherigen Vollbilds erneut kopiert wird.
11 beschreibt die Prozessierungschritte für die Aufzeichnung von Makroblöcken des Interkodiermodus. Als Bewegungsvorhersage wird das im Grundprinzip 2 des Transcoders aufgezeigte Vorgehen ausgeführt.
Zu diesem Zeitpunkt werden VAR und VAROR berechnet.
VAR ist dabei das mittlere Quadrat der bewegungskompensierten Interblock-Differenzbildpunkte (Helligkeitsvarianz) und beschreibt die Energie des Interframe-Differenzsignals. VAROR gibt das mittlere Quadrat eines Intrablock-Bildpunktes des Eingangssignals an (Helligkeitsvarianz) und stellt die Energie des Intraframe-Signals dar. RM8 (in der oben zitierten Druckschrift beschrieben) als ein typisches Beispiel eines H.261-Kodierers bestimmt mittels VAR und VAROR, ob der Kodiermodus eines Makroblocks der Inter- oder Intra-Kodiermodus ist. Im Besonderen wird die Interkodierung ausgeführt, wenn VAR < 64, d.h. das Energieniveau des Interframe-Differenzsignals absolut klein ist, oder VAR < VAROR, d.h das Energieniveau des Interframe-Differenzsignals ist kleiner als das Energieniveau des Interaframe-Signals.
Für die Interkodierung wird die Mengenanpassung ausgeführt, um die erzeugte Kodemenge so anzupassen, dass die Kodemenge im Speicher (Bcontent) nahe an die festgelegte Kodemenge herankommt. In diesem Ausführungsbeispiel, wird die festgelegte Kodemenge auf der Grundlage folgender Gleichung berechnet: festgelegte Kodermenge = Pcontent × (MPEG-4 Kodierrate/H.261 Kodierrate) × Anzahl der gerade prozessierten Makroblöcke/Gesamtzahl der Makroblöcke
In diesem Ausführungsbeispiel sind die beiden Kodierraten 64 kbps, (MPEG-4 Kodierrate/H.261 Kodierrate) ist 1 (= 1).
Da die festgelegte Kodemenge (mit anderen Worten der erzeugte kodierte Inhalt) auf der Grundlage von Pcontent berechnet wird, ist es möglich die ursprünglich ausgeführte Mengenanpassung zu erzielen, während die Quantisierungskontrolle von H.261 so weit wie möglich beibehalten wird. Beispielsweise kann die Mengenregulierung so ausgeführt werden, dass das Verhältnis der Kodemengen auf Basis der kodierten Einheiten der Datenfolge aus System A nahe an das Verhältnis der Kodemenge auf Basis der kodierten Einheiten der Datenfolge aus System B kommt.
Zusätzlich wird ein Faktor „r" mit dem VAR multipliziert wird, wie folgt berechnet: r = max (1,0, festgelegte Kodemenge/erzeugte Kodemenge)
Folglich ist VAR größer als 1 falls die erzeugte Kodemenge kleiner als die festgelegte Kodemenge ist. Dementsprechend wird VAR = VAR·r gesetzt, um VAR zu erhöhen, für den Fall, dass die verbleibende Kapazität des Ausgabespeichers relativ groß ist (die erzeugte Kodemenge ist kleiner als die festgelegte Kodemenge), so dass öfter der Intra-Kodiermodus gewählt wird. Hierdurch wird der Modus gesteuert.
Für die allgemeine Steuerung eines Kodierers werden zur Verbesserung der Bildqualität die Quantisierungsstufen verkeinert, wenn die Datenrate relativ groß ist. In einer systemumsetzenden Kodierung gemäß der vorliegenden Erfindung dagegen, die, wie oben beschrieben, vorzugsweise die Quantisierungsmerkmale möglichst nicht ändert, wird die Anzahl der Vollbilder des Intra-Kodiermodus (1-Bilder) erhöht, damit die Änderungen der Quantisierungsstufen minimiert wird. Diese Prozessierung verbessert die fehlerbeständigen Eigenschaften hinsichtlich Übertragungsfehler, wie den Verlust eines Paketes. Da angenommen werden kann, dass MPEG-4 eine höhere Effizienz der Kodierung erzielt als H.261, wird für eine Umsetzung mit der gleichen Datenrate im Allgemeinen der oben beschriebene Vorteil erreicht, in dem die Steuerung öfter den intra-kodierten Modus wählt, solange noch Kapazität im Ausgabespeicher übrig ist.
Zusätzlich ist der letzte Schritt in dem in 11 dargestellten Flussdiagramm die Steuerung von QUANT i,j. In RM8 erhält man die Abstufung der Quantisierung für den Fall von 64 bkps, durch die folgende Gleichung: Quantisierungsabstufung = 2 × int(Kodemenge im Speicher[bit]/200 + 2
Die Anpassung der Abstufung der Quantisierung auf Grundlage der oben genannten Gleichung erhält eine Rückmeldung, dass die Quantisierungsabstufung vergrößert wird, falls sich die Kodemenge im Speicher erhöht. Damit wird die erzeugte Kodemenge verringert.
Unter Berücksichtigung der Beziehung zwischen den sich angesammelten Quantisierungsfehlern und dem erzeugten binären Inhalt, wird die Abstufung der Quantisierung in diesem Ausführungsbeispiel wie folgt geändert:
Kodemenge im Speicher > 70% der Speicherkapazität
Quantisierungsabstufung = QUANT i,j × 2
Kodemenge im Speicher > 80% der Speicherkapazität
Quantisierungsabstufung = QUANT i,j × 3
Kodemenge im Speicher > 90% der Speicherkapazität
Quantisierungsabstufung = QUANT i,j × 4
Da bei MPEG-4 der Wert von QUANT i,j zwischen benachbarten Makroblöcken nur um maximal 2 verändert werden darf, ist die Änderung der Abstufung zusätzlich auf maximal 2 beschränkt.
Daher wird zuerst die Kodiermodus so gesteuert, dass die Kodemenge im Speicher nahe an den Zielwert für den kodierten Inhalt kommt. Wenn es weiterhin notwendig ist die Quantisierungseigenschaften (Abstufung der Quantisierung) zu ändern, wird die Quantisierungsabstufung des Systems B auf ein ganzzahliges Vielfaches der Abstufung der Quantisierung des Systems A gesetzt.
Wie oben beschrieben, ist das erste Ausführungsbeispiel ein Beispiel für eine Verfahren zur Mengenanpassung unter Beibehaltung der Eigenschaften der Quantisierung vor der Umwandlung des Systems.
Falls die verbleibende Kapazität im Ausgabespeicher relativ groß ist, wird in diesem Ausführungsbeispiel zusätzlich die Anzahl der Makroblöcke, die intra-kodiert werden sollen erhöht, indem der Wert VAR neu definiert wird. Es ist jedoch auch möglich, einen Wert N, der die Intra-Wiederholrate eines zu einem Bewegungsbereich gehörenden Makroblocks beschreibt, zu erhöhen oder zu erniedrigen.
Als nächstes wird das zweite Ausführungsbeispiel beschrieben.
Das zweite Ausführungsbeispiel beschreibt ein Umwandlungsverfahren von MPEG-4 nach H.261. Die Umwandlungsoperationen diese Ausführungsbeispiels werden entsprechend den in den 9, 12 und 13 dargestellten Ablaufdiagrammen ausgeführt.
Zwischen den fett umrandeten Schritten wird eine Steuerung der Intra-Inter-Kodierung entsprechend des Ablaufdiagrams aus 12 und eine Änderung der Kodierdaten auf Makroblockebene entsprechend des Ablaufdiagramms aus 13 ausgeführt.
Um die Beschreibung zu vereinfachen, werden hauptsächlich die Unterschiede zum ersten Ausführungsbeispiel erläutert.
Dabei wird angenommen, dass zur Verbesserung der Fehlerbeständigkeit mehr Makroblöcke als erforderlich intra-kodiert werden, obwohl MPEG-4 eine bessere Kodeeffizienz als H.261 besitzt.
Die in 12 dargestellte Steuerung des Intra-Inter-Kodiermodus setzt mit Ausnahme von Makroblöcken mit einer maximalen PERIODi,j, oder einem Makroblock dessen PERIODi,j die gesamte Anzahl von Makroblöcken (99) übersteigt den Kodiermodus der intrakodierten Makroblöcken zu „U" (unbestimmt). Somit verbleiben selbst in dem Fall, dass das gegenwärtige Vollbild sich im Inter-Frame Kodiermodus befindet, nur eine minimale Zahl von intra-kodierte Makroblöcke, und der Kodiermodus der übrigen intra-kodierten Makroblöcke ist zu „U" (unbestimmt) gesetzt. Folglich tritt der Fall auf, dass die übrigen intra-kodierten Makroblöcke im nächsten Schritt (13) nochmals inter-kodiert werden.
Für den Fall, dass die Daten von einem System B mit einer hohen Kodiereffizient in ein System A mit einer niedrigen Kodiereffizienz umgewandelt werden, besteht die Möglichkeit eines Datenüberlaufs im Ausgabespeicher, wenn I-Bilder (intra-kodierte Bilder) aus der Datenfolge B des Systems B alle in die Datenfolge A des Systems A umgewandelt werden, da die Kodemenge eines I-Bildes größer ist als die eines P-Bildes (inter-kodiertes Bild). In diesem Ausführungsbeispiel wird die Anzahl der Makroblöcke, die intra-kodiert werden verringert, um einen Überlauf des Speichers vorzubeugen, ohne die Abstufung der Quantisierung zu verändern. Mit anderen Worten, die Anzahl der Makroblöcke die interkodiert werden sollen wird relativ erhöht.
Die in 13 dargestellte Entscheidung der Intra-Inter-Kodierung ist ein allgemeines Entscheidungsverfahren aufgrund der in RM8 beschriebenen Werte VAR und VAROR. Die Kontrolle von QUANT i,j als letzten Schritt in 13 ist die gleiche wie in dem ersten Ausführungsbeispiel und wird daher nicht weiter erläutert.
Gemäß des zweiten Ausführungsbeispiels, in dem eine Umwandlung in das H.261 System erfolgt, und das im Allgemeinen eine Kodiereffizienz besitzt, die geringer ist als die von MPEG-4, wird der Kodiermodus geändert indem intra-kodierte Makroblöcke in inter-kodierte Makroblöcke umgewandelt werden. Hierdurch kann ein Überlauf des Speichers verhindert werden, ohne dabei die Abstufung der Quantisierung anderer Makroblöcke zu beeinflussen. Als nächstes werden zwei Ausführungsbeispiele einer Vorrichtung zur Umwandlung der Bildkodierung beschrieben. 14 stellt das Konzept-Schaubild eines Codeumwandlers dar, wie er dem dritten und vierten Ausführungsbeispiel gemeinsam zu Grunde liegt und der das Verfahren nach 9 ausführt.
Die in 8 beschriebenen Zwischendaten werden im dem Vollbild-Kodiermodus-Speicher 406, dem Bewegungsvektor-Speicher 407, dem Makroblock-Kodierspeicher 408 und dem Mengenanpassungs-Informationsspeicher 409 gespeichert. Der Kodiersteuerabschnitt 405 führt die in 9 beschriebene Steuerung aus. Der Abschnitt für den Wechsel des Vollbild-Kodiermodus 410 und der Abschnitt für den Wechsel des Makroblock-Kodiermodus führen jeweils einen Wechsel als Antwort auf das Steuersignal durch.
14 stellt einen Aufbau dar, in dem die Daten PTYPE, TR, CDi,j, CBPi,j,k, QUANT i,j und MTYPEi,j unverändert zum Kodierer des Systems B gelangen, solange der Kodier-Controller 405 kein Steuersignal überträgt.
Die Einzelheiten von 14 sind in 15 dargestellt, die eine Vorrichtung entsprechend dem Verfahren des ersten und des dritten Ausführungsbeispiels darstellt. 15 zeigt einen H.216 Dekodierer wobei 501 der Abschnitt der variablen Längenkodierung, 502 der Anschnitt der eine inverse Quantisierung zur Ausführung der inversen Quantisierung, 503 der Abschnitt einer inversen DCT, der eine inverse DCT ausführt, 504 ein Addierer, 505 ein Vollbildspeicher, 506 ein Abschnitt zur Bewegungskompensation, der eine Bewegungskompensation ausführt und 507 ein Schleifenfilter ist. Das dekodierte Bild wird über den Vollbildspeicher 505 an den MPEG-4-Kodierer geleitet.
Der MPEG-4 Kodierer setzt sich zusammen aus einem Subtrahierer 508, einem DCT-Abschnitt 509, der eine DCT-Berechnung ausführt, einem Quantisierungsabschnitt 510, der DCT-Koeffizienten quantisiert, einem Addierer 513, einem Vollbildspeicher 514, einem Abschnitt 515 zur Bewegungsvorhersage und Bewegungskompensation, der ein Bewegungsvorhersage und eine Bewegungskompensation ausführt, einem Abschnitt 516 zur variablen Längenkodierung und einem Ausgabespeicher 517.
518 ist ein Abschnitt zur Mengenanpassung für MPEG-4, der die Steuerung wie in den 9, 10 und 11 ausführt. Die Zwischendaten sind in dem Mengenanpassungsspeicher 519, dem Speicher 520 für den Kodiermodus des Makroblocks und den Speicher 521 für den Kodiermodus des Vollbildes gespeichert. Der MPEG-4 Kodierer wird überwacht, während er aus dem Zwischendaten die Daten für PTYPE, TR, CD i,j, CBP i,j,k, QUANT i,j und MTYPE i,j empfängt. Im Einzelnen wechselt der Abschnitt 522 für den Wechsel des Blockmodus den Kodiermodus eines Makroblocks und der Abschnitt zum Wechsel des Intra-Inter-Modus steuert die vorhersagbare Kodierung aufgrund der Daten von PTYPE und MTYPE.
Zusätzlich werden in dem Abschnitt 516 der variablen Längenkodierung die Modusdaten gemultiplext, um sie an den Ausgabespeicher auszugeben, der in der vereinfachten Abbildung nicht dargestellt ist.
Als nächstes wird das vierte Ausführungsbeispiel anhand von 16 erläutert.
Die Vorrichtung des vierten Ausführungsbeispiels führt, umgekehrt zu der Vorrichtung des dritten Ausführungsbeispiels, eine Umwandlung von MPEG-4 nach H.261 durch. Der MPEG-4 Dekodierer in 16 besteht aus einem Abschnitt 601 für die variable Längenkodierung, einem Abschnitt 602 für die inverse Quantisierung, einem Anschnitt 603 für die inverse DCT, einem Addierer 604, einem Vollbildspeicher 605 und einem Abschnitt zur Bewegungskompensation.
Das dekodierte Bild wird über den Vollbildspeicher 605 an den H-261 Kodierer geleitet.
Der H.261 Kodierer beseht aus dem Subtrahierer 607, dem DCT Abschnitt 608, dem Quantisierungsabschnitt 609, dem inversen Quantisierungsabschnitt 610, dem inversen Quantisierungsabschnitt 611, dem Addierer 612, dem Vollbildspeicher 613, dem Abschnitt 614 zur Bewegungsvorhersage und Bewegungskompensation, dem Schleifenfilter 615, dem Abschnitt 616 zur variablen Längenkompensation und dem Ausgabespeicher 617. 618 ist der Abschnitt zur H.261 Mengenanpassung und führt die Steuerung wie in 9, 12 und 13 beschrieben aus. Die Zwischendaten werden in dem Speicher 619 zur Mengenanpassung, dem Speicher 620 für den Kodiermodus, dem Makroblocks und dem Speicher 621 für den Kodiermodus des Vollbildes gespeichert. Der H.261 Kodierer wird überwacht, während er aus den Zwischendaten PTYPE, TR, CD i,j, CBP i,j, und MTYPE i,j empfängt. Im Einzelnen wechselt der Abschnitt für den Wechsel des Blockmodus den Kodiermodus eines Makroblocks und der Abschnitt zum Wechsel des Intra-Inter-Modus steuert die vorhersagbare Kodierung aufgrund der Daten PTYPE und MTYPE. Zusätzlich werden in dem Abschnitt 623 für die variablen Längenkodierung die Modusdaten gemultiplext, um sie an den Ausgabespeicher auszugeben, der in der vereinfachten Abbildung nicht dargestellt ist.
Der Umfang der vorliegenden Erfindung beinhaltet ein Computerprogrammprodukt in Form eines Aufzeichnungsmediums auf dem ein von einem Computer ladbares Programm gespeichert ist, mit dem die vorliegenden Erfindung ausgeführt werden kann. Die Aufzeichnungsmedien umfassen Medien wie Disketten, optischen Medien, CD-ROM und magnetische Medien, ROM, RAM, EPROM, EEPROM und magnetischen und optischen Karten. Die vorliegende Erfindung ist jedoch nicht auf solche Medien beschränkt. Weiterhin ist es auch möglich das Programm auf einem Aufzeichnungsmedium zu speichern und weltweit zu einem Terminal zu versenden, oder das Programm (in verschlüsselter Form vertrieben) über einen Kommunikationskanal, wie das Internet weiterzuleiten und dadurch die vorliegende Erfindung auf einem Computer oder einem tragbaren Informationsterminal auszuführen.

Claims

Verfahren zur Codeumsetzung einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und einen Interframe-Kodierungsmodus besitzt, in eine zweite Datenfolge, erzeugt von einem zweiten Bewegtbildkodiersystem, das einen Intraframe-Kodierungsmodus und eine Interframe-Kodierungsmodus besitzt, bestehend aus den Schritten: Ausführen einer Mengenregelung zur Regelung der Codemenge der zweiten Datenfolge; Kodierung des gegenwärtigen Vollbildes durch das zweite Bewegtbildkodiersystem; gekennzeichnet durch Vorauslesen des Kodiermodus des nachfolgenden Vollbildes, das in der ersten Datenfolge dem gegenwärtigen Vollbild folgt; Entscheiden, ob der vorausgelesene Kodiermodus des nachfolgenden Vollbildes der Intraframe-Kodiermodus ist oder nicht; Bestimmen, ob das gegenwärtige Vollbild durch das zweite Bewegtbildkodiersystem kodiert wird oder nicht, aufgrund der Entscheidung für das nachfolgende Vollbild und der erzeugten Codemenge der zweiten Datenfolge; und gemäß dieser Bestimmung, entweder Verwerfen des gegenwärtigen Vollbilds, wenn die erzeugte Codemenge der zweiten Datenfolge einen vorbestimmten Wert übersteigt und als Ergebnis für das nachfolgende Vollbild der Intraframe-Kodiermodus entschieden wurde; oder andernfalls Kodieren des gegenwärtigen Vollbilds.
Verfahren nach Anspruch 1, das des Weiteren einen Schritt umfasst, der die zweite Datenfolge, die von dem zweiten Bewegtbildkodiersystem erzeugte wurde, in einen Ausgabespeicher (404) schreibt, wobei die in den Speicher des Ausgabespeichers (404) geschriebene Codemenge als die Codemenge der zweiten Datenfolge verwendet wird.
Verfahren nach den Ansprüchen 1 oder 2, das des Weiteren die Schritte umfasst: Bestimmen der Codemenge auf der Basis von kodierten Einheit, in dem die Daten der erster Datenfolge auf der Basis von kodierten Einheiten gelesen werden; Berechnen eines Zielwertes für die Codemenge der zweiten Datenfolge auf Basis von kodierten Einheiten, wobei der Zielwert durch Multiplikation der bestimmten Codemenge mit einem Faktor berechnet wird; und Ausführen einer Mengenregelung so, dass die erzeugte Codemenge der zweiten Datenfolge dem Zielwert nahe kommt, indem das zweite Bewegtbildkodiersystem die zweite Datenfolge aus der ersten Datenfolge auf Basis von kodierten Einheiten erzeugt; wobei das Verhältnis der Codemenge auf Basis von kodierten Einheiten der erster Datenfolge, dem Verhältnis der Codemenge auf Basis der kodierten Einheiten der zweiter Datenfolge, die der ersten Datenfolge entsprechen, nahe kommt.
Verfahren nach einem der Ansprüche 1 bis 3, das des Weiteren die Schritte umfasst: Ermitteln einer Quantisierungsabstufung, die in dem ersten Bewegtbildkodiersystem zur Quantisierung von Daten benutzt wird, während die Daten der ersten Datenfolge gelesen werden; und Ändern der Quantisierungsabstufung des zweitem Bewegtbildkodiersystem in ein ganzzahliges Vielfaches der ermittelten Quantisierungsabstufung, falls die Codemenge der zweiter Datenfolge durch eine Kodierung des gegenwärtigen Vollbilds durch das zweite Bewegtbildkodiersystem angepasst wird.
Verfahren nach einem der Ansprüche 1 bis 3, das des Weiteren einen Schritt umfasst, der die Quantisierungsabstufung des zweiten Bewegtbildkodiersystems ändert, falls das Vollbild durch das zweite Bewegtbildkodiersystem kodiert wird und die erzeugte Codemenge der zweiten Datenfolge angepasst wird.
Vorrichtung zur Codeumsetzung einer ersten Datenfolge, erzeugt von einem ersten Bewegtbildkodiersystem, das einen Intraframe-Kodiermodus und einen Intraframe-Kodiermodus besitz, in eine zweite Datenfolge, erzeugt durch ein zweites Bewegtbildkodiersystem, das einen Intraframe-Kodiermodus und einen Interframe-Kodiermodus besitz, umfassend: Einrichtung zum Ausführen einer Mengenregelung zur Regelung der Codemenge der zweiter Datenfolge; und Kodiereinrichtung (103) zur Kodierung des gegenwärtigen Vollbilds durch das zweite Bewegtbildkodiersystem; gekennzeichnet durch Einrichtung zum Vorauslesen eines Kodiermodus des nachfolgenden Vollbilds, das in der ersten Datenfolge dem gegenwärtigen Vollbild nachfolgt; Einrichtung zur Entscheidung, ob der vorausgelesener Kodiermodus der Intraframe-Kodiermodus ist oder nicht, Einrichtung zur Bestimmung, ob ein gegenwärtiges Vollbild durch das zweite Bewegtbildkodiersystem kodiert wird oder nicht, aufgrund des Ergebnisses der Entscheidungseinrichtung für das nachfolgende Vollbild und der erzeugten Codemenge der zweiten Datenfolge; und basierend auf diesem bestimmten Ergebnis, entweder Einrichtung zum Verwerfen, die das gegenwärtige Vollbild verwirft, wenn die erzeugte Codemenge der zweiten Datenfolge einen vorbestimmten Wert überschreiten und die Entscheidungseinrichtung als Ergebnis für das nachfolgende Vollbild den Intraframe-Kodiermodus anzeigt; oder andernfalls die Kodiereinrichtung das gegenwärtige Vollbild kodiert.
Rechnerprogrammprodukt, das ein Aufzeichnungsmedium umfasst, das computerlesbaren Programmcode beinhaltet, der Programmcode ist geeignet alle Schritte eines der Ansprüche 1 bis 5 auszuführen.