DE60214837T2

DE60214837T2 - Erkennung und genaue skalierung bewegter bereiche mit zeilensprung in mpeg-2 komprimiertem video

Info

Publication number: DE60214837T2
Application number: DE60214837T
Authority: DE
Inventors: Zhun Zhong; Tse-Hua Lan; Yingwei Chen
Original assignee: Koninklijke Philips Electronics NV
Current assignee: IPG Electronics 503 Ltd
Priority date: 2001-03-30
Filing date: 2002-04-02
Publication date: 2007-05-16
Anticipated expiration: 2022-04-03
Also published as: US6608867B2; EP1378127A2; CN1294763C; WO2002080564A2; KR20030014681A; ES2272701T3; CN1463554A; WO2002080564A3; JP4259114B2; DE60214837D1; JP2004519953A; KR100874118B1; EP1378127B1; US20030012276A1; ATE340486T1

Description

Die vorliegende Erfindung bezieht sich im Allgemeinen auf Decodierung/Dekompression von komprimiertem Video in der DCT-Domäne ("discrete cosine transform") und insbesondere auf Methoden und Systemen zur Detektion und zur genauen Filterung/Skalierung bewegter Bereiche mit Zeilensprung in MPEG-2 codiertem Video.
MPEG ist eine Abkürzung für "Moving Pictures Experts Group". MPEG wurde 11988 gegründet, ursprünglich zum Schaffen einer Norm für Kompression von bewegtem Video. Die Notwendigkeit von Kompression von bewegtem Video für digitale Übertragung wird offensichtlich mit sogar einem oberflächlichen Blick auf nicht komprimierten Bitraten im Gegensatz zu verfügbaren Bandbreiten. Bewegtbild-Video erfordert viel Speicherraum und viel Datenübertragungsbandbreite. Das Standard US Senderfernsehsignal, manchmal als ein "NTSC"-Signal bezeichnet, hat eine Bitrate von 168 Megabits ("Mbits") in der Sekunde. Vergleichsweise erfordert die Übertragung von Fünfkanal-Stereo unkomprimiertem Audio beispielsweise eine Bitrate von 3,5 Mbits in der Sekunde. Ein Ein-Geschwindigkeit-CD-ROM liefert Daten mit einer Bitrate von 1,5 Mbits in der Sekunde.
Das erste Ziel für die MPEG Gruppe war, Video mit Audio in eine CD-ROM Format Bandbreite von 1,5 Mbits in der Sekunde. Das Ergebnis ihrer Arbeit ist die MPEG-1 Codierungsnorm, vervollständigt 1991. Zu der betreffenden Zeit hatte die in MPEG-1 verkörperte Videokompressionstechnologie nicht die Fähigkeit, Video mit Zeilensprung in Senderqualität zu codieren. Dies wurde ein primäres Ziel für die MPEG-2 Norm.
Zeilensprung-Video beschreibt ein Abtastsystem für Video, ausgedacht in den frühen Tagen des Fernsehens um es zu ermöglichen, dass Videoframes mit einer ausreichend hohen Rate übermalt werden können um sichtbares Flimmern des Videoschirms zu vermeiden. Dies geschieht durch Abtastung abwechselnder Zeilen eines Bildes in einem halben Bildintervall. So werden beispielsweise in einem 525 Zeilensystem alle 525 Zeilen in einem Dreißigstel einer Sekunde, der Bildzeit, gezogen. Der Schirm wird in Wirklichkeit alle Sechzigstel einer Sekunde übermalt. Zunächst wird jede zweite Abtastzeile gezogen (das "obere" Teilbild), wonach die fehlenden Abtastzeilen folgen. Eine Schirmübermalung eines Sechzigstel einer Sekunde ist schnell genug um ein sichtbares Flimmern zu vermeiden.
Bild- und Teilbild-DCT
Videocodierung in MPEG-2 kann entweder bildbasierte DCT oder teilbildbasierte DCT sein. Ein bildbasierte DCT codierter Videoblock enthält Information von dem oberen Teilbild oder dem unteren Teilbild, aber nicht beides.
Bildbasierte DCTen werden meistens in stationären Bereichen verwendet, und zwar wegen des örtlichen progressiven Merkmals stationärer Bereiche, d.h. es gibt zwischen den zwei Teilbildern eine hohe räumliche Korrelation. Teilbildbasierte DCTen werden andererseits oft in Bewegungsbereichen verwendet, wo es wesentliche Differenzen zwischen den zwei Teilbildern gibt. Bildbasierte DCTen werden, wenn in dieser Situation verwendet, werden zu einer signifikante Energie in de hohen Vertikalfrequenz-DCT-Koeffizienten führen, wodurch die Kompressionseffizienz reduziert wird.
MPEG2 Decoder mit eingebetteter Neudimensionierung
Der MPEG2 Decoder mit eingebetteter Neudimensionierung ist ein Konzept, das den Leuten der Bewegtvideoindustrie und relatierter Gebiete bekannt ist. Ein Decoder mit eingebetteter Neudimensionierung ermöglicht es, dass eine einzige codierte Videoquelle in jedes unterstützte Wiedergabeformat, wie Standard NTSC (USA), PAL (Europa) oder andere Wiedergabeanordnung unter Verwendung eines anderen Decoders decodiert werden kann. Diese waren sehr wichtig, und zwar wegen deren relativ niedrigen Kosten in derartigen Applikationen als "Standard-Definition" (SD) Wiedergabe von "High-Definition" (HD) Videoströmen. Decoder mit eingebetteter Neudimensionierung nutzen den Vorteil des kleineren Ausgangsformats durch Einbettung von Skalaren in die Decodierungsschleife. Zur Vermeidung von Aliasing ist Filterung erforderlich, entweder vor oder kombiniert mit Skalierung. Die Filterung/Skalierung kann entweder in der räumlichen Domäne oder in der DCT Domäne gemacht werden. Die eingebettete Skalierung, wegen der Einfachheit vorzugsweise in der DCT Domäne durchgeführt, reduziert den Betrag an Daten, die in den IDTC- und in den MC-Decodierungsschritten durchgeführt werden müssen.
Außerdem ist aus anderen Gründen eingebettete Filterung und Skalierung von DCT codiertem Video nützlicher als nicht eingebettete Implementierungen. Erstens ist Filterung und Skalierung nach Volldekompression verschwenderisch für Systemmittel, da größere Speichergebiete und längere Berechnungssätze durchgeführt werden müssen. Zweitens kann der Vorteil spezieller Eigenschaften von Zeilensprung-Video für Skalierung und Filterung dadurch genutzt werden, dass ermöglicht wird, dass DCT codierte Blöcke gefiltert und entsprechend dem örtlichen Merkmal dynamisch skaliert werden.
Bild- und Teilbildfilterung/Skalierung
Es gibt auch zwei Möglichkeiten zur Filterung/Skalierung: bildbasiert und teilbildbasiert. Bildbasierte Filterung neigt dazu, räumliche Auflösung beizubehalten aber zeitliche Auflösung zu verlieren. Teilbildbasierte Filterung/Skalierung dagegen neigt dazu, zeitliche Auflösung beizubehalten, aber räumliche Auflösung zu verlieren. Deswegen sollten zum Erhalten der besten Ergebnisse bildbasierte Verfahren in stationären Bereichen angewandt werden und teilbildbasierte Verfahren sollten in bewegten Bereichen angewandt werden.
Es sei bemerkt, dass bildbasierten oder teilbildbasierten DCTen von dem Codierer gewählt werden, während Entscheidungen über bild- oder teilbildbasierte Filterung/Skalierung von dem Decoder getroffen werden. Der Decoder nimmt in dem vorliegenden Stand der Technik Zuflucht zu einer der nachfolgenden zwei Annäherungen um zu entscheiden, ob bild- oder teilbildbasierte Filterung/Skalierung angewandt wird.

1. Es wird vorausgesetzt, dass der Codierer die geeignete Wahl trifft, d.h. Bild-DCTen für stationäre Bereiche und Teilbild-DCTen für bewegte Bereiche. Der Decoder selektiert ganz einfach bild- oder teilbildbasierte Filterung/Skalierung auf Basis des DCT-Typs, der von dem Codierer selektiert wurde;
2. Man soll den Codierer überhaupt nicht glauben und man soll immer die gleiche Filter-/Skalierungsmode anwenden, ungeachtet des DCT-Typs. Unter Anwendung dieser Annäherung, wird meistens teilbildbasierte Filterung/Skalierung auf Bild-DCTen sowie auf Teilbild-DCTen angewandt.

Die erste Annäherung liefert eine bessere räumliche Auflösung, wenn der Codierer die richtige Wahl macht, so dass das Bild im Allgemeinen schärfer ist. Diese Annäherung ist aber anfällig für schlechte Entscheidungen des Codierers, wie die Verwendung von Bild-DCTen in einem bewegten Bereich, was zu einigen sichtbar störenden Blöcken führen kann.
Die zweite Annäherung bringt die Mischung der zwei Teilbilder nicht in Gefahr, aber die Bildqualität ist wegen des Verlustes der räumlichen Auflösung nicht so gut.
EP-A-0 889 651 beschreibt ein Bildcodierungsgerät, das ein digitales Bild eingibt, das die Form eines Objektes angibt. Das binäre digitale Bild hat eine Zeilensprungstruktur, wobei ein Bild aus zwei Teilbildern besteht. Das Bildcodierungsgerät beurteilt für jeden Block in dem binären digitalen Bild, ob Codierung in Teilbildeinheiten oder in Bildeinheiten durchgeführt werden soll.
Der Artikel "Frequency Domain Down-Conversion of HDTV using an Optimal Motion Compensation Scheme" von A. Vetro u.a., veröffentlicht in "International Journal of Imaging Systems and Technology", Heft 9, Nr. 4, Seiten 274–282, beschreibt eine Frequenzdomäne-Abwärtsmischung in einer Decodierschleife, wobei Bewegungskompensation durchgeführt wird. Ein Verfahren zur Abwärtsmischung, die als bildbasierte Frequenzsynthese bezeichnet wird, bewahrt besser Hochfrequenzdaten und vermeidet dadurch Prädiktionstrift. Das Verfahren wird auf ein teilbildbasiertes Frequenzsyntheseverfahren erweitert um sperrende Artefakte zu überwinden.
Der Artikel von Atul Puri u. a. "Adaptive frame/field motion compensated viode coding", in "Signal Processing": "Image Communication" Heft 5, Nr. ½, Februar 1993, Seiten 39–58 beschreibt auf den Seiten 43–44, Abschnitt 4.2, dass die DCT von Bildblöcken, die eine Bewegung erfahren, wegen der Tatsache, dass sie verschachtelt sind, signifikante Koeffizienten in der unteren linken Ecke zeigt.
Die vorliegende Erfindung schafft Verfahren und ein System zum Lösen der bekannten Probleme. Diese Verfahren und das System schaffen die Möglichkeit zu entscheiden, ob der betreffende Bereich, der gefiltert/skaliert werden soll, ein stationärer Bereich ist, oder ein bewegter Bereich mit Zeitensprung ist, und, wenn derartige Information gegeben ist, dass auf eine gescheite Art und Weise dynamisch zwischen bild- oder teilbildbasierter Wirkung geschaltet wird, wodurch die Ausgangsbildqualität optimiert wird.
Es gibt auch ein Bedürfnis nach der Anwendung teilbildbasierter Vorgänge bei Bild-DCT codierten Blöcken um die bekannten Probleme zu überwinden. Auf diese Weise ist eine andere Aufgabe der vorliegenden Erfindung die genaue Filterung/Skalierung von DCT-codiertem komprimiertem Video mit Zeilensprung. Ein DCT-Domäne-Filterschema für teilbildbasierte Filterung/Skalierung von Teilbild-DCT-Daten ist hier gegeben.
Die beiliegenden Patentansprüche definieren mehrere Aspekte der vorliegenden Erfindung. Insbesondere definiert der Anspruch 1 ein Verfahren um zu detektieren, ob ein Bereich eines komprimierten Videostroms ein verschachteltes bewegter Bereich ist.
Der Anspruch 3 definiert ein Verfahren zum Verarbeiten eines komprimierten Videostroms, wobei ein Verfahren angewandt wird, wie in Anspruch 1 definiert.
Die vorliegende Erfindung bezieht sich auch auf ein System zum Verarbeiten eines komprimierten Videostroms, wie in Anspruch 6 definiert.
Andere Verbesserungen, welche die vorliegende Erfindung gegenüber dem Stand der Technik schafft, werden als ein Ergebnis der nachfolgenden Beschreibung identifiziert, wobei die bevorzugten Ausführungsformen der vorliegenden Erfindung beschrieben werden. Die Beschreibung soll den Rahmen der vorliegenden Erfindung keineswegs beschränken, sondern nur ein arbeitendes Beispiel der vorliegenden bevorzugten Ausführungsformen schaffen. Der Rahmen der vorliegenden Erfindung wird in den beiliegenden Patentansprüchen hervorgehoben.
Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
1 ein Blockschaltbild eines MPEG-2 Decoders mit eingebetteter Neudimensionierung nach dem Stand der Technik,
2 ein Blockschaltbild einer Ausführungsform eines MPEG-2 Decoders mit eingebetteter Neudimensionierung nach der vorliegenden Erfindung,
3 ein Flussdiagramm der Wirkungsweise einer Ausführungsform der vorliegenden Erfindung,
4 ein Flussdiagramm der Wirkungsweise einer anderen Ausführungsform der vorliegenden Erfindung,
5 eine Darstellung der Verzerrung einer vertikalen Linie, die sich horizontal in einer verschachtelten Videosequenz verlagert,
6 eine Darstellung eines 8 × 8 DCT Blocks mit Abtastkoeffizienten links in der Mitte und links unten.
Die vorliegende Erfindung schafft ein Verfahren und ein System zum Verarbeiten eines komprimierten Videostroms, dargestellt durch eine Anzahl DCT codierter Blöcke. Ein komprimierter Videostrom, wobei die MPEG-2 Norm angewandt wird, ist ein derartiger komprimierter Videostrom.
Ein MPEG-2 Decoder mit eingebetteter Neudimensionierung nach dem Stand der Technik ist in 1 dargestellt. Ein komprimierter MPEG-2 Videobitstrom 1 wird zunächst einer variablen-Länge-Decodierung 2 ausgesetzt, wobei codiertes Video in komponentendiskrete Kosinustransformationsblöcke ("DCT") aufgeteilt wird. Die DCT-Blöcke gehen zur Dequantisierung über (inverse Abtastung inverse Quantisierung) 3. danach zu einer Filterungs/Skalierungsprozedur 4, dann zu einer inversen DCT-Verarbeitung 8, und dann zu einem Addierer 10. Der Prädiktionsdecoder 5 erzeugt Bewegungsvektoren 6. Diese Bewegungsvektoren werden von einem Abwärtsskalierer 7 verarbeitet und danach in ½ pel Bewegungskompensation 9 verwendet. Das Ergebnis der ½ pel Bewegungskompensation 9 wird den bereits dem Addierer 10 von der inversen DCT Verarbeitung 8 zugesendeten Ergebnissen hinzugefügt.
Bezugsframes gehen von dem Addierer 10 zu dem Bezugsframespeicher 12, wo sie für die Bewegungskompensation 9 verfügbar sind. Die bei dem Addierer 10 gesammelten Frames werden weiter verarbeitet um die Frames durch Frame-Neuordnungslogik 11 in ihre richtige Reihenfolge zu setzen. Die dekomprimierten Videoframes sind das Ausgangssignal 12.
In 2 ist ein Blockschaltbild dargestellt, das eine Ausführungsform eines MPEG-2 Decoders mit eingebetteter Neudimensionierung nach der vorliegenden Erfindung zeigt. Ein MPEG-2 codierter Videobitstrom 14 geht in die erste Dekompressionsstufe, dem variablen Längendecoder 15, hinein, wobei die DCT Blöcke (über inverse Abtastung inverse Quantisierung) dequantisiert 16 werden. Daraufhin wird eine Prozedur durchgeführt, die Gegenstand der vorliegenden Erfindung Informationssignal, um zu ermitteln, ob teilbildbasierte oder bildbasierte Filterung/Skalierung angewandt wird 17. Die Einzelheiten dieser Implementierung des vorliegenden Verfahrens um zu ermitteln, welcher Typ zu verwendender Filterung/Skalierung in 3 dargestellt ist und wird nachstehend detailliert beschrieben.
Daraufhin wird das gefilterte/skalierte Ergebnis der zum Filtern/Skalieren 17 durchgeführten Prozedur durch inverse DCT 18 verarbeitet. Das Ergebnis der inversen DCT 18 wird danach dem Addierer 19 zugeführt.
Der Prädiktionsdecoder 20 erzeugt Bewegungsvektoren 21. Diese werden danach dem Abwärtsskalierer 22 zugeführt. Das Ergebnis des Abwärtsskalierer 22 geht zu der ¼ pel Bewegungskompensation 23. Das Ergebnis der Bewegungskompensation wird danach dem Addierer 19 zugesendet.
Bezugsframes gehen von dem Addierer 19 zu dem Bezugsframespeicher 25, wo sie zur Bewegungskompensation 23 verfügbar sind. Die bei dem Addierer 19 gesam melten Frames werden weiter verarbeitet um die Frames durch die Frame-Neuordnungslogik 24 in ihre richtige Reihenfolge zu setzen. Die dekomprimierten Videoframes werden bei 26 ausgeliefert.
In 3 ist ein Flussdiagramm dargestellt, das eine Ausführungsform eines Verfahrens nach der vorliegenden Erfindung zeigt. Wie darin angewandt ist der erste Absolutwert, der die Energie der Vertikal-Hochfrequenz darstellt, das Maß der Größe der DCT Koeffizienten der linken unteren Ecke des DCT codierten Blocks. Ein derartiges Maß ist dem Fachmann bekannt.
Auf gleiche Weise, wie hier angewandt, ist der zweite Absolutwert, der die Energie der Vertikal-Mittenfrequenz darstellt, das Maß der Größe der DCT Koeffizienten der linken Mitte des DCT codierten Blocks. Dieser Maßtyp ist dem Fachmann ebenfalls bekannt.
Der "vorbestimmte erste Bezugswert" und der "vorbestimmte zweite Bezugswert", wie hier angewandt, sind versuchsweise ermittelte Zahlen, die die Entscheidungspunkte für den ersten Absolutwert, der die Energie der Vertikal-Hochfrequenz darstellt, und für den zweiten Absolutwert, der die Energie der Vertikal-Mittenfrequenz darstellt, darstellen
Durch einen Vergleich der DCT Koeffizienten des Frames der linken unteren Ecke von komprimierten Videoblöcken, die verschachtelte nicht bewegter Bereiche darstellen, mit den DC Koeffizienten des Frames der linken unteren Ecke der komprimierten Videoblöcke, die verschachtelte bewegte Bereiche darstellen, wird ein vorbestimmter erster Wert ermittelt. Diese werden untersucht um zu ermitteln, bei welchem Absolutwert des DCT Koeffizienten der verschachtelte bewegte Bereich nebst dem verschachtelten nicht bewegten Bereich mitgeteilt werden kann. Dieser Absolutwert wird der vorbestimmte erste Wert um das Framehochpasselement des verschachtelten bewegten Bereichs einzufangen.
Auf ähnliche Weise wird ein vorbestimmter zweiter Wert durch einen Vergleich der DCT Koeffizienten der Vertikal-Mittenfrequenz komprimierter Videoblöcke, die verschachtelte bewegte Bereiche darstellen, mit den DCT Koeffizienten der Vertikal-Mittenfrequenz komprimierter Videoblöcke, die Bereiche mit Vertikal-Hochfrequenz darstellen, die nicht durch Verschachtelung verursacht wurden, beispielsweise störungsbehaftete Bereiche. Diese werden untersucht um zu ermitteln, bei welchem Absolutwert der DCT Koeffizienten der Vertikal-Mittenfrequenz der verschachtelte bewegte Bereich nebst Berei chen mit ähnlicher Vertikal-Hochfrequenz mitgeteilt werden können, die aber nicht aus Verschachtelung entstanden sind, wie störungsbehaftete Bereiche. Dieser Absolutwert wird der vorbestimmte zweite Wert zum Einfangen des Teilbildtiefpassmerkmals des verschachtelten bewegten Bereichs.
Der Wert der Energie der Vertikal-Hochfrequenz wird zunächst für einen bestimmten DCT codierten Videoblock 27 erhalten. Der Absolutwert dieser erhaltenen Energie der Vertikal-Hochfrequenz wird mit einem ersten Bezugswert 28 verglichen, der verschiedenartig erhalten werden kann, einschließlich durch Versuche. Wenn der Absolutwert dieser erhaltenen Energie der Vertikal-Hochfrequenz kleiner ist als oder gleich dem ersten Bezugswert, ist die Folgerung, dass der bestimmte DCT codierte Videoblock nicht einen verschachtelten bewegten Videobereich 29 darstellt.
Sonst, wenn der Absolutwert dieser erhaltenen Energie der Vertikal-Hochfrequenz größer ist als der erste Bezugswert, erhaltener Wert der Energie der Vertikal-Mittenfrequenz für den bestimmten DCT codierten Videoblock 30. Der Absolutwert dieser erhaltenen Energie der Vertikal-Mittenfrequenz wird dann mit einem zweiten Bezugswert 31 verglichen, der auch verschiedenartig erhalten werden kann, beispielsweise durch Versuche. Wenn der Absolutwert dieser erhaltenen Energie der Vertikal-Mittenfrequenz größer ist als oder gleich dem zweiten Bezugswert, ist die Folgerung, dass der bestimmte DCT codierte Videoblock nicht einen verschachtelten bewegten Videobereich 29 darstellt.
Zum Schluss, wenn der Absolutwert dieser erhaltenen Energie der Vertikal-Mittenfrequenz kleiner ist als der zweite Bezugswert, ist die Folgerung, dass der gegebene DCT codierte Videoblock einen verschachtelten bewegten Videobereich 32 darstellt.
In 4 ist ein Flussdiagramm dargstellt, das eine andere Ausführungsform eines Verfahrens nach der vorliegenden Erfindung darstellt. Darin wird eine ähnliche Prozedur wie die aus 3 durchgeführt um zu ermitteln, ob teilbildbasierte oder bildbasierte Filterung/Skalierung für einen bestimmten DCT codierten Videoblock angewandt wird.
Zunächst wird der DCT codierte Videoblock untersucht um zu ermitteln, ob es eine Bild- oder eine Frame-DCT 33 ist. Wenn es ein Bild DCT-Block ist, sollen Teilbilddecodierug und teilbildbasierte Filterung/Skalierung an dem DCT codieren Videoblock 34 angewandt werden.
Sonst, wenn der DCT codierte Videoblock ein Frame DCT Block ist, erhalte den Wert der Energie de Vertikal-Hochfrequenz des DCT codierten Videoblocks 35. Der Absolutwert dieser Energie der Vertikal-Hochfrequenz wird danach mit einem ersten Bezugswert 36 verglichen. Diese erste Bezugswert kann verschiedenartig erhalten werden, einschließlich durch Versuche. Wenn der Absolutwert der Energie der Vertikal-Hochfrequenz kleiner ist als oder gleich dem ersten Bezugswert, sollen bildbasierte Decodierungs- und bildbasierte Filterungs-/Skalierungsmethoden auf den DCT codierten Videoblock 37 angewandt werden.
Sonst, wenn der Absolutwert der Energie der Vertikal-Hochfrequenz größer ist als der erste Bezugswert, erhalte den Wert der Energie der Vertikal-Mittenfrequenz des DCT codierten Videoblocks 38. Der Absolutwert dieser Energie der Vertikal-Mittenfrequenz wird danach mit einem zweiten Bezugswert 39 verglichen. Dieser zweite Bezugswert kann auch verschiedenartig erhalten werden, einschließlich durch versuche. Wenn der Absolutwert dieser Energie der Vertikal-Mittenfrequenz größer ist als oder gleich dem zweiten Bezugswert, sollen bildbasierte Decodierungs- und bildbasierten Filterungs-/Skalierungsverfahren an dem DCT codierten Videoblock 37 durchgeführt werden.
Sonst, wenn der Absolutwert dieser Energie der Vertikal-Mittenfrequenz kleiner ist als der zweite Bezugswert, sollen bildbasierte Decodierungs- und bildbasierte Filterungs-/Skalierungsverfahren an dem DCT codierten Videoblock 40 durchgeführt werden.
In 5 ist die Verzerrung einer vertikalen Linie, die sich horizontal in einer progressiven und einen verschachtelten Videosequenz verlagert, dargestellt. In einer progressiven Sequenz erscheint die vertikale Linie zunächst als gerade Linie von oben nach unten, da jede Abtastzeile gezogen wird 41. Ein Dreißigstel einer Sekunde später wird die Linie nach Verlagerung 42 neu gezogen. Die beiden Frames geben die Linie als gerade 41, 42 wieder.
In der verschachtelten Sequenz erscheint die vertikale Linie als eine vertikale punktierte Linie, weil nur jede zweite Abtastzeile gezeichnet ist 43. Ein Sechzigstel einer Sekunde später werden die abwechselnden Abtastzeilen gezogen, aber die Linie hat sich bereits um einen horizontalen Abstand 44 verlagert. Dies erscheint für die zwei Teilbilder des Bildes 2, und zwar 45, 46. Das Endergebnis ist, dass es Unschärfe der vertikalen Linie in der horizontalen Richtung 47 gibt.
Diese Unschärfe sich verlagernder vertikaler Ränder veranlasst hohe Werte der Vertikal-Hochfrequenz" innerhalb der DCT codierten Blöcke für die bewegte Bereiche. Eine Vertikal-Hochfrequenz kann durch Abtastung der linken unteren Ecke des DCT Blocks gemessen werden. Eine hoher Absolutwert im Vergleich mit einem vorbestimmten Pegel für diese Messung ist für einen bewegenden verschachtelten Bereich indikativ. Um zwischen wirklich bewegenden verschachtelten Bereichen und anderen Fällen, die eine Vertikal-Hochfrequenz veranlassen können, wie das Vorhandensein von Rauschanteilen, unterscheiden zu können, kann der DCT Block mit der "Vertikal-Mittenfrequenz" abgetastet werden, etwa links von der Mitte eines DCT Blocks. Absolutwerte unterhalb eines vorbestimmten Pegels sind für einen bewegenden verschachtelten Bereich indikativ. Diese zweite Abtastung des DCT Blocks hat an sich keinen indikativen Wert, d.h. es ist nützlich, wenn kombiniert mit der ersten Abtastung des DCT Blocks in der Vertikal-Hochfrequenz. Die erste Abtastung aber ist allein stehend. Diese kann angewandt werden um verschachtelte und bewegende Bereiche zu detektieren. Die zweite Abtastung wird angewandt um die Wahrscheinlichkeit eines falschen positiven, oder Detektion eines verschachtelten bewegenden Bereichs aus der ersten Abtastung zu reduzieren. Eine vereinfachte Version des Verfahrens kann dadurch angewandt werden, dass auf die zweite Abtastung verzichtet wird. Dies würde wirken, aber vielleicht mit einer höheren Fehlerrate.
In 6 ist ein 8 × 8 DCT Block wiedergegeben 48. Die einzelnen Koeffizienten des DCT Blocks sind aus Bezugsgründen durch 0'–63' bezeichnet. Für den hier beschriebenen Gebrauch und wie im Bereich der Technik bekannt, befindet sich ein DCT Koeffizienten oder Element 49'' links in der Mitte" an oder in der Nähe der Koeffizientenposition 32'. Auf gleiche Weise befindet sich ein DCT Koeffizienten oder Element 50'' links unten" an oder in der Nähe der Koeffizientenposition 56'.
Wenn Verschachtelung einmal detektiert worden ist, soll Filterung auf Teilbildbasis durchgeführt werden. Für einen Skalierungsfaktor von beispielsweise 2 wird ein [0,5, 0, 0,5] Filter in der räumlichen Domäne wirken. Die Null in der Mitte maskiert den Beitrag des zweiten Teilbildes, wodurch es auf diese Weise der Anwendung eines [0,5, 0,5] Filters in einem einzigen Teilbild entspricht. Wenn die richtige Phasenverschiebung betrachtet wird, kann ein [0,75, 0, 0,25] Filter für das obere Teilbild und ein [0,25, 0, 0,75] Filter für das untere Teilbild verwendet werden. Eine räumliche Domänenskalierungsmatrix mit einem Abwärtsskalierungsfaktor gleich 2 kann dazu unter Verwendung dieser Filter erhalten werden. Die nachfolgende räumliche Domänenskaloierungsmatrix ist illustrativ für eine, die anwendbar ist bei Frame DCT codierten Blöcken mit verschachteltem bewegtem Bereich:
Diese räumliche Domänenskalierungsmatrix kann weiterhin in die DCT Domäne umgewandelt werden um die Komplexität zu vereinfachen.
Obschon das System und das Verfahren der vorliegenden Erfindung im Zusammenhang mit den beschriebenen Ausführungsformen beschrieben worden ist, soll die vorliegende Erfindung nicht auf die spezifische hier beschriebene Form begrenzt werden, es wird beabsichtigt, dass sie derartige Alternativen, Modifikationen und Äquivalenten deckt, die vernünftigerweise im Rahmen der vorliegenden Erfindung liegen, wie durch die beiliegenden Patentansprüche definiert.

1

1: Video Bitstream EIN
2: Variable Länge Decodierung
3: Dequantisierung
4: Filterung/Skalierung
8: Inverse DCT
11: Frame-Neuordnung
13: Video AUS
5: Prädiktionsdecoder
6: Bewegungsvektoren
7: Abwärtsskalierer
9: ½ Pel Bewegungskompensation
12: Bezugsframespeicher

2

14: Video Bitstream EIN
15: Variable Länge Decodierung
16: Dequantisierung
17: teilbild- oder bildbasierte Filterung/Skalierung
18: Inverse DCT
24: Frame-Neuordnung
26: Video AUS
20: Prädiktionsdecoder
21: Bewegungsvektoren
22: Abwärtsskalierer
23: ¼ Pel Bewegungskompensation
25: Bezugsframespeicher

3

27: Erhalte den Wert der Energie der Vertikal-Hochfrequenz des MPEG-2 codierten Videoblocks
28: Ist der Wert der Vertikal-Hochfrequenz > der erste Bezugswert ? Nein
29: kein verschachtelter bewegter Bereich Ja
30: Erhalte den Wert der Energie der Vertikal-Mittenfrequenz des MPEG-2 codierten Videoblocks
31: Ist der Wert der Vertikal-Mittelfrequenz < der zweite Bezugswert ? Nein
29: kein verschachtelter bewegter Bereich Ja
32: ein verschachtelter bewegter Bereich

4

33: Ist es eine Bild- oder Teilbild-DCT ? Teilbild
34: Benutze teilbildbasierte Decodierung und/oder Filterung/Skalierung Bild
35: Erhalte den Wert der Energie der Vertikal-Hochfrequenz des MPEG-2 codierten Videoblocks
36: Ist der Wert der Vertikal-Hochfrequenz > der erste Bezugswert ? Nein
37: Benutze bildbasierte Decodierung und Filterung/Skalierung Ja
38: Erhalte den Wert der Energie der Vertikal-Mittenfrequenz des MPEG-2 codierten Videoblocks
39: Ist der Wert der Vertikal-Mittenfrequenz < der zweite Bezugswert ? Nein
37: Benutze bildbasierte Decodierung und Filterung/Skalierung Ja
40: Benutze bildbasierte Decodierung und teilbildbasierte Filterung/Skalierung

5

41: Bild 1
42: Bild 2
: bildbasierte Bilder
: Bild 1
: Oberes Teilbild
: Unteres Teilbild
47: teilbildbasierte Bilder

6

49: Links in der Mitte
50: links unten

Claims

Verfahren um zu detektieren, ob ein Bereich eines komprimierten Videostroms (1) ein bewegter Bereich mit Zeilensprung ist, wobei der genannte Bereich eines komprimierten Videostroms (1) durch eine Anzahl Frame DCH codierter Blöcke dargestellt wird, wobei DCT ein Akronym für diskrete Kosinustransformation ist, wobei das genannte Verfahren Folgendes umfasst: – das Erhalten (27) eines ersten Absolutwertes, der die Energie vertikaler Hochfrequenz eines DCT codierten Blocks des genannten komprimierten Videostroms (1) darstellt; – das Ermitteln (28), ob der genannte erste absolute Wert ggf. größer ist als ein vorbestimmter erster Bezugswert, und, wenn nicht, – das Erhalten (30) eines zweiten Absolutwertes, der die Energie vertikaler Mittenfrequenz des genannten DCT codierten Blocks darstellt, – das Ermitteln, ob der genannte zweite absolute Wert ggf. kleiner ist als ein zweiter vorbestimmter Bezugswert; – das Ermitteln, ob der genannte DCT codierte Block ein bewegter Bereich mit Zeilensprung ist, ob der genannte erste absolute Wert größer ist als der genannte vorbestimmte erste Bezugswert und ob der genannte zweite absolute Wert kleiner ist als der genannte zweite vorbestimmte Bezugswert, und sonst – das Ermitteln, ob der genannte DCT codierte Block nicht ein bewegter Bereich mit Zeilensprung ist.
Verfahren nach Anspruch 1, wobei der genannte Videostrom (1) eine Anzahl DCT codierter Blöcke umfasst, wobei der genannte erste absolute Wert ein Maß der Größe der DCT Koeffizienten in einem linken unteren Teil des genannten DCT codierten Blocks ist, und wobei der genannte zweite absolute Wert ein Maß der Größe der DCT Koeffizienten in einem linken mittleren Teil des genannten DCT codierten Blocks ist.
Verfahren zum Verarbeiten eines komprimierten Videostroms (1), wobei der genannte komprimierte Videostrom (1) durch eine Anzahl DCT codierter Blöcke dargestellt wird, wobei das genannte Verfahren Folgendes umfasst: – das Ermitteln (34), ob die teilbildbasierte Decodierungs- und Filterung/Skalierungsverfahren zum Verarbeiten eines DCT codierten Blocks des genannten komprimieren Videostroms angewandt werden sollen, wenn der genannte DCT codierte Block ein teilbildbasierter DCT codierter Block ist; – das Durchführen des Verfahrens nach Anspruch 1, wenn ein DCT codierter Block des genannten komprimierten Videostroms ein bildbasierter DCT codierter Block ist um zu ermitteln, ob der genannte bildbasierte DCT codierte Block ggf. ein bewegter Bereich mit Zeilensprung ist; – das Ermitteln (40), ob die bildbasierten Decodierungs- und die teilbildbasierten Filter/Skalierungsverfahren zum verarbeiten des genannten bildbasierten DCT codierten Blocks angewandt werden sollen, wenn der genannte bildbasierte DCT codierte Block ein bewegter Beriech mit Zeilensprung ist; – das Ermitteln (37), ob die bildbasierten Decodierungs- und Filter/Skalierungsverfahren zum verarbeiten des genannten bildbasierten DCT codierten Blocks angewandt werden sollen, wenn der genannte bildbasierte DCT codierte Block nicht ein bewegter Bereich mit Zeilensprung ist.
Verfahren nach Anspruch 3, wobei die genannte Verarbeitung des genannten komprimierten Videostroms (1) eine eingebettete Neubemessung umfasst, die dynamisch bild- oder teilbildbasierte Skalierung, durchgeführt innerhalb einer Decodierungsschleife wählt.
Verfahren nach Anspruch 3, wobei die genannte Verarbeitung des genannten komprimierten Videostroms (1) die Filterung und Skalierung der genannten bildbasierten DCT codierten Blöcke auf Teilbildbasis umfasst.
System zum verarbeiten eines komprimierten Videostroms (1), wobei der genannte Videostrom (1) durch eine Anzahl DCT codierter Blöcke dargestellt wird, wobei DCT ein Akronym für diskrete Kosinustransformation ist, wobei das genannte System Folgendes umfasst: – eine Videosignalquelle des genannten komprimierten Videostroms (1); und – einen Prozessor, der wirksam mit der genannten Videosignalquelle gekoppelt ist, und einen Videoausgang, wobei der genannte Prozessor vorgesehen ist zum: – Ermitteln (34), ob die teilbildbasierten Decodierungs- und Filterung/Skalierungsverfahren zum Verarbeiten eines DCT codierten Blocks des genannten komprimierten Videostroms angewandt werden sollen, wenn der genannte DCT codierte Block ein teilbildbasierter DCT codierter Block ist; – das Erhalten (27) eines ersten absoluten Wertes, der die Energie vertikaler Hochfrequenz des genannten bildbasierten DCT codierten Blocks darstellt; – das Ermitteln (28), ob der genannte erste absolute Wert ggf. größer ist als ein vorbestimmter erster Bezugswert, und wenn nicht, – das Erhalten (30) eines zweiten absoluten Wertes, der die Energie von vertikaler Mittenfrequenz des genannten teilbildbasierten DCT codierten Blocks darstellt; – das Ermitteln, ob der genannte zweite absolute Wert ggf. kleiner ist als ein zweiter vorbestimmter Bezugswert; – das Ermitteln, ob bildbasierten Decodierungs- und teilbildbasierten Filterung/Skalierungsverfahren zum Verarbeiten des genannten bildbasierten DCT codierten Blocks angewandt werden sollen, wenn der genannte erste absolute Wert größer ist als der genannte vorbestimmte erste Bezugswert und wenn der genannte zweite absolute Wert kleiner ist als der genannte zweite vorbestimmte Bezugswert, und sonst das Ermitteln, ob die bildbasierten Decodierungs- und Filterung/Skalierungsverfahren zum verarbeiten des genannten bildbasierten DCT codierten Block angewandt werden sollen.