-
Die
vorliegende Erfindung bezieht sich im Allgemeinen auf Decodierung/Dekompression
von komprimiertem Video in der DCT-Domäne ("discrete cosine transform") und insbesondere
auf Methoden und Systemen zur Detektion und zur genauen Filterung/Skalierung
bewegter Bereiche mit Zeilensprung in MPEG-2 codiertem Video.
-
MPEG
ist eine Abkürzung
für "Moving Pictures Experts
Group". MPEG wurde
11988 gegründet,
ursprünglich
zum Schaffen einer Norm für
Kompression von bewegtem Video. Die Notwendigkeit von Kompression
von bewegtem Video für
digitale Übertragung
wird offensichtlich mit sogar einem oberflächlichen Blick auf nicht komprimierten
Bitraten im Gegensatz zu verfügbaren
Bandbreiten. Bewegtbild-Video erfordert viel Speicherraum und viel
Datenübertragungsbandbreite.
Das Standard US Senderfernsehsignal, manchmal als ein "NTSC"-Signal bezeichnet,
hat eine Bitrate von 168 Megabits ("Mbits") in der Sekunde. Vergleichsweise erfordert
die Übertragung
von Fünfkanal-Stereo
unkomprimiertem Audio beispielsweise eine Bitrate von 3,5 Mbits in
der Sekunde. Ein Ein-Geschwindigkeit-CD-ROM
liefert Daten mit einer Bitrate von 1,5 Mbits in der Sekunde.
-
Das
erste Ziel für
die MPEG Gruppe war, Video mit Audio in eine CD-ROM Format Bandbreite von 1,5 Mbits
in der Sekunde. Das Ergebnis ihrer Arbeit ist die MPEG-1 Codierungsnorm,
vervollständigt
1991. Zu der betreffenden Zeit hatte die in MPEG-1 verkörperte Videokompressionstechnologie
nicht die Fähigkeit,
Video mit Zeilensprung in Senderqualität zu codieren. Dies wurde ein
primäres
Ziel für
die MPEG-2 Norm.
-
Zeilensprung-Video
beschreibt ein Abtastsystem für
Video, ausgedacht in den frühen
Tagen des Fernsehens um es zu ermöglichen, dass Videoframes mit
einer ausreichend hohen Rate übermalt
werden können um
sichtbares Flimmern des Videoschirms zu vermeiden. Dies geschieht
durch Abtastung abwechselnder Zeilen eines Bildes in einem halben
Bildintervall. So werden beispielsweise in einem 525 Zeilensystem
alle 525 Zeilen in einem Dreißigstel
einer Sekunde, der Bildzeit, gezogen. Der Schirm wird in Wirklichkeit
alle Sechzigstel einer Sekunde übermalt.
Zunächst
wird jede zweite Abtastzeile gezogen (das "obere" Teilbild), wonach die fehlenden Abtastzeilen
folgen. Eine Schirmübermalung
eines Sechzigstel einer Sekunde ist schnell genug um ein sichtbares
Flimmern zu vermeiden.
-
Bild- und
Teilbild-DCT
-
Videocodierung
in MPEG-2 kann entweder bildbasierte DCT oder teilbildbasierte DCT
sein. Ein bildbasierte DCT codierter Videoblock enthält Information
von dem oberen Teilbild oder dem unteren Teilbild, aber nicht beides.
-
Bildbasierte
DCTen werden meistens in stationären
Bereichen verwendet, und zwar wegen des örtlichen progressiven Merkmals
stationärer
Bereiche, d.h. es gibt zwischen den zwei Teilbildern eine hohe räumliche
Korrelation. Teilbildbasierte DCTen werden andererseits oft in Bewegungsbereichen
verwendet, wo es wesentliche Differenzen zwischen den zwei Teilbildern
gibt. Bildbasierte DCTen werden, wenn in dieser Situation verwendet,
werden zu einer signifikante Energie in de hohen Vertikalfrequenz-DCT-Koeffizienten führen, wodurch
die Kompressionseffizienz reduziert wird.
-
MPEG2 Decoder mit eingebetteter
Neudimensionierung
-
Der
MPEG2 Decoder mit eingebetteter Neudimensionierung ist ein Konzept,
das den Leuten der Bewegtvideoindustrie und relatierter Gebiete
bekannt ist. Ein Decoder mit eingebetteter Neudimensionierung ermöglicht es,
dass eine einzige codierte Videoquelle in jedes unterstützte Wiedergabeformat,
wie Standard NTSC (USA), PAL (Europa) oder andere Wiedergabeanordnung
unter Verwendung eines anderen Decoders decodiert werden kann. Diese
waren sehr wichtig, und zwar wegen deren relativ niedrigen Kosten
in derartigen Applikationen als "Standard-Definition" (SD) Wiedergabe
von "High-Definition" (HD) Videoströmen. Decoder mit
eingebetteter Neudimensionierung nutzen den Vorteil des kleineren
Ausgangsformats durch Einbettung von Skalaren in die Decodierungsschleife.
Zur Vermeidung von Aliasing ist Filterung erforderlich, entweder
vor oder kombiniert mit Skalierung. Die Filterung/Skalierung kann
entweder in der räumlichen
Domäne
oder in der DCT Domäne
gemacht werden. Die eingebettete Skalierung, wegen der Einfachheit
vorzugsweise in der DCT Domäne
durchgeführt,
reduziert den Betrag an Daten, die in den IDTC- und in den MC-Decodierungsschritten durchgeführt werden
müssen.
-
Außerdem ist
aus anderen Gründen
eingebettete Filterung und Skalierung von DCT codiertem Video nützlicher
als nicht eingebettete Implementierungen. Erstens ist Filterung
und Skalierung nach Volldekompression verschwenderisch für Systemmittel,
da größere Speichergebiete
und längere
Berechnungssätze
durchgeführt
werden müssen.
Zweitens kann der Vorteil spezieller Eigenschaften von Zeilensprung-Video
für Skalierung
und Filterung dadurch genutzt werden, dass ermöglicht wird, dass DCT codierte
Blöcke
gefiltert und entsprechend dem örtlichen
Merkmal dynamisch skaliert werden.
-
Bild- und Teilbildfilterung/Skalierung
-
Es
gibt auch zwei Möglichkeiten
zur Filterung/Skalierung: bildbasiert und teilbildbasiert. Bildbasierte Filterung
neigt dazu, räumliche
Auflösung
beizubehalten aber zeitliche Auflösung zu verlieren. Teilbildbasierte Filterung/Skalierung
dagegen neigt dazu, zeitliche Auflösung beizubehalten, aber räumliche
Auflösung
zu verlieren. Deswegen sollten zum Erhalten der besten Ergebnisse
bildbasierte Verfahren in stationären Bereichen angewandt werden
und teilbildbasierte Verfahren sollten in bewegten Bereichen angewandt
werden.
-
Es
sei bemerkt, dass bildbasierten oder teilbildbasierten DCTen von
dem Codierer gewählt
werden, während
Entscheidungen über
bild- oder teilbildbasierte Filterung/Skalierung von dem Decoder
getroffen werden. Der Decoder nimmt in dem vorliegenden Stand der
Technik Zuflucht zu einer der nachfolgenden zwei Annäherungen
um zu entscheiden, ob bild- oder teilbildbasierte Filterung/Skalierung
angewandt wird.
- 1. Es wird vorausgesetzt, dass
der Codierer die geeignete Wahl trifft, d.h. Bild-DCTen für stationäre Bereiche
und Teilbild-DCTen für
bewegte Bereiche. Der Decoder selektiert ganz einfach bild- oder
teilbildbasierte Filterung/Skalierung auf Basis des DCT-Typs, der
von dem Codierer selektiert wurde;
- 2. Man soll den Codierer überhaupt
nicht glauben und man soll immer die gleiche Filter-/Skalierungsmode anwenden,
ungeachtet des DCT-Typs. Unter Anwendung dieser Annäherung,
wird meistens teilbildbasierte Filterung/Skalierung auf Bild-DCTen
sowie auf Teilbild-DCTen angewandt.
-
Die
erste Annäherung
liefert eine bessere räumliche
Auflösung,
wenn der Codierer die richtige Wahl macht, so dass das Bild im Allgemeinen
schärfer
ist. Diese Annäherung
ist aber anfällig
für schlechte
Entscheidungen des Codierers, wie die Verwendung von Bild-DCTen
in einem bewegten Bereich, was zu einigen sichtbar störenden Blöcken führen kann.
-
Die
zweite Annäherung
bringt die Mischung der zwei Teilbilder nicht in Gefahr, aber die
Bildqualität
ist wegen des Verlustes der räumlichen
Auflösung
nicht so gut.
-
EP-A-0
889 651 beschreibt ein Bildcodierungsgerät, das ein digitales Bild eingibt,
das die Form eines Objektes angibt. Das binäre digitale Bild hat eine Zeilensprungstruktur,
wobei ein Bild aus zwei Teilbildern besteht. Das Bildcodierungsgerät beurteilt
für jeden
Block in dem binären
digitalen Bild, ob Codierung in Teilbildeinheiten oder in Bildeinheiten
durchgeführt
werden soll.
-
Der
Artikel "Frequency
Domain Down-Conversion of HDTV using an Optimal Motion Compensation Scheme" von A. Vetro u.a.,
veröffentlicht
in "International
Journal of Imaging Systems and Technology", Heft 9, Nr. 4, Seiten 274–282, beschreibt
eine Frequenzdomäne-Abwärtsmischung
in einer Decodierschleife, wobei Bewegungskompensation durchgeführt wird.
Ein Verfahren zur Abwärtsmischung,
die als bildbasierte Frequenzsynthese bezeichnet wird, bewahrt besser
Hochfrequenzdaten und vermeidet dadurch Prädiktionstrift. Das Verfahren
wird auf ein teilbildbasiertes Frequenzsyntheseverfahren erweitert
um sperrende Artefakte zu überwinden.
-
Der
Artikel von Atul Puri u. a. "Adaptive
frame/field motion compensated viode coding", in "Signal Processing": "Image
Communication" Heft
5, Nr. ½,
Februar 1993, Seiten 39–58
beschreibt auf den Seiten 43–44, Abschnitt
4.2, dass die DCT von Bildblöcken,
die eine Bewegung erfahren, wegen der Tatsache, dass sie verschachtelt
sind, signifikante Koeffizienten in der unteren linken Ecke zeigt.
-
Die
vorliegende Erfindung schafft Verfahren und ein System zum Lösen der
bekannten Probleme. Diese Verfahren und das System schaffen die
Möglichkeit
zu entscheiden, ob der betreffende Bereich, der gefiltert/skaliert
werden soll, ein stationärer
Bereich ist, oder ein bewegter Bereich mit Zeitensprung ist, und,
wenn derartige Information gegeben ist, dass auf eine gescheite
Art und Weise dynamisch zwischen bild- oder teilbildbasierter Wirkung
geschaltet wird, wodurch die Ausgangsbildqualität optimiert wird.
-
Es
gibt auch ein Bedürfnis
nach der Anwendung teilbildbasierter Vorgänge bei Bild-DCT codierten
Blöcken
um die bekannten Probleme zu überwinden.
Auf diese Weise ist eine andere Aufgabe der vorliegenden Erfindung
die genaue Filterung/Skalierung von DCT-codiertem komprimiertem
Video mit Zeilensprung. Ein DCT-Domäne-Filterschema für teilbildbasierte
Filterung/Skalierung von Teilbild-DCT-Daten ist hier gegeben.
-
Die
beiliegenden Patentansprüche
definieren mehrere Aspekte der vorliegenden Erfindung. Insbesondere
definiert der Anspruch 1 ein Verfahren um zu detektieren, ob ein
Bereich eines komprimierten Videostroms ein verschachteltes bewegter
Bereich ist.
-
Der
Anspruch 3 definiert ein Verfahren zum Verarbeiten eines komprimierten
Videostroms, wobei ein Verfahren angewandt wird, wie in Anspruch
1 definiert.
-
Die
vorliegende Erfindung bezieht sich auch auf ein System zum Verarbeiten
eines komprimierten Videostroms, wie in Anspruch 6 definiert.
-
Andere
Verbesserungen, welche die vorliegende Erfindung gegenüber dem
Stand der Technik schafft, werden als ein Ergebnis der nachfolgenden
Beschreibung identifiziert, wobei die bevorzugten Ausführungsformen
der vorliegenden Erfindung beschrieben werden. Die Beschreibung
soll den Rahmen der vorliegenden Erfindung keineswegs beschränken, sondern
nur ein arbeitendes Beispiel der vorliegenden bevorzugten Ausführungsformen
schaffen. Der Rahmen der vorliegenden Erfindung wird in den beiliegenden
Patentansprüchen
hervorgehoben.
-
Ausführungsbeispiele
der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden
näher beschrieben.
Es zeigen:
-
1 ein
Blockschaltbild eines MPEG-2 Decoders mit eingebetteter Neudimensionierung
nach dem Stand der Technik,
-
2 ein
Blockschaltbild einer Ausführungsform
eines MPEG-2 Decoders mit eingebetteter Neudimensionierung nach
der vorliegenden Erfindung,
-
3 ein
Flussdiagramm der Wirkungsweise einer Ausführungsform der vorliegenden
Erfindung,
-
4 ein
Flussdiagramm der Wirkungsweise einer anderen Ausführungsform
der vorliegenden Erfindung,
-
5 eine
Darstellung der Verzerrung einer vertikalen Linie, die sich horizontal
in einer verschachtelten Videosequenz verlagert,
-
6 eine
Darstellung eines 8 × 8
DCT Blocks mit Abtastkoeffizienten links in der Mitte und links
unten.
-
Die
vorliegende Erfindung schafft ein Verfahren und ein System zum Verarbeiten
eines komprimierten Videostroms, dargestellt durch eine Anzahl DCT
codierter Blöcke.
Ein komprimierter Videostrom, wobei die MPEG-2 Norm angewandt wird,
ist ein derartiger komprimierter Videostrom.
-
Ein
MPEG-2 Decoder mit eingebetteter Neudimensionierung nach dem Stand
der Technik ist in 1 dargestellt. Ein komprimierter
MPEG-2 Videobitstrom 1 wird zunächst einer variablen-Länge-Decodierung 2 ausgesetzt,
wobei codiertes Video in komponentendiskrete Kosinustransformationsblöcke ("DCT") aufgeteilt wird.
Die DCT-Blöcke gehen
zur Dequantisierung über
(inverse Abtastung inverse Quantisierung) 3. danach zu
einer Filterungs/Skalierungsprozedur 4, dann zu einer inversen
DCT-Verarbeitung 8, und dann zu einem Addierer 10.
Der Prädiktionsdecoder 5 erzeugt
Bewegungsvektoren 6. Diese Bewegungsvektoren werden von einem
Abwärtsskalierer 7 verarbeitet
und danach in ½ pel
Bewegungskompensation 9 verwendet. Das Ergebnis der ½ pel Bewegungskompensation 9 wird
den bereits dem Addierer 10 von der inversen DCT Verarbeitung 8 zugesendeten
Ergebnissen hinzugefügt.
-
Bezugsframes
gehen von dem Addierer 10 zu dem Bezugsframespeicher 12,
wo sie für
die Bewegungskompensation 9 verfügbar sind. Die bei dem Addierer 10 gesammelten
Frames werden weiter verarbeitet um die Frames durch Frame-Neuordnungslogik 11 in
ihre richtige Reihenfolge zu setzen. Die dekomprimierten Videoframes
sind das Ausgangssignal 12.
-
In 2 ist
ein Blockschaltbild dargestellt, das eine Ausführungsform eines MPEG-2 Decoders
mit eingebetteter Neudimensionierung nach der vorliegenden Erfindung
zeigt. Ein MPEG-2 codierter Videobitstrom 14 geht in die
erste Dekompressionsstufe, dem variablen Längendecoder 15, hinein,
wobei die DCT Blöcke
(über inverse
Abtastung inverse Quantisierung) dequantisiert 16 werden.
Daraufhin wird eine Prozedur durchgeführt, die Gegenstand der vorliegenden
Erfindung Informationssignal, um zu ermitteln, ob teilbildbasierte
oder bildbasierte Filterung/Skalierung angewandt wird 17.
Die Einzelheiten dieser Implementierung des vorliegenden Verfahrens
um zu ermitteln, welcher Typ zu verwendender Filterung/Skalierung
in 3 dargestellt ist und wird nachstehend detailliert
beschrieben.
-
Daraufhin
wird das gefilterte/skalierte Ergebnis der zum Filtern/Skalieren 17 durchgeführten Prozedur durch
inverse DCT 18 verarbeitet. Das Ergebnis der inversen DCT 18 wird
danach dem Addierer 19 zugeführt.
-
Der
Prädiktionsdecoder 20 erzeugt
Bewegungsvektoren 21. Diese werden danach dem Abwärtsskalierer 22 zugeführt. Das
Ergebnis des Abwärtsskalierer 22 geht
zu der ¼ pel
Bewegungskompensation 23. Das Ergebnis der Bewegungskompensation
wird danach dem Addierer 19 zugesendet.
-
Bezugsframes
gehen von dem Addierer 19 zu dem Bezugsframespeicher 25,
wo sie zur Bewegungskompensation 23 verfügbar sind.
Die bei dem Addierer 19 gesam melten Frames werden weiter
verarbeitet um die Frames durch die Frame-Neuordnungslogik 24 in
ihre richtige Reihenfolge zu setzen. Die dekomprimierten Videoframes
werden bei 26 ausgeliefert.
-
In 3 ist
ein Flussdiagramm dargestellt, das eine Ausführungsform eines Verfahrens
nach der vorliegenden Erfindung zeigt. Wie darin angewandt ist der
erste Absolutwert, der die Energie der Vertikal-Hochfrequenz darstellt,
das Maß der
Größe der DCT
Koeffizienten der linken unteren Ecke des DCT codierten Blocks.
Ein derartiges Maß ist
dem Fachmann bekannt.
-
Auf
gleiche Weise, wie hier angewandt, ist der zweite Absolutwert, der
die Energie der Vertikal-Mittenfrequenz darstellt, das Maß der Größe der DCT
Koeffizienten der linken Mitte des DCT codierten Blocks. Dieser
Maßtyp
ist dem Fachmann ebenfalls bekannt.
-
Der "vorbestimmte erste
Bezugswert" und
der "vorbestimmte
zweite Bezugswert",
wie hier angewandt, sind versuchsweise ermittelte Zahlen, die die
Entscheidungspunkte für
den ersten Absolutwert, der die Energie der Vertikal-Hochfrequenz
darstellt, und für
den zweiten Absolutwert, der die Energie der Vertikal-Mittenfrequenz
darstellt, darstellen
-
Durch
einen Vergleich der DCT Koeffizienten des Frames der linken unteren
Ecke von komprimierten Videoblöcken,
die verschachtelte nicht bewegter Bereiche darstellen, mit den DC
Koeffizienten des Frames der linken unteren Ecke der komprimierten
Videoblöcke,
die verschachtelte bewegte Bereiche darstellen, wird ein vorbestimmter
erster Wert ermittelt. Diese werden untersucht um zu ermitteln,
bei welchem Absolutwert des DCT Koeffizienten der verschachtelte
bewegte Bereich nebst dem verschachtelten nicht bewegten Bereich mitgeteilt
werden kann. Dieser Absolutwert wird der vorbestimmte erste Wert
um das Framehochpasselement des verschachtelten bewegten Bereichs
einzufangen.
-
Auf ähnliche
Weise wird ein vorbestimmter zweiter Wert durch einen Vergleich
der DCT Koeffizienten der Vertikal-Mittenfrequenz komprimierter
Videoblöcke,
die verschachtelte bewegte Bereiche darstellen, mit den DCT Koeffizienten
der Vertikal-Mittenfrequenz
komprimierter Videoblöcke,
die Bereiche mit Vertikal-Hochfrequenz darstellen, die nicht durch
Verschachtelung verursacht wurden, beispielsweise störungsbehaftete
Bereiche. Diese werden untersucht um zu ermitteln, bei welchem Absolutwert
der DCT Koeffizienten der Vertikal-Mittenfrequenz der verschachtelte
bewegte Bereich nebst Berei chen mit ähnlicher Vertikal-Hochfrequenz mitgeteilt
werden können,
die aber nicht aus Verschachtelung entstanden sind, wie störungsbehaftete
Bereiche. Dieser Absolutwert wird der vorbestimmte zweite Wert zum
Einfangen des Teilbildtiefpassmerkmals des verschachtelten bewegten
Bereichs.
-
Der
Wert der Energie der Vertikal-Hochfrequenz wird zunächst für einen
bestimmten DCT codierten Videoblock 27 erhalten. Der Absolutwert
dieser erhaltenen Energie der Vertikal-Hochfrequenz wird mit einem ersten
Bezugswert 28 verglichen, der verschiedenartig erhalten
werden kann, einschließlich
durch Versuche. Wenn der Absolutwert dieser erhaltenen Energie der
Vertikal-Hochfrequenz kleiner ist als oder gleich dem ersten Bezugswert,
ist die Folgerung, dass der bestimmte DCT codierte Videoblock nicht
einen verschachtelten bewegten Videobereich 29 darstellt.
-
Sonst,
wenn der Absolutwert dieser erhaltenen Energie der Vertikal-Hochfrequenz größer ist
als der erste Bezugswert, erhaltener Wert der Energie der Vertikal-Mittenfrequenz für den bestimmten
DCT codierten Videoblock 30. Der Absolutwert dieser erhaltenen
Energie der Vertikal-Mittenfrequenz wird dann mit einem zweiten
Bezugswert 31 verglichen, der auch verschiedenartig erhalten
werden kann, beispielsweise durch Versuche. Wenn der Absolutwert
dieser erhaltenen Energie der Vertikal-Mittenfrequenz größer ist
als oder gleich dem zweiten Bezugswert, ist die Folgerung, dass
der bestimmte DCT codierte Videoblock nicht einen verschachtelten
bewegten Videobereich 29 darstellt.
-
Zum
Schluss, wenn der Absolutwert dieser erhaltenen Energie der Vertikal-Mittenfrequenz kleiner
ist als der zweite Bezugswert, ist die Folgerung, dass der gegebene
DCT codierte Videoblock einen verschachtelten bewegten Videobereich 32 darstellt.
-
In 4 ist
ein Flussdiagramm dargstellt, das eine andere Ausführungsform
eines Verfahrens nach der vorliegenden Erfindung darstellt. Darin
wird eine ähnliche
Prozedur wie die aus 3 durchgeführt um zu ermitteln, ob teilbildbasierte
oder bildbasierte Filterung/Skalierung für einen bestimmten DCT codierten
Videoblock angewandt wird.
-
Zunächst wird
der DCT codierte Videoblock untersucht um zu ermitteln, ob es eine
Bild- oder eine Frame-DCT 33 ist. Wenn es ein Bild DCT-Block
ist, sollen Teilbilddecodierug und teilbildbasierte Filterung/Skalierung
an dem DCT codieren Videoblock 34 angewandt werden.
-
Sonst,
wenn der DCT codierte Videoblock ein Frame DCT Block ist, erhalte
den Wert der Energie de Vertikal-Hochfrequenz des DCT codierten
Videoblocks 35. Der Absolutwert dieser Energie der Vertikal-Hochfrequenz
wird danach mit einem ersten Bezugswert 36 verglichen.
Diese erste Bezugswert kann verschiedenartig erhalten werden, einschließlich durch
Versuche. Wenn der Absolutwert der Energie der Vertikal-Hochfrequenz kleiner
ist als oder gleich dem ersten Bezugswert, sollen bildbasierte Decodierungs-
und bildbasierte Filterungs-/Skalierungsmethoden auf den DCT codierten
Videoblock 37 angewandt werden.
-
Sonst,
wenn der Absolutwert der Energie der Vertikal-Hochfrequenz größer ist
als der erste Bezugswert, erhalte den Wert der Energie der Vertikal-Mittenfrequenz
des DCT codierten Videoblocks 38. Der Absolutwert dieser
Energie der Vertikal-Mittenfrequenz
wird danach mit einem zweiten Bezugswert 39 verglichen. Dieser
zweite Bezugswert kann auch verschiedenartig erhalten werden, einschließlich durch
versuche. Wenn der Absolutwert dieser Energie der Vertikal-Mittenfrequenz
größer ist
als oder gleich dem zweiten Bezugswert, sollen bildbasierte Decodierungs-
und bildbasierten Filterungs-/Skalierungsverfahren
an dem DCT codierten Videoblock 37 durchgeführt werden.
-
Sonst,
wenn der Absolutwert dieser Energie der Vertikal-Mittenfrequenz
kleiner ist als der zweite Bezugswert, sollen bildbasierte Decodierungs-
und bildbasierte Filterungs-/Skalierungsverfahren an dem DCT codierten
Videoblock 40 durchgeführt
werden.
-
In 5 ist
die Verzerrung einer vertikalen Linie, die sich horizontal in einer
progressiven und einen verschachtelten Videosequenz verlagert, dargestellt.
In einer progressiven Sequenz erscheint die vertikale Linie zunächst als
gerade Linie von oben nach unten, da jede Abtastzeile gezogen wird 41.
Ein Dreißigstel
einer Sekunde später
wird die Linie nach Verlagerung 42 neu gezogen. Die beiden
Frames geben die Linie als gerade 41, 42 wieder.
-
In
der verschachtelten Sequenz erscheint die vertikale Linie als eine
vertikale punktierte Linie, weil nur jede zweite Abtastzeile gezeichnet
ist 43. Ein Sechzigstel einer Sekunde später werden
die abwechselnden Abtastzeilen gezogen, aber die Linie hat sich
bereits um einen horizontalen Abstand 44 verlagert. Dies
erscheint für
die zwei Teilbilder des Bildes 2, und zwar 45, 46.
Das Endergebnis ist, dass es Unschärfe der vertikalen Linie in
der horizontalen Richtung 47 gibt.
-
Diese
Unschärfe
sich verlagernder vertikaler Ränder
veranlasst hohe Werte der Vertikal-Hochfrequenz" innerhalb der DCT codierten Blöcke für die bewegte
Bereiche. Eine Vertikal-Hochfrequenz kann durch Abtastung der linken
unteren Ecke des DCT Blocks gemessen werden. Eine hoher Absolutwert
im Vergleich mit einem vorbestimmten Pegel für diese Messung ist für einen
bewegenden verschachtelten Bereich indikativ. Um zwischen wirklich
bewegenden verschachtelten Bereichen und anderen Fällen, die
eine Vertikal-Hochfrequenz veranlassen können, wie das Vorhandensein
von Rauschanteilen, unterscheiden zu können, kann der DCT Block mit
der "Vertikal-Mittenfrequenz" abgetastet werden,
etwa links von der Mitte eines DCT Blocks. Absolutwerte unterhalb
eines vorbestimmten Pegels sind für einen bewegenden verschachtelten
Bereich indikativ. Diese zweite Abtastung des DCT Blocks hat an
sich keinen indikativen Wert, d.h. es ist nützlich, wenn kombiniert mit
der ersten Abtastung des DCT Blocks in der Vertikal-Hochfrequenz.
Die erste Abtastung aber ist allein stehend. Diese kann angewandt
werden um verschachtelte und bewegende Bereiche zu detektieren. Die
zweite Abtastung wird angewandt um die Wahrscheinlichkeit eines
falschen positiven, oder Detektion eines verschachtelten bewegenden
Bereichs aus der ersten Abtastung zu reduzieren. Eine vereinfachte
Version des Verfahrens kann dadurch angewandt werden, dass auf die
zweite Abtastung verzichtet wird. Dies würde wirken, aber vielleicht
mit einer höheren
Fehlerrate.
-
In 6 ist
ein 8 × 8
DCT Block wiedergegeben 48. Die einzelnen Koeffizienten
des DCT Blocks sind aus Bezugsgründen
durch 0'–63' bezeichnet. Für den hier
beschriebenen Gebrauch und wie im Bereich der Technik bekannt, befindet
sich ein DCT Koeffizienten oder Element 49'' links
in der Mitte" an
oder in der Nähe der
Koeffizientenposition 32'.
Auf gleiche Weise befindet sich ein DCT Koeffizienten oder Element 50'' links unten" an oder in der Nähe der Koeffizientenposition 56'.
-
Wenn
Verschachtelung einmal detektiert worden ist, soll Filterung auf
Teilbildbasis durchgeführt
werden. Für
einen Skalierungsfaktor von beispielsweise 2 wird ein [0,5, 0, 0,5]
Filter in der räumlichen
Domäne wirken.
Die Null in der Mitte maskiert den Beitrag des zweiten Teilbildes,
wodurch es auf diese Weise der Anwendung eines [0,5, 0,5] Filters
in einem einzigen Teilbild entspricht. Wenn die richtige Phasenverschiebung betrachtet
wird, kann ein [0,75, 0, 0,25] Filter für das obere Teilbild und ein
[0,25, 0, 0,75] Filter für
das untere Teilbild verwendet werden. Eine räumliche Domänenskalierungsmatrix mit einem
Abwärtsskalierungsfaktor gleich
2 kann dazu unter Verwendung dieser Filter erhalten werden. Die
nachfolgende räumliche
Domänenskaloierungsmatrix
ist illustrativ für eine,
die anwendbar ist bei Frame DCT codierten Blöcken mit verschachteltem bewegtem
Bereich:
-
Diese
räumliche
Domänenskalierungsmatrix
kann weiterhin in die DCT Domäne
umgewandelt werden um die Komplexität zu vereinfachen.
-
Obschon
das System und das Verfahren der vorliegenden Erfindung im Zusammenhang
mit den beschriebenen Ausführungsformen
beschrieben worden ist, soll die vorliegende Erfindung nicht auf
die spezifische hier beschriebene Form begrenzt werden, es wird
beabsichtigt, dass sie derartige Alternativen, Modifikationen und Äquivalenten
deckt, die vernünftigerweise
im Rahmen der vorliegenden Erfindung liegen, wie durch die beiliegenden
Patentansprüche
definiert.
-
1
- 1
- Video
Bitstream EIN
- 2
- Variable
Länge Decodierung
- 3
- Dequantisierung
- 4
- Filterung/Skalierung
- 8
- Inverse
DCT
- 11
- Frame-Neuordnung
- 13
- Video
AUS
- 5
- Prädiktionsdecoder
- 6
- Bewegungsvektoren
- 7
- Abwärtsskalierer
- 9
- ½ Pel Bewegungskompensation
- 12
- Bezugsframespeicher
-
2
- 14
- Video
Bitstream EIN
- 15
- Variable
Länge Decodierung
- 16
- Dequantisierung
- 17
- teilbild-
oder bildbasierte Filterung/Skalierung
- 18
- Inverse
DCT
- 24
- Frame-Neuordnung
- 26
- Video
AUS
- 20
- Prädiktionsdecoder
- 21
- Bewegungsvektoren
- 22
- Abwärtsskalierer
- 23
- ¼ Pel Bewegungskompensation
- 25
- Bezugsframespeicher
-
3
- 27
- Erhalte
den Wert der Energie der Vertikal-Hochfrequenz des MPEG-2 codierten
Videoblocks
- 28
- Ist
der Wert der Vertikal-Hochfrequenz > der erste Bezugswert ? Nein
- 29
- kein
verschachtelter bewegter Bereich Ja
- 30
- Erhalte
den Wert der Energie der Vertikal-Mittenfrequenz des MPEG-2 codierten
Videoblocks
- 31
- Ist
der Wert der Vertikal-Mittelfrequenz < der zweite Bezugswert ? Nein
- 29
- kein
verschachtelter bewegter Bereich Ja
- 32
- ein
verschachtelter bewegter Bereich
-
4
- 33
- Ist
es eine Bild- oder Teilbild-DCT ? Teilbild
- 34
- Benutze
teilbildbasierte Decodierung und/oder Filterung/Skalierung Bild
- 35
- Erhalte
den Wert der Energie der Vertikal-Hochfrequenz des MPEG-2 codierten
Videoblocks
- 36
- Ist
der Wert der Vertikal-Hochfrequenz > der erste Bezugswert ? Nein
- 37
- Benutze
bildbasierte Decodierung und Filterung/Skalierung Ja
- 38
- Erhalte
den Wert der Energie der Vertikal-Mittenfrequenz des MPEG-2 codierten
Videoblocks
- 39
- Ist
der Wert der Vertikal-Mittenfrequenz < der zweite Bezugswert ? Nein
- 37
- Benutze
bildbasierte Decodierung und Filterung/Skalierung Ja
- 40
- Benutze
bildbasierte Decodierung und teilbildbasierte Filterung/Skalierung
-
5
- 41
- Bild
1
- 42
- Bild
2
-
- bildbasierte
Bilder
-
- Bild
1
-
- Oberes
Teilbild
-
- Unteres
Teilbild
- 47
- teilbildbasierte
Bilder
-
6
- 49
- Links
in der Mitte
- 50
- links
unten