DE69324090T2 - Intraframefilter für Bildkompressionssysteme - Google Patents
Intraframefilter für BildkompressionssystemeInfo
- Publication number
- DE69324090T2 DE69324090T2 DE69324090T DE69324090T DE69324090T2 DE 69324090 T2 DE69324090 T2 DE 69324090T2 DE 69324090 T DE69324090 T DE 69324090T DE 69324090 T DE69324090 T DE 69324090T DE 69324090 T2 DE69324090 T2 DE 69324090T2
- Authority
- DE
- Germany
- Prior art keywords
- data values
- frame
- range
- filtering
- frequencies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007906 compression Methods 0.000 title claims description 13
- 230000006835 compression Effects 0.000 title claims description 13
- 238000000034 method Methods 0.000 claims description 21
- 238000001914 filtration Methods 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 9
- 230000002238 attenuated effect Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 19
- 238000001228 spectrum Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0202—Two or more dimensional filters; Filters for complex signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
Description
- Eine signifikante Verringerung der Videobandbreite zum Zweck der Speicherung und Übertragung wird in verschiedenen Anwendungen gewünscht, wie z. B. bei Compact-Disc- Video und einer Fernsehübertragung mit hoher Auflösung (high definition). Eine Art eines Video-Kompressionssystems, welches jüngst eine erhebliche Aufmerksamkeit auf sich zog, ist dasjenige, welches von der Expertengruppe für bewegte Bilder (MPEG = Moving Pictures Expert Group) vorgeschlagen wurde, ein Komitee innerhalb der Internationalen Standardisierungs Organisation (ISO). Das MPEG-System wird in einer Veröffentlichung beschrieben mit dem Titel "MPEG Video Simulation Model 3 (SM3)" von der Simulationsmodell-Redaktionsgruppe, erhältlich von der ISO-IEC/JTC1/SC2/WG11/N0010 MPEG 90/041, 1990, welches das MPEG-Video-Signalkodierverfahren beschreibt. Dieses System bezieht sich auf das konditionale bewegungskompensierte Interpolations (CMCI = Conditional Motion Compensated Interpolation)-Codiersystem, welches in dem US-Patent Nr. 4,999,705 beschrieben ist, mit dem Titel "Dreidimensionale bewegungskompensierte Video-Codierung".
- Das MPEG-System enthält bzw. integriert eine Anzahl von wohlbekannten Datenkompressions-Techniken in einem einzelnen System. Diese umfassen eine bewegungskompensierte, voraussagende bzw. prädiktive Codierung, eine diskrete Kosinustransformation (DCT), eine adaptive Quantisierung und eine Codierung mit variabler bzw. veränderbarer Länge (VLC = Variable Length Coding). Bei diesen Systemen wird der adaptive Quantisierungsschritt durchgeführt mit den Koeffizientenwerten, welche von der Diskreten-Kosinustransformations-Verknüpfung erzeugt wurden, für Blöcke mit 64 Pixeln bzw. Bildelementen, die aus dem Eingabebild erhalten wurden.
- Die DCT-Koeffizienten werden mit einer veränderbaren Auflösung quantisiert, als eine Funktion der Menge der Daten, welche von dem Codiervorgang bzw. der Codierverknüpfung erzeugt wurden. Bei einem System mit einem Kanal mit fester Bandbreite müssen, wenn ein einzelnes Vollbild eine relativ große Menge von codierten Daten erzeugt, unter Umständen die Quantisierungsschrittgrößen, welche bei nachfolgenden Vollbildern angewandt werden, unter Umständen erhöht werden (gröber gemacht werden), um die Menge der codierten Daten zu verringern, welche verwendet werden, um diese Vollbilder abzubilden bzw. darzustellen. Dies wird so durchgeführt, daß der durchschnittliche Pegel bzw. Rate von Daten, die über mehrere Vollbildintervalle erzeugt werden, über den Kanal mit fester Bandbreite übertragen werden können. Falls ein Bild codiert wird, welches ein Objekt mit relativ wenigen Konturen bzw. Umrissen enthält, kann, wenn der Quantisierer eine grobe Quantisierung bei den DCT-Koeffizienten anwendet, das reproduzierte bzw. wiedergegebene Bild dieses Objekts eine nicht gewünschte Quantisierungsstörung bzw. - verzerrung aufweisen. Diese Verzerrung würde als eine Hervorhebung bzw. Übertreibung der Umrisse in dem Objekt erscheinen.
- Zusätzlich wird eine größere Quantisierungs-Schrittgröße gewöhnlich bei den DCT-Koeffizienten angelegt bzw. angewandt, welche hohe diagonale räumliche Frequenzen innerhalb des Blocks darstellen, welchen die CDT-Koeffizienten beschreiben, weil das menschliche Auge weniger empfindlich ist bezüglich eines Details bzw. einer Einzelheit entlang von Bilddiagonalen, als bezüglich eines Details in horizontaler oder vertikaler Richtung. Jedoch kann diese Technik auch Umrisse in dem Gesamtbild erzeugen, welches durch die Blöcke gebildet wird, weil sich die Quantisierungsniveaus von Block zu Block verändern können, in Abhängigkeit von der sich verändernden Menge der codierten Information, welche von den umgebenden Blöcken erzeugt wird.
- Die EP 0 480 353 A2 offenbart eine Datenkompressionsvorrichtung für Videodaten mit einem Unterteilungsschaltkreis zum Unterteilen der Videodaten in Einheitsblöcke, einem Konverter bzw. Wandler zum orthogonalen Umwandeln der Videodaten bei jedem der Einheitsblöcke, einem Quantisierer zum Quantisieren der orthogonal umgewandelten Videodaten, und einem Codierer zum Lauflängencodieren (run-length-coding) der quantisierten Videodaten, welche aufweist: Einen ersten Detektor zum Detektieren von Leistungen der Videodaten in den horizontalen und vertikalen Richtungen innerhalb jeweils gegebener Bandbereiche; einen zweiten Detektor zum Detektieren einer Differenz zwischen den Leistungen; und einen Regler zum Regeln der Menge der codierten Daten, welche von der Lauflängencodierung erzeugt wurden, in Abhängigkeit von einer Gesamtsumme der Leistungen und der Differenz. Diese Vorrichtung regelt die Menge der codierten Daten in Abhängigkeit von der Leistung der Eingabevideodaten und der Differenz zwischen den Leistungen der Videodaten der horizontalen und vertikalen Richtungen.
- Die vorliegende Erfindung, welche in den Ansprüchen 1 und 11 definiert ist, ist in einem Video-Codiersystem verkörpert, das eine Vorrichtung umfaßt, die einen Bereich von hohen diagonalen räumlichen Frequenzen in einzelnen Vollbildern herausfiltert. Ein Schaltkreis in dem Codierer empfängt ein einzelnes Vollbild und legt dieses an einen Filter mit endlicher Impulsantwort (FIR = Finite Impulse Response) an, um eine räumliche Information in den einzelnen Vollbildern zu unterdrücken, welche hohe diagonale räumliche Frequenzen aufweisen.
- Gemäß einem Aspekt der Erfindung umfaßt der Filter trennbare bzw. separierbare Filter für die horizontale und vertikale Komponente.
- Gemäß einem anderen Aspekt der Erfindung umfaßt der Filter einen nicht-separierbaren bzw. nicht-trennbaren diagonalen Filter.
- Fig. 1 (Stand der Technik) ist ein Blockdiagramm eines beispielhaften Video-Signal- Codiersystems.
- Fig. 2 ist ein Blockdiagramm des in Fig. 1 gezeigten Codiersystem, welches so verändert wurde, um eine Ausführungsform der vorliegenden Erfindung aufzuweisen.
- Fig. 3 (Stand der Technik) ist eine Darstellung von Videohalbbildern und -vollbildern, welche die Funktion des Vollbildkonverters veranschaulicht, der in den Fig. 1 und 2 gezeigt ist.
- Fig. 4a bis 4d sind Blockdiagramme eines beispielhaften Intra-Frame-Schaltkreises bzw. Schaltkreises für selbstcodierte Bilder, welcher für die Verwendung bei der Ausführungsfarm der Erfindung, wie in Fig. 2 gezeigt, geeignet ist.
- Fig. 5 (Stand der Technik) ist ein Pixel bzw. Bildelement-Diagramm, welches die Zick- Zack-Abtaststruktur veranschaulicht, die von den in den Fig. 1 und 2 gezeigten Codierern verwendet wird.
- Fig. 6 zeigt das gefilterte Videospektrum, welches von einem beispielhaften Filter erzeugt wurde, welcher durch den in den Fig. 4a bis 4d gezeigten Schaltkreis verkörpert werden kann.
- Fig. 7a und 7b zeigen gefilterte Video-Spektren für beispielhafte zweidimensionale Intra-Frame-Filter, welche geeignet sind für die Verwendung in dem in Fig. 2 gezeigten Schaltkreis.
- Obwohl diese Erfindung im Bezug und mit den Ausdrücken eines MPEG-Video-Codiersystems beschrieben wird, wird festgestellt, daß diese mit anderen Arten von Codiersystemen verwendet werden kann, bei welchen Vollbilder codiert werden, zum Teil basierend auf deren Gehalt bzw. Anteil an räumlichen Frequenzen.
- Ein beispielhaftes MPEG-Codiersystem nach dem Stand der Technik ist in Fig. 1 gezeigt. Bei diesem System ist ein Videosignal, welches ein Bild beschreibt, in der Reihenfolge einer Rasterabtastung (raster scan) von einer Videocamera (nicht gezeigt) oder einer anderen Video-Quelle vorgesehen bzw. wird angelegt.
- Wenn das Signal ein Zeilensprungsignal bzw. Halbbildsignal (interlaced signal) ist, wird das Videosignal von einem herkömmlichen Vollbild-Konverter 104 verarbeitet, welcher z. B. einen herkömmlichen Speicher mit wahlfreiem bzw. Direkt-Zugriff (RAM = Random Access Memory) aufweisen kann. Der Vollbild-Konverter 104 kombiniert die zwei verschachtelten bzw. verschränkten (interlaced) Halbbilder, um ein einzelnes Vollbild zu erzeugen. Fig. 3 zeigt ein Beispiel des Verfahrens, welches von dem Vollbild-Konverter 104 durchgeführt wird. Zwei Halbbilder, Halbbild 1 und Halbbild 2, wobei Halbbild 2 räumlich in der vertikalen Richtung bezüglich Halbbild 1 versetzt (offset) ist, werden zu einem einzelnen Vollbild kombiniert. Wenn das Videosignal nicht ein Halbbild- bzw. verschachteltes bzw. verschränktes Signal ist, dann wäre der Vollbildkonverter 104 nicht erforderlich.
- Das Videosignal, welches das Vollbild darstellt, das von dem Vollbild-Konverter 104 (falls erforderlich) erzeugt wurde, wird an einen Block-Konverter bzw. Block-Wandler 110 angelegt. Der Block-Konverter 110, welcher z. B. einen herkömmlichen Dual-Port-Speicher aufweisen kann, wandelt das Signal von einem Raster-Scan- bzw. Raster-Abtast-Format in ein Blockformat um.
- In dem Blockformat wird jedes Einzelbild bzw. Vollbild des Bildes dargestellt als eine Ansammlung bzw. Zusammenfassung von Blöcken, wobei jeder Block 64 Pixel bzw. Bildelemente aufweist, welche als eine Matrix von acht horizontalen Pixeln mal acht vertikale Pixel angeordnet sind. Jeder dieser Pixelwerte wird als ein Acht-Bit digitaler Wert dargestellt. Der Blockkonverter 110 führt diese Pixelwerte mit einem Block zu einer Zeit bzw. Block für Block einem Subtrahierer 112 zu.
- In dem Nicht-Intra-Modus subtrahiert der Subtrahierer 112 einen Block, welcher von dem Bewegungskompensationsschaltkreis 134 zur Verfügung gestellt wurde, von einem entsprechenden Block, welcher von dem Block-Konverter 110 zur Verfügung gestellt bzw. übertragen wurde. Der Subtrahierer 112 erzeugt Blöcke von Daten, welche bewegungsvorausgesagte bzw. -voraussagende (motion-predicted) differenzcodierte Blöcke darstellen.
- In dem Intra-Modus erzeugt der Subtrahierer 112 Blöcke von Daten, welche die Blöcke darstellen, die von dem Blockkonverter 110 zur Verfügung gestellt wurden.
- Ein Schalter 106 regelt bzw. steuert, ob die Blöcke, die von dem Subtrahierer 112 erzeugt wurden, bewegungsvorausbestimmte bzw. -vorausgesagte, differenzcodierte Blöcke (Nicht- Intra-Modus) darstellen, oder die Blöcke, die von dem Blockkonverter 110 erzeugt wurden (Intra-Modus). In dem Nicht-Intra-Modus leitet der Schalter 106 die Blöcke der Daten, die von dem Bewegungskompensationsschaltkreis 134 erzeugt wurden, so, daß sie an den Subtrahierer 112 angelegt werden. Bei dem MPEG-System wird der Nicht-Intra-Modus verwendet zum Codieren von vorausbestimmten Vollbildern bzw. Rahmen, wie z. B. den vorausbestimmten Anker- bzw. Referenzvollbildern, P-Vollbilder. Bei dem Intra-Modus leitet der Schalter 106 die Datenwerte von bzw. mit Null so, daß sie an den Subtrahierer 112 so angelegt werden, daß der Subtrahierer 112 Blöcke erzeugt, welche die Blöcke darstellen, die von dem Blockkonverter 110 erzeugt wurden. Bei dem MPEG-System wird der Intra- Modus verwendet zum Codieren von unabhängigen (nicht-vorausgesagten) Vollbildern, wie z. B. die unabhängigen Referenz- bzw. Anker-Vollbilder, I-Vollbilder.
- Die Blöcke, die von dem Subtrahierer 112 erzeugt wurden, werden einem Prozessor für eine Diskrete-Kosinus-Transformation (DCT) 114 zugeführt bzw. daran angelegt. Der DCT- Prozessor 114 wendet eine Diskrete-Kosinustransformation auf jeden der Blöcke der Pixelwerte an, um diese in entsprechende Blöcke von DCT-Koeffizienten umzuwandeln. Jeder der Blöcke wird dann in einem linearen Strom bzw. Fluß von 64 Koeffizienten neu angeordnet, unter Verwendung einer Zick-Zack-Abtastung, wie z. B. der in Fig. 5 gezeigten.
- Für jeden Block stellt der erste dieser Koeffizienten den Gleichstrom(DC)-Anteil der räumlichen Frequenz der Bildelemente bzw. Pixel in dem Block dar, und die verbleibenden Koeffizienten stellen die Komponenten bzw. Bestandteile bei nachfolgend bzw. aufeinanderfolgend höheren räumlichen Frequenzen dar.
- Die Koeffizientenwerte, die von dem DCT-Prozessor 114 erzeugt wurden, werden an einen Quantisierer 116 angelegt, welcher jeden Koeffizientenwert in einen binären Wert umwan delt bzw. umsetzt, mit einer zugeordneten Anzahl von Bits. Im allgemeinen wird eine größere Anzahl von Bits verwendet für die Koeffizienten niedrigerer Ordnung, als für die Koeffizienten höherer Ordnung, weil das menschliche Auge bezüglich Bildbestandteilen bei höheren räumlichen Frequenzen weniger empfindlich ist als bezüglich Bestandteilen bei niedrigeren räumlichen Frequenzen. Dieses Verfahren kann z. B. durchgeführt werden, indem jeder Koeffizientenwert in dem linearisierten Block unterteilt bzw. geteilt wird durch einen jeweils unterschiedlichen Wert, welcher proportional zu der Frequenz des Koeffizienten ist. Ein Feld (array), welches diese Werte enthält, kann mit dem Signal übertragen werden, um es zu ermöglichen, daß das Signal bei seiner Bestimmung entquantisiert wird.
- Zusätzlich kann die Anzahl der Bits, welche einem jeden Koeffizientenwert zugeordnet sind, in Reaktion auf bzw. Abhängigkeit von Reduktions- bzw. Verringerungsfaktoren verändert werden, welche von dem unten beschriebenen Quantisiersteuer- bzw. -regelschaltkreis 122 zur Verfügung gestellt werden. Diese Faktoren können eingesetzt bzw. angewendet werden, um jeden Koeffizientenwert in dem Block durch den Faktor zu teilen, bevor oder nachdem diese geteilt wurden durch das Feld der frequenzabhängigen Werte. Der Quantisierer 116 erzeugt einen Strom von digitalen Werten, welcher an einen Codierer 118 mit variabler Länge und an einen inversen Quantisierer 124 angelegt wird.
- Der Codierer mit bzw. für variable Länge (VLC) 118 codiert die Daten unter Verwendung von z. B. einem Amplituden-Lauflängen(Run-Length)-Huffman-Typ-Code. Unter Verwendung des Codes vom Huffman-Typ weist der Codierer 118 mit variabler Länge weniger Bits den häufiger auftretenden Kombinationen von Datenwerten und Lauflängen mit bzw. von Nullen zu. Das Zick-Zack-Muster bei der Codierung der DCT-Koeffizientenwerte, wie in Fig. 5 gezeigt, kann die Anzahl der Nullen erhöhen, welche sequentiell bzw. aufeinanderfolgend auftreten, weil das System dazu neigt, daß mehr Bildinformation bei niedrigeren Frequenzen auftritt als bei den hohen räumlichen Frequenzen, und demzufolge mehr Null- Wert-DCT-Koeffizienten, wenn die Frequenz, die durch den DCT-Koeffizienten dargestellt wird, sich erhöht bzw. ansteigt.
- Die Signale, welche von dem Codierer 118 mit variabler Länge erzeugt werden, werden einem first-in-first-out (FIFO)-Puffer 120 eingegeben, welcher die Werte für eine Über tragung mit einer vorgegebenen Rate als die Signalausgabe speichert. Die Ausgaberate des VLC 118 neigt dazu, diskontinuierlich (bursty) zu sein, aufgrund der Verwendung der Codierung vom Huffman-Typ und des Quantisierers 116. Der FIFO-Puffer 120 glättet die Ausgaberate des VLC 118, um Datenwerte zu erzeugen, welche einen Video-Bitstrom mit einer konstanten Bit-Rate darstellen für Anwendungen mit einer festen Kanalbandbreite. Für Anwendungen mit variablen Kanalbandbreiten kann der FIFO-Puffer 120 zum Beispiel nur erforderlich sein, um Daten daran zu hindern, bei einer Rate erzeugt zu werden, welche größer ist als irgendeine obere Begrenzungsrate.
- Wie oben beschrieben, wird das Ausgangssignal, welches von dem Quantisierer 116 erzeugt wird, auch bei einem inversen Quantisierer 124 angelegt. Der inverse Quantisierer 124 kehrt die Operation bzw. Verknüpfung um, welche von dem Quantisierer 116 durchgeführt wurde, um angenäherte bzw. approximierte diskrete Kosinustransformationskoeffizienten zu erzeugen, welche jeden Block des codierten Bildes darstellen. Diese Koeffizientenwerte werden an einen Prozessor 126 für eine inverse Diskrete-Kosinustransformation (IDCT) angelegt. Dieser Prozessor kehrt die Operation bzw. Verknüpfung der Diskreten-Kosinustransformation um bzw. macht diese rückgängig, um Werte zu erzeugen, welche die Werte darstellen, welche von dem Subtrahierer 112 zur Verfügung gestellt werden.
- Diese Werte werden von dem IDCT-Schaltkreis 126 an einen Eingangsanschluß eines Addierers 128 angelegt. Der andere Eingangsanschluß des Addierers 128 ist so gekoppelt bzw. geschaltet, um die bewegungskompensierten Werte von dem vorangegangenen Rahmen bzw. Vollbild aufzunehmen, die in dem Subtrahierer 112 in dem Nicht-Intra-Modus verwendet wurden, um die differenzcodierten, bewegungsvorausbestimmten Werte zu erzeugen. Der Addierer 128 addiert diese Werte, um decodierte Pixelwerte zu erzeugen, welche in dem Vollbildspeicher 130 gespeichert werden.
- Ein Bewegungs-Schätz-Schaltkreis 132 ist so gekoppelt bzw. verschaltet, um beide aufzunehmen bzw. zu erhalten: Die Blöcke der Pixel, welche von dem Blockkonverter 110 erzeugt wurden, und die decodierten Pixel, wie in dem Vollbild- bzw. Rahmenspeicher 130 gespeichert. Der Schaltkreis 132 vergleicht die Blöcke, welche von dem Blockkonverter 110 zur Verfügung gestellt wurden, Block für Block, mit entsprechenden Pixeln von einem vorangegangenen codierten Vollbild in einem Suchbereich, welcher um die gleichen Vollbildkoordinaten zentriert ist. Der Block der Pixel von dem vorangegangenen Vollbild, der die kleinste Differenz in Bezug auf den Eingabeblock zeigt, gemäß einer mathematischen Funktion bzw. Verknüpfung der zwei Blöcke, wird als der am besten passende (matching) Block identifiziert bzw. bestimmt.
- Wenn der am besten passende Block lokalisiert wurde, wird dieser von dem bewegungskompensierenden Schaltkreis 134 zu dem Subtrahierer 112 übertragen bzw. dort zur Verfügung gestellt, um die differenzcodierten, bewegungskompensierten Pixelwerte zu erzeugen. Nachdem diese Werte codiert und decodiert wurden, wird dieser Block auch bei dem Addierer 128 angelegt bzw. zur Verfügung gestellt, um den decodierten Block zu erzeugen.
- Verschiedene Arten von Bildern erzeugen codierte Rahmen bzw. Vollbilder mit einer unterschiedlichen bzw. voneinander abweichenden Anzahl von Bits. Z. B. kann ein Videobild mit einem großen monochromatischen bzw. einfarbigen Objekt, wie z. B. einer Nahaufnahme einer einzelnen Blume, nur eine kleine Anzahl von Bits bei den codierten Daten benötigen, weil die Szene bzw. das Bild vielleicht keinen Anteil mit vielen hohen räumlichen Frequenzen aufweisen kann. Andererseits kann eine Szene bzw. ein Bild mit einem Garten, welcher voll mit Blumen ist, eine relativ große Anzahl von Bits benötigen, weil diese Szene eine erhebliche Menge eines Anteils mit einer hohen räumlichen Frequenz aufweisen kann.
- Bei einer Ver- bzw. Anwendung eines Kanals mit einer festen Bandbreite kompensiert die Quantisierregelungs- bzw. -steuerungsvorrichtung 122 bezüglich der sich verändernden Raten, mit bzw. bei welchen eine codierte Information erzeugt wird, durch Steuern bzw. Regeln der Quantisierungs-Schrittgröße, welche bei dem Quantisierer 116 angewendet wird. Bei einer beispielhaften Ausführungsform der Erfindung hat der FIFO-Puffer 120 eine Marke für eine untere Grenze (low-water-mark) und drei Marken bei einer oberen Grenze (high-water-marks), welche voneinander abweichende Mengen von gespeicherten Daten definieren bzw. bestimmen. Die Marke der unteren Grenze kann z. B. anzeigen, daß der FIFO-Puffer 120 zu 50% voll ist; die erste Marke bei der oberen Grenze, daß er zu fünfundsiebzig Prozent voll ist; die zweite Marke bei der oberen Grenze, daß er zu neunzig Prozent voll ist; und die letzte Marke bei der oberen Grenze, daß er zu fünfundneunzig Prozent voll ist.
- In Reaktion auf die bzw. Abhängigkeit von den verschiedenen Puffer-Füll-Signalen versetzt der Quantisiersteuer- bzw. -regelschaltkreis 122 den Quantisierer 116 in einen solchen Zustand, daß er unterschiedliche Pegel bzw. Werte einer Quantisierauflösung bei den Koeffizientenwerten anlegt, welche von der DCT 114 zur Verfügung gestellt wurden. In Reaktion auf das Puffer-Füll-Signal bei der Marke der unteren Grenze würde der Quantisiersteuer- bzw. -regelschaltkreis 122 den Quantisierer 116 so einstellen, daß er einen relativ feinen bzw. kleinen Pegel einer Quantisierauflösung an die Koeffizientenwerte anlegt. In Reaktion auf das jeweilige der Signale der Markierung der oberen Grenze würde der Regel- bzw. Steuerschaltkreis 122 bewirken, daß der Quantisierer 116 aufeinanderfolgende bzw. abgestufte gröbere Pegel der Quantisierauflösung bei den Koeffizientenwerten anlegt. Sobald irgendeiner der groben Quantisierungspegel angelegt wurde, wird der feine bzw. kleine Quantisierpegel nur angewendet werden, nachdem das nächste Puffer-Füll-Signal der Marke bei der unteren Grenze von dem FIFO-Puffer 120 erhalten bzw. empfangen wurde.
- Demzufolge erzeugt der Quantisierer 116 weniger Bits der codierten Daten durch eine gröbere Quantisierung der DCT-Koeffizienten, welche das empfangene Bild darstellen, weil der FIFO 120 successiv bzw. aufeinanderfolgend mehr Daten speichert. Falls, wenn der Quantisierer eine grobe Quantisierung bei den DCT-Koeffizienten anwendet, ein Bild codiert wird, welches ein Objekt mit relativ wenigen Umrissen bzw. Konturen umfaßt, kann das wiedergegebene Bild dieses Objekts eine nicht gewünschte Quantisations- bzw. Quantisierverzerrung aufweisen.
- Die Anzahl der Marken bei der oberen Grenze, der Marken bei der unteren Grenze und die Quantisier-Einstellwerte, welche in dieser Beschreibung verwendet werden, sind nur beispielhaft. Bei einer tatsächlichen Implementation bzw. Verwirklichung kann eine größere oder kleinere Anzahl von jedem dieser Werte gewünscht werden.
- Wie vorher festgestellt, ist das menschliche Auge jedoch weniger empfindlich bezüglich hoher diagonaler räumlicher Frequenzen, wobei hohe diagonale räumliche Frequenzen diejenigen Frequenzen sind, welche einen hohen vertikalen und einen hohen horizontalen räumlichen Frequenzanteil aufweisen. Einzelne Vollbilder bzw. Bildrahmen können ein Detail bzw. eine Einzelheit bei diesen Frequenzen enthalten, welches die Menge der Daten, die bei der Codierung des Vollbildes erzeugt wird, erhöhen kann. Zusätzlich kann ein signifikanter bzw. erheblicher Anteil der Bildbestandteile bei den hohen diagonalen räumlichen Frequenzen das Ergebnis eines Rauschens sein, und nicht das Vorliegen irgendeinen räumlichen Details in dem Bild bei diesen Frequenzen.
- Fig. 2 ist ein Blockdiagramm eines Videocodiersystems gemäß dem MPEG-Standard, welches eine Ausführungsform der vorliegenden Erfindung aufweist. Das in Fig. 2 gezeigte Codiersystem unterscheidet sich von dem in Fig. 1 gezeigten dadurch, daß ein Intra-Frame- Filter (IFF) bzw. Filter für selbstcodierte Bilder 108 hinzugefügt ist.
- Kurz erläutert erzeugt der IFF 108 ein Vollbild, welches das Vollbild darstellt, das von dem Vollbild- bzw. Rahmenkonverter 104 zur Verfügung gestellt wurde. In diesem erzeugten Bild wurde ein Bereich von hohen diagonalen räumlichen Frequenzen unterdrückt bzw. gedämpft. Die Erfinder haben gefunden, daß diese Modifikation bzw. Abwandlung des MPEG-Video-Codiersystems sehr effektiv bzw. wirksam ist bei der Erhöhung des Kompressionsgrades (compression efficiency) des Video-Codiersystems und demzufolge die Entropie des Videosignals verringert. Zusätzlich wirkt sich diese Abwandlung nicht erheblich bzw. signifikant auf die Qualität des wiedergegebenen Bildes aus, wobei die Entropie des Signals verringert wird, und kann, in bzw. bei bestimmten Vollbildern, die Qualität des wiedergegebenen Bildes steigern bzw. verbessern.
- Das beispielhafte IFF 108 empfängt Datenwerte, welche ein Vollbild beschreiben, von dem Rahmen bzw. Vollbild-Konverter 104 und unterzieht bzw. unterwirft die Datenwerte einem zweidimensionalen Filter, um einen Bereich von hohen diagonalen räumlichen Frequenzen in dem Vollbild zu unterdrücken. Wie oben angemerkt, weil das menschliche Auge weniger empfindlich ist bezüglich hohen räumlichen Frequenzen, als bezüglich niedrigen räumlichen Frequenzen, und weil ein Teil der Information bei den hohen räumlichen Frequenzen im allgemeinen eher von einem Rauschen kommt, und nicht ein Bildbestandteil ist, verursacht das Unterdrücken eines Bereiches von hohen diagonalen räumlichen Frequenzen in dem Vollbild im allgemeinen nicht eine merkbare Verzerrung in dem Bild, und kann die Bildqualität verbessern.
- Die Kompressions-Effizienz bzw. der Kompressions-Grad des Video-Codiersystems kann erhöht werden durch das Unterdrücken der hohen diagonalen räumlichen Frequenzen, weil mehrere der DCT-Koeffizienten, welche von der DCT 114 erzeugt werden, Null sein können. Dies verringert die Entropie des Signals. Wie oben angemerkt, legt die DCT 114 die Datenwerte an, welche einen Block beschreiben, der von dem Subtrahierer 112 zur Verfügung gestellt wurde, um DCT-Koeffizienten zu erzeugen, die das jeweilige Vorliegen von bestimmten räumlichen Frequenzen in dem Block darstellen. Wenn ein Bereich von hohen diagonalen räumlichen Frequenzen in einem Vollbild unterdrückt wird, kann ein Teil der DCT-Koeffizienten, welche höhere räumliche Frequenzen darstellen, Null sein oder mit bzw. zu Null quantisiert werden von dem Quantisierer 116.
- Zusätzlich werden die DCT-Koeffizienten, die höhere räumliche Frequenzen darstellen, in einer aufeinanderfolgenden bzw. sequentiellen Reihenfolge sein, weil die quantisierten DCT- Koeffizienten, welche von dem Quantisierer 116 erzeugt wurden, an den VLC 118 angelegt werden, mit dem Zick-Zack-Muster, wie in Fig. 5 gezeigt. Dieses Ergebnis kann es ermöglichen, daß das Lauflängen- (run length) Codier-Verfahren, welches in dem VLC 118 durchgeführt wird, erheblich die Anzahl der Bits verringert, welche nötig sind, um die quantisierten DCT-Koeffizienten darzustellen, welche von dem Quantisierer 116 erzeugt wurden, weil ein oder mehrere DCT-Koeffizienten, welche mit bzw. zu Null quantisiert wurden, sequentiell bzw. aufeinanderfolgend bei dem VLC 118 angelegt werden können.
- Nachfolgend kann bei einer Anwendung mit einem Kanal mit fester Bandbreite der Quantisierpegel kleiner bzw. feiner gemacht werden, wodurch die Bildqualität verbessert wird, weil im Durchschnitt weniger DCT-Koeffizienten benötigt werden, um einen Block zu beschreiben, welcher an den DCT 114 angelegt wird. Bei einer Anwendung mit einem Kanal mit variabler Bandbreite kann die maximale Bandbreite, welche benötigt wird, um das Vollbild darzustellen, verringert werden.
- Die Fig. 4a bis 4d stellen äquivalente Ausführungsformen eines beispielhaften IFF 108 dar, welche hohe diagonale räumliche Frequenzen unterdrückt unter Verwendung eines trennbaren bzw. separierbaren 2-D-Filter-Designs. Die Fig. 6 zeigt ein gefiltertes Videospektrum, welches von einem beispielhaften Filter erzeugt wurde, welcher durch den in den Fig. 4a bis 4d gezeigten Schaltkreis verkörpert werden kann. Die Ausführungsform, welche in Fig. 4a gezeigt ist, ist im Detail nachfolgend beschrieben. Ein Fachmann auf dem Gebiet der Video-Codiersysteme wird dazu fähig sein, die Arbeitsweise der anderen äquivalenten Ausführungsformen, welche in den Fig. 4b bis 4d gezeigt sind, zu verstehen, aus der Beschreibung der in Fig. 4a gezeigten Ausführungsform.
- Wie in Fig. 4a gezeigt, umfaßt ein beispielhafter IFF 108 einen horizontalen Tiefpaßfilter (H LPF) 104, zwei Kompensationsverzögerungen (delays) 408 und 418, einen vertikalen Tiefpaßfilter (V LPF) 414, einen Subtrahierer 406 und einen Addierer 416. Wie oben angemerkt, ist das Zwei-D-Filter-Design, welches bei diesem beispielhaften IFF verkörpert ist, eine separierbare bzw. trennbare Funktion. Deshalb kann das Zwei-D-Filter-Verfahren unabhängig entlang der horizontalen und vertikalen Richtung durchgeführt werden.
- Bei der in Fig. 4a gezeigten Ausführungsform werden die Datenwerte, welche ein Vollbild beschreiben, zuerst an einen horizontalen Tiefpaßfilter (H LPF) 404 angelegt, wobei H LPF 404 ein Standard-FIR-Filter ist. Der H LPF 404 unterdrückt alle horizontalen Frequenzen jenseits einer ausgewählten Abschneide- (cut off) Frequenz. In Fig. 6 ist die ausgewählte horizontale Abschneidefrequenz 25% der vollen Bandbreite. Bei einem Design bzw. Entwurf, bei dem die Abschneidefrequenz in der horizontalen Richtung 25% der vollen Bandbreite beträgt, würde das gefilterte Video-Spektrum, welches von dem H LPF 404 erzeugt wurde, durch die rechteckige Fläche in Fig. 6 dargestellt werden, mit deren oberer linker Ecke bei (den Koordinaten) horizontal (H) 0,0, vertikal (V) 0,0, obere rechte Ecke bei H 0,25, V 0,0, untere linke Ecke bei H 0,0, V 1,0 und untere rechte Ecke bei H 0,25, V 1,0.
- Beispielhafte Filterkoeffizienten für den H LPF 404, welche horizontale räumliche Frequenzen jenseits von 25% der vollen Bandbreite unterdrücken, sind in der Tabelle 1 nachfolgend aufgelistet. Dieses beispielhafte Filterdesign ist ein ausgangsgewichteter (output-weighted) FIR Filter mit 39 symmetrischen Filterkoeffizienten. Tabelle 1
- Um einen Datenwert in einer bestimmten horizontalen räumlichen Position zu erzeugen (als h[0] in Tabelle 1 bezeichnet), werden 39 aufeinanderfolgende Datenwerte (Abtastwerte bzw. samples) in horizontalen räumlichen Positionen, welche den Datenwert umgeben, der erzeugt wird, mit den geeigneten Filterkoeffizienten multipliziert, wie in Tabelle 1 gezeigt, und dann addiert. Z. B. stellt in Tabelle 1 h[1] einen Filterkoeffizienten dar, der dazu dient, den angelegten Datenwert zu skalieren, einen Abtastwert nach der horizontalen räumlichen Position des Datenwerts, welcher erzeugt wird. Ähnlich stellt h[-1] einen Filterkoeffizienten dar, der dazu dient, den angelegten Datenwert zu skalieren, einen Abtastwert vor der horizontalen räumlichen Position des Datenwerts, welcher erzeugt wird. Natürlich können die mit Null bewerteten (zero valued) Koeffizienten als übersprungene Abgriffe bzw. skipped taps in der Verzögerungszeile bzw. Verzögerungsleitung implementiert werden, und würden so nicht in den Summiervorgang eintreten.
- Dieses Skalier- und Summierverfahren wird für alle horizontalen räumlichen Positionen der Datenwerte durchgeführt, die ein Vollbild beschreiben, welches an den H LPF 404 angelegt wird.
- Die Datenwerte, welche ein Vollbild bzw. einen Bildrahmen beschreiben, werden auch an das Verzögerungselement 408 angelegt, wie in Fig. 4a gezeigt. Das Verzögerungselement bzw. die Verzögerung 408 verzögert die angelegten Datenwerte um die Menge einer Zeit, um bezüglich der Multiplikations- und Additionsvorgänge in dem H LPF 404 zu kompensieren bzw. auszugleichen. Der Subtrahierer 406 legt die Datenwerte, die von dem Verzögerungselement 408 und dem H LPF 404 zur Verfügung gestellt werden, an, um Datenwerte zu erzeugen, die die Differenz zwischen den angelegten Datenwerten darstellt. Diese Differenz beschreibt ein horizontales komplementäres Vollbild bzw. Bildrahmen. Das gefilterte Video-Spektrum des horizontalen komplementären Vollbildes, welches von dem Subtrahierer 406 erzeugt wurde, wäre ein Hochpaß-Spektrum, welches durch eine rechteckige Fläche in Fig. 6 dargestellt wird, mit einer oberen linken Ecke bei H 0,25, V 0,0 obere rechte Ecke bei H 1,0, V 0,0, untere linke Ecke bei 0,25, V 1,0 und untere rechte Ecke bei H 1,0, V 1,0.
- Der vertikale Tiefpaßfilter 414 (V LPF), der auch ein Standard-FIR-Filter ist, filtert die Datenwerte, welche von dem Subtrahierer 406 zur Verfügung gestellt werden, um Datenwerte zu erzeugen, welche eine vertikale tiefpaßgefilterte Version des horizontalen komplementären Vollbildes darstellen. Bei dem beispielhaften Filterdesign bzw. Filterentwurf, welcher in Fig. 6 gezeigt ist, unterdrückt der V LPF 414 alle vertikalen räumlichen Fre quenzen über 50% der vollen Bandbreite. Die 7 Filterkoeffizienten für dieses beispielhafte symmetrische Filter-Design sind in Tabelle 2 aufgelistet. Der V LPF 414 arbeitet auf eine Art ähnlich zu dem H LPF 404, außer daß dieser die angelegten Datenwerte verwendet, in der Nähe bzw. neben der vertikalen räumlichen Position des Datenwerts, welcher erzeugt werden soll. Das gefilterte Video-Spektrum des Vollbildes, welches die Datenwerte beschreibt, die von dem V LPF 414 erzeugt wurden, unter Verwendung des beispielhaften Filter-Designs, wie in Tabelle 2 aufgelistet, würde durch eine rechteckige Fläche in Fig. 6 dargestellt werden mit einer oberen linken Ecke bei H 0,25, V 0,0, obere rechte Ecke bei H 1,0, V 0,0, untere linke Ecke bei H 0,25, V 0,5 und untere rechte Ecke bei H 1,0, V 0,5. Tabelle 2
- Das Verzögerungselement 418 legt die Datenwerte, welche von dem H LPF 404 zur Verfügung gestellt werden, an bzw. nimmt diese auf, um Datenwerte zu erzeugen, welche eine verzögerte Version des horizontalen tiefpaßgefilterten Signals darstellen. Das Verzögerungselement 418 verzögert die angelegten Datenwerte um die Menge einer Zeit, um bezüglich der Substraktion bzw. des Subtraktionsvorgangs in dem Subtrahierer 406 und den Multiplikations- und Additionsvorgängen in dem V LPF 414 zu kompensieren.
- Der Addierer 416 legt die Datenwerte an, welche von dem Verzögerungselement 418 und dem V LPF 414 zur Verfügung gestellt werden, um Datenwerte zu erzeugen, welche das Vollbild bzw. den Bildrahmen darstellen, wobei die hohen horizontalen und vertikalen räumlichen Frequenzen (d. h. hohe diagonale räumliche Frequenzen) unterdrückt sind. Abtastwerte, welche das gefilterte Video-Vollbild bzw. Video-Bildrahmen darstellen, wobei hohe räumliche diagonale Frequenzen unterdrückt sind, werden dem Addierer 416 zugeführt. Das Frequenzspektrum dieses Signals wird dargestellt durch den in Fig. 6 schraffierten Bereich bzw. Fläche, nämlich die Fläche bzw. den Bereich des gesamten Videospektrums, außer dem rechteckigen Bereich bzw. der Fläche mit einer oberen linken Ecke bei H 0,25, V 0,5, einer oberen rechten Ecke bei H 1,0, V 0,5, einer unteren linken Ecke bei H 0,25, V 1,0 und einer unteren rechten Ecke bei H 1,0, V 1,0. Dieses Ergebnis folgt aus der Kombination der Flächen bzw. Bereiche des Videospektrums der Datenwerte, welche von dem H LPF 404 und von dem V LPF 414 zur Verfügung gestellt wurden, wie oben beschrieben.
- Die Fig. 7a und 7b zeigen zwei gefilterte Video-Spektren, welche von zwei beispielhaften Filtern erzeugt wurden, welche von dem in Fig. 2 gezeigten Schaltkreis verkörpert werden können. Diese Filter sind zweidimensional (2-D)-Tiefpaßfilter (LPF), welche einen Bereich von hohen diagonalen räumlichen Frequenzen unterdrücken.
- Die zwei beispielhaften Ausführungsformen des IFF, welche in den Fig. 7a und 7b veranschaulicht sind, werden erhalten unter Verwendung der jeweiligen 11 mal 11 Tap bzw. Abgriff-Zweidimensional-FIR-Filter mit den Koeffizienten, welche nachfolgend in den Tabellen 3 bzw. 4 aufgelistet sind. Tabelle 3 Tabelle 4
- Wie in Fig. 7a gezeigt, beträgt die ausgewählte Abschnittsfrequenz 50% der vollen Bandbreite für die diagonalen räumlichen Frequenzen. Wie in Fig. 7b gezeigt, ist die ausgewählte Abschnittsfrequenz ungefähr 72% der vollen Bandbreite für die diagonalen räumlichen Frequenzen. Beide beispielhafte Filter-Designs bzw. Filter-Auslegungen werden implementiert bzw. verwirklicht als 11 mal 11 Tap bzw. Abgriff-2 dimensionale, gewichtete FIR-Filter mit symmetrischen Ausgang.
- Zweidimensionale Filter sind in einer Veröffentlichung beschrieben mit dem Titel "Design Techniques for Two-Dimensional Digital Filters" von J. V. Hu und L. R. Rabiner, erhältlich bei IEEE als IEEE Trans. on Audio und Electroacoustics, AU-20, Nr. 4, 249-257, Okt. 1972. Zusätzlich sind zweidimensionale Filter auch in einem Buch beschrieben mit dem Titel "Theory and Application of Digital Signal Processing" von L. R. Rabiner and B. Gold, erhältlich von Prentice-Hall, Inc., Seiten 438-83, 1975.
- Sobald der geeignete Satz der Filterkoeffizienten ausgewählt wird, arbeitet der 2-D-LPF 710 auf eine Art ähnlich zu einem Standard-FIR-Filter. Um einen Datenwert bei einer bestimmten horizontalen und vertikalen räumlichen Position zu erzeugen (als hv[0,0] in Tabellen 3 und 4 bezeichnet), werden 121 sukzessive bzw. aufeinanderfolgende Datenwerte in ausgewählten räumlichen Positionen, welche den Datenwert umgeben, welcher erzeugt wird, multipliziert mit den geeigneten Koeffizienten, welche entweder in Tabelle 3 oder 4 gezeigt sind, wie geeignet, und dann summiert.
- Zum Beispiel stellt in den Tabellen 3 und 4 hv[-5, -5] einen Filterkoeffizienten dar, welcher verwendet wird, um den angelegten Datenwert zu skalieren, welcher bei einer räumlichen Position angeordnet ist, die fünf horizontale Abtastwerte vor der räumlichen Position des Datenwerts liegt, welcher erzeugt wird, und fünf vertikale Abtastwerte über der vertikalen räumlichen Position des Datenwerts liegt, der erzeugt wird. Ähnlich stellt hv[5, 5] einen Filterkoeffizienten dar, welcher zum Multiplizieren des angelegten Datenwerts dient, bei einer räumlichen Position, fünf horizontale Abtastwerte nach der horizontalen räumlichen Position des Datenwerts, welcher erzeugt wird, und fünf vertikale Abtastwerte unterhalb des Datenwerts, welcher erzeugt wird.
- Dieses Multiplikations- und Summierverfahren wird für alle räumlichen Positionen der Datenwerte durchgeführt, welche das Vollbild bzw. den Bildrahmen beschreiben, der bei dem 2-D LPF 710 angelegt wird.
- Die Verringerung bzw. Reduktion des räumlichen Frequenzbestandteils des Vollbildes bzw. Bildrahmens durch den 2-D LPF 710 kann die Anzahl der mit Null bewerteten DCT- Koeffizienten erhöhen, welche von dem Quantisierer 116 erzeugt werden. Dies kann in eine erhebliche Erhöhung bzw. Verbesserung des Kompressionsgrades bzw. der Kompressionswirksamkeit des Videocodiersystems umgesetzt werden, weil ein sequentieller bzw. aufeinanderfolgender Strom von Nullen mit relativ wenigen Bits dargestellt werden kann unter der Verwendung von Lauflängen-Null-Codiertechniken. Während bis zu 50% des Video-Spektrums von jedem Vollbild unterdrückt werden können, in Abhängigkeit davon, welcher Filter verwendet wird, wird die Bildqualität nicht merkbar beeinflußt, weil nur hohe diagonale räumliche Frequenzen unterdrückt werden. Zusätzlich, bei einem System mit fester Bandbreite, kann die gesamte Bildqualität verbessert werden, wenn die verbleibenden Koeffizienten feiner bzw. präziser quantisiert werden aufgrund der verringerten Anzahl der Bits, welche im Durchschnitt benötigt werden, um die Blöcke zu beschreiben, welche an das Video-Codiersystem angelegt werden.
- Obwohl die Erfindung in Bezug auf eine beispielhafte Ausführungsform beschrieben wurde, wird angemerkt, daß sie, wie oben umschrieben, innerhalb des Schutzbereichs der beiliegenden Ansprüche ausgeführt werden kann.
Claims (20)
1. Videosignal-Codiersystem, welches digitale Datenwerte komprimiert, die
Bildinformationen darstellen, wobei das System eine Filtervorrichtung aufweist, welche
einen Bereich von räumlichen Frequenzen vor der Bildkompression unterdrückt, mit:
a) einer Vorrichtung (104) zum Empfangen bzw. Aufnehmen von Datenwerten eines
abgetasteten Daten-Videosignals, welche ein Vollbild bzw. einen Bildrahmen
(image frame) darstellen;
b) einer Filtervorrichtung (108) zum Filtern der empfangenen Datenwerte, um
selektiv die Frequenzen von dem Vollbild zu unterdrücken bzw. zu sperren bzw.
zu dämpfen; und
c) einer Kompressionsvorrichtung zum Komprimieren der gefilterten Datenwerte,
welche das Vollbild beschreiben;
dadurch gekennzeichnet, dass:
d) die Filtervorrichtung (108) selektiv einen Bereich von hohen diagonalen
räumlichen Frequenzen von dem Vollbild unterdrückt bzw. dämpft.
2. Videosignal-Codiersystem nach Anspruch 1, wobei:
die Filtervorrichtung (108) die empfangenen Datenwerte über das Vollbild filtert, um
selektiv einen Bereich von hohen diagonalen räumlichen Frequenzen zu unterdrücken
relativ bzw. im Verhältnis zu niedrigeren diagonalen räumlichen Frequenzen in dem
Vollbild, wodurch die Entropie des Vollbilds bzw. Bildrahmens verringert wird; und
die Kompressionsvorrichtung komprimiert die gefilterten Datenwerte, basierend auf
räumlichen Frequenzbestandteilen bzw. Frequenzkomponenten der gefilterten
Datenwerte, wobei der Kompressionswirkungsgrad erhöht wird durch das Filtern der
empfangenen Datenwerte.
3. Videosignal-Codiersystem nach Anspruch 2, wobei die Filtervorrichtung (108) einen
zweidimensionalen Filter mit endlicher Impulsantwort (finite impulse response filter)
aufweist.
4. Videosignal-Codiersystem nach Anspruch 2, wobei die Filtervorrichtung umfasst:
- eine Vorrichtung zum Filtern der empfangenen Datenwerte über das Vollbild
bzw. den Bildrahmen, um selektiv Komponenten des Vollbildes zu unterdrücken
bzw. zu dämpfen, welche einen Bereich von hohen horizontalen räumlichen
Frequenzen belegen relativ bzw. im Verhältnis zu Komponenten, welche einem
Bereich von relativ niedrigen horizontalen räumlichen Frequenzen belegen; und
- eine Vorrichtung zum Filtern der empfangenen Datenwerte über das Vollbild, um
selektiv Komponenten des Vollbildes zu unterdrücken bzw. zu dämpfen, welche
einen Bereich von hohen vertikalen räumlichen Frequenzen belegen relativ bzw.
im Verhältnis zu Komponenten, welche einen Bereich von relativ niedrigen
vertikalen räumlichen Frequenzen belegen.
5. Videosignal-Codiersystem nach Anspruch 4, wobei die Filtervorrichtung erste und zweite
Filter mit endlicher Impulsantwort (finite impulse response) umfasst, wobei der erste
Filter den Bereich von hohen horizontalen Frequenzen unterdrückt bzw. dämpft und der
zweite Filter den Bereich von hohen vertikalen Frequenzen unterdrückt bzw. dämpft.
6. Videosignal-Codiersystem nach Anspruch 2, wobei die Kompressionsvorrichtung
umfasst:
- eine Frequenzbestimmungsvorrichtung zum Bestimmen von relativen Amplituden
der jeweiligen räumlichen Frequenzbestandteile der gefilterten Datenwerte.
7. Videosignal-Codiersystem nach Anspruch 6, wobei die Kompressionsvorrichtung weiter
umfasst:
- eine Quantisiervorrichtung zum Zuordnen bzw. Zuweisen von Datenwerten,
welche die bestimmten relativen Amplituden von jedem der räumlichen
Frequenzbestandteile darstellen.
8. Videosignal-Codiersystem nach Anspruch 7, wobei die Kompressionsvorrichtung weiter
aufweist:
- eine Codiervorrichtung zum Kodieren der zugeordneten bzw. zugewiesenen
Datenwerte, um eine kleinere Anzahl von kodierten Datenwerten zu erzeugen mit
einer Entropie, welche im wesentlichen gleich der Entropie der zugeordneten
Datenwerte ist, welche von der Quantisiervorrichtung zur Verfügung gestellt bzw.
erzeugt werden.
9. Videosignal-Codiersystem nach Anspruch 8, wobei die Frequenzbestimmungsvorrichtung
eine Vorrichtung aufweist zum Bestimmen bzw. ermitteln der Diskret-Kosinus-
Transformations-Koeffizienten für die gefilterten Datenwerte.
10. Videosignal-Codiersystem nach Anspruch 9, wobei die Codiervorrichtung eine
Vorrichtung umfasst zum Durchführen einer Lauflängen-Codierung (run length coding)
der zugeordneten Datenwerte.
11. Verfahren zum digitalen Komprimieren von Datenwerten, welche eine Bildinformation
darstellen, mit den Schritten:
a) Empfangen bzw. Aufnehmen von Datenwerten von einem abgetasteten
Datenvideosignal, welches einen Bildrahmen bzw. ein Vollbild (image frame)
darstellt; i
b) Filtern der aufgenommenen Datenwerte, um selektiv Frequenzen in dem Vollbild
zu unterdrücken bzw. zu dämpfen; und
c) Komprimieren der gefilterten Datenwerte, welche das Vollbild beschreiben;
dadurch gekennzeichnet, dass:
d) ein Bereich von hohen diagonalen räumlichen Frequenzen in dem Vollbild
selektiv durch das Filtern unterdrückt bzw. gesperrt bzw. gedämpft wird.
12. Verfahren nach Anspruch 11, wobei:
Schritt b) das Filtern der empfangenen Datenwerten über das Vollbild umfasst, um
selektiv einen Bereich von hohen diagonalen räumlichen Frequenzen relativ bzw. im
Verhältnis zu niedrigeren diagonalen räumlichen Frequenzen in den Vollbild zu
unterdrücken bzw. zu dämpfen, wodurch die Entropie des Vollbildes bzw. Bildrahmens
verringert wird; und
Schritt c) das Komprimieren der gefilterten Datenwerte, welche das Vollbild beschreiben,
umfasst, wobei der Kompressions-Wirkungsgrad erhöht wird durch das Filtern der
empfangenen Datenwerte.
13. Verfahren nach Anspruch 12, wobei Schritt b) den Schritt des Filterns der empfangenen
bzw. aufgenommenen Werte in zwei Dimensionen umfasst.
14. Verfahren nach Anspruch 12, wobei Schritt b) die Schritte umfasst:
b1) Filtern der aufgenommenen bzw. empfangenen Datenwerte über das Vollbild, um
selektiv Komponenten bzw. Bestandteile des Vollbildes zu unterdrücken bzw. zu
dämpfen, welche einen Bereich von hohen horizontalen räumlichen Frequenzen
belegen relativ bzw. im Verhältnis zu Komponenten, welche einen Bereich von
relativ niedrigen horizontalen räumlichen Frequenzen belegen; und
b2) Filtern der empfangenen bzw. aufgenommenen Datenwerten über das Vollbild,
um selektiv Komponenten des Vollbildes zu unterdrücken bzw. zu dämpfen,
welche einen Bereich von hohen vertikalen räumlichen Frequenzen belegen
relativ bzw. im Verhältnis zu Komponenten, welche einen Bereich von relativ
niedrigen vertikalen räumlichen Frequenzen belegen.
15. Verfahren nach Anspruch 14, wobei Schritt b1) den Schritt des Filterns der empfangenen
Datenwerte unter Verwendung eines Filters mit endlicher Impulsantwort (finite impulse
response) umfasst, um den Bereich von hohen horizontalen Frequenzen zu unterdrücken,
und Schritt b2) den Schritt des Filterns der empfangenen Datenwerte unter Verwendung
eines weiteren Filters mit endlicher Impulsantwort umfasst, um den Bereich von hohen
vertikalen Frequenzen zu unterdrücken.
16. Verfahren nach Anspruch 12, wobei Schritt c) den Schritt umfasst:
c1) Bestimmen der relativen Amplituden von bestimmten Frequenzen in den
gefilterten Datenwerten.
17. Verfahren nach Anspruch 16, wobei Schritt c) weiter den Schritt umfasst:
c2) Zuordnen von Datenwerten, welche die bestimmten relativen Amplituden von
jeder der bestimmten Frequenzen darstellen.
18. Verfahren nach Anspruch 17, wobei Schritt c) weiter den Schritt umfasst:
c3) Kodieren der zugeordneten Datenwerte, um eine kleinere Anzahl von kodierten
Datenwerten zu erzeugen, welche eine Entropie aufweisen, welche im
wesentlichen gleich zu der Entropie der zugeordneten bzw. zugewiesenen
Datenwerte ist, welche durch Schritt c1) zur Verfügung gestellt bzw. erzeugt
wurden.
19. Verfahren nach Anspruch 18, wobei der Schritt c1) den Schritt des Berechnens eines
Satzes von Diskret-Kosinus-Transformations-Koeffizienten für die gefilterten Datenwerte
umfasst.
20. Verfahren nach Anspruch 18, wobei der Schritt c3) den Schritt der Lauflängenkodierung
der zugeordneten bzw. zugewiesenen Datenwerte, welche durch bzw. im Schritt c2)
erzeugt bzw. erhalten wurden, umfasst.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/950,473 US5325125A (en) | 1992-09-24 | 1992-09-24 | Intra-frame filter for video compression systems |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69324090D1 DE69324090D1 (de) | 1999-04-29 |
DE69324090T2 true DE69324090T2 (de) | 1999-11-11 |
Family
ID=25490476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69324090T Expired - Fee Related DE69324090T2 (de) | 1992-09-24 | 1993-08-24 | Intraframefilter für Bildkompressionssysteme |
Country Status (5)
Country | Link |
---|---|
US (1) | US5325125A (de) |
EP (1) | EP0589220B1 (de) |
JP (1) | JPH06225284A (de) |
CA (1) | CA2100003A1 (de) |
DE (1) | DE69324090T2 (de) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03295495A (ja) * | 1990-04-13 | 1991-12-26 | Toshiba Corp | タイマー装置 |
US5614952A (en) | 1994-10-11 | 1997-03-25 | Hitachi America, Ltd. | Digital video decoder for decoding digital high definition and/or digital standard definition television signals |
JP3275423B2 (ja) * | 1993-03-04 | 2002-04-15 | キヤノン株式会社 | 記録装置 |
JP3239541B2 (ja) * | 1993-07-13 | 2001-12-17 | ソニー株式会社 | 立体テレビジョン信号発生装置及び立体映像表示装置 |
US5566284A (en) * | 1993-12-22 | 1996-10-15 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for mip-map generation using low-pass filtering based on resolution ratio |
US5754235A (en) * | 1994-03-25 | 1998-05-19 | Sanyo Electric Co., Ltd. | Bit-rate conversion circuit for a compressed motion video bitstream |
US5650829A (en) * | 1994-04-21 | 1997-07-22 | Sanyo Electric Co., Ltd. | Motion video coding systems with motion vector detection |
US5767898A (en) * | 1994-06-23 | 1998-06-16 | Sanyo Electric Co., Ltd. | Three-dimensional image coding by merger of left and right images |
WO1996002895A1 (en) | 1994-07-14 | 1996-02-01 | Johnson Grace Company | Method and apparatus for compressing images |
US5822456A (en) * | 1994-07-14 | 1998-10-13 | Johnson-Grace | Optimal spline interpolation for image compression |
JPH08154247A (ja) * | 1994-09-29 | 1996-06-11 | Sanyo Electric Co Ltd | 圧縮画像データ処理装置及び方法 |
US5815634A (en) * | 1994-09-30 | 1998-09-29 | Cirrus Logic, Inc. | Stream synchronization method and apparatus for MPEG playback system |
US5598352A (en) * | 1994-09-30 | 1997-01-28 | Cirrus Logic, Inc. | Method and apparatus for audio and video synchronizing in MPEG playback systems |
CA2157066C (en) | 1994-10-21 | 1999-09-21 | Nelson Botsford Iii | Method for controlling a compressed data buffer |
US5734419A (en) * | 1994-10-21 | 1998-03-31 | Lucent Technologies Inc. | Method of encoder control |
TW293227B (de) * | 1994-11-24 | 1996-12-11 | Victor Company Of Japan | |
US5646687A (en) * | 1994-12-29 | 1997-07-08 | Lucent Technologies Inc. | Temporally-pipelined predictive encoder/decoder circuit and method |
US5668598A (en) * | 1995-03-27 | 1997-09-16 | International Business Machines Corporation | Motion video compression system with guaranteed bit production limits |
JP3585990B2 (ja) * | 1995-05-01 | 2004-11-10 | 富士写真フイルム株式会社 | 画像処理方法 |
US5568200A (en) * | 1995-06-07 | 1996-10-22 | Hitachi America, Ltd. | Method and apparatus for improved video display of progressively refreshed coded video |
KR100304660B1 (ko) * | 1995-09-22 | 2001-11-22 | 윤종용 | 누적에러처리를통한비디오신호부호화방법및부호화기 |
US5819035A (en) | 1995-10-20 | 1998-10-06 | Matsushita Electric Industrial Co., Ltd. | Post-filter for removing ringing artifacts of DCT coding |
US5909249A (en) * | 1995-12-15 | 1999-06-01 | General Instrument Corporation | Reduction of noise visibility in a digital video system |
US5825927A (en) * | 1996-01-16 | 1998-10-20 | Hitachi America, Ltd. | Methods and apparatus for encoding video data in a manner that is well suited for decoding by regular or downconverting decoders |
JP3067628B2 (ja) * | 1996-01-19 | 2000-07-17 | 日本電気株式会社 | 画像符号化装置 |
US6148135A (en) * | 1996-01-29 | 2000-11-14 | Mitsubishi Denki Kabushiki Kaisha | Video and audio reproducing device and video decoding device |
US5798795A (en) * | 1996-03-01 | 1998-08-25 | Florida Atlantic University | Method and apparatus for encoding and decoding video signals |
US5777679A (en) * | 1996-03-15 | 1998-07-07 | International Business Machines Corporation | Video decoder including polyphase fir horizontal filter |
US5978023A (en) * | 1996-10-10 | 1999-11-02 | Florida Atlantic University | Color video camera system and method for generating color video signals at increased line and/or frame rates |
US5978029A (en) * | 1997-10-10 | 1999-11-02 | International Business Machines Corporation | Real-time encoding of video sequence employing two encoders and statistical analysis |
US6061400A (en) * | 1997-11-20 | 2000-05-09 | Hitachi America Ltd. | Methods and apparatus for detecting scene conditions likely to cause prediction errors in reduced resolution video decoders and for using the detected information |
US6370192B1 (en) | 1997-11-20 | 2002-04-09 | Hitachi America, Ltd. | Methods and apparatus for decoding different portions of a video image at different resolutions |
JPH11177993A (ja) * | 1997-12-12 | 1999-07-02 | Nec Corp | 動画像符号化装置 |
US6141456A (en) * | 1997-12-31 | 2000-10-31 | Hitachi America, Ltd. | Methods and apparatus for combining downsampling and inverse discrete cosine transform operations |
US6539058B1 (en) * | 1998-04-13 | 2003-03-25 | Hitachi America, Ltd. | Methods and apparatus for reducing drift due to averaging in reduced resolution video decoders |
US6148032A (en) * | 1998-05-12 | 2000-11-14 | Hitachi America, Ltd. | Methods and apparatus for reducing the cost of video decoders |
US6122321A (en) * | 1998-05-12 | 2000-09-19 | Hitachi America, Ltd. | Methods and apparatus for reducing the complexity of inverse quantization operations |
US6385248B1 (en) | 1998-05-12 | 2002-05-07 | Hitachi America Ltd. | Methods and apparatus for processing luminance and chrominance image data |
US6208382B1 (en) | 1998-07-29 | 2001-03-27 | Florida Atlantic University | Color video processing system and method |
US6341181B1 (en) * | 1998-08-07 | 2002-01-22 | Canadian Space Agency | Mid-spatial frequency digital boost filter |
JP3757088B2 (ja) * | 1999-10-26 | 2006-03-22 | 日本電気株式会社 | 動画像符号化装置および方法 |
US7091985B1 (en) | 2000-05-16 | 2006-08-15 | International Business Machines Corporation | System and method for compressing color data using expandable color palette |
CN1167034C (zh) | 2001-02-27 | 2004-09-15 | 华为技术有限公司 | 图像预去噪的方法 |
JP2005020294A (ja) * | 2003-06-25 | 2005-01-20 | Sony Corp | ブロック歪低減装置 |
KR100557660B1 (ko) * | 2004-07-29 | 2006-03-10 | 매그나칩 반도체 유한회사 | 영상 신호에서의 플리커 검출 방법 |
US7952647B2 (en) * | 2006-12-27 | 2011-05-31 | Intel Corporation | Method and apparatus of content adaptive detailing filtering for digital pictures |
JP2010199631A (ja) * | 2007-11-30 | 2010-09-09 | 国立大学法人京都大学 | 画像ノイズ除去方法 |
US8983218B2 (en) | 2012-04-11 | 2015-03-17 | Texas Instruments Incorporated | Virtual boundary processing simplification for adaptive loop filtering (ALF) in video coding |
EP3472806A4 (de) | 2016-06-17 | 2020-02-26 | Immersive Robotics Pty Ltd | Bildkompressionsverfahren und -vorrichtung |
AU2017285700B2 (en) * | 2016-06-17 | 2019-07-25 | Immersive Robotics Pty Ltd | Image compression method and apparatus |
US11429337B2 (en) | 2017-02-08 | 2022-08-30 | Immersive Robotics Pty Ltd | Displaying content to users in a multiplayer venue |
AU2018280337B2 (en) | 2017-06-05 | 2023-01-19 | Immersive Robotics Pty Ltd | Digital content stream compression |
CN111699693A (zh) | 2017-11-21 | 2020-09-22 | 因默希弗机器人私人有限公司 | 用于数字现实的图像压缩 |
TW201935927A (zh) | 2017-11-21 | 2019-09-01 | 澳大利亞商伊門斯機器人控股有限公司 | 用於影像壓縮之頻率分量選擇 |
CN114556930A (zh) * | 2019-10-14 | 2022-05-27 | 谷歌有限责任公司 | 自适应量化和死区调制 |
CN111242830B (zh) * | 2020-01-20 | 2022-09-20 | 暨南大学 | 基于极谐变换的图像可逆鲁棒数据隐藏方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2643531B1 (fr) * | 1989-02-21 | 1996-04-26 | Thomson Csf | Procede et dispositif de compression de l'information destine au decodage compatible d'une famille de signaux de television de resolutions croissantes |
JPH0832047B2 (ja) * | 1989-04-28 | 1996-03-27 | 日本ビクター株式会社 | 予測符号化装置 |
EP0396846B1 (de) * | 1989-05-12 | 1993-04-28 | Rai Radiotelevisione Italiana | Gerät zur Diskret-Kosinus-Transform-Kodierung digitaler Videosignale |
EP0444918B1 (de) * | 1990-02-28 | 1996-06-05 | Victor Company Of Japan, Limited | Einrichtung zur Datenkompression |
US4999705A (en) * | 1990-05-03 | 1991-03-12 | At&T Bell Laboratories | Three dimensional motion compensated video coding |
JPH0414393A (ja) * | 1990-05-08 | 1992-01-20 | Matsushita Electric Ind Co Ltd | 映像信号処理装置 |
US5079621A (en) * | 1990-06-29 | 1992-01-07 | Eastman Kodak Company | Dct transform compression, transmission and recovery of digital color using virtual filtering mechanism |
JP2549013B2 (ja) * | 1990-10-08 | 1996-10-30 | 日本ビクター株式会社 | データ圧縮装置 |
US5121191A (en) * | 1991-03-15 | 1992-06-09 | Aware, Inc. | Method and apparatus for coding motion pictures |
JPH04342372A (ja) * | 1991-05-20 | 1992-11-27 | Seiko Epson Corp | 画像データ圧縮装置 |
-
1992
- 1992-09-24 US US07/950,473 patent/US5325125A/en not_active Expired - Lifetime
-
1993
- 1993-07-07 CA CA002100003A patent/CA2100003A1/en not_active Abandoned
- 1993-08-24 DE DE69324090T patent/DE69324090T2/de not_active Expired - Fee Related
- 1993-08-24 EP EP93113484A patent/EP0589220B1/de not_active Expired - Lifetime
- 1993-09-07 JP JP5222594A patent/JPH06225284A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US5325125A (en) | 1994-06-28 |
DE69324090D1 (de) | 1999-04-29 |
EP0589220A3 (de) | 1994-11-30 |
EP0589220A2 (de) | 1994-03-30 |
CA2100003A1 (en) | 1994-03-25 |
EP0589220B1 (de) | 1999-03-24 |
JPH06225284A (ja) | 1994-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69324090T2 (de) | Intraframefilter für Bildkompressionssysteme | |
DE69323354T2 (de) | System zur Kodierung eines hochauflösenden Videosignals mit farbempfindlicher Quantisierung | |
DE69322713T2 (de) | Vorrichtung zur orthogonalen Transformationskodierung und -dekodierung | |
DE69631108T2 (de) | Nachfilterung zur Entfernung von Artefakten in DCT-codierten Bildern | |
DE69027785T2 (de) | Einrichtung zur Zwischenbild-Vorhersagekodierung eines Videosignals | |
DE69032177T2 (de) | Kodierungsgerät | |
DE69622518T2 (de) | Verfahren und Vorrichtung zur Nachbearbeitung von Bildern | |
DE69227352T2 (de) | Verfahren und System für die Ausführung einer hochwirksamen Bildsignalkodierung | |
DE69424591T2 (de) | Verfahren zur Kontrolle der Datenmenge und Kodierer zur Durchführung desselben. | |
DE69735838T2 (de) | Videokodierer mit Transformationskoeffizientenprädiktion | |
EP0309669B1 (de) | Verfahren zur szenenmodellgestützten Bilddatenreduktion für digitale Fernsehsignale | |
DE69230704T2 (de) | Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung | |
DE69213511T2 (de) | Kodiervorrichtung zum Kodieren eines digitalen Bildsignals | |
DE69529323T2 (de) | Digitaler Videodekoder zum Dekodieren von digitalen hochauflösenden und/oder standardauflösenden Fernsehsignalen | |
DE69434668T2 (de) | Adaptives Codierungs- und Decodierungsverfahren mit variabler Länge für Bilddaten | |
US8165222B2 (en) | Video coder employing pixel transposition | |
DE69228442T2 (de) | Verfahren und vorrichtung zur bilddatenkompression durch luminanz/chrominanz-kodierung | |
DE69624669T2 (de) | Videokodierer und -dekodierersystem und -methoden | |
DE69123646T2 (de) | Kodierverfahren und -vorrichtung | |
DE69226127T2 (de) | Effiziente Kodierungs- und Dekodierungsanordnungen zur Verarbeitung eines digitalen Bildsignals | |
DE60203850T2 (de) | System und Verfahren zum Verarbeiten von Bildern mit aufgelöster Mosaikstruk- tur, um durch Farb-Aliasing hervorgerufenen Artefakte zu verringern. | |
DE69428034T2 (de) | Bildsignalkodierung und -dekodierung | |
DE69818751T2 (de) | Dekompression von interpolierten Bildern | |
DE69711736T2 (de) | Adaptive Postfilterung für ein Bildfernsprechsystem mit niedriger Bitrate | |
DE69126525T2 (de) | Digitale bildverarbeitung mit filterung der blockkanten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |