-
GEBIET DER ERFINDUNG
-
Die
Erfindung betrifft ein Abstimmungsverfahren für Videobildbände, bei
dem ein Bild, das aus Pixel zusammengesetzt ist, wenigstens vorgefiltert,
codiert und in einem Puffer zur weiteren Übertragung gespeichert wird,
wobei die Vorfilterung einen Referenzwert in Abhängigkeit von den Pixelwerten
in einem Pixelblock liefert, der dem Pixel bezüglich Lage und/oder Zeit für das Bildpixel
zugeordnet ist, und bei dem die Vorfilterung des gefilterten Pixelwertes
von der Relation der Differenz zwischen dem Originalpixelwert und
dem erzeugten Referenzwert zu einem Filterschwellenwert abhängt.
-
Die
Erfindung bezieht sich auch auf eine Filtervorrichtung zur Optimierung
des Betrages der Bildinformation, wobei diese Vorrichtung einen
Vorfilter, eine Codierungseinrichtung und einen Puffer aufweist,
die so angeordnet sind, dass sie wenigstens die Vorfilterung, Codierung
und Speicherung des aus Pixeln zusammengesetzten Bildes in einen
Puffer zur weiteren Übertragung
bewerkstelligen, wobei das Vorfilter für das Bildpixel einen Bezugswert
erzeugt, der eine Funktion der Pixelwerte eines Pixelblocks ist,
der mit der Lage und/oder Zeit des Pixels in Zusammenhang steht,
während
der gefilterte Pixelwert eine Funktion der Differenz zwischen dem
Originalpixelwert und dem erzeugten Referenzwert sowie dem Filterschwellenwert
ist.
-
HINTERGRUND DER ERFINDUNG
-
Das
Problem bei der Übertragung
digitaler Videobilder besteht in den großen Bandbreitenschwankungen,
die von dem Bitstrom benötigt
werden, der durch Videocodierung erzeugt wird. Die Schwankungen
sind besonders groß,
wenn mit Bewegungsschätzung
arbeitende Videotechniken verwendet werden. Gewöhnlich muss eine konstante
Bandbreite für
Videoübertragung
bei der praktischen Umsetzung erhalten bleiben, wodurch der Videocodierungsbitstrom
auf Kosten der Bildqualität
abzustimmen ist.
-
-
US-Patent 5 367 629 beschreibt
ein Videobildkompressionssystem, bei dem ein Vorbehandlungsabschnitt
einen Medianfilter und einen Adaptivfilter aufweist. Auf der Basis
der Pufferfüllmenge
stellt das Kompressionssystem die Bandbreite des adaptiven temporären Filters
in der Vorbehandlungsstufe ein sowie die Bandbreite des räumlichen
und temporären
Innenfilters sowie die Quantisierung.
-
Das
Patent
EP 0 396 846 beschreibt
eine DCT-Entschlüsselungsvorrichtung,
bei der die Bandbreite eines digitalen Niedrigdurchlauffilters,
der vor dem DCT-Enschlüsseler
eingeordnet ist, reduziert wird, sobald sich die Pufferfüllmenge
erhöht.
-
Die
US-Patente 4 691 233 und
4 700 226 beschreiben eine
Lösung
für die
Dezimalwerteinstellung in einem adaptiven Impulscodemodulator nach
der Pufferfüllmenge.
-
US-Patent 4 047 221 beschreibt
eine Codierungseinrichtung, bei der die Dämpfung und die obere Grenzfrequenz
eines Kammfilters, der hinter einem Wechselstrom/Gleichstrom-Wandler
angeordnet ist, auf der Grundlage der Pufferfüllmenge eingestellt werden.
-
US-Patent 5 134 476 beschreibt
ein Videosignalentschlüsselungsverfahren,
bei dem der Quantisierungsschritt und/oder die Vorfilterung entsprechend
der Pufferfüllmenge
abgestimmt bzw. eingestellt werden.
-
US-Patent 4 189 748 beschreibt
ein Videobandbreitenreduzierungssystem mit zweidimensionaler Transformation,
bei dem ein Adaptivfilter benutzt wird. Die Pufferfüllmenge
dient zur Einstellung einer Schwelle, und die Umwandlungskoeffizienten,
die unter diese Schwelle fallen, werden ausgesondert.
-
Die
bekannten Lösungen
sind jedoch mit einigen Nachteilen versehen. Das einfachste Verfahren, Band
zu sparen, besteht darin, nicht die vollständigen Videobilder zu übertragen,
wobei jedoch die Schwankungen der Bildfrequenz, die durch dieses
Verfahren verursacht werden, den Betrachter ziemlich verwirren. Bei
blockgestützten
Videocodierungslösungen
auf der Grundlage von DCT (Diskrete Cosinustransformation) wird
das Band gewöhnlich
durch Veränderung
der Quantifizierung abgestimmt, das heißt durch Reduzierung der Genauigkeit
der erhaltenen DCT-Komponenten, die jedoch leicht zu betonten Blockgrenzen
führen,
die den Betrachter verwirren. Bei einer Ausführungsform der vorliegenden
Lösung
werden nicht die DCT-Komponenten übertragen, die höheren Frequenzen
entsprechen und oftmals zu Geräuschen
führen,
jedoch führt selbst
dieses Verfahren zu denselben Problemen.
-
KURZE BESCHREIBUNG DER ERFINDUNG
-
Die
Aufgabe der Erfindung besteht darin, ein Verfahren sowie eine Vorrichtung
zur praktischen Anwendung des Verfahrens zu schaffen, um die obigen
Probleme zu lösen.
Trotz der zur Verfügung
stehenden begrenzten Bandbreite wird die Bildfrequenz nicht geändert. Wenn
DCT verwendet wird, muss die Quantifizierung auch nicht geändert werden,
und die Übertragung
der hochfrequenten DCT-Komponenten braucht nicht begrenzt zu werden.
-
Dies
wird bei einem Verfahren der eingangs genannten Art dadurch erreicht,
dass der Vorfilterschwellenwert entsprechend der Pufferfüllmenge
geändert
wird, wodurch eine konstante Videobildfrequenz erhalten wird.
-
Die
erfindungsgemäße Filteranordnung
kennzeichnet sich wiederum dadurch, dass Anpassungsmittel verwendet
werden, um den Vorfilterschwellenwert mit der Pufferfüllmenge
zu ändern
und dadurch eine konstante Videobildfrequenz zu erhalten.
-
Das
Verfahren sowie die Vorrichtung gemäß der Erfindung bieten eine
Vielzahl von Vorteilen. Die erfindungsgemäße Lösung ermöglicht eine kontinuierliche
und schnelle Bandbreitenanpassung ohne Segmentbildung oder Änderungen
der Bildfrequenz. Das Bildsignalgeräusch kann ebenfalls in Schranken
gehalten werden.
-
KURZE BESCHREIBUNG DER ERFINDUNG
-
Im
Folgenden wird die Erfindung im Einzelnen anhand von bevorzugten
Ausführungsformen
unter Bezug auf die beigefügten
Zeichnungen näher
erläutert,
in denen:
-
1 eine
Bildsignalübertragungsanordnung
zeigt,
-
2 eine
Bildsignalfilteranordnung zeigt und
-
3 den
Wirkungsgrad der erfindungsgemäßen Lösung darstellt.
-
DETAILLIERTE BESCHREIBUNG
DER ERFINDUNG
-
Die
erfindungsgemäße Lösung ist
besonders für
die Übertragung
digitaler Videobilder geeignet, ohne jedoch auf diesen Zweck beschränkt zu sein.
-
1 zeigt
eine typische Videobildübertragungsanordnung,
bestehend aus einer Kamera 10, einer Kompressionsvorrichtung 11,
einem Übertragungsnetzwerk 12,
einer Dekompressionsvorrichtung 13 und einem Monitor 14.
Bei der erfindungsgemäßen Lösung ist
die Kamera 10 eine gewöhnliche
analoge oder digitale Schwarzweiß- oder Farbbildvideokamera.
Von der Kamera 10 wird an die Kompressionsvorrichtung 11 ein
Signal abgegeben, das das Bildsignal digital verarbeitet. Bei einer
analogen Kamera 10 wird das Signal in der Kompressionsvorrichtung 11 umgewandelt,
und zwar zuletzt durch einen Wechselstrom/Gleichstrom-Wandler in
eine digitale Form, bevor die Kompression stattfindet. Ein digitales
Videobild weist gewöhnlich
Bilder auf, die im Allgemeinen durch eine Rechteckmatrix in regulären Intervallen
abgetastet werden. Ein derartiges digitales Bild setzt sich aus
einer Matrix aus Pixeln zusammen, also Bildmuster. Wegen der analogen
Fernsehübertragung
wird auch die überlappte
Musterbildung benutzt, bei der entweder ungerade oder gerade Reihen
der Mustermatrix abwechselnd in aufeinanderfolgenden Zeitpunkten übertragen
werden. Die Auflösung
einer Mustermatrix ist vertikal und horizontal nicht immer dieselbe.
Die Kompressionseinrichtung 11 komprimiert die Bildinformation,
bestehend aus einem Bildsignal, in digitaler Weise so, dass sie
in das Übertragungsnetzwerk 12 übertragen
werden kann, das möglicherweise
eine beschränkte Übertragungskapazität aufweist.
Das Übertragungsnetzwerk 12 ist
irgendein bekanntes Kabelnetzwerk oder Radionetzwerk, das die Bildübertragung
ermöglicht.
Die Bildinformation wird von dem Übertragungsnetzwerk 12 an
die Dekompressionseinrichtung 13 weitergegeben, in der
das Bild entkomprimiert wird und das Signal an den Monitor 14 weitergeleitet
wird, um das Bild sichtbar zu machen.
-
Das
Bildsignal und seine Verarbeitung werden im folgenden im einzelnen
betrachtet. Die Darstellung von Farben ist möglich durch Verwendung von
drei numerischen Werten für
jedes Pixel. Die Bedeutung und Eigenschaften dieser numerischen
Werte variieren in Abhängigkeit
von der benutzten Farbzeile. Die Videokamera 10 mißt die Stärke des
roten (R), grünen
(G) und blauen (B) Lichts, das von dem Ziel reflektiert wird, so daß bei der
Musterbildung eine bekannte RGB-Farbzeile benutzt wird. Zur Übertragung
und Verarbeitung wird das Bildsignal gewöhnlich in eine andere Farbzeile
transformiert. Da die Display-Vorrichtung, also der Monitor 14,
das Bild erzeugt, in dem das rote, grüne und blaue Licht kombiniert
werden, ist am Ende der Übertragungskette
auf der Seite des Monitors 14 eine inverse Transformation
erforderlich.
-
Die
Augen einer Person sind, was die Helligkeit anbelangt, empfindlicher
als was die Farbinformation anbelangt. Demzufolge arbeitet die Bildsignalübertragung
im allgemeinen mit einer Transformation der YUV-Farbzeile, bei der
das Übertragungsband
mehr Platz für
die Leuchtstärkenkomponente
(Y) bietet als für die
Farbunterschiedinformation (UV). Die U- und V-Komponenten des PAL-Systems
(Phase Information Line) sind Modulationsachsen der Trägerfrequenzen
des Farbkodierungssystems. Die maßstäblich veränderten und gefilterten Farbdifferenzsignale
B-Y und R-Y dienen zur Modulation der PAL-Trägerfrequenz in die U- und V-Achsen.
Die Augen des Betrachters sind ebenfalls empfindlich, was eine geringe
Zeilenleuchtstärkenschwankung
anbelangt. Bei einem analogen Bildsignal enthält die vertikale Leuchtstärkeninformation
die doppelte Anzahl Details der Farbinformation. Ein digitales Bildsignal
der Farbunterschiedinformation bei Studioqualität ist demzufolge bei vertikaler
Musterbildung durch die halbe Auflösung der Leuchtstärkeninformation gekennzeichnet.
Oftmals ist es so, daß dann,
wenn ein digitales Bild komprimiert, also verdichtet wird, die horizontale
Auflösung
der Farbdifferenzinformation ebenfalls um die Hälfte sinkt.
-
Sehr
schnelle räumliche
Leuchtstärkenschwankungen
wiederum sind möglicherweise
geräuschvoll. Änderungskomponenten,
die hohen Frequenzen entsprechen, werden demzufolge in vielen Codes
durch etwas, was Vorfilterung genannt wird, um Geräusch zu
beseitigen, ohne die Bildränder
zu trüben.
Selbst starke Filterung bedeutet aber nicht, daß sich die Augen wie genau
beobachtende Werkzeuge verhalten, so daß die DCT-Komponenten der blockgestützten Codes
nicht mehr benötigt
werden.
-
Die
diskrete Cosine-Transformation DCT ist der schnellen Fourier-Transformation
FFT ähnlich.
Sie transformiert die Daten zwischen dem Zeitbereich und dem Frequenzbereich,
wobei diese Transformation eine entsprechende inverse Transformation
für die
Wiederherstellung der Originaldaten beinhaltet. Die DCT wird auf
die Kompression eines Bildes angewendet. Die DCT-Transformation
läßt sich
ziemlich schwer errechnen. So erfolgt beispielsweise die Durchführung einer
zweidimensionalen DCT-Transformation
für einen
8 × 8
Pixelblock nach der folgenden Formel:
wobei f
i ein
Pixel-Wert i ist und C(x) = 1/√2
für x =
0, sonst 1 beträgt.
-
In
den MPEG-1 und MPEG-2 (Moving Picture Expert Group) Video-Codierungsstandards
beispielsweise, wird die Korrelation benachbarter Pixels durch Aufteilung
des Bildes in 8 × 8
Pixelblocks bewirkt, die der DCT-Transformation unterworfen werden.
Wenige Komponenten mit hohen Werten verbleiben in dem DCT-Transformationsblock,
während
die Werte der anderen Komponenten niedrig bleiben. Indem die niedrigwertigen
Komponenten durch Quantifizierung auf Null gesetzt werden, wodurch
die Lauflänge
der Codierung von Niedrigfrequenzen zu hohen Frequenzen bewirkt
wird, kombiniert mit Entropie-Codierung, wird ein erheblich kleinerer
Bit-Strom im Vergleich
zu dem Original erzeugt. MPEG-Standards benutzen die Zeitkorrelation zwischen
Bildern durch Benutzung von Bewegungsschätzung, um die besten Äquivalente
aus dem vorherigen Bild für
einen 16 × 16
Pixel-Makro-Block des vorhandenen Bildes zu suchen und dadurch,
daß nur
die Bewegungsvektoren des Differenzsignales der DCT-Transformation übertragen
werden.
-
Neben
der DCT-Transformation können
auch andere bekannte Videocodierungsverfahren für die erfindungsgemäße Lösung verwendet
werden. Die am besten arbeitenden Videocodierungsverfahren kombinieren
kreativ mehrere Verfahren. In der Tafel 1 sind unterschiedliche
Codierungsverfahren dargestellt. Tafel
1: Fehlercodierungsverfahren
-
Im
folgenden soll nun die Bildsignalfilterung im einzelnen betrachtet
werden. 2 zeigt in der Kompressionsvorrichtung 11 die
wichtigsten Behandlungsblöcke
eines Bildsignals, das in der Kamera 10 erzeugt wird. Die
Anordnung weist eine Dezimierungseinrichtung 20, Vorfilterungseinrichtung 21,
Codierungseinrichtung 22, einen Puffer 23 und
eine Einstell- oder Anpassungsvorrichtung 24 auf. Die Dezimierungseinrichtung 20 verkleinert
Bildsignalmuster in an sich bekannter Weise, um dadurch die Anzahl
der Muster zu verringern. Die Vorfiltereinrichtung 21 beseitigt
Geräusch,
ohne die Bildränder
unscharf zu machen. In diesem Stadium werden selbst durch intensive
Filterung keine klar bemerkbare Interferenzmuster für das Bild
bewirkt, wie dies durch Ver kleinerung der DCT-Komponenten blockgestützter Codes
erreicht wird. In der Codierungsvorrichtung 22 wird ein
vorgefiltertes Bildsignal der Codierung unterworfen, das typischerweise
DCT-Transformation aufweist. Die Energie, d. h. hohe Werte eines
Blocks, der in der DCT-Transformation genutzt wird und die Größe des gesamten
Bildes oder beispielsweise 8 × 8
Pixels haben kann, werden auf wenige DCT-Komponenten konzentriert, während die
Werte der anderen Komponenten niedrig bleiben. Falls die Quantifizierung
benutzt wird, werden die meisten niedrigen Werte Null, wodurch die
Bandbreite des Bitstroms verringert wird. Ein codiertes Bildsignal
wird von der Codierungsvorrichtung 22 an den Puffer 23 abgegeben,
von dem aus das Signal weiter an beispielsweise das Übertragungsnetzwerk übertragen
wird. Der Puffer 23 ist vorzugsweise eine elektronische
Memory-Schaltung, die digitale Daten speichert. Die Dezimierungsvorrichtung 20,
Vorfilterungsvorrichtung 21 und Codierungsvorrichtung 22 können auch
als Hardwarelösungen
oder in Software durch Verwendung elektronischer Schaltkreise implementiert
werden. Bei der erfindungsgemäßen Lösung besteht
das Ziel insbesondere in der Komprimierung der Lichtstärke des
Bildsignals.
-
Da
der Puffer 23 nur eine beschränkte Menge an Bildsignaldaten
speichern kann, wird er gefüllt
werden, wenn das Bildsignal nicht ausreichend komprimiert wird.
Der Bitstrom eines nicht komprimierten Bildsignals ist typischerweise
150 Mbps. Aus diesem Grund wird die Information über den Füllungsgrad des Puffers 23 bei
der erfindungsgemäßen Lösung über die
Anpassungsvorrichtung 24 an die Vorfiltervorrichtung 21 rückgemeldet,
in die Information aus dem Bildsignal insoweit ausgefiltert wird,
daß die
Speicherkapazität
des Puffers 23 nie überschritten
wird. Dies stellt ebenfalls sicher, daß die Speicherkapazität des Puffers 23 ständig optimal
genutzt wird.
-
Ein
Bezugswert, der von den Pixelwerten eines Pixelblocks, der entweder örtlich und/oder
zeitlich einem Pixel zuzuordnen ist, abhängig ist, wird in der Vorfiltervorrichtung 21 in
an sich bekannter Weise für
das Bildpixel erzeugt. In der Vorfiltervorrichtung 21 wird
das Pixel ferner mit einem Filterwert versehen, der von dem Zusammenhang
der Differenz zwischen dem originalen Pixelwert und dem für einen
Schwellenwert, welcher bei der Filterung benutzt wird, erzeugten
Bezugswert abhängt.
Diese Vorgänge
werden vorzugsweise getrennt für
die Pixel jedes zu behandelnden Bildbereiches ausgeführt. In
diesem Fall behält
ein Pixelwert seinen Originalwert nur, wenn die Differenz zwischen
dem Pixelwert und dem Bezugswert den Schwellenwert überschreitet.
Sonst wird der Originalpixelwert durch die Bezugswerte ersetzt.
Der Unterschied kann absolut gemessen werden, beispielsweise als
Differenz, oder relativ, beispielsweise als ein Quotient. Der Bezugswert
ist typischerweise ein Durchschnittswert eines Blocks oder des gesamten
Bildbereiches, beispielsweise als Durchschnitt oder Mittelwert.
Mittelwert- oder
Medianfilter sind nicht linear und entfernen von dem Bild die Impulsgeräusche und
halten gleichermaßen
Diskontinuitätspunkte,
beispielsweise Ränder,
scharf. Die Blockgröße beträgt vorzugsweise
3 × 3
Pixel in einer Fläche
von viereckiger oder Kreuzform. Bei der erfindungsgemäßen Lösung verändert die
Einstell- oder Anpassungsvorrichtung 24 den Vorfilterschwellenwert
gemäß der Füllgeschwindigkeit
bzw. Füllmenge
des Puffers 23. Der Puffer 23 informiert die Anpassungsvorrichtung 24 über den im
Puffer 23 noch vorhandenen Speicherraum oder die Größe des Speicherraums,
der sich in Benutzung befindet. Je voller der Puffer 23,
desto schneller wird die Anpassungsvorrichtung 24 den Schwellenwert ändern, so
daß mehr
und mehr Pixel um einen Betrag von dem Bezugswert abweichen, der
unter dem Schwellenwert liegt und den Wert erhalten, der dem Bezugswert
entspricht. Dadurch wird die Bandbreite des Bildsignalbitstroms
verringert. Wenn der Pixelwert beispielsweise bei 8 Bit liegt, kann
der Schwellenwert Größen erreichen, die
schrittweise bei etwa 0 bis 28, also beispielsweise
bei 0 bis 256, liegen. Wenn eine blockgestützte Videocodierung benutzt
wird, wird jeder Codierungsblock getrennt vorgefiltert, wobei eine
Bewegungsabschätzungsinformation
Verwendung findet. Die erfindungsgemäße Lösung verringert die Nachteile,
die durch die Videoquelle und Videoelektronik verursacht werden,
beispielsweise Geräusche.
Somit verbessert die Lösung
den Wirkungsgrad der Codierung und ermöglicht die Benutzung einer
qualitativ geringerwertigen, beispielsweise selbst einer billigen
Kamera.
-
3 zeigt
die Meßergebnisse
für verschiedene
Vorfilterverfahren und Schwellenwerte. Die senkrechte Achse zeigt
die Bandeinsparung im Vergleich zu einer Situation, bei der keine
Vorfilterung stattfindet. Die horizontale Achse zeigt den DCT-Quantifizierungskoeffizienten
der Codierungsvorrichtungen 22. In allen Fällen wurden
ein 3 × 3
Pixel-Block und eine mittlere Filterung benutzt, wobei die Plus-Mittel-Filterung getrennt angegeben
wird. Bei der Plus-Mittel-Filterung werden die Pixel aus einem kreuzförmigen Muster
ausgewählt, während bei
der gewöhnlichen
Mittel-Filterung
die Pixel aus einem viereckigen Bereich ausgewählt werden. Die obere Kurve 30 beschreibt
einen Fall, bei dem der Schwellenwert 18 betrug. Im Falle der Kurve 31 betrug der
Schellenwert zwar auch 18, jedoch die Filterung war eine Plus-Mittel-Filterung. Die Kurve 32 gibt
eine Messung an, bei der der Schwellenwert 9 betrug und eine Plus-Mittel-Filterung
benutzt wurde. Auch die Kurve 33 basiert auf einem Schwellenwert
9. Das Kurvenpaar 34 und 35 basiert auf einem
Schwellenwert 0. Die Kurve 34 stützt sich auf eine Plus-Mittel-Filterung.
-
Obgleich
die Erfindung im obigen unter Bezug auf das in den beigefügten Zeichnungen
dargestellte Beispiel beschrieben wurde, ist sie offensichtlich
nicht darauf beschränkt,
sondern vielfältigen
Abänderungen zugänglich,
die im Schutzumfang der Erfindungsidee liegen, welche in den beigefügten Ansprüchen enthalten ist.