-
Gebiet
-
Die
vorliegende Erfindung betrifft die Bildverarbeitung und insbesondere
das adaptive Schärfen
eines Bilds.
-
Hintergrund
-
Anwendungen,
bei denen ein komprimiertes Video verwendet und angezeigt wird,
müssen
das Video häufig
zur Übertragung über eine
Kommunikationsstrecke in der Art gewöhnlicher Telefonleitungen (d.h.
des "Plain Old Telephone
Service" (POTS))
oder des "Integrated
Services Digital Network" (ISDN)
vorbereiten, welche eine begrenzte Bandbreite bereitstellen, über die
das Video übertragen
werden muss. Diese Beschränkung
der Bandbreite legt dem mit Algorithmen nach dem neuesten Stand
der Technik komprimierten Video eine qualitative obere Grenze auf.
Zusätzlich
ist die Größe der Bildrahmen
typischerweise begrenzt, wenn die Kommunikation über POTS erfolgt. Im Allgemeinen
ist die Datenkompression ein verlustbehafteter Prozess, und eine
Folge davon besteht darin, dass sich Kompressionsartefakte zeigen,
die infolge der Kompression in dem Bild erzeugte Produkte sind,
welche andernfalls nicht vorhanden wären. Weiterhin erfährt das
Bild durch die Datenkompression einen allgemeinen Detailverlust.
Trotz dieser Beschränkungen
wünschen
Anwendungsbenutzer typischerweise größere Videobilder (d.h. Bilder,
die einen erheblich größeren Prozentsatz
der Anzeigeschirmfläche
belegen).
-
Wenn
Bilder klein sind, ist das Auge nachsichtig. Wenn Bilder jedoch
auf höhere
Größen skaliert
werden, werden die kleinen Defekte (beispielsweise die Artefakte
oder der Detail- und Strukturverlust) infolge der Kompression gut
sichtbar, wodurch bewirkt wird, dass das Bild häufig als "ausgewaschen" erscheint, wenn die gleichen Informationen über eine
größere Fläche ausgebreitet
werden. Um diesen "Auswascheffekt" zu vermeiden, werden
schärfende
Nachfilter angewendet, um dabei zu helfen, den Bildern etwas mehr
Definition und Schärfe
zu geben. Kompressionsartefakte wie Ringing müssen jedoch während des
Schärfungsprozesses
berücksichtigt
werden. Andernfalls werden diese Defekte zusammen mit dem Bild vergrößert, was
dazu führt, dass
das Bild sogar noch schlechter aussieht, als wenn keine Schärfung ausgeführt worden
wäre. Daher
besteht aus diesen und anderen Gründen ein Bedarf am Identifizieren
der unerwünschten
Kompressionsartefakte innerhalb eines Bilds und am Vermeiden ihrer
Verstärkung
während
des Schärfungsprozesses
durch ein adaptives Schärfen
eines Bilds, wodurch das gesamte Bild mit Ausnahme der identifizierten
unerwünschten Kompressionsartefakte
geschärft
wird.
-
In
der europäischen
Patentanmeldung EP-A-0 721 286 ist eine Bilddekodiervorrichtung
offenbart, welche die Rekonstruktion der quantisierten Koeffizienten
und ein adaptives Kantenanhebungsfilter, das auf jene dekodierten
Blöcke
angewendet wird, deren durch einen statistischen Kantendetektor
gemessener Kantenanteil über
einem vorgegebenen Schwellenwert liegt, aufweist.
-
Zusammenfassung
-
Gemäß einer
Ausführungsform
umfasst ein Verfahren das Dekodieren eines Videobilds, so dass durch das
Dekodieren eine Anzahl von Transformationskoeffizienten erzeugt
wird. Zusätzlich
wird die Anzahl der Transformationskoeffizienten verarbeitet, um
zu bestimmen, ob das Videobild zu schärfen ist.
-
Kurzbeschreibung der Zeichnung
-
1 ist
ein Blockdiagramm eines Systems gemäß einer Ausführungsform
der Erfindung.
-
Die 2 und 3 sind
Flussdiagramme von Verfahren gemäß Ausführungsformen
der vorliegenden Erfindung.
-
4 ist
ein Diagramm eines Computers, in Zusammenhang mit dem eine Ausführungsform
der Erfindung verwirklicht werden kann.
-
Detaillierte Beschreibung
-
Die
Erfindung umfasst Systeme, Verfahren, Computer und computerlesbare
Medien nach Anspruch 1 bzw. 11 und 22. Abgesehen von den hier beschriebenen
Ausführungsformen,
Vorteilen und Aspekten der Erfindung umfasst die Erfindung auch
andere Ausführungsformen,
Vorteile und Aspekte, wie beim Lesen und Studieren der Zeichnung
und der folgenden Beschreibung verständlich werden wird.
-
In
der folgenden detaillierten Beschreibung der als Beispiel dienenden
Ausführungsformen
wird auf die anliegende Zeichnung Bezug genommen, die ein Teil dieses
Dokuments ist und worin zur Veranschaulichung spezifische Ausführungsformen
dargestellt sind, in denen die Erfindung verwirklicht werden kann.
Es ist zu verstehen, dass auch andere Ausführungsformen verwendet werden
können
und strukturelle Änderungen
vorgenommen werden können,
ohne vom Schutzumfang der vorliegenden Erfindung abzuweichen.
-
Einige
Teile der detaillierten Beschreibungen, welche folgen, werden in
Bezug auf Algorithmen und symbolische Darstellungen von Operationen
an Datenbits innerhalb eines Computerspeichers präsentiert.
Diese algorithmischen Beschreibungen und Darstellungen sind die
Mittel, die von Fachleuten auf dem Gebiet der Datenverarbeitung
verwendet werden, um die Substanz ihrer Arbeit anderen Fachleuten
am wirksamsten zu vermitteln. Ein Algorithmus wird hier und allgemein
als eine selbstkonsistente Folge von Schritten, die zu einem gewünschten
Ergebnis führen,
angesehen. Die Schritte sind jene, die physikalische Manipulationen
physikalischer Größen erfordern.
Diese Größen nehmen
gewöhnlich,
jedoch nicht notwendigerweise, die Form elektrischer oder magnetischer
Signale an, die gespeichert, übertragen,
kombiniert, verglichen und auf andere Weise manipuliert werden können. Es hat
sich gelegentlich als zweckmäßig erwiesen,
insbesondere aus Gründen
der allgemeinen Verwendung, diese Signale als Bits, Werte, Elemente,
Symbole, Zeichen, Terme, Zahlen oder dergleichen zu bezeichnen.
Es sollte jedoch im Gedächtnis
behalten werden, dass all diese und ähnliche Begriffe den geeigneten
physikalischen Größen zuzuordnen
sind und lediglich zweckmäßige Bezeichnungen
sind, die für
diese Größen verwendet
werden. Sofern in den folgenden Erörterungen nichts anderes spezifisch
erwähnt wird,
ist zu verstehen, dass gemäß der vorliegenden
Erfindung Erörterungen,
in denen die Begriffe "Verarbeiten" oder "Berechnen" oder "Bestimmen" oder "Anzeigen" oder dergleichen
verwendet werden, Vorgänge
und Prozesse eines Computersystems oder einer ähnlichen elektronischen Rechenvorrichtung
betreffen, bei denen als physikalische (elektronische) Größen dargestellte
Daten innerhalb der Register und Speicher des Computersystems zu
anderen Daten, die ähnlich
als physikalische Größen innerhalb
der Speicher oder Register des Computersystems oder anderen solchen
Informationsspeicher-, Übertragungs-
oder Anzeigevorrichtungen dargestellt werden, manipuliert und transformiert
werden.
-
In 1 ist
ein Blockdiagramm eines Systems gemäß einer Ausführungsform
der Erfindung dargestellt. Das System aus 1 umfasst
einen Computer 100, eine Videobild-Dekodiereinrichtung 102, eine Schärfungseinheit 104,
eine Transformationskoeffizienteneinheit 106, eine Videoschärfungseinrichtung 108 und
eine Videoanzeige 110. Wie dargestellt ist, sind die Videobild-Dekodiereinrichtung 102,
die Schärfungseinheit 104,
die Transformationskoeffizienteneinheit 106 und die Videoschärfungseinrichtung 108 wünschenswerterweise
Teil des Computers 100, wenngleich die Erfindung nicht
darauf beschränkt
ist. Bei einer solchen Ausführungsform
sind die Videobild-Dekodiereinrichtung 102, die Schärfungseinheit 104,
die Transformationskoeffizienteneinheit 106 und die Videoschärfungseinrichtung 108 wünschenswerterweise
Computerprogramme auf einem Computer, d.h.
-
Programme
(nämlich
ein Videobild-Dekodiereinrichtungs-Programm, ein Schärfungseinheits-Programm, ein
Transformationskoeffizienteneinheits-Programm und ein Videoschärfungseinrichtungs-Programm),
die von einem Prozessor des Computers von einem computerlesbaren
Medium in der Art eines Speichers davon ausgeführt werden. Durchschnittsfachleute
werden verstehen, dass der Computer 100 auch andere in 1 nicht
dargestellte Komponenten aufweisen kann, wobei nur jene Teile bereitgestellt
sind, die zur Beschreibung der Erfindung erforderlich sind.
-
Die
Videobild-Dekodiereinrichtung 102 dekodiert eine komprimierte
Videosequenz unter Verwendung einer blockbasierten Transformation,
die auf dem Fachgebiet wohlbekannt ist. Standards zur Videokompression
umfassen H.261, H.263, MPEG (Motion Picture Experts Group)-1, MPEG-2
und JPEG (Joint Photographic Experts Group). ITU-T (Telecommunications
Standardization Sector of International Telecommunication Union,
früher
als CCITT (The International Telegraph and Telephone Consultative
Committee) bekannt) H.261, Video Codec for Audiovisual Services
at p × 64
kbits; ITU-T H.263, Video Coding for Low Bitrate Communication; ISO/IEC
(International Organization for Standardization/Internal Electrotechnical
Commission) 11172-2 (MPEG-1 Video), Information Technology – Coding
of Moving Pictures and Associated Audio Information for Digital
Storage Media at up to about 1.5 Mbit/s: Part 2 Video; ISO/IEC 13818-2
(MPEG-2 Video), Information Technology – Generic Coding of Moving
Pictures and Associated Audio Information: Part 2 Video; ISO 10918-1 (CCITT
T.81) JPEG, Information Technology – Digital Compression and Coding
of Continuous-Tone Still Images – Requirements and Guidelines;
ISO/IEC 14496-2: 1999 (MPEG-4 Video) Information Technology – Generic
Coding of Audio-Visual Objects – Part
2: Visual.
-
Ein
Zwischenergebnis dieser Dekodierung (d.h. Dekompression) durch die
Videobild-Dekodiereinrichtung 102 ist durch eine Anzahl
von Transformationskoeffizienten für jeden der Blöcke in dem
Videobild gegeben. Gemäß einer
Ausführungs form
ist diese Anzahl von Transformationskoeffizienten durch diskrete
Kosinustransformationskoeffizienten (DCT-Koeffizienten) gegeben
(d.h. die Transformation ist die diskrete Kosinustransformation),
wie auf dem Fachgebiet wohlbekannt ist. Der Codierprozess verwendet
diese Transformation zum Transformieren des zweidimensionalen Pixelblocks
(d.h. des Videobilds) aus dem Raumbereich in den Transformationsbereich,
wobei ein zweidimensionales Feld von Transformationskoeffizienten
erzeugt wird. Der Dekodierer verwendet wiederum diese Transformationskoeffizienten,
um das vom Codierer komprimierte Videobild wiederherzustellen. Abgesehen
von der Verwendung dieser Koeffizienten zum Dekodieren des Videobilds
werden diese Transformationskoeffizienten gemäß nachstehend erörterten
Ausführungsformen
verwendet, um festzustellen, ob Abschnitte des Bilds zu schärfen sind.
-
Für jeden
der Blöcke
innerhalb des dekodierten Videobilds empfängt die Schärfungseinheit 104 die Anzahl
der Transformationskoeffizienten und verarbeitet die Anzahl der
Transformationskoeffizienten, um festzustellen, ob das Videobild
zu schärfen
ist. Gemäß einer
Ausführungsform
enthält
die Schärfungseinheit 104 den
Transformationskoeffizientenzähler 106,
der in der Lage ist, jeden Block des Videobilds zu empfangen und einen
Transformationszählwert
für jeden
Block auf der Grundlage der Anzahl nicht verschwindender Transformationskoeffizienten
für jeden
Block zu erzeugen. Gemäß einer
anderen Ausführungsform
weist der Transformationskoeffizientenzähler 106 eine Lokalisierungseinheit
auf, die jeden Block des Videobilds in einer bestimmten Reihenfolge
durchläuft
und den letzten nicht verschwindenden Transformationskoeffizienten
in der Reihenfolge lokalisiert. Wenn ein Videobild durch ein Übertragungssystem
(beispielsweise POTS, ISDN oder das Internet) komprimiert und gesendet
wird, wird das Videobild als ein Bitstrom dargestellt. Der Videodekodierer
interpretiert den Bitstrom zur Bestimmung der Position und des Werts
der Transformationskoeffizienten, die dem komprimierten Bitstrom
zugeordnet sind. Gemäß einer
Ausführungsform
weist der Transformationskoeffizientenzähler 106 eine Bitstromeinheit
zum Interpretieren des Bitstroms auf, um die Position der nicht verschwindenden
Transformationskoeffizienten zu bestimmen. Gemäß einer anderen Ausführungsform
weist der Transformationskoeffizientenzähler 106 einen Mechanismus
zum Bestimmen der Position des nicht verschwindenden Transformationskoeffizienten
anhand des dekodierten Bitstroms auf.
-
Gemäß einer
Ausführungsform
setzt die Lokalisierungseinheit den Transformationszählwert auf
die Position des nicht verschwindenden Transformationskoeffizienten.
Gemäß einer
alternativen Ausführungsform nimmt
die Lokalisierungseinheit die Position dieses letzten nicht verschwindenden
Transformationskoeffizienten und addiert eine Zahl zur Bildung des
Transformationszählwerts.
Gemäß einer
Ausführungsform
ist diese zur Position des letzten nicht verschwindenden Transformationskoeffizienten
addierte Zahl eins.
-
Gemäß einer
anderen Ausführungsform
ist die Reihenfolge des Durchlaufens eine Zickzack-Reihenfolge.
Diese Zickzack-Reihenfolge
ist, wie auf dem Fachgebiet wohlbekannt ist, in den vorstehend zitierten
Beschreibungen von H.261, MPEG-1, MPEG-2 und MPEG-4 definiert. Während des
Codierprozesses werden verschiedene Reihenfolgen für das Durchlaufen
der Blöcke
des Videobilds bei der Transformation eines Blocks vom Raumbereich
in den Transformationsbereich während
der Transformation verwendet. Um hieraus maximale Vorteile zu ziehen,
werden die Transformationskoeffizienten in einer Zickzack-Reihenfolge organisiert, um
lange Nullfolgen zu erzeugen. Bei dem Dekodierprozess wird die gleiche
Durchlaufreihenfolge für
das Dekodieren und auch für
das Bestimmen der Position nicht verschwindender Transformationskoeffizienten
für jeden
Block des Videobilds verwendet. Es sei bemerkt, dass die gemäß der vorliegenden
Erfindung verwendete Durchlaufreihenfolge für den Gesamtbetrieb des Systems
nicht entscheidend ist und dass die damit erhaltenen Vorteile auch
mit anderen Durchlaufreihenfolgen erhalten werden könnten.
-
Zusätzlich besteht
die Schärfungseinheit 104 aus
einer Videoschärfungseinrichtung 108.
Die Videoschärfungseinrichtung 108 empfängt den
Transformationszählwert
für jeden
Block und schärft
den Block, dessen Transformationszählwert kleiner als ein vorgegebener
Schwellenwert ist. Falls der Transformationszählwert dagegen nicht kleiner
als der vorgegebene Schwellenwert ist, wird dieser Block nicht geschärft.
-
Gemäß einer
Ausführungsform
für das
POTS-Raten-Video (das in etwa 20 Kilobits/Sekunde (kBits/s) oder
weniger aufweist) ist dieser vorgegebene Schwellenwert, mit dem
der Transformationszählwert
verglichen wird, eins. Gemäß einer
anderen Ausführungsform
für ISDN-Raten-Video
(das etwa 90 kBits/s oder weniger aufweist) ist dieser vorgegebene
Schwellenwert, mit dem der Transformationszählwert verglichen ist, fünf. Dieser
vorgegebene Schwellenwert ändert
sich jedoch entsprechend der Umgebung, in der er verwendet wird,
und ist nicht auf einen bestimmten Wert beschränkt. Beispielsweise können Videokonferenzen
zwischen zwei Einzelpersonen einen anderen Schwellenwert erfordern
als eine Videosequenz, die mehr Einzelheiten enthält.
-
Gemäß einer
Ausführungsform
weist die Videoschärfungseinrichtung
108 eine
Faltungseinheit auf, um eine Faltung unter Verwendung eines stückweisen
kubischen Schärfungsfilters
an jedem Block innerhalb des Videobilds auszuführen, wie auf dem Fachgebiet
wohlbekannt ist. Insbesondere ist das Schärfungsfilter im Wesentlichen
ein Filter mit vier Abgriffen von einer Gleichung dritter Ordnung.
Bei Ignorieren der Ränder
ist die grundlegende kubische Interpolierende:
wobei α (Alpha)
die Steigung oder die erste Ableitung ist, wenn x = 1 ist, und β (Beta) der
Wert bei x = 1 ist. Für
weitere Informationen in Bezug auf diese Faltung sei auf Stephen
E. Reichenback und Stephen K. Park "Two-Parameter Cubic Convolution for
Image Reconstruction",
SPIE, Band 1199 Visual Communications and Image Processing IV, S.
833 – 840,
1989 verwiesen. Vorteilhafterweise ermöglicht diese zweiparametrige
kubische Faltung sowohl das Zoomen als auch das Schärfen eines
bestimmten Blocks innerhalb des Videobilds. Die Festlegung der Werte
dieser beiden Parameter (Alpha und Beta) bestimmt das Ausmaß der auszuführenden
Schärfung.
-
Gemäß einer
Ausführungsform
bleibt Beta konstant, und der Schärfungsbetrag hängt vom
Wert von Alpha ab. Nachdem festgestellt wurde, dass der Transformationszählwert den
vorgegebenen Schwellenwert übersteigt,
wendet eine nicht schärfende
Alpha-Einheit die Standardwerte –1/2 und 0 auf den Alpha- bzw.
den Beta-Parameter an, wodurch verhindert wird, dass der Block innerhalb
des Bilds geschärft
wird. Wenn umgekehrt festgestellt wird, dass dieser vorgegebene
Schwellenwert nicht überschritten
wurde, wendet eine schärfende
Alpha-Einheit einen
Wert von 0 auf den Beta-Parameter an und verringert den Wert des
Alpha-Parameters (von dem Standardwert von –1/2), um eine Schärfung des
Blocks bereitzustellen. Im Allgemeinen nimmt der Schärfungsbetrag
zu, wenn der Wert von Alpha abnimmt (d.h. negativer wird). Gemäß einer
Ausführungsform,
bei der ISDN-Raten-Video verwendet wird, werden die Schärfungsparameter
Alpha und Beta auf –1,5 bzw.
Null gelegt. Gemäß einer
anderen Ausführungsform,
bei der POTS-Raten-Video verwendet wird, werden die Schärfungsparameter
Alpha und Beta auf –1,0
bzw. Null gelegt.
-
Weiterhin
sollten Fachleute verstehen, dass die vorliegende Erfindung nicht
auf einen bestimmten Typ einer Videoschärfungseinrichtung beschränkt ist.
Andere Ausführungsformen
einer Videoschärfungseinrichtung
zum adaptiven Schärfen
umfassen eine parametrische bilineare Faltung oder eine andere Filterung,
die ein Zoomen eines Bilds bereitstellt, und ein parametrisches
Mittel zum Steuern des Glättens
und Schärfens des
Bilds.
-
Eine
Videoanzeige 110 zeigt das Videobild an. Gemäß einer
anderen Ausführungsform
weist das System aus 1 einen Videobildskalierer zum
Vergrößern des
Videobilds auf. Gemäß einer
Ausführungsform vergrößert der
Videobildskalierer das Bild, nachdem die Videoschärfungseinrichtung 110 die
Blöcke
geschärft hat,
deren Transformationszählwert
kleiner ist als ein vorgegebener Schwellenwert, jedoch bevor die
Videoanzeige 110 das Videobild anzeigt.
-
In
den 2 – 3,
auf die als nächstes
Bezug genommen wird, sind Flussdiagramme von Verfahren gemäß Ausführungsformen
der Erfindung dargestellt. Die Verfahren werden wünschenswerterweise
zumindest teilweise als ein oder mehrere auf einem Computer laufende
Programme in der Art eines von einem computerlesbaren Medium in
der Art eines Speichers durch einen Prozessor eines Computers ausgeführten Programms
verwirklicht. Die Programme werden wünschenswerterweise auf einem
computerlesbaren Medium in der Art einer Diskette oder einer CD-ROM
gespeichert, um sie an einen anderen (geeignet ausgerüsteten)
Computer weiterzuleiten und auf diesem zu installieren und auszuführen. Zusätzlich können die
Programme auf einem Server gespeichert werden und über ein
Netzwerk verteilt werden.
-
Wie
in Block 200 von 2 dargestellt
ist, wird das Videobild unter Verwendung auf dem Fachgebiet wohlbekannter
Techniken zu einer Anzahl von Blöcken
dekodiert. Standards zur Videokompression umfassen H.261, H.263,
MPEG (Motion Picture Experts Group)-1, MPEG-2 und JPEG (Joint Photographic
Experts Group). Wie zuvor beschrieben wurde, besteht das Zwischenergebnis
dieser Dekodierung (d.h. Dekomprimierung) aus einer Anzahl von Transformationskoeffizienten
für jeden
Block in dem Videobild. Gemäß einer
Ausführungsform
ist diese Anzahl von Transformationskoeffizienten durch diskrete
Kosinustransformationskoeffizienten (DCT-Koeffizienten) gegeben
(d.h. die Transformation ist die diskrete Kosinustransformation),
wie auf dem Fachgebiet wohlbekannt ist. In Block 202 wird
die Anzahl der Transformationskoeffizienten verarbeitet, um zu bestimmen,
ob das Videobild zu schärfen
ist.
-
Das
Flussdiagramm in 3 zeigt Ausführungsformen der Verarbeitung
der Anzahl der Transformationskoeffizienten aus Block 202.
Insbesondere wird in Block 300 ein Transformationszählwert auf
der Grundlage einer Anzahl nicht verschwindender Transformationskoeffizienten
aus der Anzahl der Transformationskoeffizienten für jeden
Block des Videobilds erzeugt. Gemäß einer Ausführungsform
wird jeder Block des Videobilds in einer bestimmten Reihenfolge
durchlaufen, um den letzten nicht verschwindenden Transformationskoeffizienten
in der Reihenfolge zu lokalisieren. Gemäß einer Ausführungsform
gleicht der Transformationszählwert
der Position des nicht verschwindenden Transformationskoeffizienten.
Gemäß einer
alternativen Ausführungsform
wird eine Zahl zur Position dieses letzten nicht verschwindenden
Transformationskoeffizienten addiert, um den Transformationszählwert zu
bilden. Gemäß einer
Ausführungsform
ist diese zur Position des letzten nicht verschwindenden Transformationskoeffizienten
addierte Zahl eins.
-
Wie
zuvor beschrieben wurde, wird ein Videobild als ein Bitstrom dargestellt,
wenn es komprimiert und über
ein Übertragungssystem
(beispielsweise POTS, ISDN oder das Internet) gesendet wird. Der
Videodekodierer interpretiert den Bitstrom zur Bestimmung der Position
und des Werts der dem komprimierten Videobild zugeordneten Transformations koeffizienten.
Gemäß einer
Ausführungsform
umfasst das Bestimmen der Position der nicht verschwindenden Transformationskoeffizienten
in Block 202 das Interpretieren des Bitstroms. Gemäß einer
anderen Ausführungsform
umfasst das Bestimmen der Position der nicht verschwindenden Transformationskoeffizienten
in Block 202 das Verarbeiten des dekodierten Bitstroms.
-
Gemäß einer
anderen Ausführungsform
ist die Durchlaufreihenfolge eine Zickzack-Reihenfolge. Die Zickzack-Reihenfolge
ist, wie auf dem Fachgebiet wohlbekannt ist, in den vorstehend zitierten
Spezifikationen von H.261, MPEG-1 und MPEG-2 definiert. Es sei bemerkt,
dass die von der vorliegenden Erfindung verwendete Durchlaufreihenfolge
für den
Gesamtbetrieb des Systems nicht entscheidend ist und dass die dadurch erhaltenen
Vorteile auch mit anderen Durchlaufreihenfolgen erhalten werden
könnten.
In Block 302 wird jeder Block des Videobilds mit einem
Transformationszählwert,
der kleiner als ein vorgegebener Schwellenwert ist, geschärft.
-
Gemäß einer
Ausführungsform
wird das Schärfen
in Block 302 durch Ausführen
einer zweiparametrigen kubischen Faltung an jedem Block innerhalb
des Videobilds bereitgestellt, wie auf dem Fachgebiet wohlbekannt
ist. Wie zuvor beschrieben wurde, werden durch diese zweiparametrige
kubische Faltung sowohl das Zoomen als auch das Schärfen eines
bestimmten Blocks innerhalb des Videobilds bereitgestellt. Bei Verwendung
der vorstehend erwähnten
Formel für
die zweiparametrige kubische Faltung bestimmen die Einstellungen
der Werte dieser beiden Parameter (Alpha und Beta) das Ausmaß der auszuführenden
Schärfung.
-
Gemäß einer
Ausführungsform
bleibt Beta konstant, und das Ausmaß der Schärfung hängt vom Wert von Alpha ab.
Nachdem festgestellt wurde, dass die Anzahl der DCT-Koeffizienten
den vorgegebenen Schwellenwert übersteigt,
werden Alpha und Beta auf die Standardwerte –1/2 bzw. 0 gelegt, wodurch
das Schärfen des
Blocks innerhalb des Bilds ausgeschlossen wird. Wenn umgekehrt festgestellt
wird, dass dieser vorgegebene Schwellenwert nicht überstiegen
wird, bleibt Beta bei 0 und wird Alpha verringert (über seinen
Standardwert von –1/2),
um ein Schärfen
des Blocks bereitzustellen. Im Allgemeinen wird das Ausmaß der Schärfung erhöht, wenn
der Wert von Alpha abnimmt (d.h. negativer wird). Gemäß einer
Ausführungsform,
bei der ISDN-Raten-Video verwendet wird, sind die Schärfungsparameter
Alpha und Beta auf –1,5
bzw. Null gelegt. Gemäß einer
anderen Ausführungsform,
bei der POTS-Raten-Video verwendet wird, sind die Schärfungsparameter
Alpha und Beta auf –1,0
bzw. Null, gelegt.
-
Fachleute
werden verstehen, dass die vorliegende Erfindung auf keinen bestimmten
Typ einer adaptiven Schärfung
beschränkt
ist. Andere Ausführungsformen
für das
adaptive Schärfen
in Block 302 umfassen eine parametrische bilineare Faltung
oder eine andere Filterung, die das Zoomen eines Bilds bereitstellt,
und ein parametrisches Mittel zum Steuern des Glättens und Schärfens für das Bild.
-
Gemäß einer
anderen Ausführungsform
umfasst das Verfahren aus 3 auch das
Vergrößern des Videobilds.
Gemäß einer
Ausführungsform
geschieht das Vergrößern des
Bilds anschließend
an die Verarbeitung der Transformationskoeffizienten in Block 202.
Gemäß einer
anderen Ausführungsform
umfasst das in Block 200 dekodierte Videobild ein stehendes
Bild (beispielsweise ein Bild nach Joint Photographic Experts Group
(JPEG)) oder einen Videorahmen innerhalb einer Videosequenz (beispielsweise
MPEG), ISO 10918-1 (CCITT T.81) JPEG, Information Technology – Digital
Compression and Coding of Continuous-Tone Still Images – Requirements
and Guidelines.
-
Gemäß einer
anderen Ausführungsform
wird das Ausmaß der
Schärfung,
abhängig
von der Anwendung und/oder vom Benutzer, dynamisch eingestellt.
Gemäß einer
Ausführungsform
wird dem Benutzer eine Gleiteinheit (beispielsweise ein Gleiter
auf dem Computerbildschirm) bereitgestellt, um das Niveau des an
den Blöcken
des Videobilds ausgeführten
Schärfens
einzustellen (beispielsweise zu erhöhen und zu verringern).
-
Schließlich ist
in 4 ein Diagramm eines als Beispiel dienenden Computers
dargestellt, in Zusammenhang mit dem Ausführungsformen der Erfindung
verwirklicht werden können.
Es sei bemerkt, dass Ausführungsformen
der Erfindung auch auf anderen elektronischen Vorrichtungen, einschließlich einer
mit dem Internet verbundenen Settop-Box, verwirklicht werden können. Der
Computer 410 ist wirkungsmäßig mit einem Bildschirm 412 und
einer Zeigevorrichtung 414 verbunden. Der Computer 410 weist
einen Prozessor (wünschenswerterweise
einen von einer Anzahl von Intel®-Pentium®-Prozessoren),
einen Direktzugriffsspeicher (RAM), einen Nurlesespeicher (ROM)
und eine oder mehrere Speichervorrichtungen in der Art eines Festplattenlaufwerks,
eines Diskettenlaufwerks (in das eine Diskette eingeführt werden
kann), eines optischen Plattenlaufwerks und eines Bandkassettenlaufwerks
auf. Der Speicher, die Festplatten, Disketten usw. sind Typen computerlesbarer
Medien. Die Erfindung ist nicht ausdrücklich auf irgendeinen Typ
eines Computers 410 beschränkt. Gemäß einer Ausführungsform
ist der Computer 410 ein PC-kompatibler Computer, auf dem
eine Version des Betriebssystems Microsoft® Windows® läuft. Auf
dem Computer 410 befindet sich ein computerlesbares Medium,
auf dem ein Computerprogramm gespeichert ist, das vom Computer 410 ausgeführt wird. Das
vom Computerprogramm ausgeführte
kompressionsempfindliche Schärfen
entspricht einer Ausführungsform
der Erfindung.
-
Wenngleich
hier spezifische Ausführungsformen
erläutert
und beschrieben wurden, werden Durchschnittsfachleute verstehen,
dass eine beliebige Anordnung, die berechnet ist, um den gleichen
Zweck zu erfüllen,
die dargestellten spezifischen Ausführungsformen ersetzen kann.
Diese Anmeldung soll beliebige Anpassungen und Variationen der Erfindung
abdecken. Es ist ausdrücklich
vorgesehen, dass diese Erfindung nur durch die folgenden Ansprüche und
gleichwertige Ausgestaltungen eingeschränkt ist.