DE60021072T2

DE60021072T2 - Kompressionsempfindliches schärfen

Info

Publication number: DE60021072T2
Application number: DE60021072T
Authority: DE
Inventors: A. Judith GOLDSTEIN; P. Thomas O'ROURKE; Rajeeb Hazra
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 1999-04-14
Filing date: 2000-04-14
Publication date: 2005-12-29
Anticipated expiration: 2020-04-15
Also published as: EP1181667B1; EP1181667A1; AU4349500A; DE60021072D1; CA2369517A1; US6526179B2; WO2000062252A1; US20020034335A1; JP2002541752A

Description

Gebiet
Die vorliegende Erfindung betrifft die Bildverarbeitung und insbesondere das adaptive Schärfen eines Bilds.
Hintergrund
Anwendungen, bei denen ein komprimiertes Video verwendet und angezeigt wird, müssen das Video häufig zur Übertragung über eine Kommunikationsstrecke in der Art gewöhnlicher Telefonleitungen (d.h. des "Plain Old Telephone Service" (POTS)) oder des "Integrated Services Digital Network" (ISDN) vorbereiten, welche eine begrenzte Bandbreite bereitstellen, über die das Video übertragen werden muss. Diese Beschränkung der Bandbreite legt dem mit Algorithmen nach dem neuesten Stand der Technik komprimierten Video eine qualitative obere Grenze auf. Zusätzlich ist die Größe der Bildrahmen typischerweise begrenzt, wenn die Kommunikation über POTS erfolgt. Im Allgemeinen ist die Datenkompression ein verlustbehafteter Prozess, und eine Folge davon besteht darin, dass sich Kompressionsartefakte zeigen, die infolge der Kompression in dem Bild erzeugte Produkte sind, welche andernfalls nicht vorhanden wären. Weiterhin erfährt das Bild durch die Datenkompression einen allgemeinen Detailverlust. Trotz dieser Beschränkungen wünschen Anwendungsbenutzer typischerweise größere Videobilder (d.h. Bilder, die einen erheblich größeren Prozentsatz der Anzeigeschirmfläche belegen).
Wenn Bilder klein sind, ist das Auge nachsichtig. Wenn Bilder jedoch auf höhere Größen skaliert werden, werden die kleinen Defekte (beispielsweise die Artefakte oder der Detail- und Strukturverlust) infolge der Kompression gut sichtbar, wodurch bewirkt wird, dass das Bild häufig als "ausgewaschen" erscheint, wenn die gleichen Informationen über eine größere Fläche ausgebreitet werden. Um diesen "Auswascheffekt" zu vermeiden, werden schärfende Nachfilter angewendet, um dabei zu helfen, den Bildern etwas mehr Definition und Schärfe zu geben. Kompressionsartefakte wie Ringing müssen jedoch während des Schärfungsprozesses berücksichtigt werden. Andernfalls werden diese Defekte zusammen mit dem Bild vergrößert, was dazu führt, dass das Bild sogar noch schlechter aussieht, als wenn keine Schärfung ausgeführt worden wäre. Daher besteht aus diesen und anderen Gründen ein Bedarf am Identifizieren der unerwünschten Kompressionsartefakte innerhalb eines Bilds und am Vermeiden ihrer Verstärkung während des Schärfungsprozesses durch ein adaptives Schärfen eines Bilds, wodurch das gesamte Bild mit Ausnahme der identifizierten unerwünschten Kompressionsartefakte geschärft wird.
In der europäischen Patentanmeldung EP-A-0 721 286 ist eine Bilddekodiervorrichtung offenbart, welche die Rekonstruktion der quantisierten Koeffizienten und ein adaptives Kantenanhebungsfilter, das auf jene dekodierten Blöcke angewendet wird, deren durch einen statistischen Kantendetektor gemessener Kantenanteil über einem vorgegebenen Schwellenwert liegt, aufweist.
Zusammenfassung
Gemäß einer Ausführungsform umfasst ein Verfahren das Dekodieren eines Videobilds, so dass durch das Dekodieren eine Anzahl von Transformationskoeffizienten erzeugt wird. Zusätzlich wird die Anzahl der Transformationskoeffizienten verarbeitet, um zu bestimmen, ob das Videobild zu schärfen ist.
Kurzbeschreibung der Zeichnung
1 ist ein Blockdiagramm eines Systems gemäß einer Ausführungsform der Erfindung.
Die 2 und 3 sind Flussdiagramme von Verfahren gemäß Ausführungsformen der vorliegenden Erfindung.
4 ist ein Diagramm eines Computers, in Zusammenhang mit dem eine Ausführungsform der Erfindung verwirklicht werden kann.
Detaillierte Beschreibung
Die Erfindung umfasst Systeme, Verfahren, Computer und computerlesbare Medien nach Anspruch 1 bzw. 11 und 22. Abgesehen von den hier beschriebenen Ausführungsformen, Vorteilen und Aspekten der Erfindung umfasst die Erfindung auch andere Ausführungsformen, Vorteile und Aspekte, wie beim Lesen und Studieren der Zeichnung und der folgenden Beschreibung verständlich werden wird.
In der folgenden detaillierten Beschreibung der als Beispiel dienenden Ausführungsformen wird auf die anliegende Zeichnung Bezug genommen, die ein Teil dieses Dokuments ist und worin zur Veranschaulichung spezifische Ausführungsformen dargestellt sind, in denen die Erfindung verwirklicht werden kann. Es ist zu verstehen, dass auch andere Ausführungsformen verwendet werden können und strukturelle Änderungen vorgenommen werden können, ohne vom Schutzumfang der vorliegenden Erfindung abzuweichen.
Einige Teile der detaillierten Beschreibungen, welche folgen, werden in Bezug auf Algorithmen und symbolische Darstellungen von Operationen an Datenbits innerhalb eines Computerspeichers präsentiert. Diese algorithmischen Beschreibungen und Darstellungen sind die Mittel, die von Fachleuten auf dem Gebiet der Datenverarbeitung verwendet werden, um die Substanz ihrer Arbeit anderen Fachleuten am wirksamsten zu vermitteln. Ein Algorithmus wird hier und allgemein als eine selbstkonsistente Folge von Schritten, die zu einem gewünschten Ergebnis führen, angesehen. Die Schritte sind jene, die physikalische Manipulationen physikalischer Größen erfordern. Diese Größen nehmen gewöhnlich, jedoch nicht notwendigerweise, die Form elektrischer oder magnetischer Signale an, die gespeichert, übertragen, kombiniert, verglichen und auf andere Weise manipuliert werden können. Es hat sich gelegentlich als zweckmäßig erwiesen, insbesondere aus Gründen der allgemeinen Verwendung, diese Signale als Bits, Werte, Elemente, Symbole, Zeichen, Terme, Zahlen oder dergleichen zu bezeichnen. Es sollte jedoch im Gedächtnis behalten werden, dass all diese und ähnliche Begriffe den geeigneten physikalischen Größen zuzuordnen sind und lediglich zweckmäßige Bezeichnungen sind, die für diese Größen verwendet werden. Sofern in den folgenden Erörterungen nichts anderes spezifisch erwähnt wird, ist zu verstehen, dass gemäß der vorliegenden Erfindung Erörterungen, in denen die Begriffe "Verarbeiten" oder "Berechnen" oder "Bestimmen" oder "Anzeigen" oder dergleichen verwendet werden, Vorgänge und Prozesse eines Computersystems oder einer ähnlichen elektronischen Rechenvorrichtung betreffen, bei denen als physikalische (elektronische) Größen dargestellte Daten innerhalb der Register und Speicher des Computersystems zu anderen Daten, die ähnlich als physikalische Größen innerhalb der Speicher oder Register des Computersystems oder anderen solchen Informationsspeicher-, Übertragungs- oder Anzeigevorrichtungen dargestellt werden, manipuliert und transformiert werden.
In 1 ist ein Blockdiagramm eines Systems gemäß einer Ausführungsform der Erfindung dargestellt. Das System aus 1 umfasst einen Computer 100, eine Videobild-Dekodiereinrichtung 102, eine Schärfungseinheit 104, eine Transformationskoeffizienteneinheit 106, eine Videoschärfungseinrichtung 108 und eine Videoanzeige 110. Wie dargestellt ist, sind die Videobild-Dekodiereinrichtung 102, die Schärfungseinheit 104, die Transformationskoeffizienteneinheit 106 und die Videoschärfungseinrichtung 108 wünschenswerterweise Teil des Computers 100, wenngleich die Erfindung nicht darauf beschränkt ist. Bei einer solchen Ausführungsform sind die Videobild-Dekodiereinrichtung 102, die Schärfungseinheit 104, die Transformationskoeffizienteneinheit 106 und die Videoschärfungseinrichtung 108 wünschenswerterweise Computerprogramme auf einem Computer, d.h.
Programme (nämlich ein Videobild-Dekodiereinrichtungs-Programm, ein Schärfungseinheits-Programm, ein Transformationskoeffizienteneinheits-Programm und ein Videoschärfungseinrichtungs-Programm), die von einem Prozessor des Computers von einem computerlesbaren Medium in der Art eines Speichers davon ausgeführt werden. Durchschnittsfachleute werden verstehen, dass der Computer 100 auch andere in 1 nicht dargestellte Komponenten aufweisen kann, wobei nur jene Teile bereitgestellt sind, die zur Beschreibung der Erfindung erforderlich sind.
Die Videobild-Dekodiereinrichtung 102 dekodiert eine komprimierte Videosequenz unter Verwendung einer blockbasierten Transformation, die auf dem Fachgebiet wohlbekannt ist. Standards zur Videokompression umfassen H.261, H.263, MPEG (Motion Picture Experts Group)-1, MPEG-2 und JPEG (Joint Photographic Experts Group). ITU-T (Telecommunications Standardization Sector of International Telecommunication Union, früher als CCITT (The International Telegraph and Telephone Consultative Committee) bekannt) H.261, Video Codec for Audiovisual Services at p × 64 kbits; ITU-T H.263, Video Coding for Low Bitrate Communication; ISO/IEC (International Organization for Standardization/Internal Electrotechnical Commission) 11172-2 (MPEG-1 Video), Information Technology – Coding of Moving Pictures and Associated Audio Information for Digital Storage Media at up to about 1.5 Mbit/s: Part 2 Video; ISO/IEC 13818-2 (MPEG-2 Video), Information Technology – Generic Coding of Moving Pictures and Associated Audio Information: Part 2 Video; ISO 10918-1 (CCITT T.81) JPEG, Information Technology – Digital Compression and Coding of Continuous-Tone Still Images – Requirements and Guidelines; ISO/IEC 14496-2: 1999 (MPEG-4 Video) Information Technology – Generic Coding of Audio-Visual Objects – Part 2: Visual.
Ein Zwischenergebnis dieser Dekodierung (d.h. Dekompression) durch die Videobild-Dekodiereinrichtung 102 ist durch eine Anzahl von Transformationskoeffizienten für jeden der Blöcke in dem Videobild gegeben. Gemäß einer Ausführungs form ist diese Anzahl von Transformationskoeffizienten durch diskrete Kosinustransformationskoeffizienten (DCT-Koeffizienten) gegeben (d.h. die Transformation ist die diskrete Kosinustransformation), wie auf dem Fachgebiet wohlbekannt ist. Der Codierprozess verwendet diese Transformation zum Transformieren des zweidimensionalen Pixelblocks (d.h. des Videobilds) aus dem Raumbereich in den Transformationsbereich, wobei ein zweidimensionales Feld von Transformationskoeffizienten erzeugt wird. Der Dekodierer verwendet wiederum diese Transformationskoeffizienten, um das vom Codierer komprimierte Videobild wiederherzustellen. Abgesehen von der Verwendung dieser Koeffizienten zum Dekodieren des Videobilds werden diese Transformationskoeffizienten gemäß nachstehend erörterten Ausführungsformen verwendet, um festzustellen, ob Abschnitte des Bilds zu schärfen sind.
Für jeden der Blöcke innerhalb des dekodierten Videobilds empfängt die Schärfungseinheit 104 die Anzahl der Transformationskoeffizienten und verarbeitet die Anzahl der Transformationskoeffizienten, um festzustellen, ob das Videobild zu schärfen ist. Gemäß einer Ausführungsform enthält die Schärfungseinheit 104 den Transformationskoeffizientenzähler 106, der in der Lage ist, jeden Block des Videobilds zu empfangen und einen Transformationszählwert für jeden Block auf der Grundlage der Anzahl nicht verschwindender Transformationskoeffizienten für jeden Block zu erzeugen. Gemäß einer anderen Ausführungsform weist der Transformationskoeffizientenzähler 106 eine Lokalisierungseinheit auf, die jeden Block des Videobilds in einer bestimmten Reihenfolge durchläuft und den letzten nicht verschwindenden Transformationskoeffizienten in der Reihenfolge lokalisiert. Wenn ein Videobild durch ein Übertragungssystem (beispielsweise POTS, ISDN oder das Internet) komprimiert und gesendet wird, wird das Videobild als ein Bitstrom dargestellt. Der Videodekodierer interpretiert den Bitstrom zur Bestimmung der Position und des Werts der Transformationskoeffizienten, die dem komprimierten Bitstrom zugeordnet sind. Gemäß einer Ausführungsform weist der Transformationskoeffizientenzähler 106 eine Bitstromeinheit zum Interpretieren des Bitstroms auf, um die Position der nicht verschwindenden Transformationskoeffizienten zu bestimmen. Gemäß einer anderen Ausführungsform weist der Transformationskoeffizientenzähler 106 einen Mechanismus zum Bestimmen der Position des nicht verschwindenden Transformationskoeffizienten anhand des dekodierten Bitstroms auf.
Gemäß einer Ausführungsform setzt die Lokalisierungseinheit den Transformationszählwert auf die Position des nicht verschwindenden Transformationskoeffizienten. Gemäß einer alternativen Ausführungsform nimmt die Lokalisierungseinheit die Position dieses letzten nicht verschwindenden Transformationskoeffizienten und addiert eine Zahl zur Bildung des Transformationszählwerts. Gemäß einer Ausführungsform ist diese zur Position des letzten nicht verschwindenden Transformationskoeffizienten addierte Zahl eins.
Gemäß einer anderen Ausführungsform ist die Reihenfolge des Durchlaufens eine Zickzack-Reihenfolge. Diese Zickzack-Reihenfolge ist, wie auf dem Fachgebiet wohlbekannt ist, in den vorstehend zitierten Beschreibungen von H.261, MPEG-1, MPEG-2 und MPEG-4 definiert. Während des Codierprozesses werden verschiedene Reihenfolgen für das Durchlaufen der Blöcke des Videobilds bei der Transformation eines Blocks vom Raumbereich in den Transformationsbereich während der Transformation verwendet. Um hieraus maximale Vorteile zu ziehen, werden die Transformationskoeffizienten in einer Zickzack-Reihenfolge organisiert, um lange Nullfolgen zu erzeugen. Bei dem Dekodierprozess wird die gleiche Durchlaufreihenfolge für das Dekodieren und auch für das Bestimmen der Position nicht verschwindender Transformationskoeffizienten für jeden Block des Videobilds verwendet. Es sei bemerkt, dass die gemäß der vorliegenden Erfindung verwendete Durchlaufreihenfolge für den Gesamtbetrieb des Systems nicht entscheidend ist und dass die damit erhaltenen Vorteile auch mit anderen Durchlaufreihenfolgen erhalten werden könnten.
Zusätzlich besteht die Schärfungseinheit 104 aus einer Videoschärfungseinrichtung 108. Die Videoschärfungseinrichtung 108 empfängt den Transformationszählwert für jeden Block und schärft den Block, dessen Transformationszählwert kleiner als ein vorgegebener Schwellenwert ist. Falls der Transformationszählwert dagegen nicht kleiner als der vorgegebene Schwellenwert ist, wird dieser Block nicht geschärft.
Gemäß einer Ausführungsform für das POTS-Raten-Video (das in etwa 20 Kilobits/Sekunde (kBits/s) oder weniger aufweist) ist dieser vorgegebene Schwellenwert, mit dem der Transformationszählwert verglichen wird, eins. Gemäß einer anderen Ausführungsform für ISDN-Raten-Video (das etwa 90 kBits/s oder weniger aufweist) ist dieser vorgegebene Schwellenwert, mit dem der Transformationszählwert verglichen ist, fünf. Dieser vorgegebene Schwellenwert ändert sich jedoch entsprechend der Umgebung, in der er verwendet wird, und ist nicht auf einen bestimmten Wert beschränkt. Beispielsweise können Videokonferenzen zwischen zwei Einzelpersonen einen anderen Schwellenwert erfordern als eine Videosequenz, die mehr Einzelheiten enthält.
Gemäß einer Ausführungsform weist die Videoschärfungseinrichtung 108 eine Faltungseinheit auf, um eine Faltung unter Verwendung eines stückweisen kubischen Schärfungsfilters an jedem Block innerhalb des Videobilds auszuführen, wie auf dem Fachgebiet wohlbekannt ist. Insbesondere ist das Schärfungsfilter im Wesentlichen ein Filter mit vier Abgriffen von einer Gleichung dritter Ordnung. Bei Ignorieren der Ränder ist die grundlegende kubische Interpolierende:
wobei α (Alpha) die Steigung oder die erste Ableitung ist, wenn x = 1 ist, und β (Beta) der Wert bei x = 1 ist. Für weitere Informationen in Bezug auf diese Faltung sei auf Stephen E. Reichenback und Stephen K. Park "Two-Parameter Cubic Convolution for Image Reconstruction", SPIE, Band 1199 Visual Communications and Image Processing IV, S. 833 – 840, 1989 verwiesen. Vorteilhafterweise ermöglicht diese zweiparametrige kubische Faltung sowohl das Zoomen als auch das Schärfen eines bestimmten Blocks innerhalb des Videobilds. Die Festlegung der Werte dieser beiden Parameter (Alpha und Beta) bestimmt das Ausmaß der auszuführenden Schärfung.
Gemäß einer Ausführungsform bleibt Beta konstant, und der Schärfungsbetrag hängt vom Wert von Alpha ab. Nachdem festgestellt wurde, dass der Transformationszählwert den vorgegebenen Schwellenwert übersteigt, wendet eine nicht schärfende Alpha-Einheit die Standardwerte –1/2 und 0 auf den Alpha- bzw. den Beta-Parameter an, wodurch verhindert wird, dass der Block innerhalb des Bilds geschärft wird. Wenn umgekehrt festgestellt wird, dass dieser vorgegebene Schwellenwert nicht überschritten wurde, wendet eine schärfende Alpha-Einheit einen Wert von 0 auf den Beta-Parameter an und verringert den Wert des Alpha-Parameters (von dem Standardwert von –1/2), um eine Schärfung des Blocks bereitzustellen. Im Allgemeinen nimmt der Schärfungsbetrag zu, wenn der Wert von Alpha abnimmt (d.h. negativer wird). Gemäß einer Ausführungsform, bei der ISDN-Raten-Video verwendet wird, werden die Schärfungsparameter Alpha und Beta auf –1,5 bzw. Null gelegt. Gemäß einer anderen Ausführungsform, bei der POTS-Raten-Video verwendet wird, werden die Schärfungsparameter Alpha und Beta auf –1,0 bzw. Null gelegt.
Weiterhin sollten Fachleute verstehen, dass die vorliegende Erfindung nicht auf einen bestimmten Typ einer Videoschärfungseinrichtung beschränkt ist. Andere Ausführungsformen einer Videoschärfungseinrichtung zum adaptiven Schärfen umfassen eine parametrische bilineare Faltung oder eine andere Filterung, die ein Zoomen eines Bilds bereitstellt, und ein parametrisches Mittel zum Steuern des Glättens und Schärfens des Bilds.
Eine Videoanzeige 110 zeigt das Videobild an. Gemäß einer anderen Ausführungsform weist das System aus 1 einen Videobildskalierer zum Vergrößern des Videobilds auf. Gemäß einer Ausführungsform vergrößert der Videobildskalierer das Bild, nachdem die Videoschärfungseinrichtung 110 die Blöcke geschärft hat, deren Transformationszählwert kleiner ist als ein vorgegebener Schwellenwert, jedoch bevor die Videoanzeige 110 das Videobild anzeigt.
In den 2 – 3, auf die als nächstes Bezug genommen wird, sind Flussdiagramme von Verfahren gemäß Ausführungsformen der Erfindung dargestellt. Die Verfahren werden wünschenswerterweise zumindest teilweise als ein oder mehrere auf einem Computer laufende Programme in der Art eines von einem computerlesbaren Medium in der Art eines Speichers durch einen Prozessor eines Computers ausgeführten Programms verwirklicht. Die Programme werden wünschenswerterweise auf einem computerlesbaren Medium in der Art einer Diskette oder einer CD-ROM gespeichert, um sie an einen anderen (geeignet ausgerüsteten) Computer weiterzuleiten und auf diesem zu installieren und auszuführen. Zusätzlich können die Programme auf einem Server gespeichert werden und über ein Netzwerk verteilt werden.
Wie in Block 200 von 2 dargestellt ist, wird das Videobild unter Verwendung auf dem Fachgebiet wohlbekannter Techniken zu einer Anzahl von Blöcken dekodiert. Standards zur Videokompression umfassen H.261, H.263, MPEG (Motion Picture Experts Group)-1, MPEG-2 und JPEG (Joint Photographic Experts Group). Wie zuvor beschrieben wurde, besteht das Zwischenergebnis dieser Dekodierung (d.h. Dekomprimierung) aus einer Anzahl von Transformationskoeffizienten für jeden Block in dem Videobild. Gemäß einer Ausführungsform ist diese Anzahl von Transformationskoeffizienten durch diskrete Kosinustransformationskoeffizienten (DCT-Koeffizienten) gegeben (d.h. die Transformation ist die diskrete Kosinustransformation), wie auf dem Fachgebiet wohlbekannt ist. In Block 202 wird die Anzahl der Transformationskoeffizienten verarbeitet, um zu bestimmen, ob das Videobild zu schärfen ist.
Das Flussdiagramm in 3 zeigt Ausführungsformen der Verarbeitung der Anzahl der Transformationskoeffizienten aus Block 202. Insbesondere wird in Block 300 ein Transformationszählwert auf der Grundlage einer Anzahl nicht verschwindender Transformationskoeffizienten aus der Anzahl der Transformationskoeffizienten für jeden Block des Videobilds erzeugt. Gemäß einer Ausführungsform wird jeder Block des Videobilds in einer bestimmten Reihenfolge durchlaufen, um den letzten nicht verschwindenden Transformationskoeffizienten in der Reihenfolge zu lokalisieren. Gemäß einer Ausführungsform gleicht der Transformationszählwert der Position des nicht verschwindenden Transformationskoeffizienten. Gemäß einer alternativen Ausführungsform wird eine Zahl zur Position dieses letzten nicht verschwindenden Transformationskoeffizienten addiert, um den Transformationszählwert zu bilden. Gemäß einer Ausführungsform ist diese zur Position des letzten nicht verschwindenden Transformationskoeffizienten addierte Zahl eins.
Wie zuvor beschrieben wurde, wird ein Videobild als ein Bitstrom dargestellt, wenn es komprimiert und über ein Übertragungssystem (beispielsweise POTS, ISDN oder das Internet) gesendet wird. Der Videodekodierer interpretiert den Bitstrom zur Bestimmung der Position und des Werts der dem komprimierten Videobild zugeordneten Transformations koeffizienten. Gemäß einer Ausführungsform umfasst das Bestimmen der Position der nicht verschwindenden Transformationskoeffizienten in Block 202 das Interpretieren des Bitstroms. Gemäß einer anderen Ausführungsform umfasst das Bestimmen der Position der nicht verschwindenden Transformationskoeffizienten in Block 202 das Verarbeiten des dekodierten Bitstroms.
Gemäß einer anderen Ausführungsform ist die Durchlaufreihenfolge eine Zickzack-Reihenfolge. Die Zickzack-Reihenfolge ist, wie auf dem Fachgebiet wohlbekannt ist, in den vorstehend zitierten Spezifikationen von H.261, MPEG-1 und MPEG-2 definiert. Es sei bemerkt, dass die von der vorliegenden Erfindung verwendete Durchlaufreihenfolge für den Gesamtbetrieb des Systems nicht entscheidend ist und dass die dadurch erhaltenen Vorteile auch mit anderen Durchlaufreihenfolgen erhalten werden könnten. In Block 302 wird jeder Block des Videobilds mit einem Transformationszählwert, der kleiner als ein vorgegebener Schwellenwert ist, geschärft.
Gemäß einer Ausführungsform wird das Schärfen in Block 302 durch Ausführen einer zweiparametrigen kubischen Faltung an jedem Block innerhalb des Videobilds bereitgestellt, wie auf dem Fachgebiet wohlbekannt ist. Wie zuvor beschrieben wurde, werden durch diese zweiparametrige kubische Faltung sowohl das Zoomen als auch das Schärfen eines bestimmten Blocks innerhalb des Videobilds bereitgestellt. Bei Verwendung der vorstehend erwähnten Formel für die zweiparametrige kubische Faltung bestimmen die Einstellungen der Werte dieser beiden Parameter (Alpha und Beta) das Ausmaß der auszuführenden Schärfung.
Gemäß einer Ausführungsform bleibt Beta konstant, und das Ausmaß der Schärfung hängt vom Wert von Alpha ab. Nachdem festgestellt wurde, dass die Anzahl der DCT-Koeffizienten den vorgegebenen Schwellenwert übersteigt, werden Alpha und Beta auf die Standardwerte –1/2 bzw. 0 gelegt, wodurch das Schärfen des Blocks innerhalb des Bilds ausgeschlossen wird. Wenn umgekehrt festgestellt wird, dass dieser vorgegebene Schwellenwert nicht überstiegen wird, bleibt Beta bei 0 und wird Alpha verringert (über seinen Standardwert von –1/2), um ein Schärfen des Blocks bereitzustellen. Im Allgemeinen wird das Ausmaß der Schärfung erhöht, wenn der Wert von Alpha abnimmt (d.h. negativer wird). Gemäß einer Ausführungsform, bei der ISDN-Raten-Video verwendet wird, sind die Schärfungsparameter Alpha und Beta auf –1,5 bzw. Null gelegt. Gemäß einer anderen Ausführungsform, bei der POTS-Raten-Video verwendet wird, sind die Schärfungsparameter Alpha und Beta auf –1,0 bzw. Null, gelegt.
Fachleute werden verstehen, dass die vorliegende Erfindung auf keinen bestimmten Typ einer adaptiven Schärfung beschränkt ist. Andere Ausführungsformen für das adaptive Schärfen in Block 302 umfassen eine parametrische bilineare Faltung oder eine andere Filterung, die das Zoomen eines Bilds bereitstellt, und ein parametrisches Mittel zum Steuern des Glättens und Schärfens für das Bild.
Gemäß einer anderen Ausführungsform umfasst das Verfahren aus 3 auch das Vergrößern des Videobilds. Gemäß einer Ausführungsform geschieht das Vergrößern des Bilds anschließend an die Verarbeitung der Transformationskoeffizienten in Block 202. Gemäß einer anderen Ausführungsform umfasst das in Block 200 dekodierte Videobild ein stehendes Bild (beispielsweise ein Bild nach Joint Photographic Experts Group (JPEG)) oder einen Videorahmen innerhalb einer Videosequenz (beispielsweise MPEG), ISO 10918-1 (CCITT T.81) JPEG, Information Technology – Digital Compression and Coding of Continuous-Tone Still Images – Requirements and Guidelines.
Gemäß einer anderen Ausführungsform wird das Ausmaß der Schärfung, abhängig von der Anwendung und/oder vom Benutzer, dynamisch eingestellt. Gemäß einer Ausführungsform wird dem Benutzer eine Gleiteinheit (beispielsweise ein Gleiter auf dem Computerbildschirm) bereitgestellt, um das Niveau des an den Blöcken des Videobilds ausgeführten Schärfens einzustellen (beispielsweise zu erhöhen und zu verringern).
Schließlich ist in 4 ein Diagramm eines als Beispiel dienenden Computers dargestellt, in Zusammenhang mit dem Ausführungsformen der Erfindung verwirklicht werden können. Es sei bemerkt, dass Ausführungsformen der Erfindung auch auf anderen elektronischen Vorrichtungen, einschließlich einer mit dem Internet verbundenen Settop-Box, verwirklicht werden können. Der Computer 410 ist wirkungsmäßig mit einem Bildschirm 412 und einer Zeigevorrichtung 414 verbunden. Der Computer 410 weist einen Prozessor (wünschenswerterweise einen von einer Anzahl von Intel^®-Pentium^®-Prozessoren), einen Direktzugriffsspeicher (RAM), einen Nurlesespeicher (ROM) und eine oder mehrere Speichervorrichtungen in der Art eines Festplattenlaufwerks, eines Diskettenlaufwerks (in das eine Diskette eingeführt werden kann), eines optischen Plattenlaufwerks und eines Bandkassettenlaufwerks auf. Der Speicher, die Festplatten, Disketten usw. sind Typen computerlesbarer Medien. Die Erfindung ist nicht ausdrücklich auf irgendeinen Typ eines Computers 410 beschränkt. Gemäß einer Ausführungsform ist der Computer 410 ein PC-kompatibler Computer, auf dem eine Version des Betriebssystems Microsoft^® Windows^® läuft. Auf dem Computer 410 befindet sich ein computerlesbares Medium, auf dem ein Computerprogramm gespeichert ist, das vom Computer 410 ausgeführt wird. Das vom Computerprogramm ausgeführte kompressionsempfindliche Schärfen entspricht einer Ausführungsform der Erfindung.
Wenngleich hier spezifische Ausführungsformen erläutert und beschrieben wurden, werden Durchschnittsfachleute verstehen, dass eine beliebige Anordnung, die berechnet ist, um den gleichen Zweck zu erfüllen, die dargestellten spezifischen Ausführungsformen ersetzen kann. Diese Anmeldung soll beliebige Anpassungen und Variationen der Erfindung abdecken. Es ist ausdrücklich vorgesehen, dass diese Erfindung nur durch die folgenden Ansprüche und gleichwertige Ausgestaltungen eingeschränkt ist.

Claims

Verfahren zum Betreiben eines Videobildverarbeitungssystems, wobei die vom System durchgeführten Schritte die folgenden Schritte umfassen: Dekodieren (200) eines Videobilds mit einer und einer Anzahl von Blöcken, wobei das Dekodieren des Videobilds eine Anzahl von Transformationskoeffizienten erzeugt; und Verarbeiten (202) der Anzahl von Transformationskoeffizienten jedes Blockes, um zu bestimmen, ob das Videobild in diesem Block geschärft wird; gekennzeichnet dadurch, daß das Verarbeiten der Anzahl von Transformationskoeffizienten den folgenden Schritt umfaßt: Erzeugen (300) eines Transformationszählwerts für jeden Block basierend auf einer Anzahl von nicht-verschwindenden Transformationskoeffizienten aus der Anzahl der Transformationskoeffizienten für jeden Block.
Verfahren nach Anspruch 1, umfassend das Schärfen (302) jedes Blocks mit einem Transformationszählwert kleiner einem vorbestimmten Schwellwert.
Verfahren nach Anspruch 2, wobei das Erzeugen des Transformationszählwerts für jeden Block das Ableiten der Anzahl von nicht-verschwindenden Transformationskoeffizienten aus einem dekodierten Bitstream umfaßt.
Verfahren nach Anspruch 2, wobei das Erzeugen des Transformationszählwerts für jeden Block umfaßt: Durchlaufen jedes Blocks in einer Reihenfolge; Lokalisieren einer Position eines letzten nichtverschwindenden Transformationskoeffizienten in der Reihenfolge; und Addieren von 1 zur Position des letzten nichtverschwindenden Transformationskoeffizienten, um den Transformationszählwert zu bilden.
Verfahren nach Anspruch 4, wobei die Reihenfolge des Durchlaufens von jedem Block eine Zickzack-Reihenfolge umfaßt.
Verfahren nach Anspruch 2, wobei das Schärfen jedes Blocks mit Transformationszählwert kleiner einem vorbestimmten Schwellwert das Durchführen einer zweiparametrigen kubischen Faltung auf jedem Block umfaßt.
Verfahren nach Anspruch 6, wobei das Durchführen der zweiparametrigen kubischen Faltung auf jedem Block umfaßt: Verwenden eines nicht-schärfenden Alpha-Werts auf jedem Block mit Transformationszählwert größer oder gleich dem vorbestimmten Schwellwert; und Verwenden eines schärfenden Alpha-Werts auf jedem Block mit Transformationszählwert kleiner dem vorbestimmten Schwellwert.
Verfahren nach Anspruch 1, wobei die Anzahl der Transformationskoeffizienten diskrete Kosinustransformationskoeffizienten sind.
Verfahren nach Anspruch 1, ferner umfassend das Vergrößern der Größe des Videobildes.
Verfahren nach Anspruch 1, wobei das Videobild ein unbewegtes Bild oder ein Video-Frame innerhalb einer Videosequenz ist.
Videobildverarbeitungssystem, umfassend: einen Computer (100) zum adaptiven Schärfen eines Videobilds mit einer Größe, umfassend: eine Videobild-Dekodiereinrichtung (102), die zum Empfangen des Videobilds und zum Dekodieren des Videobilds in einer Anzahl von Blöcken ausgelegt ist, wobei die Videobild-Dekodiereinrichtung eine Anzahl von Transformationskoeffizienten erzeugt; und eine Schärfungseinheit (104), die zum Empfangen der Anzahl von Transformationskoeffizienten und zum Verarbeiten der Anzahl von Transformationskoeffizienten jedes Blocks ausgelegt ist, um zu bestimmen, ob das Videobild in diesem Block geschärft wird; gekennzeichnet dadurch, daß die Schärfungseinheit umfaßt: einen Transformationskoeffizientenzähler (106), der zum Empfangen jedes Blocks des Videobilds und zum Erzeugen eines Transformationszählwerts für jeden Block basierend auf einer Anzahl von nicht-verschwindenden Transformationskoeffizienten aus der Anzahl der Transformationskoeffizienten für diesen Block ausgelegt ist; und eine Videoschärfungseinrichtung (108), die zum Empfangen des Transformationszählwerts für jeden Block und zum Schärfen der Blocks mit Transformationszählwert kleiner einem vorbestimmten Schwellwert ausgelegt ist, um ein geschärftes Videobild zu erzeugen.
System nach Anspruch 11, umfassend ein Videodisplay (110) um das geschärfte Bild darzustellen.
System nach Anspruch 12, wobei der Transformationskoeffizientenzähler eine Bitstream-Einheit (106) umfaßt, die zum Ableiten der Anzahl von nicht-verschwindenden Transformationskoeffizienten aus einem dekodierten Bitstream ausgelegt ist.
System nach Anspruch 12, wobei der Transformationskoeffizientenzähler eine Lokalisierungseinheit (106) umfaßt, die zum Empfangen jedes Blocks des Videobilds, zum Durchlaufen jedes Blocks in einer Reihenfolge, zum Lokalisieren einer Position eines letzten nicht-verschwindenden Transformationskoeffizienten in der Reihenfolge für jeden Block und zum Addieren von 1 zur Position des letzten nicht-verschwindenden Transformationskoeffizienten für jeden Block ausgelegt ist, um den Transformationszählwert für jeden Block auszugeben.
System nach Anspruch 14, wobei die Reihenfolge zum Durchlaufen jedes Blocks eine Zickzack-Reihenfolge umfaßt.
System nach Anspruch 12, wobei die Videoschärfungseinrichtung eine Faltungseinheit umfaßt, die zum Empfangen jedes Blocks des Videobilds und zum Durchführen einer zweiparametrigen kubischen Faltung auf jedem Block des Videobilds ausgelegt ist.
System nach Anspruch 16, wobei die Faltungseinheit umfaßt: eine nicht-schärfende Alpha-Einheit, die zum Empfangen jedes Blocks mit Transformationszählwert größer oder gleich dem vorbestimmten Schwellwert und zum Verwenden eines nichtschärfenden Alpha-Werts auf jedem Block mit Transformationszählwert größer oder gleich dem vorbestimmten Schwellwert ausgelegt ist; und eine schärfende Alpha-Einheit, die zum Empfangen jedes Blocks mit Transformationszählwert kleiner dem vorbestimmten Schwellwert und zum Verwenden eines schärfenden Alpha-Werts auf jedem Block mit Transformationszählwert kleiner dem vorbestimmten Schwellwert ausgelegt ist.
System nach Anspruch 11, wobei die Anzahl der Transformationskoeffizienten diskrete Kosinustransformationskoeffizienten sind.
System nach Anspruch 11, ferner umfassend eine Videobildskalierungseinrichtung, die zum Empfangen des geschärften Videobilds und zum Vergrößern der Größe des geschärften Videobilds ausgelegt ist.
System nach Anspruch 11, ferner umfassend eine Gleiteinheit, die zum Justieren einer Schärfungsstufe ausgelegt ist.
System nach Anspruch 11, wobei das Videobild ein unbewegtes Bild oder ein Videoframe innerhalb einer Videosequenz ist.
Gegenstand, umfassend ein computerlesbares Medium mit einem darauf gespeicherten Computerprogramm zur Ausführung auf einem Computer mit Anweisungen zum Ausführen eines Verfahrens nach einem der Ansprüche 1 bis 10.