DE60309039T2 - Verfahren und vorrichtung zur optimierung der bildschärfe während der kodierung - Google Patents

Verfahren und vorrichtung zur optimierung der bildschärfe während der kodierung Download PDF

Info

Publication number
DE60309039T2
DE60309039T2 DE60309039T DE60309039T DE60309039T2 DE 60309039 T2 DE60309039 T2 DE 60309039T2 DE 60309039 T DE60309039 T DE 60309039T DE 60309039 T DE60309039 T DE 60309039T DE 60309039 T2 DE60309039 T2 DE 60309039T2
Authority
DE
Germany
Prior art keywords
blocks
video data
input video
data
dct coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60309039T
Other languages
English (en)
Other versions
DE60309039D1 (de
Inventor
Jorge Briarcliff Manor CAVIEDES
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE60309039D1 publication Critical patent/DE60309039D1/de
Publication of DE60309039T2 publication Critical patent/DE60309039T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Transforming Light Signals Into Electric Signals (AREA)
  • Facsimile Heads (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Facsimiles In General (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein Verfahren und ein System zur Verbesserung der Bildschärfe und insbesondere auf ein Verfahren und ein System zur Optimierung der Schärfequalität von Bildern bei Codierungs- und Bildverbesserungsprozessen.
  • Es ist das höchste Ziel von Videosachverständigen den Zuschauern wahrnehmend meist attraktive Videobilder zu präsentieren. Schärfe ist mit deutlichen Einzelheiten in einem Videobild verbunden und ist weitgehend abhängig von der Randauflösung eines Bildes. Die relative Schärfe eines Bildes kann gemessen werden, in der räumlichen Domäne, durch die Definition von Rändern im vergleich zu einem Bezugsbild, oder in der transformierten Domäne, durch die Differenz in HF-Energie assoziiert mit Rändern und feinen Einzelheiten, auch gegenüber dem Bezugsbild. Wie ein Fachmann verstehen wird, verursacht die Quantisierung der DCT Koeffizienten von 8 × 8 Blöcken Verlust an Inhalt, was die Schärfe beeinträchtigt während Sperrartefakte während eines MPEG/JPEG Codierungsprozesses eingeführt werden. Obschon die Sperrartefakte reduziert werden können, ohne dass die Randinformation verloren geht, ist der Verlust an Schärfe, herrührend von DCT Quantisierung durch Nachbearbeitung nicht wiederherstellbar.
  • Dementsprechend schlägt die vorliegende Erfindung ein Verfahren zum berechnen des Verlusts an Schärfe, verursacht durch die Quantisierung vor, wobei dieses Verlustkriterium angewandt wird um den Quantisierungsparameter selektiv einzustellen um die Schärfe des Bildes während des Videocodierungsprozesses beizubehalten.
  • Die vorliegende Erfindung richtet sich auf eine Anordnung und ein Verfahren zur Steuerung der Qualität der Videoschärfe durch Hinzufügung eines Schärfekriteriums zu dem Quantisierungsparameterselektionsprozess, so dass das resultierende Bild eine Verstärkung in Schärfe für dasselbe Bitratenbudget haben wird
  • Noch ein anderer Aspekt der vorliegenden Erfindung kann in einer einfachen, zuverlässigen und preisgünstigen Implementierung verwirklicht werden.
  • Die oben stehenden und andere Merkmale und Vorteile der vorliegenden Erfindung dürften aus den nachfolgenden detaillierten Beschreibung bevorzugter Ausführungsformen, wie in der beiliegenden Zeichnung dargestellt, hervorgehen, wobei in den jeweiligen Figuren entsprechende Elemente durch die gleichen Bezugszeichen angegeben werden. Die Zeichnung ist nicht notwendigerweise maßstäblich; stattdessen ist die Darstellung der Grundlagen der vorliegenden Erfindung Hauptziel.
  • Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 ein vereinfachtes Blockschaltbild einer Anordnung gebaut nach einer ersten Ausführungsform der vorliegenden Erfindung,
  • 2 ein vereinfachtes Blockschaltbild einer Anordnung, gebaut entsprechend einer zweiten Ausführungsform der vorliegenden Erfindung,
  • 3 ein Flussdiagramm der Arbeitsschritte zur Steuerung der Schärfe der Videoqualität nach der vorliegenden Erfindung, und
  • 4 ein vereinfachtes Blockschaltbild einer Anordnung, gebaut nach einer dritten Ausführungsform der vorliegenden Erfindung.
  • In der nachfolgenden Beschreibung werden zur Erläuterung statt zur Begrenzung spezifische Einzelheiten wie die bestimmte Architektur, Schnittstellen, Techniken usw. beschrieben, damit ein besseres Verständnis der vorliegenden Erfindung erhalten wird. Der Einfachheit und der Deutlichkeit halber wird auf eine detaillierte Beschreibung durchaus bekannter Anordnungen, Schaltungsanordnungen und Verfahren verzichtet, damit die Beschreibung der vorliegenden Erfindung nicht durch unnötige Einzelheiten verdunkelt wird.
  • Um ein Verständnis der vorliegenden Erfindung zu ermöglichen wird Hintergrundinformation in Bezug auf MPEG ("Moving Picturess Expert Group" und H.263 Codierung näher erläutert. Im Allgemeinen werden die MPEG-2 und die H.263 Codierung an einem Bild durchgeführt durch Aufteilung des Bildes in Makroblöcke von 16 × 16 Pixeln, mit je einem einzelnen damit assoziierten Quantisiererskalierungswert. Die Makroblöcke werden weiterhin in einzelne Blöcke von 8 × 8 Pixeln aufgeteilt. Jeder 8 × 8 Pixelblock wird einer diskreten Kosinustransformation (DCT) ausgesetzt um für jedes der 64 Frequenzbänder darin DCT Koeffizienten zu erzeugen. Die DCT Koeffizienten in einem 8 × 8 Pixelblock werden danach durch einen entsprechenden Codierungsparameter, d.h. eine Quantisierungsgewichtung, aufgeteilt. Die Quantisierungsgewichtungen für einen bestimmten 8 × 8 Pixelblock werden in Termen einer 8 × 8 Quantisierungsmatrix ausgedrückt. Danach werden zusätzliche Berechnungen an den DCT Koeffizienten durchgeführt um u. a. nämlich den Quantisierungsskalierungswert, und dadurch die komplette MPEG-2- und H.263-Codierung zu berücksichtigen. Es sei bemerkt, dass andere Codierungstechniken, wie JPEG oder dergleichen bei der vorliegenden Erfindung angewandt werden können. Es gibt drei Arten von Frames mit Videoinformation, die durch den MPEG-Standard definiert werden, Intraframes (I frame), vorwärts vorhergesagte Frames (P frame) und bidirektionell vorhergesagte Frames (B frame). Das I Frame oder ein aktuellen Videobezugsframe, wird periodisch codiert, d.h. ein Bezugsframe für jedes der fünfzehn Frames. Es wird eine Vorhersage gemacht über die Zusammensetzung eines Videoframes, des P Frames, das eine bestimmte Anzahl Frames nach vorne und vor das Bezugsframe gebracht werden soll. Das B Frame wird zwischen dem I Frame und dem P Frame vorhergesagt oder durch Interpolation (Mittelwertbestimmung) eines Makroblocks in das vergangene Bezugsframe mit einem Makroblock in dem künftigen Frame. Der Bewegungsvektor wird ebenfalls codiert, was die relative Lage eines Makroblocks in einem Bezugsframe gegenüber dem Makroblock in dem aktuellen Frame.
  • Wie es einem Fachmann einleuchten wird, ist eine grundsätzliche Aufgabe in vielen statistischen Analysen, die Lage und die Veränderlichkeit eines Datensatzes zu kennzeichnen. Die Kennzeichnung der Daten kann mit Schräge und Wölbung (Kurtosis) dargestellt werden. Schräge ist ein Maß der Symmetrie, und ein Datensatz, oder eine Verteilung, ist als symmetrisch betrachtet, wenn links und recht von der Mitte gleich aussieht. Wölbung ist ein Maß ob die Daten spitz oder flach gegenüber einer normalen Verteilung sind. Datensätze mit einer großen Wölbung neigen dazu, dass sie eine bestimmte Spitze in der Nähe des Mittelwertes haben, danach schnell abfallen und einen starken Schwanz haben. Datensätze mit einer geringen Wölbung neigen dazu, dass sie eine flache Spitze statt eine schärfe Spitze in der Nähe des Mittelwertes haben. Normalerweise ist Wölbung angewandt worden zum Berechnen von Schärfe, beispielsweise bei der Bilderzeugung in abtastenden Elektronenmikroskopen. Wölbung der räumlichen Frequenzverteilung des FFT oder des DCT ist nicht auf codierte Bilder und Video angewandt worden. Auf entsprechende Weise liegt ein Basisprinzip der vorliegenden Erfindung in der Verwirklichung, dass Wölbung und Schräge stark korreliert sind mit dem Verlust an Schärfe, verursacht durch Codierung.
  • Nun wird eine detaillierte Beschreibung in Bezug auf die vorliegende Erfindung anhand der Zeichnung gegeben. Es dürfte aus der nachfolgenden Beschreibung einleuchten, dass auf eine detaillierte Beschreibung der Funktions- und Codierungstechniken eines herkömmlichen Codierers, die dem Fachmann durchaus bekannt sind, der Deutlichkeit und der Kürze wegen in dem vorliegenden Fall verzichtet worden ist.
  • 1 ist ein vereinfachtes Blockschaltbild des Schärfecontrollers 10 nach einer ersten Ausführungsform der vorliegenden Erfindung. Insbesondere ist die Ausführungsform nach 1 bei der JPEG-Codierung von Standbildern anwendbar. Wie in 1 dargestellt, umfasst der Schärfecontroller ein DCT Modul 12, ein Quantisierungsmodul 14, ein Schärfesteuerungsmodul 16 und einen Entropiecodierer 18 zur Optimierung von Bildschärfe beim Codieren. Es sei bemerkt, dass der Schärfecontroller 10 einen Mikroprozessor, eine zentrale Verarbeitungseinheit, einen Computer, eine Schaltungskarte oder eine applikationsspezifische integrierte Schaltung (ASIC) und auch einen digitalen Prozessor umfassen kann.
  • Im Betrieb werden die digitalen Bilddaten, nachdem sie von Analog-Videodaten umgewandelt wurden, dem Schärfecontroller 10 zugeführt. Die digitalen Eingangsdaten werden in eine Gruppe von 8 × 8 Pixelblöcken umgewandelt, danach setzt das DCT Modul 12 jeden 8 × 8 Block einer DCT Verarbeitung aus, damit für jedes der 64 Frequenzbänder darin DCT Koeffizienten erzeugt werden. Wie einem Fachmann einleuchten dürfte, wird die DCT Codierung zum Codieren von Koeffizienten als eine Amplitude einer spezifischen Kosinusbasisfunktion durchgeführt. Im normalen Betrieb verteilt der Quantisierer 14 unter Ansteuerung des Schärfesteuermoduls 16 die DCT Koeffizienten in einen 8 × 8 Pixelblock durch einen spezifischen Quantisierungsparameter, selektiert durch das Schärfesteuermodul 16. Wie einem Fachmann einleuchten dürfte, betrifft der Quantisierungsprozess eine bewusste Ablegung einiger Frequenzdaten, die als redundant oder von geringer Bedeutung für eine angemessene Empfindung des Bildes.
  • Das Schärfesteuermodul 16 ist verantwortlich für die Selektion des DCT Quantisierungsparameters, d.h. der Quantisierungsschrittgröße, während der Quantisierung. Die Quantisierungstabelle 20 umfasst einen Bereich von Quantisierungsschrittgrößen, so dass das Schärfesteuermodul 16 die Quantisierung für einen bestimmten Makroblock durchführen kann, und zwar unter Verwendung verschiedener Quantisierungsschrittgrößen. Nach der Erhaltung der quantisierten DCT Koeffizienten unter Verwendung verschiedener Quantisierungsschrittgrößen, wird die 2-D Wölbung für die betreffenden quantisierten DCT Koeffizienten durchgeführt. Es sei bemerkt, dass die 2-D Wölbung ein Schärfeindikator für das ganze m × n Bild oder für einen Teil davon ist. Danach wird die Quantisierungsschritt größe selektiert, die den höchsten Wölbungswert unter den Blöcken mit digitalen Eingangsbilddaten ergibt, und zwar durch das Schärfesteuermodul 16 zum Quantisieren eines Ausgangssignals von dem DCT Modul 12 im normalen Betrieb. Danach werden die von dem Quantisierer 14 ausgelieferten quantisierten Daten unter Verwendung der Quantisierungsschrittgröße, die von dem Schärfesteuermodul 16 selektiert worden ist, dem Entropiecodierer 18 zugeführt. Wie es dem Fachmann einleuchten dürfte, werden die quantisierten DCT Koeffizientenwerte je unter Anwendung eines Codes mit variabler Länge, wie eines Huffman-Codes, codiert, damit die Datenrate minimiert wird. Codeworte und entsprechende Codelängen sind in die Form von Codelängennachschlagtabellen in der Huffman-Tabelle 22 eingeschlossen. Zum Schluss komprimiert der Entropiecodierer 18 die eingangs quantisierten DCT Koeffizientenwerte und liefert die kompensierten Daten aus, wodurch die Codierung komplettiert wird.
  • 2 ist ein funktionelles Blockschaltbild des Schärfecontrollers 30 nach einer zweiten Ausführungsform der vorliegenden Erfindung. Insbesondere ist die in 2 dargestellte Ausführungsform anwendbar bei blockbasierter Videokompression, wie MPEG und H.26x ITU Familie, die Bewegungssequenzen enthält. Der MPEG Standard ist definiert in "International Standard ISO/IEC 11172-1 : "Information Technology – Coding of moving pictures and associated audio-for-digital storage media at up to approximately 1,5 Mbit/s", Teile 1, 2 und 3, Erste Auflage 1993-08-01, die in dem vorliegenden Fall als hierin aufgenommen betrachtet wird. Weiterhin sei bemerkt, dass der Schärfecontroller 30 beispielsweise einen Mikroprozessor, eine zentrale Verarbeitungseinheit, einen Computer, eine Schaltungskarte oder eine applikationsspezifische integrierte Schaltung (ASIC) darstellen kann und auch einen digitalen Signalprozessor umfassen kann.
  • Wie in 2 dargestellt, geht ein eintreffender Videostrom mit Bilddaten durch den Videoproprozessor 32 und wird in eine Gruppe von 8 × 8 Pixelblöcken umgewandelt. Das Ausgangssignal des Videopreprozessors 32 wird der Bewegungsschätzung 34 zugeführt, welche die vorbei gegangenen Bilder mit den aktuellen Bilddaten vergleicht um Bewegungsvektoren für eine einstweilige Kompression der Bilddaten in dem Videostrom zu erzeugen.
  • Es dürfte dem Fachmann einleuchten, dass die vergangenen Bilder in dem Framespeicher 46 gespeichert werden und dadurch erhalten werden, dass die quantisierten Daten dem IDCT und Quantisierungsmodul 44 zugeführt werden um den invertierten DCT- Vorgang und eine Dequantisierung zu erfahren um die Pixelwerte zu dekomprimieren. Das Ausgangssignal der Bewegungsschätzung 34 wird dem DCT und Quantisierungsmodul 36 zugeführt, das jeden 8 × 8 Block in DCT Verarbeitung verwandelt um DCT Koeffizienten für jedes der 64 Frequenzbänder darin zu erzeugen. Gleichzeitig verteilt der Quantisierer 14 die DCT Koeffizienten in einen 8 × 8 Pixelblock durch eine spezifische Quantisierungsschrittgröße, selektiert durch das Schärfesteuermodul 42. Es sei bemerkt, dass der Quantisierungsfehler (die Differenz zwischen quantisierten und nicht quantisierten DCT Koeffizienten) von der Quantisierungsmatrix sowie von dem Quantisierermaßstab (durch MQANT bezeichnet) abhängig ist. Da die Quantisierungsmatrix ziemlich konstant ist, werden die Entscheidungen in Bezug auf Quantisierungsparameter auf Basis von vier 8 × 8 Blöcken getroffen, wobei die Komplexität des Makroblocks auf Basis des Zustandes des Puffers 40 in Applikationen mit einer konstanten Bitrate berücksichtigt wird. Es sei bemerkt, dass eine begrenzte Anzahl von vier 8 × 8 Pixel Blöcken gleichzeitig verarbeitet werden, und zwar entsprechend dem in dem MPEG Standard beschriebenen Standard. Es dürfte aber einleuchten, dass die Anzahl Makroblöcke in der Spezifikation den Rahmen der vorliegenden Erfindung nicht begrenzen soll.
  • Die Selektion der Quantisierungsschrittgröße wird wie folgt durchgeführt. Zunächst führt das Schärfesteuermodul 42 die Quantisierung für alle gegebenen vier Makroblöcke durch, und zwar unter Anwendung eines unterschiedlichen Schrittgrößenbereichs, danach wird die Wölbung für die betreffenden quantisierten DCT Koeffizienten durchgeführt. Dann wird die Quantisierungsschrittgröße, die den höchsten Wölbungswert unter vier Makroblöcken ergibt, von dem Schärfesteuermodul 42 selektiert um ein Ausgangssignal von der Bewegungsschätzung 34 zu quantisieren.
  • Nach dem Erhalten der Quantisierungsschrittgröße wird das Ausgangssignal der Bewegungsschätzung 34 unter Anwendung der Quantisierungsschrittgröße, selektiert von dem Schärfesteuermodul 42 quantisiert. Die von dem DCT und Quantisierungsmodul 36 ausgelieferten quantisierten DCT Koeffizienten werden dem Lauflängencodierer 38 zugeführt. Zum Schluss empfängt der Lauflängencodierer 38 das Ausgangssignal des DCT und Quantisierers 36 zum Erzeugen der komprimierten Datenpakete für ein Bild, die danach in dem Puffer 40 zur Auslieferung als codierten Videostrom gespeichert werden. Der Bewegungsvektor wird auch codiert, was die relative Lage eines Makroblocks innerhalb eine Bezugsframes gegenüber dem Makroblock innerhalb des aktuellen Frames spezifiziert.
  • 3 ist ein Flussdiagramm, das die Arbeitsschritte der Selektion der DCT Quantisierungsparameter während des Quantisierungsprozesses nach der ersten und der zweiten Ausführungsform der vorliegenden Erfindung darstellt. Es sei bemerkt, dass die Flussdiagramme die funktionelle Information darstellen, die ein Fachmann braucht zum Herstellen von Schaltungsanordnungen oder zum Erzeugen von Computersoftware zum Durchführen des Verarbeitung, erforderlich für die bestreffende Anordnung.
  • Ein eintreffender 8 × 8 Videodatenblock wird in dem Schritt 100 einem DCT Vorgang ausgesetzt zum Erhalten von DCT Koeffizienten für jedes der 64 Frequenzbänder darin. Die DCT Koeffizienten werden danach unter Anwendung verschiedener Schrittgrößen in dem Schritt 120 quantisiert um Frequenzdaten abzulegen, die redundant sind oder von geringer Bedeutung für eine entsprechende Empfindung des Bildes. Danach wird die 2-D Wölbungsberechnung an jedem Makroblock für alle quantisierten DCT Koeffizienten in dem Schritt 140 durchgeführt. In dem Schritt 160 wird der Makroblock mit dem höchsten Wölbungswert ermittelt. Danach wird in dem Schritt 180 unter Anwendung der Schrittgröße, die den höchsten Wölbungswert ergab, die Quantisierung des Gesamtbildes durchgeführt.
  • 4 zeigt ein Video/Bildverarbeitungssystem 50 nach einer dritten Ausführungsform der vorliegenden Erfindung. Das System 50 kann beispielsweise einen Fernseher, eine Settopbox, einen Desktop-, einen Laptop- oder Palmtopcomputer, einen PDA, eine Video/Bildspeicheranordnung, wie einen Videokassettenrecorder, einen digitalen Videorecorder, eine TiVO-Anordnung, usw., sowie Teile oder Kombinationen aus diesen oder anderen Anordnungen. Wie in 3 dargestellt, umfasst das System 50 eine oder mehrere Video/Bildquellen 52, eine oder mehrere Eingangs/Ausgangsanordnungen 54, einen Prozessor 56 und einen Speicher 58. Die Video/Bildquelle(n) 52 kann (können) u. a. einen Fernsehempfänger, einen VCR oder eine andere Video/Bildspeicheranordnung darstellen. Die Eingangs/Ausgangsanordnungen 54, der Prozessor 56, und der Speicher 58 können über ein Kommunikationsmedium 60 kommunizieren, das u. a. einen Bus, ein Kommunikationsnetzwerk eine oder mehrere interne Verbindungen eines Schaltungsanordnung, eine Schaltungskarte oder eine andere Anordnung darstellen kann, sowie Teile und Kombinationen dieser und anderer Kommunikationsmedien. Der Programmspeicher 58 kann u. a. diskbasierte optische oder magnetische Speichereinheiten, elektronische Speicher, sowie Teile oder Kombination dieser und anderer Speicheranordnungen darstellen.
  • Mehrere funktionelle Vorgänge, assoziiert mit dem Schärfecontroller 10 und 30, wie oben erläutert, können als Ganzes oder teilweise in einer oder mehreren Software Programm/Signalverarbeitungsroutinen, gespeichert in dem, Speicher 58 und durchgeführt von dem Prozessor 56, implementiert werden. In anderen Ausführungsformen aber kann eine Hardwareschaltung statt oder in Kombination mit Softwareinstruktionen zum Implementieren der vorliegenden Erfindung verwendet werden.
  • Während die bevorzugten Ausführungsformen der vorliegenden Erfindung dargestellt und beschrieben worden sind, dürfte es dem Fachmann einleuchten, dass im Rahmen der vorliegenden Erfindung mehrere Änderungen und Modifikationen durchgeführt und Elemente durch Äquivalenten davon ersetzt werden können. Außerdem können in dem zentralen Rahmen der vorliegenden Erfindung viele Modifikationen als Anpassung an eine bestimmte Situation und an die Lehre der vorliegenden Erfindung durchgeführt werden. Deswegen wird beabsichtigt, dass die vorliegende Erfindung nicht auf die als die beste Art und Weise zum Durchführen der vorliegenden Erfindung beschriebene bestimmte Ausführungsform beschränkt wird, sondern dass die vorliegende Erfindung alle Ausführungsformen im Rahmen der beiliegenden Patentansprüche umfasst.
  • Text in der Zeichnung
    • 1
    • Daten

Claims (19)

  1. Verfahren zum Steuern der Schärfequalität der Videodaten, wobei das verfahren die nachfolgenden Verfahrensschritte umfasst: (a) das Umwandeln von Eingangs-Videodaten in Blöcke, (b) das Durchführen einer diskreten Kosinustransformation (DCT) an den Blöcken der genannten Eingangs-Videodaten zum Erzeugen von Blöcken mit DCT-Koeffizienten; (c) das Selektieren eines Quantisierungsparameters, der den höchsten Kurtosiswert eines der Blöcke der genannten DCT-Koeffizienten liefert; und (d) das Quantisieren der Blöcke der genannten DCT-Koeffizienten unter Verwendung des genannten Quantisierungsparameters zum Erzeugen quantisierter Daten.
  2. Verfahren nach Anspruch 1, das weiterhin die nachfolgenden Verfahrensschritte umfasst: das Codieren der genannten quantisierten Daten in ein vorbestimmtes übereinstimmendes Standardpaket, und das Übertragen des genannten übereinstimmenden Standardpakets.
  3. Verfahren nach Anspruch 2, wobei der Verfahrensschritt der Codierung unter Anwendung eines Huffman-Codes durchgeführt wird.
  4. Verfahren nach Anspruch 1, wobei der Schritt von (c), das Selektieren des genannten Quantisierungsparameters die nachfolgenden Schritte umfasst: – das Quantisieren der Blöcke der genannten DCT-Koeffizienten unter Verwendung eines vorbestimmten Bereichs von Schrittgrößen und das Bestimmen des Kurtosiswertes davon; und – das Bestimmen eines der Blöcke der genannten DCT-Koeffizienten und der entsprechenden Schrittgröße, was den höchsten Kurtosiswert ergibt.
  5. Verfahren nach Anspruch 1, wobei die genannten Eingangs-Videodaten ein JPEG- oder ein MPEG-Signal ist.
  6. Anordnung zur Steuerung der Schärfequalität der Eingangs-Videodaten, wobei diese Anordnung die nachfolgenden Elemente umfasst: – Mittel zum Umwandeln der genannten Eingangs-Videodaten in Blöcke; – Mittel zum Transformieren der Blöcke des genannten Eingangs-Videos in Blöcke mit DCT-Koeffizienten; – einen Quantisierer, der unter Verwendung eines Quantisierungsparameters adapativ ein Ausgangssignal der genannten Transformationsmittel quantisiert, und zwar zum Erzeugen quantisierter Daten; und – einen Schärfecontroller, der mit dem genannten Quantisierer gekoppelt ist zum selektieren des genannten Quantisierungsparameters auf Basis der Quantisierung der Blöcke mit den genannten DCT-Koeffizienten unter Verwendung eines vorbestimmten Bereichs von Schrittgrößen und zum Berechnen des Kurtosiswertes davon, und zum Selektieren eines der genannten Schrittgrößen, die den höchsten Kurtosiswert unter einem der Blöcke als der genannte Quantisierungsparameter ergibt.
  7. Anordnung nach Anspruch 6, die weiterhin einen Codierer aufweist zum Codieren der genannten quantisierten Daten in ein vorbestimmtes übereinstimmendes Standardpaket.
  8. Anordnung nach Anspruch 6, wobei der genannte Kurtosiswert eine Schärfequalität der Blöcke der genannten Eingangs-Videodaten angibt.
  9. Anordnung nach Anspruch 6, wobei die genannten Eingangs-Videodaten ein JPEG- oder ein MPEG-Signal ist.
  10. Verfahren zur Steuerung der Schärfequalität von Videodaten, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: (a) das Umwandeln von Eingangs-Videodaten in Blöcke; (b) das Durchführen einer Bewegungsschätzungsanalyse an den Blöcken der genannten Eingangs-Videodaten zum Erzeugen eines Bezugssignals; (c) das Durchführen einer diskreten Kosinustransformation (DCT) an den Blöcken der ge nannten Eingangs-Videodaten zum Erzeugen von Blöcken mit DCT-Koeffizienten; (d) das Selektieren eines Quantisierungsparameters, der den höchsten Kurtosiswert unter den Blöcken der genannten DCT-Koeffizienten liefert; und (e) das Quantisieren der Blöcke der genannten DCT-Koeffizienten unter Verwendung des genannten selektierten Quantisierungsparameters zum Erzeugen quantisierter Daten; (f) das Codieren der genannten quantisierten Daten und des genannten Bezugssignals in ein vorbestimmtes übereinstimmendes Standardpaket, und das Übertragen des genannten übereinstimmenden Standardpakets.
  11. Verfahren nach Anspruch 10, das weiterhin den Verfahrensschritt der Speicherung des genannten übereinstimmenden Standardpakets zur nachfolgenden Übertragung umfasst.
  12. Verfahren nach Anspruch 10, das weiterhin die Schritte der invertierten Quantisierung und der Transformation der genannten quantisierten Daten in dekomprimierte Daten, und die Speicherung der genannten dekomprimierten Daten zur nachfolgenden Erzeugung des genannten Bezugssignals umfasst.
  13. Verfahren nach Anspruch 10, wobei der Schritt (d) der Selektion des genannten Quantisierungsparameters die nachfolgenden Schritte umfasst: – das Quantisieren der Blöcke der genannten DCT-Koeffizienten unter Verwendung eines vorbestimmten Bereichs von Schrittgrößen und das Bestimmen des Kurtosiswertes davon; und – das Bestimmen eines Blocks und der entsprechenden Schrittgröße, was den höchsten Kurtosiswert ergibt.
  14. Verfahren nach Anspruch 10, wobei die genannten Eingangsdaten ein JPEG- oder ein MPEG-Signal ist.
  15. Anordnung zur Steuerung der Schärfequalität von Eingangs-Videodaten, wobei diese Anordnung die nachfolgenden Elemente umfasst: – Mittel zum Umwandeln der genannten Eingangs-Videodaten in Blöcke, – Mittel zum Durchführen einer Bewegungsschätzungsanalyse an den Blöcken der genannten Eingangs-Videodaten zum Erzeugen eines Bezugssignals; – Mittel zum Transformieren der Blöcke des genannten Eingangsvideos in Blöcke mit DCT-Koeffizienten und zum Quantisieren der Blöcke der genannten DCT-Koeffizienten unter Verwendung eines Quantisierungsparameters zum Erzeugen quantisierter Daten; – einen Schärfecontroller, der mit den genannten Transformationsmitteln gekoppelt ist zum Selektieren des genannten Quantisierungsparameters auf Basis der Quantisierung der Blöcke der genannten DCT-Koeffizienten unter Verwendung eines vorbestimmten Bereichs von Schrittgrößen und zum Berechnen des Kurtosiswertes davon, und zum Selektieren einer der Schrittgrößen, was zu dem höchsten Kurtosiswert unter einem der Blöcke als der genannte Quantisierungsparameter führt; und – einen Codierer, vorgesehen zum Empfangen und Codierer der genannten quantisierten Daten und des genannten Bezugssignals in ein vorbestimmtes übereinstimmendes Standardpaket.
  16. Anordnung nach Anspruch 15, wobei der genannte Kurtosiswert eine Schärfequalität der Blöcke der genannten Eingangs-Videodaten angibt.
  17. Anordnung nach Anspruch 15, wobei die genannten Eingangs-Videodaten ein JPEG- oder ein MPEG-Signal ist.
  18. Anordnung nach Anspruch 15, die weiterhin einen Puffer aufweist zum Empfangen eines Ausgangssignals des genannten Codierers zur Speicherung des genannten übereinstimmenden Standardpakets zur nachfolgenden Übertragung.
  19. Anordnung nach Anspruch 15, die weiterhin Folgendes umfasst: – einen invertierten Wandler, der das Ausgangssignal der genannten Transformationsmittel empfängt um operativ die genannten quantisierten Daten zu quantisieren und diese in dekomprimierte Daten umzuwandeln; und – einen Speicher zur Speicherung der dekomprimierten Daten zur nachfolgenden Erzeugung des genannten Bezugssignals.
DE60309039T 2002-06-14 2003-06-04 Verfahren und vorrichtung zur optimierung der bildschärfe während der kodierung Expired - Fee Related DE60309039T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US172416 1993-12-22
US10/172,416 US7054497B2 (en) 2002-06-14 2002-06-14 Method and system for optimizing image sharpness during coding and image enhancement
PCT/IB2003/002526 WO2003107682A1 (en) 2002-06-14 2003-06-04 A method and system for optimizing image sharpness during coding

Publications (2)

Publication Number Publication Date
DE60309039D1 DE60309039D1 (de) 2006-11-23
DE60309039T2 true DE60309039T2 (de) 2007-05-03

Family

ID=29733053

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60309039T Expired - Fee Related DE60309039T2 (de) 2002-06-14 2003-06-04 Verfahren und vorrichtung zur optimierung der bildschärfe während der kodierung

Country Status (9)

Country Link
US (1) US7054497B2 (de)
EP (1) EP1516493B1 (de)
JP (1) JP2005530423A (de)
KR (1) KR20050012782A (de)
CN (1) CN1659890A (de)
AT (1) ATE342635T1 (de)
AU (1) AU2003239286A1 (de)
DE (1) DE60309039T2 (de)
WO (1) WO2003107682A1 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769084B1 (en) * 2002-07-15 2010-08-03 Apple Inc. Method for implementing a quantizer in a multimedia compression and encoding system
KR100813258B1 (ko) 2005-07-12 2008-03-13 삼성전자주식회사 화상 데이터 부호화 및 복호화 장치 및 방법
US20080285645A1 (en) * 2007-05-17 2008-11-20 Tandberg Television Asa Adaptive border processing
US8023562B2 (en) 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
US8369403B2 (en) * 2007-09-12 2013-02-05 Sony Corporation Image processing device and image processing method
JP5365518B2 (ja) * 2007-09-12 2013-12-11 ソニー株式会社 画像処理装置及び方法
US8363969B1 (en) * 2008-08-01 2013-01-29 Marvell International Ltd. Systems and methods for image coding and processing
US9473792B2 (en) 2009-11-06 2016-10-18 Texas Instruments Incorporated Method and system to improve the performance of a video encoder
WO2011100347A2 (en) * 2010-02-09 2011-08-18 Vanguard Software Solutions, Inc. Video sequence encoding system and algorithms
WO2013074964A1 (en) 2011-11-16 2013-05-23 Vanguard Software Solutions, Inc. Video compression for high efficiency video coding
KR101279705B1 (ko) * 2011-12-22 2013-06-27 연세대학교 산학협력단 영상 프레임 내의 블러 측정 방법과 이를 이용하여 영상 프레임의 화질 측정 장치 및 방법
KR101367777B1 (ko) * 2012-08-22 2014-03-06 주식회사 핀그램 적응 이미지 압축시스템 및 그 방법
US9106922B2 (en) 2012-12-19 2015-08-11 Vanguard Software Solutions, Inc. Motion estimation engine for video encoding
US10007644B2 (en) * 2014-06-17 2018-06-26 Sap Se Data analytic consistency of visual discoveries in sample datasets
JP6417815B2 (ja) * 2014-09-19 2018-11-07 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
WO2016076515A1 (ko) * 2014-11-13 2016-05-19 삼성전자 주식회사 영상의 주파수 특성 정보를 포함하는 메타 데이터를 생성하는 방법 및 장치
CN108629744B (zh) * 2018-04-09 2021-07-30 北京无线电计量测试研究所 一种图像增强方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62222783A (ja) * 1986-03-24 1987-09-30 Kokusai Denshin Denwa Co Ltd <Kdd> 動画像の高能率符号化方式
DE69225365T2 (de) * 1991-08-30 1998-11-19 Fuji Xerox Co Ltd Bildsignalkodierungsvorrichtung
US6539122B1 (en) * 1997-04-04 2003-03-25 General Dynamics Decision Systems, Inc. Adaptive wavelet coding of hyperspectral imagery
JP3720577B2 (ja) 1997-04-18 2005-11-30 株式会社リコー 画像形成装置
AU762996B2 (en) * 1999-02-09 2003-07-10 Motorola Australia Pty Ltd An image compression system and method of determining quantisation parameters therefor
US6535647B1 (en) * 1999-03-25 2003-03-18 General Dynamics Decision Systems, Inc. Image encoder method
CN1248486C (zh) 1999-12-17 2006-03-29 皇家菲利浦电子有限公司 用于峰化信号的方法和设备
US6870962B2 (en) * 2001-04-30 2005-03-22 The Salk Institute For Biological Studies Method and apparatus for efficiently encoding chromatic images using non-orthogonal basis functions

Also Published As

Publication number Publication date
JP2005530423A (ja) 2005-10-06
US7054497B2 (en) 2006-05-30
EP1516493B1 (de) 2006-10-11
CN1659890A (zh) 2005-08-24
EP1516493A1 (de) 2005-03-23
WO2003107682A1 (en) 2003-12-24
ATE342635T1 (de) 2006-11-15
DE60309039D1 (de) 2006-11-23
US20030231796A1 (en) 2003-12-18
KR20050012782A (ko) 2005-02-02
AU2003239286A1 (en) 2003-12-31

Similar Documents

Publication Publication Date Title
DE60309039T2 (de) Verfahren und vorrichtung zur optimierung der bildschärfe während der kodierung
DE69116869T2 (de) Digitale bildkodierung mit einer zufallsabtastung der bilder
DE69535228T2 (de) Bildumsetzungsvorrichtung
DE69432142T2 (de) Verfahren und vorrichtung zur effizienten transkodierung
DE69434667T2 (de) Adaptives codierungs-decodierungsverfahren mit variabler länge für bilddaten
DE69734831T2 (de) Adaptive steuerung der datenrate für digitale videokompression
DE69635369T2 (de) Videokodierungsvorrichtung
DE60305325T2 (de) System und verfahren zur ratenverzerrungsoptimierten datenpartitionierung zur videocodierung unter verwendung von rückwärtsadaption
DE60125301T2 (de) Videosignaltranskodierung
DE69414931T2 (de) Transkodierer
DE69435000T2 (de) Bildkodierungsvorrichtung
DE69512548T2 (de) Verfahren und Vorrichtung zur Vermeidung von wiederholenden Zufallsfehlern in Transformationskoeffizienten von Bewegtbildsignalen
DE69815922T2 (de) Verfahren und Vorrichtung zur prädiktiven Bildkodierung und -dekodierung
DE69129595T2 (de) Systeme und Verfahren zur Kodierung alternierender Halbbilder in Zeilensprungbildsequenzen
DE69637335T2 (de) Bildsignalkodierungsmethode und -vorrichtung
DE69718687T2 (de) Vorrichtung und verfahren zur bildvorhersage und -codierung/ -decodierung.
DE69030056T2 (de) Videosignalkodierungsgerät, Kodierungsverfahren und Videosignalübertragungssystem
DE69813349T2 (de) Vorrichtung zur Kontrolle der Datenmenge und Kodierer dieselbige anwendend
DE69837361T2 (de) Verfahren und Vorrichtung zur Bildkodierung
DE4442643B4 (de) Verfahren zum Abschätzen der Bewegung in einem Bewegtbild
EP1472888B1 (de) Kontextsensitive kodierung und dekodierung eines videodatenstroms
DE69928616T2 (de) System zur extrahierung von codierungsparametern aus videodaten
DE102019215911A1 (de) Adaptive inhaltsquantisierung zur videocodierung
DE69321924T2 (de) Verfahren zum zwei-standard-kodieren von bildern, mit sehr niedriger datenrate und codierer/decodierer zur durchführung dieses verfahrens
DE69730148T2 (de) Speichereffiziente komprimierung und quantisierung für bildsignale

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee