DE60305181T2 - Fgs dekodierung unter kontrolle eines im dekoder kalkulierten bildqualitätsparameters - Google Patents

Fgs dekodierung unter kontrolle eines im dekoder kalkulierten bildqualitätsparameters Download PDF

Info

Publication number
DE60305181T2
DE60305181T2 DE60305181T DE60305181T DE60305181T2 DE 60305181 T2 DE60305181 T2 DE 60305181T2 DE 60305181 T DE60305181 T DE 60305181T DE 60305181 T DE60305181 T DE 60305181T DE 60305181 T2 DE60305181 T2 DE 60305181T2
Authority
DE
Germany
Prior art keywords
quality
bit rate
image
data stream
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60305181T
Other languages
English (en)
Other versions
DE60305181D1 (de
Inventor
Mihaela Briarcliff Manor VAN DER SCHAAR
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE60305181D1 publication Critical patent/DE60305181D1/de
Publication of DE60305181T2 publication Critical patent/DE60305181T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6373Control signals issued by the client directed to the server or network components for rate control, e.g. request to the server to modify its transmission rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Graphics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Image Processing (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf die Implementierung eines FGS-Decoders ("fine granular scalability").
  • Videostreaming über Internetprotokollnetzwerke (IP) hat einen weiten Bereich von Multimediaapplikationen ermöglicht. Internet-Videostreaming schafft Echtzeitlieferung und -präsentation von kontinuierlichem Mediacontent, während Kompensation für das Fehlen von Garantien der Dienstleistungsqualität ("Quality-of-Service") übers Internet geboten wird. Durch die Schwankung und die Unvorhersagbarkeit der Bandbreite und anderer Leitungsparameter (beispielsweise Paketverlustrate) über IP Netzwerke, basieren, im Allgemeinen, die meisten der vorgeschlagenen Streaminglösungen auf irgendeinem Typ eines geschichteten (oder skalierbaren) Videocodierungsschemas.
  • Es wurden bereits verschiedene Videoskalierbarkeitsannäherungen durch Videokompressionsstandarde wie MPEG-2, MPEG-4 und H.263 angenommen. Es wurden bereits zeitliche, räumliche und Qualitätsskalierbarkeitstypen (SNR) in diesen Standarden definiert. All diese Typen von skalierbarem Video umfassen eine Basisschicht (BL) und eine oder mehrere Verbesserungsschichten (ELs). Der BL-Teil des skalierbaren Videostroms stellt im Allgemeinen den minimalen Betrag an Daten dar, die zum Decodieren dieses Stromes erforderlich sind. Der EL-Teil des Stroms stellt zusätzliche Information dar und verbessert deswegen die Videosignaldarstellung, wenn von dem Empfänger decodiert.
  • Ein Codierer für "fine granular scalability" (FGS) ist aus WO 00/35187 bekannt. FGS ist ein neues Videokompressionssystem das neulich von dem MPEG-4 Standard für Streamingapplikationen angenommen worden ist. FGS ist imstande, einen breiten Bereich von Bandbreitenvariationszenarien zu unterstützen, die IP-basierte Netzwerke, im Allgemeinen, und das Internet insbesondere kennzeichnen. Mit diesem Typ von Skalierbarkeit codierte Bilder können progressiv decodiert werden. Das heißt, der Decoder kann die Decodierung und die Wiedergabe des Bildes nach Empfang eines geringen Betrags an Daten starten. Je nachdem der Decoder mehr Daten empfängt, wird die Qualität des decodierten Bildes progressiv verbessert, bis die komplette Information empfangen, decodiert und wiedergegeben wird. Unter führenden internationalen Standards ist progressive Bildcodierung eine der Moden, die in JPEG und dem Standbild, Texturcodierungswerkzeug in MPEG-4 Video unterstützt werden. WO 00/35187 beschreibt, wie der Decoder entscheiden kann, Daten für bestimmte Bit-Ebenen in den codierten Strom aufzunehmen, wenn detektiert wird, dass alle Pixel in diesen Bit-Ebenen einen vorbestimmten Wert haben.
  • Der EL komprimiert den SNR und die zeitlichen übrigen Daten, und zwar unter Anwendung eines progressiven (eingebetteten) Codecs. Auf diese Weise wird das FGS Restsignal bitebenenmäßig komprimiert, ausgehend von der signifikantesten Bitebene und endend mit der am wenigsten signifikanten Bit-Ebene (siehe 5). Bei bekannt Decodern wird die ganze Anzahl empfangener Bit-Ebenen decodiert. 5 zeigt ein Beispiel derartiger FGS Verbesserungsschicht-Bit-Ebenen, mit progressiver (bitebenenmäßiger) Codierung von dem signifikantesten Bit (MSB) bis zu dem am wenigsten signifikanten Bit (LSB) über das ganze Frame.
  • Auf alternative Weise kann, zum Reduzieren den Komplexität, ein Decoder die Decodierung beenden, nachdem eine bestimmte Anzahl Bitebenen empfangen und decodiert worden ist. So kann beispielsweise, wenn eine Datenratebegrenzung R und eine Framerate fr gegeben ist, nach Decodierung von R/fr Bits je Frame der Decoder gestoppt werden. Aber Ablegung von Bitebenen zur Verringerung der Komplexität des Decoders kann zu einer unerwünschten sichtbaren Qualität führen. Außerdem wird, wenn die Decodierung beendet wird, wenn die vorgeschriebene Bitrate genau erfüllt wird (d.h. es werden genau R/fr Bits übertragen und je Frame übertragen), diese Anzahl Bits höchstwahrscheinlich einer nicht ganzzahligen Anzahl Bitebenen entsprechen. So kann beispielsweise der Anfang des Bildes drei Bitebenen haben, während das Ende des Bildes zwei Bitebenen hat, was zu einer nicht konsistenten Qualität innerhalb desselben Bildes bzw. derselben Sequenz führt.
  • Ein verbesserter Decoder ist erwünscht.
  • Die vorliegende Erfindung umfasst ein Verfahren und einen Decoder zum Decodieren eines Datenstromes. Zwischen einem decodierten Bild und einer Bitrate wird zum Decodieren des Bildes eine Beziehung identifiziert. Es wird eine gewünschte Qualität der aus dem Strom mit Daten zu decodierenden Bilder selektiert. Es wird eine Bitrate bestimmt, die der gewünschten Qualität entspricht, und zwar unter Anwendung der Beziehung. Aus dem Datenstrom wird eine minimale Anzahl Bitebenen entsprechend der bestimmten Bitrate decodiert.
  • 1 zeigt ein Flussdiagramm eines Ausführungsbeispiels der vorliegenden Erfindung,
  • 2 zeigt ein Flussdiagramm einer dynamischen Variation der Bitrate in dem Ausführungsbeispiel nach 1,
  • 3 zeigt ein Flussdiagramm einer Benutzerinteraktion mit Steuerung der Ausführungsform nach 1,
  • 4 zeigt ein Blockschaltbild eines Decoders nach einem Aspekt der vorliegenden Erfindung,
  • 5 zeigt ein Darstellung der Decodierung von Bitebenen, von dem signifikantesten Bit zu dem am wenigsten signifikanten Bits,
  • 6 zeigt eine Darstellung, wie Bildqualität gegenüber Bitrate für eine Anzahl Bildsequenzen variiert,
  • 7 zeigt eine Darstellung, wie Decodierungskomplexität gegenüber der Bitrate des decodierten Stromes für eine Anzahl Bildsequenzen variiert.
  • Ablegung einer festen (und möglicherweise einer ganzzahligen) Anzahl Bitebenen zur Verringerung der Komplexität des Decoders ohne Berücksichtigung der resultierenden sichtbaren Bildqualität kann zu unerwünschter Reduktion der sichtbaren Qualität führen.
  • Weiterhin ist der Effekt auf die durch Ablegung einer festen Anzahl Bitebenen erhaltene Bildqualität von den Charakteristiken der Sequenz abhängig. So werden beispielsweise Sequenzen mit hoher Detaillierung und mit geringer Bewegung durch FGS mit vielen Bits codiert und folglich könnte beispielsweise das Ablegen von zwei Bitebenen einen wesentlich größeren Effekt auf die Bildqualität als das Ablegen von beispielsweise vier Bitebenen für ein Bild mit viel Bewegung und einem NF-Detail. Folglich könnte dies zu großen Qualitätsschwankungen führen, wenn der Inhalt sich ändert. In den Ausführungsbeispielen nach 14 berücksichtigt der Decoder vor der Entscheidung, Bitebenen abzulegen zum Reduzieren der Komplexität der Decodierung, den Effekt der Ablegung der Bitebenen auf die Bildqualität.
  • Die Ausführungsformen nach den 14 reduzieren die Komplexität von Decodieranordnungen mit einer geringen Leistung und einer geringen Kapazität zum Decodieren von FGS Strömen. Der FGS Decoder hat ein Merkmal der inhärenten Komplexitätsskalierbarkeit, weil eine geringere Komplexität mit der Decodierung geringerer Anzahl Bitebenen assoziiert wird. Wenn aber eine feste Anzahl ganzer Bitebenen immer abgelegt werden, ist die resultierende decodierte Bildqualität unvorhersagbar. In den Ausführungs formen nach den 14 werden ein Verfahren und ein Decoder beschrieben, wobei die sichtbare Qualität (beispielsweise in dem Spitzensignal-zu-Rauschverhältnis PSNR), die mit der Decodierung einer bestimmten Anzahl Bitebenen unter Verwendung einer Basisschichtqualitätsmarke (beispielsweise PSNR) assoziiert wird. Dies ermöglicht eine Reduktion in der Komplexität der Skalierbarkeit beim Erfüllen einer gewünschten Qualitätsbeschränkung.
  • In den Ausführungsbeispielen wird die Qualität der FGS decodierten Bilder an der Decoderseite bestimmt (wo das ursprüngliche Bild nicht vorhanden ist), und daraufhin benutzt der Decoder die berechnete Qualität um zu ermitteln, wie viel Bitebenen abgelegt werden können zum Reduzieren der Komplexität ohne Verringerung der Bildqualität unter einen gewünschten Qualitätspegel.
  • 1 ist ein Flussdiagramm einer Ausführungsform der vorliegenden Erfindung. 11 zeigt ein Verfahren und eine Anordnung zum Decodieren eines Datenstroms.
  • In dem Schritt 100 wird eine Beziehung zwischen Qualität eines decodierten Bildes und einer Bitrate zum Decodieren des Bildes identifiziert. Ein Beispiel einer derartigen Beziehung wird nachstehend in dem Abschnitt "Beziehung zwischen Qualität und Bitrate" beschrieben.
  • In dem Schritt 102 kann, wenn der Wert der Basisschichtqualität, QBL, bei der Basisschicht-Bitrate, RBL, in den Datenstrom aufgenommen ist, in dem Schritt 104 der Wert von QBL als Nebeninformation (in den Benutzerdatenfeldern) von dem Decoder empfangen werden. Auf alternative Weise kann, wenn QBL in dem Schritt 102 nicht in dem Datenstrom vorhanden ist, in dem Schritt 106 QBL auf Basis der Decodierungsinformation, die dem Decoder zur Verfügung steht, d.h. auf Basis von Quantisierungsschritten, Bewegungsvektoren, Makroblockprädiktionstypen oder einer Kombination dieser drei, berechnet werden. Es sei bemerkt, dass QBL entweder in Termen von PSNR oder unter Anwendung einer anderen subjektiven Metrik (d.h. objektiver Metriken, die mit subjektiven Bewertungen von Bildqualität korreliert und geordnet worden sind). Andere Metriken können Blockformung, Schärfe, Flimmerrauschen umfassen, sind aber nicht darauf begrenzt. In dem Schritt 108 werden die anderen Parameter, die in der Bildqualitätsberechnung verwendet werden, bestimmt. So umfassen beispielsweise für die nachstehend beschriebene Beziehung die zusätzlichen Parameter die Basisschichtbitrate und die Neigung der Kurve Qualität-zu-Bitrate.
  • In dem Schritt 110 wird eine Selektion einer gewünschten Qualität zu decodierender Bilder aus dem Datenstrom, einer anzuwendenden Verarbeitungsgeschwindigkeit, oder einer Decodierzeit durchgeführt. Ein Beispiel eines Selektionsprozesses wird nachstehend anhand der 3 beschrieben.
  • In dem Schritt 112 wird unter Anwendung der Beziehung eine Bitrate entsprechend der gewünschten Qualität, Geschwindigkeit oder Decodierzeit bestimmt.
  • In dem Schritt 116 wird die Decodierung einer minimalen Anzahl Bitebenen gestartet, entsprechend der bestimmten Bitrate aus dem Datenstrom. Die minimale Anzahl Bitebenen kann eine reelle Anzahl entsprechend der berechneten Bitrate oder die kleinste ganze Zahl größer als oder gleich der berechneten Bitrate sein.
  • Bei einigen Ausführungsformen wird die Anzahl decodierter Bitebenen in einer einzigen Videosequenz dynamisch eingestellt um während einer Folge von Frames zuzunehmen, wenn es mehr Details gibt, und abzunehmen während einer Sequenz von Frames, wenn es weniger Details gibt. So wird beispielsweise vorzugsweise jeweils, wenn eine neue Szenenänderung detektiert wird (beispielsweise bei Bewegungsvektoren oder dergleichen), die Basisschichtqualität bewertet und es wird eine Untersuchung angestellt, ob eine Änderung in der Decodierbitrate geeignet ist. Es ist vorgesehen, dass, wenn es mehr Bewegung und NF-Details gibt in diesen Ausführungsformen, die abgelegt werden würden, wenn eine feste Anzahl Bitebenen für die ganze Videosequenz verwendet wird, mehr Bitebenen abgelegt werden können.
  • 2 ist ein Flussdiagramm, das eine etwaige dynamische Einstellung der Bitrate in den Ausführungsbeispielen darstellt. Die Schritte nach 2 können zu geeigneten Zeitpunkten, beispielsweise bei Detektion einer Szenenänderung, automatische durchgeführt werden. In dem Schritt 200 wird eine Szenenänderung detektiert. Detektion kann beispielsweise auf Bewegungsvektoren basiert sein.
  • In dem Schritt 202 wird eine Änderung in der Beziehung zwischen Bildqualität und Bitrate identifiziert. Beispielsweise wird eine Änderung in QBL identifiziert.
  • In dem Schritt 204 wird der Betrag an Einzelheiten in den Bildern betrachtet. Wenn der Betrag an Einzelheiten in dem Bild abnimmt, werden die Schritte 207 und 209 durchgeführt. Diese Schritte stellen die Anzahl decodierter Bitebenen dynamisch ein um der gewünschten Qualität und der geänderten Beziehung zu entsprechen.
  • In dem Schritt 206 wird für eine Bildsequenz mit viel Details die Anzahl decodierter Bitebenen gesteigert (und die Anzahl abgelegter Bitebenen verringert). In dem Schritt 208 wird eine relativ hohe Bitrate verwendet.
  • In dem Schritt 207 wird für eine Bildsequenz mit wenig Details die Anzahl decodierter Bitebenen verringert (und die Anzahl abgelegter Bitebenen gesteigert). In dem Schritt 209 wird eine relativ niedrige Bitrate verwendet.
  • Obschon 2 eine dynamische Einstelltechnik zeigt, kann es sein, dass es in anderen Ausführungsformen keine dynamische Einstellung gibt; die Anzahl abzulegender Bitebenen kann einmal für jede Bildsequenz bestimmt werden und durch die ganze Sequenz hindurch konstant bleiben. In einem derartigen Fall kann der Wert auf dem ersten Frame der Sequenz basiert sein, oder auf irgendeinem Mittelwert. Für einen Mittelwert von QBL können Bewegungsvektoren verwendet werden um den Betrag an Bewegung innerhalb der Sequenz zu ermitteln.
  • 3 ist ein Flussdiagramm einer etwaigen Benutzerinteraktion mit dem Decodierprozess und dem Decoder.
  • In dem Schritt 300 beantragt der Benutzer ein Menü der Bildqualität oder Decodierungskomplexitätsmöglichkeiten. Der Benutzer kann einen derartigen Antrag dadurch stellen, dass er das Menü aus einem Menü mit Funktionen und Regelungen eines höheren Pegels in der speziellen Anordnung mit dem Decoder selektiert.
  • In dem Schritt 302 gibt die Anordnung mit dem Decoder wenigstens zwei Werte von Bildqualität wieder und ein betreffenden Maß eines Mittels, erforderlich zum Decodieren des Bildes für die wenigstens zwei Werte der Bildqualität. Jede beliebige Anzahl Qualität-Mittelpaare kann wiedergegeben werden, aber vorzugsweise sollen nur mögliche Kombinationen wiedergegeben werden. So soll beispielsweise ein Bildqualitätswert entsprechend einer Decodierzeit, die über die Kapazität der Batterie der Anordnung hinausgeht, nicht als Möglichkeit wiedergegeben werden. Das wiedergegebene Mittel kann die Zeit zum Decodieren des Datenstroms mit der betreffenden Bildqualität sein, ein Bruchteil der Batterieladung, verwendet zum Decodieren des Datenstroms mit der betreffenden Bildqualität, oder eine Bitrate, verwendet zum Decodieren des Datenstroms mit der betreffenden Bildqualität.
  • In dem Schritt 306 selektiert der Benutzer eines der Paare, was zu einer Selektion einer Decodierbitrate führt (sogar, wenn die Bitrate nicht das dem Benutzer in dem Schritt 302 gezeigte Mittel ist).
  • In dem Schritt 308 kann der Decoder ggf. die ermittelte Bitrate zu einer Quelle des Datenstromes senden, wobei beantragt wird, dass die Quelle des Datenstroms nur künftige Datenströme mit der festgestellten Bitrate überträgt. Wenn diese Option eingeschlossen ist, dann kann in dem Schritt 310 die Quelle des Datenstromes die übertragene Bitrate gegenüber die von dem Decoder beantragte Bitrate setzen.
  • Auf alternative Weise kann der Decoder den Schritt 308 fortlassen und Bitebenen, von denen der Benutzer wünscht, dass sie nicht decodiert werden, ablegen.
  • Unter Anwendung der Techniken aus 3 kann der Benutzer oder das Terminal (automatisch) entweder eine selektierte Qualität oder eine gewünschte Verarbeitungsleistung selektieren. Der Benutzer kann von Hand die feste Qualitätseinstellung QFIX beispielsweise, einstellen um die restliche Batteriezeit zu verlängern oder um die Bildqualität zu verbessern. Die Anordnung kann auf einfache Art und Weise Bildqualität gegen Batteriezeit eintauschen, und zwar auf Basis des Benutzerantrags oder einer vorbestimmten Qualitätsvereinbarung oder sie kann die Batteriezeit dadurch maximieren, dass die Bildqualität so niedrig wie QBL reduziert wird (d.h. durch Verringerung der Bitrate auf RBL).
  • So kann beispielsweise ein derartiges Merkmal in dem mobilen Terminal bestehen, und zwar auf Basis der selektierten Qualität, die Anordnung kann den Benutzer darüber informieren, wie viel Batteriezeit noch übrig ist für Streamingapplikationen unter Verwendung von FGS. Es wird nun vorausgesetzt, dass in einer einfachen mobilen Anordnung der Batteriepegel überwacht wird, was einem etwaigen Betrag an Zeit entspricht, dass die mobile Anordnung ohne Aufladung der Batterie betrieben werden kann. Eine mittlere Zeit zum Decodieren eines bestimmten Betrags an Daten in der mobilen Anordnung kann geschätzt werden. (Dieser Mittelwert könnte als eine Zusammensetzung aus der Decodierzeit der Basisschicht und der Verbesserungsschicht geschätzt werden). Durch Spezifizierung einer Übertragungsrate R steuert der Benutzer den Betrag an decodierten Daten, und folglich den Betrag an Zeit, welche die mobile Anordnung auf die Decodierung eines bestimmten Stromes verwenden soll. Die mobile Station kann den Betrag an restlicher Betriebszeit in der Batterie mit dem vorhergesagten Betrag an Zeit, erforderlich zum Decodieren eines Stromes bei der bestreffenden Rate vergleichen und die Information dem Benut zer bekannt geben, entweder in Minuten oder als Prozentsatz der gesamten Batteriekapazität. Der Benutzer kann dann die Rate auf Basis dieser Information selektieren.
  • 4 ist ein Blockschaltbild eines Ausführungsbeispiels mit einem Decoder 400. Der Decoder 400 hat einen Basisschichtdecoder 410 und einen Verbesserungsschichtdecoder 450. Der BL Decoder 410 umfasst einen Demultiplexer, der den BL Bitstrom empfängt und die codierten diskreten Kosinustransformationskoeffizientendaten (DCT) einem BL Decoder mit variabler Länge (VLD) 414 liefert und BL Bewegungsvektoren (MVs) zu einem Bewegungskompensationsblock 422 schafft. Der BL VLD 414 liefert decodierte Daten zu dem invertierten Quantisierungsblock 416, der die DCT Koeffizientendaten dem DCT Block 418 liefert. Der invertierte DCT Block 418 führt den invertierten DCT Vorgang durch und liefert dem Addierer 424 Videoframes. Der Bewegungskompensationsblock 422 empfängt die BL MVs und BL Framedaten von Drain-Elektrode, BL Framespeicher 429 und führt die Bewegungskompensation an den BL Frames in dem Speicher 420 durch um dem Addierer 424 zusätzliche Frames zu liefern. Der decodierte BL Datenstrom wird von dem Addierer 424 dem BL Framespeicher 420 und dem EL Decodierteil 450 zugeführt.
  • Der EL Decoder 450 hat eine FGS Bitebene VLD 452, die den EL Bitstrom empfängt und dem invertierten DCT Block 454 DCT Koeffizientendaten liefert. Der invertierte DCT Block 454 führt den invertierten DCT Vorgang durch und liefert die EL Framedaten, die in dem Addierer 456 addiert werden zu den BL Daten zum Schaffen eines verbesserten Videostroms.
  • Der Decoder 400 umfasst einen zusätzlichen Block 460, der ermittelt, wie viele Bitebenen decodiert werden sollen. Der Block 460 empfängt Information von dem invertierten Quantisierungsblock 416, die BL Bewegungsvektoren, und den EL Bitstrom und liefert der FGS Bitebene VLD eine Anzahl zu decodierender Bitebenen. Die Wirkungsweise des Blocks 460 kann sein, wie in den 13 dargestellt und wie oben beschrieben.
  • In 6 sind einige Ratenstörungskurven für mehrere Sequenz 602, 604 und 606 dargestellt, codiert in demselben Bereich von Bitraten. In jeder der Kurven in 6 entspricht die meist linke Stelle der Basisschichtbitrate und der entsprechenden Qualität QBL. Aus 6 lassen sich zwei Beobachtungen machen:
    • (1) die Basisschichtqualität QBL hat einen großen Einfluss auf die gesamte Qualität der FGS Ströme.
    • (2) Die FGS Qualität nimmt nahezu lineare als eine Funktion der Bitraten zu.
  • Eine Beispielsfunktion wird nachstehend beschrieben, und kann zum Bestimmen einer Bitrate verwendet werden, was eine gewünschte Bildqualität liefern wird, wenn eine Basisschichtbildqualität und eine Basisschichtbildrate gegeben sind. Diese Funktion benutzt empirische Beobachtungen zum Liefern einer Qualitätsberechnung, die mit einer geringen Anzahl rechnerischer Vorgänge schnell durchgeführt wird.
  • Andere Funktionen können vom Fachmann bestimmt werden um die gewünschte Bitrate zu berechnen.
  • Die Qualität eines FGS Stromes Q mit der Rate R kann wie folgt modelliert werden: Q(R) = QBL + (R – RBL)/c,wobei QBL die Basisschichtqualität ist, wobei RBL die Basisschichtbitrate ist, wobei c eine Konstante ist, experimentell gefunden zum Ausgleichen von RBL (d.h. die Neigung der FGS Ratenverzerrungsfunktion ist experimentell gefunden um eine Neigung von etwa 45 Grad zu haben).
  • Typischerweise ist der Wert des Terms (R – RBL)/c kleiner als zehn. Die Basisschichtqualität QBL ist stark abhängig von der Basisschichtbitrate RBL. Beispielsweise für viele Details Sequenzen mit wenig Bewegung von CIF Auflösungsbildern mit RBL = 100 kbps, dann ist QBL (in PSNR) etwa 25–28 dB. Für wenig Details Sequenzen mit viel Bewegung von CIF Auflösungsbildern mit RBL = 100 kbps, QBL (in PSNR) etwa 32–35 dB. Auf diese Weise ist der große Einfluss von QBL auf die Gesamtbildqualität deutlich.
  • Denn, wenn das Verhältnis Komplexität/Stromverbrauch des Decoders reduziert werden soll, während die Qualität Q(R) immer (unabhängig von den Kennzeichen der Sequenz) auf einem konstanten Wert QFIX gehalten wird, soll nur eine Anzahl Bitebenen entsprechend der Rate R1 decodiert werden. R1 lässt sich aus der nachfolgenden Formel berechnen: QFIX = Q(R1) = QBL + (R1 – RBL)/c = QBL + (R1 – RBL)/RBL
  • Der Wert R1, der dem voreingestellten Wert QFIX entspricht, kann auf einfache Weise berechnet werden, da die Qualität eines FGS Stromes Q mit der Rate R (wie oben beschrieben) eine lineare Funktion ist.
  • Die Komplexitätsersparnis, assoziiert mit dieser Strategie, kann auch im voraus im Schnitt für einen großen Satz von Sequenzen berechnet werden. Denn eine Tabelle der Qualität zu mittlerer Komplexität kann gespeichert und bei dem (geeigneten) Decoder verwendet werden. Für jede beliebige gegebene Qualität QFIX, Basisschichtbitrate RBL, Codierungsframerate und räumliche Auflösung schafft diese Tabelle einen mittleren Komplexitätsfaktor.
  • So kann beispielsweise Komplexität durch die mittlere CPU-Zeit (in Millisekunden je Frame) erforderlich zum Decodieren der Sequenz, gemessen werden. Es gibt kein einziges Komplexitätsfaktorverhältnis für alle Rechenplattformen, da dies von der spezifischen Implementierungsplattform und dem Optimierungsalgorithmus stark abhängig ist. Typischerweise aber ist die Komplexität nicht von den Sequenzcharakteristiken abhängig, sondern vielmehr von der Bitrate R.
  • 7 zeigt ein Beispiel mit drei verschiedenen Bildsequenzen. Die Komplexität wird durch die Anzahl Millisekunden je Frame zum Decodieren der Sequenzen dargestellt, als eine Funktion der Bitrate. Die Komplexität ist mit der Bitrate stark korreliert und die Beziehung ist nahezu linear. Es gibt eine leichte Variation unter den Sequenzen.
  • Die Ausführungsbeispiele sind insbesondere nützlich für Produkt, wie drahtlose Terminals, wie Handys, PCs Fernseh-Settopboxen, Speicheranordnungen, digitale Videokameras, (Heim)Transcodierungstore usw. Die Ausführungsbeispiele können im Dienstleistungsbereich verwendet werden, wie Videokonferenzen, Echtzeit-Videodecodierung/Streaming, Speicherapplikationen und dergleichen. Diese Liste ist nicht vollständig und andere Applikationen für die Decodierungstechnik können ebenfalls bedacht werden.
  • Die vorliegende Erfindung kann in Form von computerimplementierten Prozessen und Anordnungen zum Durchführen dieser Prozesse verkörpert werden. Die vorliegende Erfindung kann auch in Form eines Computerprogrammcodes in konkreten Medien verkörpert werden, wie in Speichern mit beliebigem Zugriff (RAM), Floppies, Festwertspeichern (ROM), CD-ROM, DVD-ROM, Festplatten, entfernbaren Platten (beispielsweise "ZIPPTM" oder "JAZZTM") oder jedem anderen vom Computer lesbaren Speichermedium, wobei, wenn der Computerprogrammcode in einen Computer geladen und von demselben durchgeführt wird, wird der Computer eine Anordnung zum Praktisieren der vorliegenden Erfindung. Die vorliegende Erfindung kann auch in Form eines Computerprogrammcodes verkörpert werden, beispielsweise entweder gespeichert in einem Speichermedium, geladen in einen Computer und/oder von demselben durchgeführt, oder über irgendein Übertra gungsmedium übertragen, wie über die elektrische Verdrahtung oder Verkabelung, über optische Fasern, oder über elektromagnetische Strahlung, wobei, wenn der Computerprogrammcode in einen Computer geladen und von demselben durchgeführt, der Computer eine Anordnung zum Praktisieren der vorliegenden Erfindung wird. Wenn in einem Allzweckprozessor implementiert, bilden die Computerprogrammcodesegmente den Prozessor zum Schaffen spezifischer logischer Schaltungen. Auf alternative Weise kann der Decoder in spezifischen logischen Schaltungen implementiert werden.
  • Obschon die vorliegende Erfindung in Termen von Ausführungsbeispielen beschrieben worden ist, ist sie nicht darauf begrenzt. Vielmehr sollen die beiliegenden Patentansprüche breit ausgelegt werden, damit andere Varianten und Ausführungsformen der vorliegenden Erfindung umfasst werden, was im Rahmen der vorliegenden Erfindung von dem Fachmann gemacht werden kann.

Claims (27)

  1. Verfahren zum Decodieren eines codierten Datenstroms, der eine Anzahl Bitebenen aufweist, wobei dieses Verfahren die nachfolgenden Computergesteuerten Schritte umfasst: – das Selektieren (110, 306) einer gewünschten Qualität zu decodierender Bilder aus dem codierten Datenstrom; – das Ermitteln (112) einer Bitrate zum Decodieren entsprechend der gewünschten Qualität; – das Decodieren (116) nur einer minimalen Anzahl Bitebenen aus dem codierten Strom, wobei die minimale Anzahl der ermittelten Bitrate entspricht, gekennzeichnet durch – die Identifizierung (202, 204, 206, 207) einer vom Strominhalt abhängigen Beziehung zwischen Qualität eines decodierten Bildes und einer Bitrate zum Decodieren des Bildes, wobei die Bitrate zum Decodieren entsprechend der gewünschten Qualität unter Anwendung der Beziehung ermittelt wird (12).
  2. Verfahren nach Anspruch 1, wobei die Beziehung durch die nachfolgende Gleichung definiert wird: Q(R) = QBL + (R – RBL)/c, wobei Q(R) die Qualität des Bildes bei einer Bitrate R ist, wobei QBL ein Qualitätsmaß einer Basisschicht des Datenstroms ist, wobei RBL eine Bitrate entsprechend der Übertragung der Basisschicht ist und wobei c eine Konstante ist.
  3. Verfahren nach Anspruch 1, wobei dieses Verfahren weiterhin die nachfolgenden Schritte umfasst: (e) das Identifizieren einer Änderung in der Beziehung; und das dynamische Einstellen der Anzahl decodierter Bitebenen zur Übereinstimmung mit der gewünschten Qualität und der geänderten Beziehung.
  4. Verfahren nach Anspruch 3, wobei der Schritt (f) die Verwendung einer relativ niedrigen Bitrate für eine Bildsequenz mit geringem Detail umfasst.
  5. Verfahren nach Anspruch 3, wobei die Schritte (e) und (f) durchgeführt werden, wenn eine Szenenänderung detektiert wird.
  6. Verfahren nach Anspruch 1, das die Wiedergabe wenigstens zweier Bildqualitätswerte und eines betreffenden Maßes eines Mittels umfasst, das zum Decodieren des Bildes für jeden der wenigstens zwei Bildqualitätswerte vor dem Schritt (b) erforderlich ist.
  7. Verfahren nach Anspruch 1, das weiterhin die Übertragung der ermittelten Bitrate zu einer Quelle des Datenstromes umfasst, wobei die Quelle des Datenstromes erbeten wird, nur künftige Datenströme mit der ermittelten Bitrate zu übertragen.
  8. Computerlesbares Medium mit einem darauf codierten Computerprogrammcode, wobei, wenn der Computerprogrammcode von einem Prozessor durchgeführt wird, der Prozessor ein Verfahren zum Decodieren eines codierten Datenstroms durchführt, der eine Anzahl Bitebenen aufweist, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: – das Selektieren (110, 306) einer gewünschten Qualität zu decodierender Bilder aus dem codierten Datenstrom; – des Ermitteln (112) einer Bitrate zum Decodieren entsprechend der gewünschten Qualität; und – das Decodieren (116) nur einer minimalen Anzahl Bitebenen aus dem codierten Strom, wobei die minimale Anzahl der ermittelten Bitrate entspricht; gekennzeichnet durch – die Identifizierung (202, 204, 206, 207) einer vom Strominhalt abhängigen Beziehung zwischen Qualität eines decodierten Bildes und einer Bitrate zum Decodieren des Bildes, wobei die Bitrate zum Decodieren unter Anwendung der genannten Beziehung ermittelt wird.
  9. Computerlesbares Medium nach Anspruch 8, wobei die Beziehung durch die nachfolgende Gleichung definiert wird: Q(R) = QBL + (R – RBL)/c, wobei Q(R) die Qualität des Bildes bei einer Bitrate R ist, wobei QBL ein Qualitätsmaß einer Basisschicht des Datenstroms ist, wobei RBL eine Bitrate entsprechend der Übertragung der Basisschicht ist und wobei c eine Konstante ist.
  10. Computerlesbares Medium nach Anspruch 9, wobei c etwa gleich RBL ist.
  11. Computerlesbares Medium nach Anspruch 9, das weiterhin das Empfangen eines Wertes von QBL aus einer Quelle des Datenstromes umfasst.
  12. Computerlesbares Medium nach Anspruch 9, das weiterhin das Berechnen von QLB umfasst, und zwar auf Basis einer oder mehrerer der Gruppe, bestehend aus Quantisierungsschritten, Bewegungsvektoren und Makroblockprädiktionstypen.
  13. Computerlesbares Medium nach Anspruch 8, wobei die minimale Anzahl Bitebenen eine der Gruppe ist, bestehend aus einer echten Zahl, die der Bitrate entspricht, die in dem Schritt (c) ermittelt wurde, und einer kleinsten ganzen Zahl, größer als oder gleich der Bitrate, die in dem Schritt (c) ermittelt wurde.
  14. Computerlesbares Medium nach Anspruch 8, das weiterhin die nachfolgenden Verfahrensschritte umfasst: (e) das Identifizieren einer Änderung in der Beziehung; und (f) das dynamische Einstellen der Anzahl decodierter Bitebenen entsprechend der gewünschten Qualität und der geänderten Beziehung.
  15. Computerlesbares Medium nach Anspruch 14, wobei der Schritt (f) die Verwendung einer relativ hohen Bitrate für eine Bildsequenz mit hohem Detail und geringer Bewegung umfasst.
  16. Computerlesbares Medium nach Anspruch 14, wobei der Schritt (f) die Verwendung einer relativ niedrigen Bitrate für eine Bildsequenz mit relativ geringem Detail umfasst.
  17. Computerlesbares Medium nach Anspruch 14, wobei die Schritte (e) und (f) durchgeführt werden, wenn eine Szenenänderung detektiert wird.
  18. Computerlesbares Medium nach Anspruch 8, wobei das Verfahren die Wiedergabe wenigstens zweier Bildqualitätswerte und ein betreffendes Maß eines Mittels umfasst, erforderlich zum Decodieren des Bildes für jeden der wenigstens zwei Bildqualitätswerte vor dem Schritt (b) umfasst.
  19. Computerlesbares Medium nach Anspruch 18, wobei das Maß des Mittels eines der Gruppe ist, bestehend aus einer Zeit zum Decodieren des Datenstromes mit der betreffenden Bildqualität, einem Bruchteil der Batterieladung, benutzt zum Decodieren des Datenstroms mit der betreffenden Bildqualität, und einer Bitrate, verwendet zum Decodieren des Datenstroms bei der betreffenden Bildqualität.
  20. Computerlesbares Medium nach Anspruch 8, wobei das Verfahren weiterhin das Übertragen der ermittelten Bitrate zu einer Quelle des Datenstroms umfasst und die Datenstromquelle beauftragt wird, nur künftige Datenströme mit der ermittelten Bitrate zu übertragen.
  21. Decoder zum Decodieren eines codierten Datenstroms, der eine Anzahl Bitebenen aufweist, wobei der Decoder die nachfolgenden Elemente aufweist: – Mittel zum Empfangen einer Selektion einer gewünschten Qualität zu decodierender Bilder aus dem codierten Datenstrom; – Mittel zum Ermitteln einer Bitrate zum Decodieren des Bildes entsprechend der gewünschten Qualität; – Mittel zur Steuerung einer Anzahl zu codierender Bitebenen, so dass nur eine minimale Anzahl Bitebenen aus dem codierten Strom decodiert werden zum Bilden eines oder mehrerer Bilder, wobei die minimale Anzahl der gewünschten Bitrate entspricht, dadurch gekennzeichnet, dass die Mittel zum ermitteln der Bitrate zum Decodieren, vorgesehen zum ermitteln der Bitrate auf Basis der Qualität eines decodierten Bildes, wie durch eine Strominhaltabhängigen Beziehung zwischen Qualität des decodierten Bildes und einer Bitrate zum Decodieren des Bildes definiert.
  22. Decoder nach Anspruch 21, der weiterhin Folgendes umfasst: Mittel zum identifizieren einer Änderung in der Beziehung zwischen der Bitrate und der Qualität des decodierten Bildes; und Mittel zum dynamischen Einstellen der Anzahl decodierter Bitebenen zum Entsprechen der gewünschten Qualität und der geänderten Beziehung.
  23. Decoder nach Anspruch 22, wobei die Einstellmittel eine relativ niedrige Bitrate verwenden für eine Bildsequenz mit einem relativ geringen Detail.
  24. Decoder nach Anspruch 22, wobei die Änderungsidentifikationsmittel eine Änderung in der Beziehung identifizieren, wenn eine Szenenänderung detektiert wird.
  25. Decoder nach Anspruch 21, wobei der Decoder in einer mobilen Anordnung vorgesehen ist, die wenigstens zwei Bildqualitätswerte und ein betreffendes Maß eines Mittels wiedergibt, das zum Decodieren des Bildes für jeden der wenigstens zwei Bildqualitätswerte erforderlich ist.
  26. Decoder nach Anspruch 25, wobei das Maß des Mittels eines der Gruppe ist, die besteht aus einer Zeit zum Decodieren des Datenstroms mit der betreffenden Bildqualität, einem Bruchteil der Batterieladung, verwendet zum decodieren des Datenstroms mit der betreffenden Bildqualität, und einer Bitrate, verwendet zum Decodieren des Datenstroms mit der betreffenden Bildqualität.
  27. Decoder nach Anspruch 21, wobei der Decoder in einer mobilen Anordnung vorgesehen ist, welche die ermittelte Bitrate zu einer Quelle des Datenstroms überträgt, und zwar zum Beantragen, dass die Quelle des Datenstroms nur künftige Datenströme mit der ermittelten Bitrate überträgt.
DE60305181T 2002-06-27 2003-06-11 Fgs dekodierung unter kontrolle eines im dekoder kalkulierten bildqualitätsparameters Expired - Fee Related DE60305181T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US183760 2002-06-27
US10/183,760 US7136532B2 (en) 2002-06-27 2002-06-27 FGS decoder based on quality estimated at the decoder
PCT/IB2003/002566 WO2004004352A1 (en) 2002-06-27 2003-06-11 Fgs decoder based on quality estimated at the decoder

Publications (2)

Publication Number Publication Date
DE60305181D1 DE60305181D1 (de) 2006-06-14
DE60305181T2 true DE60305181T2 (de) 2007-03-08

Family

ID=29779193

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60305181T Expired - Fee Related DE60305181T2 (de) 2002-06-27 2003-06-11 Fgs dekodierung unter kontrolle eines im dekoder kalkulierten bildqualitätsparameters

Country Status (9)

Country Link
US (1) US7136532B2 (de)
EP (1) EP1520422B1 (de)
JP (1) JP2005531240A (de)
KR (1) KR20050013619A (de)
CN (1) CN1669325A (de)
AT (1) ATE326122T1 (de)
AU (1) AU2003241110A1 (de)
DE (1) DE60305181T2 (de)
WO (1) WO2004004352A1 (de)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003199019A (ja) * 2001-12-26 2003-07-11 Sony Corp 撮像装置および方法、記録媒体、並びにプログラム
JP3952459B2 (ja) * 2002-11-15 2007-08-01 株式会社リコー 画像処理装置、プログラム、記憶媒体及び画像処理方法
US7474792B2 (en) * 2002-12-02 2009-01-06 Ricoh Company, Ltd. Image processing apparatus for using distortion amount information
US7903734B2 (en) * 2003-04-24 2011-03-08 Canon Kabushiki Kaisha Moving image decoding apparatus, moving image decoding method, image decoding method, and image decoding apparatus
DE10326168B4 (de) * 2003-06-10 2010-01-28 Siemens Ag Verfahren und Funktionseinheit zur Optimierung der Darstellung progressiv kodierter Bilddaten
JP4618676B2 (ja) 2005-04-28 2011-01-26 株式会社リコー 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
EP1932363B1 (de) 2005-10-05 2016-05-18 LG Electronics Inc. Verfahren und vorrichtung zum rekonstruieren von bildblöcken
KR20070096751A (ko) * 2006-03-24 2007-10-02 엘지전자 주식회사 영상 데이터를 코딩/디코딩하는 방법 및 장치
KR100891662B1 (ko) * 2005-10-05 2009-04-02 엘지전자 주식회사 비디오 신호 디코딩 및 인코딩 방법
KR100891663B1 (ko) * 2005-10-05 2009-04-02 엘지전자 주식회사 비디오 신호 디코딩 및 인코딩 방법
KR20070038396A (ko) * 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
KR100802180B1 (ko) * 2005-12-08 2008-02-12 한국전자통신연구원 엠펙-4 비디오 신호의 비트율을 동적인 통신 용량 변화에따라 제어하는 방법
EP2008464A4 (de) * 2006-04-03 2014-10-29 Lg Electronics Inc Verfahren und vorrichtung zum decodieren/codieren eines skalierbaren videosignals
US8233544B2 (en) * 2006-07-13 2012-07-31 Qualcomm Incorporated Video coding with fine granularity scalability using cycle-aligned fragments
US8942292B2 (en) * 2006-10-13 2015-01-27 Qualcomm Incorporated Efficient significant coefficients coding in scalable video codecs
US8068608B2 (en) * 2007-12-17 2011-11-29 Broadcom Corporation Video processing system for scrambling video streams with dependent portions and methods for use therewith
US9078024B2 (en) * 2007-12-18 2015-07-07 Broadcom Corporation Video processing system with user customized graphics for use with layered video coding and methods for use therewith
US8130823B2 (en) * 2007-12-19 2012-03-06 Broadcom Corporation Channel adaptive video transmission system for use with layered video coding and methods for use therewith
US9210480B2 (en) * 2007-12-20 2015-12-08 Broadcom Corporation Video processing system with layered video coding and methods for use therewith
US8416848B2 (en) * 2007-12-21 2013-04-09 Broadcom Corporation Device adaptive video transmission system for use with layered video coding and methods for use therewith
US9143731B2 (en) * 2008-01-02 2015-09-22 Broadcom Corporation Mobile video device for use with layered video coding and methods for use therewith
US8594191B2 (en) * 2008-01-03 2013-11-26 Broadcom Corporation Video processing system and transcoder for use with layered video coding and methods for use therewith
US8144781B2 (en) * 2008-01-04 2012-03-27 Broadcom Corporation Video processing system for scrambling layered video streams and methods for use therewith
US8290285B2 (en) * 2008-06-23 2012-10-16 Mediatek Inc. Method and related apparatuses for decoding multimedia data
FR2954035B1 (fr) * 2009-12-11 2012-01-20 Thales Sa Procede d'estimation de la qualite video a une resolution quelconque
EP2779655B1 (de) 2010-01-06 2019-05-22 Dolby Laboratories Licensing Corporation Komplexitätsadaptives skalierbares Dekodieren und Streaming für mehrschichtige Videosysteme
CN102668579A (zh) * 2010-10-05 2012-09-12 英特尔公司 用于动态调整视频质量的方法和装置
CN105191329B (zh) * 2013-03-06 2018-10-19 交互数字专利控股公司 用于视频流的功率感知自适应
US9872255B2 (en) * 2015-04-01 2018-01-16 Ebay Inc. Battery charge aware communications
US11546611B2 (en) 2018-08-01 2023-01-03 Samsung Display Co., Ltd. Rate control for fixed rate foveated display compression
US11871052B1 (en) * 2018-09-27 2024-01-09 Apple Inc. Multi-band rate control

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100477474B1 (ko) * 1995-06-29 2005-08-01 톰슨 디지털신호프로세싱장치및방법
US5748903A (en) 1995-07-21 1998-05-05 Intel Corporation Encoding images using decode rate control
EP0804035B1 (de) * 1996-04-25 2002-06-26 Matsushita Electric Industrial Co., Ltd. Gerät und Verfahren zur Bewegtbildkodierung
US6480541B1 (en) * 1996-11-27 2002-11-12 Realnetworks, Inc. Method and apparatus for providing scalable pre-compressed digital video with reduced quantization based artifacts
JPH10164581A (ja) * 1996-12-03 1998-06-19 Sony Corp 画像信号符号化方法及び装置、信号記録媒体
US6631403B1 (en) * 1998-05-11 2003-10-07 At&T Corp. Architecture and application programming interfaces for Java-enabled MPEG-4 (MPEG-J) systems
US6292512B1 (en) * 1998-07-06 2001-09-18 U.S. Philips Corporation Scalable video coding system
KR20010080666A (ko) 1998-12-04 2001-08-22 매클린토크 샤운 엘 변환계수의 비트플레인 코딩을 이용한 세밀한 세분성스칼라빌러티의 향상
US6882711B1 (en) * 1999-09-20 2005-04-19 Broadcom Corporation Packet based network exchange with rate synchronization
WO2001047283A1 (en) * 1999-12-22 2001-06-28 General Instrument Corporation Video compression for multicast environments using spatial scalability and simulcast coding
US6668090B1 (en) 2000-05-26 2003-12-23 Eastman Kodak Company Producing a compressed digital image organized into layers corresponding to increasing visual quality levels and providing rate-control of such compressed digital image
US6859446B1 (en) 2000-09-11 2005-02-22 Lucent Technologies Inc. Integrating power-controlled and rate-controlled transmissions on a same frequency carrier
US7266148B2 (en) * 2001-01-05 2007-09-04 Lg Electronics Inc. Video transcoding apparatus
US6925120B2 (en) 2001-09-24 2005-08-02 Mitsubishi Electric Research Labs, Inc. Transcoder for scalable multi-layer constant quality video bitstreams
US7391807B2 (en) * 2002-04-24 2008-06-24 Mitsubishi Electric Research Laboratories, Inc. Video transcoding of scalable multi-layer videos to single layer video

Also Published As

Publication number Publication date
EP1520422B1 (de) 2006-05-10
KR20050013619A (ko) 2005-02-04
WO2004004352A1 (en) 2004-01-08
CN1669325A (zh) 2005-09-14
US20040001635A1 (en) 2004-01-01
DE60305181D1 (de) 2006-06-14
ATE326122T1 (de) 2006-06-15
EP1520422A1 (de) 2005-04-06
US7136532B2 (en) 2006-11-14
JP2005531240A (ja) 2005-10-13
AU2003241110A1 (en) 2004-01-19

Similar Documents

Publication Publication Date Title
DE60305181T2 (de) Fgs dekodierung unter kontrolle eines im dekoder kalkulierten bildqualitätsparameters
DE60305880T2 (de) Skalierbare gezielte videomehrfachsendung auf basis der bandbreite oder fähigkeit des clients
DE60023576T2 (de) Verfahren und Vorrichtung zur Bewegtbilddatentranscodierung
US9225983B2 (en) Rate-distortion-complexity optimization of video encoding guided by video description length
US8731152B2 (en) Reducing use of periodic key frames in video conferencing
US9143776B2 (en) No-reference video/image quality measurement with compressed domain features
US8270473B2 (en) Motion based dynamic resolution multiple bit rate video encoding
DE69815720T2 (de) Kodierung von bewegten bildern mit variabler bitrate in einem durchgang
DE69815159T2 (de) Kodierung von bewegten bildern mit globaler konstanter bitrate
DE60009159T2 (de) Video kompression für mehrfachsendeverteilungen unter verwendung von räumlicher skalierbarkeit und gleichwellenfunkkodierung
DE69233411T2 (de) Verfahren und Einrichtung zur Kompression von sich bewegenden Videobildern mit adaptiver Bitzuordnung und Quantisierung
CN109788316B (zh) 码率控制、视频转码方法与装置、计算机设备及存储介质
DE69826823T2 (de) Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer
DE69921108T2 (de) Verfahren und vorrichtung zur adaptiven codierung eines videodatenstroms
US20090067493A1 (en) Method and apparatus for controlling bitrate of scalable video stream
DE102016125353A1 (de) Kodierratensteuerung von echtzeitvideos unter verwendung einer dynamischen auflösungsumschaltung
Wang et al. SSIM-motivated two-pass VBR coding for HEVC
EP1921863A2 (de) Kodierer
EP2047685A2 (de) Feinkörnige skalierbare bitcodierung und decodierung
DE60312960T2 (de) Kodierungsverfahren und Dekodierungsverfahren für bewegliche Bilder
DE102019103346A1 (de) Ssim-basierte rate-distortion-optimierung für eine verbesserte wahrnehmbare qualität bei videos
DE60212401T2 (de) Übertragungssteuerung in einem hybriden zeitlich - snr feingranularskalierbaren videokodierungsverfahren
DE102019215911A1 (de) Adaptive inhaltsquantisierung zur videocodierung
Mansour et al. Rate and distortion modeling of CGS coded scalable video content
CN117956160A (zh) 码率控制方法、码率控制装置以及计算机存储介质

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee