DE60123596T2 - Verfahren zur Komprimierung einer Baumhierarchie, zugehöriges Signal und Verfahren zur Dekodierung eines Signals - Google Patents

Verfahren zur Komprimierung einer Baumhierarchie, zugehöriges Signal und Verfahren zur Dekodierung eines Signals Download PDF

Info

Publication number
DE60123596T2
DE60123596T2 DE60123596T DE60123596T DE60123596T2 DE 60123596 T2 DE60123596 T2 DE 60123596T2 DE 60123596 T DE60123596 T DE 60123596T DE 60123596 T DE60123596 T DE 60123596T DE 60123596 T2 DE60123596 T2 DE 60123596T2
Authority
DE
Germany
Prior art keywords
tree
compression coding
data
context
subtree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60123596T
Other languages
English (en)
Other versions
DE60123596D1 (de
Inventor
Cyril Concolato
Claude Seyrat
Gregoire Pau
Cedric Thienot
Alexandre Cotarmanac'h
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Groupe Des Ecoles De Telecommunications-Etablissement Enst De Bretagne
GROUPE ECOLES TELECOMM
Orange SA
Expway SA
Original Assignee
Groupe Des Ecoles De Telecommunications-Etablissement Enst De Bretagne
GROUPE ECOLES TELECOMM
France Telecom SA
Expway SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Groupe Des Ecoles De Telecommunications-Etablissement Enst De Bretagne, GROUPE ECOLES TELECOMM, France Telecom SA, Expway SA filed Critical Groupe Des Ecoles De Telecommunications-Etablissement Enst De Bretagne
Application granted granted Critical
Publication of DE60123596D1 publication Critical patent/DE60123596D1/de
Publication of DE60123596T2 publication Critical patent/DE60123596T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Document Processing Apparatus (AREA)
  • Error Detection And Correction (AREA)

Description

  • Das Gebiet der Erfindung ist das der Kompression von Daten. Genauer gesagt, die Erfindung bezieht sich auf das Komprimieren von auf XML („eXtended Markup Language") basierenden Dokumenten.
  • Die Erfindung findet Anwendung insbesondere, aber nicht ausschließlich, in den folgenden Bereichen:
    • – Multimedia-Anwendungen;
    • – Indexierungs-Werkzeugen;
    • – Metadatenmanipulations-Werkzeugen;
    • – MEPG-7 Spezifikation (siehe vor allem NACK et al. "Everything you wanted to know about MPG-7: Part 2" IEEE Multimedia, IEEE Computer Society, US, Vol. 6, No. 4, Oktober 1999, Seiten 64–73).
    • – SMIL;
    • – TV-Anytime;
    • – der dritten Generation von Funkkommunikationen (3GPP).
  • Kompressionstechniken des Standes der Technik für XML weisen mehrere Nachteile auf. Insbesondere unterstützen sie nicht gleichzeitig einen schnellen Zugriff auf Daten, hohe Kompressionsraten und einen progressiven Aufbau des Dokuments. Mit anderen Worten, die meiste Zeit, wenn eines der oben genannten Merkmale unterstützt wird, fehlen alle anderen Merkmale.
  • Eine der Kompressionstechniken des Standes der Technik ist als BiM (Binary MPEG) bekannt und ist vor allem in dem Text von ISO/IEC FCD 15938-1 Information Technology Multimedia Content Description Interface – Part 1 Systems" „ISO/IEC" JTC1/SC 29/WG11 "MPEG" 01/N4001, März 2001, beschrieben. Eine solche Technik stellt ein Verfahren zum Komprimieren eines XML-Dokuments durch Binarisieren der Struktur des Dokuments bereit, dass heißt, der Knoten der mit dem XML-Dokument verknüpften Baumstruktur. Daher ist die beim Ausführen der BiM-Technik erreichte Kompressionsrate sehr schlecht, obwohl die BiM-Technik einen schnellen Zugriff auf Daten, eine progressive Konstruktion des Dokuments und Überspringbarkeit erlaubt. Liefke et al. in „XMILL: An efficient compressor for XML Data", (Sigmod Record, Association for Computing Machinery, New York, US, Vol. 29, No. 2, Juni 2000, Seiten 153–164) haben ebenfalls ein Verfahren zum Komprimieren von Daten in einem XML-Baum beschrieben. Ein Nachteil dieser Technik ist, dass diese es nicht erlaubt, einen Unterbaum zu identifizieren, eine spezifische Kompressionskodiertechnik einem Datentyp des identifizierten Unterbaums zuzuordnen, und diese Kompressionskodiertechnik nur für die Blätter des Unterbaums durchzuführen, deren Daten von dem mit der Kompressionskodiertechnik verknüpften Typ sind.
  • Es ist eine Aufgabe der Erfindung, die Nachteile der Techniken des Standes zu kompensieren.
  • Genauer gesagt, die Erfindung zielt auf ein Bereitstellen einer effizienten Kompressionstechnik für auf XML basierende Dokumente ab.
  • Die Erfindung zielt auch auf ein Bereitstellen einer Kompressionstechnik für XML ab, welche Überspringbarkeit, hohe Kompressionsraten und eine progressive Konstruktion von Dokumenten bereitstellt.
  • Die Erfindung zielt auch auf ein effizientes Komprimieren von MPEG-7 Deskriptoren ab.
  • Eine weitere Aufgabe der Erfindung ist es, ein Verfahren zum Komprimieren eines XML-Dokuments zu implementieren, welches die durch eine Technik vom BiM-Typ bereitgestellte Kompressionsrate stark verbessert, welches aber die gleichen Funktionalitäten wie BiM bereitstellt.
  • Die oben erwähnten Aufgaben der Erfindung und auch weitere Aufgaben der Erfindung, die später erscheinen werden, werden gemäß der Erfindung gelöst mittels eines Verfahrens zum Komprimieren eines ein Multimedia-Signal beschreibenden hierarchischen Baums, wobei der Baum Knoten und Blätter aufweist, welche mit Inhalten zumindest zweier verschiedener Typen verknüpft werden können, wobei das Verfahren eine Inhaltskompression zumindest einiger der Blätter mittels zumindest zweier Kompressionskodiertechniken durchführt, wobei jede der Techniken selektiv mit zumindest einem der Inhaltstypen verknüpft ist.
  • Gemäß einem bevorzugten Ausführungsbeispiel der Erfindung umfasst ein solches Verfahren einen Schritt des Identifizierens zumindest eines Unterbaums und einen Schritt des Zuordnens einer der Kompressionskodiertechniken zu dem Unterbaum.
  • Vorteilhafter Weise umfasst ein solches Verfahren einen Schritt des Durchführens der dem Unterbaum zugeordneten Kompressionskodiertechnik nur für diejenigen Blätter des Unterbaums, deren Inhalt von dem mit der Kompressionskodiertechnik verknüpften Typ ist, und die anderen Blätter des Unterbaums werden keiner Kompressionskodierung unterzogen.
  • Gemäß einem vorteilhaften Merkmal der Erfindung führt ein solches Verfahren eine parametrische Beschreibung der Kompressionskodiertechniken durch.
  • Vorzugsweise umfasst ein solches Verfahren auch einen Schritt des Komprimierens der Struktur des Baums.
  • Vorteilhafter Weise ist der Baum vom BiM-Typ gemäß des MPEG7-Standards.
  • Vorzugsweise führt eine der Kompressionskodiertechniken eine lineare Quantisierung durch.
  • Vorteilhafter Weise führt eine der Kompressionskodiertechniken einen statistischen Kompressionsalgorithmus aus.
  • Vorzugsweise ist der Algorithmus vom GZip-Typ.
  • Vorteilhafter Weise wird der Algorithmus gleichzeitig für eine Gruppe von Daten ausgeführt, die dem Inhalt von zumindest zwei Blättern entsprechen.
  • Vorzugsweise repräsentiert der Baum die Struktur eines Dokuments vom XML (Extended markup language)-Typ.
  • Die Erfindung betrifft auch ein Verfahren zum Dekodieren eines Multimediasignals, das gemäß dem oben genannten Verfahren zum Komprimieren eines hierarchischen Baums komprimiert ist.
  • Vorteilhafter Weise führt ein solches Verfahren einen Schritt des Auffrischens eines vorliegenden Dekodierungskontexts gemäß einer durch das Signal übermittelten Kodierkontextinformation durch.
  • Vorzugsweise definiert der vorliegende Kontext zumindest einen Inhaltstyp, wobei das Verfahren einen Schritt des Implementierens einer mit dem Inhaltstyp verknüpften Kompressionskodiertechnik für die Blätter, die einen Inhalt des Inhaltstyps aufweisen.
  • Die Erfindung betrifft auch ein Signal, das durch das oben beschriebene Verfahren zum Komprimieren eines hierarchischen Baums erzeugt ist.
  • Andere Merkmale und Bestandteile der Erfindung werden deutlicher im Lichte der nachfolgenden Beschreibung, die als ein rein veranschaulichendes aber nicht einschränkendes Beispiel gegeben ist, und der folgenden Figuren erscheinen:
  • 1 veranschaulicht das Konzept eines Kodierkontexts;
  • 2 beschreibt die Struktur eines gemäß der BiM-Technik kodierten Elements;
  • 3 veranschaulicht einige der Schritte, die gemäß der Erfindung zum Komprimieren des Inhalts der Blätter eines hierarchischen Baums durchgeführt werden.
  • Vor einer detaillierten Beschreibung, wie die Erfindung zu implementieren ist, werden wir zuerst an die Hauptmerkmale der Kompressionstechnik des Standes der Technik, bekannt als die BiM-Technik, erinnern.
  • Um das Verstehen des Dokuments zu erleichtern, wurden einige Quellenangaben im Anhang 9 erfasst, und es wird überall im Dokument auf diese Bezug genommen.
  • Alle mit diesem Dokument bereitgestellten Anhänge sind Bestandteile der vorliegenden Beschreibung der Erfindung.
  • 1. Stand der Technik
  • Einführung
  • Ein in 1 veranschaulichter Kodierkontext ist eine Gruppe von Dekodierinformationen, die während einer Dekodierung des Bitstroms benötigt wird. Ein Kodierkontext ist auf den gesamten Unterbaum des Knotens, in dem dieser definiert ist, anwendbar. An jedem der Knoten des Baums kann der Kodierkontext modifiziert werden; wobei das zu der Erstellung eines neuen Kodierkontexts führt, der auf den entsprechenden Unterbaum anwendbar ist.
  • Ein Kontext kann mehrere Informationen führen, die auf den betroffenen Unterbaum anwendbare Merkmale vorschreiben. Gegenwärtig sind diese Merkmale in dem BiM-Unterbaum-Kodierformat [1] Überspringbarkeit eines Unterbaums/Kontexts und Mehrfachschemakodierung eines Unterbaums/Kontexts (um das Rückwärts- und Vorwärts-Kompatibilitätsmerkmal bereitzustellen). Schließlich kann der Kontextmechanismus in jedem Unterbaum deaktiviert werden, um Bandbreite einzusparen; dieses ist der kontexteingefrorene Modus.
  • Der Kodierkontextmechanismus stellt maximale Flexibilität in jedem Unterbaum eines Dokumentbaums bereit und erlaubt den Einbau erweiterbarer Merkmale, in den BiM-Kodiermechanismus.
  • Wir präsentieren nun den gegenwärtigen, in BiM verwendeten Kontextmechanismus.
  • Gegenwärtiger Kodierkontextmechanismus
  • Definitionen
  • Kodierkontext (CodingContext)
  • Ein Kodierkontext (codingContext) ist eine Gruppe von Informationen, die kontextuellen Informationen, die von dem Dekodierer benötigt werden, um den Bitstrom zu dekodieren. Ein codingContext ist auf den Knoten, in dem er definiert worden ist, und auf den gesamten Unterbaum, der diesem Knoten entspricht, anwendbar.
  • Der gegenwärtige codingContext (d.h. der an einem spezifizierten Knoten einer Beschreibung anwendbarer Kontext) kann innerhalb des Dokuments modifiziert werden (das heißt, eine Modifikation der ihm unterliegenden Gruppe von Informationen). Jede Modifikation eines codingContext führt zu der Erstellung eines neuen codingContext, der die modifizierte Gruppe von Informationen führt. Es wird für alle codingContexts erwartet, das diese gestapelt werden, um diese zurückzuerhalten, wenn der Dekodierer ein Dekodieren eines einem Unterbaum entsprechenden Kontexts abgeschlossen hat.
  • Dekodierer (Decoder)
  • Der BiM decoder besteht aus zwei Dekodierern:
    • – dem Kontextdekodierer; dieser Dekodierer ist dafür bestimmt, die kontextuelle Information zu dekodieren. Wie zuvor erläutert, stellt die kontextuelle Information keinen Bestandteil der Beschreibung dar. Diese ist eine Gruppe von Informationen, die einige externe Merkmale, Rückwärts- und Vorwärts-Kompatibilität, schnelles Überspringen usw. führt.
    • – dem Elementdekodierer; dieser Dekodierer ist der BiM-Reguläre [1] und ist dafür bestimmt, die Elementinformationen zu dekodieren.
  • Chunks
  • Jedes Element einer Beschreibung wird als das in 2 veranschaulichte 3-plett kodiert, wobei der Kopfteil aus zwei Chunks konstituiert ist, deren Größen Null (nil) sein können:
    • – MC ist der Metakontext-Chunk;
    • – C ist der Kontext-Chunk;
    • – Element ist der Element-Chunk, welcher der reguläre Elementkodier-Chunk ist, siehe [1].
  • Der MC-Metakontext-Chunk enthält die von dem Dekodierer benötigte Information, um den darauffolgenden C-Chunk zu dekodieren. Das heißt, dass der MC-Chunk der Kontext-Chunk des C-Kontext-Chunks ist.
  • Der C-Kontext-Chunk enthält die Information, die in der Lage ist, die gegenwärtige Kodierkontext-Gruppe von Informationen zu ändern, und die von dem Dekodierer benötigt wird, um den darauffolgenden Element-Chunk zu dekodieren. Das heißt, dass der C-Chunk der Kontext-Chunk des Element-Chunks ist.
  • Gruppe von Informationen
  • Der gegenwärtige BiM-Kodierkontext führt eine Gruppe von Informationen, die kontextuellen Informationen, die in die zwei folgenden Hauptklassen unterteilt werden können:
    • – den Metakontext-Abschnitt, falls die in diesem Abschnitt enthaltene Information nur den Kontextdekodierungsprozess beeinflusst
    • – den Kontext-Abschnitt, falls die in diesem Abschnitt enthaltene Information nur den Elementdekodierungsprozess beeinflusst
  • Die gegenwärtige Gruppe von Informationen wird durch die folgende Gruppe von Variablen gebildet:
  • Figure 00080001
  • Die definierten Klassen kodieren exakt die oben beschriebenen Chunks (den MC-Metakontext-Chunk und den C-Kontext-Chunk).
  • Metakontext-Chunk
  • Definition
  • Der MC-Metakontext-Chunk, dessen Größe Null sein kann, enthält Informationen, um zu wissen, ob der Dekodierer den nächsten C-Kontext-Chunk, dem in der drauffolgenden Abschnitt beschreiben ist, lesen muss.
  • Involvierten Variablen
    Figure 00090001
  • Vorgegebene Werte
  • Der vorgegebene Wert von freezing_state ist false; das heißt, dass bei einer Vorgabe der Wurzelkontext dynamisch verändert werden kann.
  • Ausbreitungsregeln
  • Bei der Erstellung eines neuen Kontexts:
    • – wird der Wert von freezing_state auf den Wert von freezing_state seines Vaterkontexts gesetzt.
  • Dynamische Modifikationsregeln
  • An jedem Knoten einer Beschreibung und um einen neuen Kontext zu erstellen:
    • – kann der Wert von freezing_state von dem Wert false auf den Wert true geschaltet werden.
  • Dekodierungsregeln
  • Falls der Wert von freezing_state true ist, wird der MC-Metakontext-Chunk (und der anstehende C-Kontext-Chunk) nicht in den Bitstrom reinkodiert. Sonst wird der MC-Metakontext-Chunk-Teil des Kopfs wie folgt kodiert:
  • Figure 00100001
  • Der context_chunk ist eine lokale Variable, die mit false initiiert ist.
  • Figure 00100002
  • Figure 00110001
  • Wie in dem voranstehenden Abschnitt angegeben, impliziert die Modifikation der Variablen des aktuellen Kontexts die Erstellung eines neuen Kontexts.
  • Einfluss auf den Kontextdekodierungsprozess
  • Falls der Wert von context_chunk true ist, muss der Dekoder den darauffolgenden C-Kontext-Chunk lesen.
  • Kontext-Chunk
  • Definition
  • Der C-Kontext-Chunk, dessen Größe Null sein kann, enthält eine Gruppe von Informationen, die es erlauben, die gegenwärtigen Kontextvariablen dynamisch zu ändern. Diese Variablen werden als Kodiereigenschaften (codingProperties) bezeichnet, da diese den BiM-Element-Dekodierungsprozess beeinflussen.
  • Involvierte Kodiereigenschaften
    Figure 00110002
  • Figure 00120001
  • Vorgegebene Werte
  • Die Variable allows_skip wird am Anfang des Bitstroms durch die ersten zwei Bits des speziellen 4-Bit-Bitfelds so initialisiert, wie es in dem FCD-System-Dokument [1] definiert ist.
  • Die Variable allows_partial_instantiation wird am Anfang des Bitstroms durch die dritten zwei Bits des speziellen 4-Bit-Bitfelds initialisiert.
  • Die Variable allows_subtyping wird am Anfang des Bitstroms durch die vierten zwei Bits des speziellen 4-Bit-Bitfelds initialisiert.
  • Der vorgegebene Wert von schema_mode ist mono; das heißt, dass bei einer Vorgabe der Unterbaum/Kontext der Wurzel mit einem Schema kodiert wird.
  • Ausbreitungsregeln
  • Bei der Erstellung eines neuen Kontexts:
    • – der Wert von allows_skip wird auf den Wert von allows_skip seines Vaterkontexts gesetzt
    • – der Wert von allows_partial_instantiation wird auf den Wert seines Vaterkontexts gesetzt
    • – der Wert von allows_subtyping wird auf den Wert seines Vaterkontexts gesetzt
    • – der Wert von schema_mode wird auf seinen vorgegebenen Wert gesetzt
  • Dynamische Modifikationsregeln
  • An jedem Knoten einer Beschreibung und um einen neuen Kontext zu erstellen:
    • – kann allows_skip dynamisch modifiziert werden
    • – kann allows_partial_instantiation nicht dynamisch modifiziert werden
    • – kann allows_subtyping nicht dynamisch modifiziert werden
    • – kann schema_mode dynamisch modifiziert werden
  • Dekodierungsregeln
  • Der C-Kontext-Chunk liegt nur dann vor, falls der MC-Metakontext-Chunk bereits vorliegt und seine vorherige lokale Variable context_chunk den Wert true hat.
  • Die dynamische Modifikation des gegenwärtigen Kontexts wird mit einem XML-Element beschrieben, das mit dem regulären BiM-Kodierschema kodiert wird. Es wird das globale Element modifyContext aus dem BiM-Schema verwendet. Das http://www.mpeg7.org/2001/BiMCoding-Kodierschema wird im Anhang 1 beschrieben.
  • Der C-Kontext-Chunk muss mit dem regulären BiM-Schema, mit dem obigen Schema, dekodiert werden.
  • Wie zuvor dargestellt, impliziert die Modifikation der gegenwärtigen codingProperties in dem Kontext die Erstellung eines neuen Kontexts. Daher impliziert das Vorliegen des C-Kontext-Chunks die Erstellung eines neuen Kontexts, der die modifizierten codingProperties führen wird.
  • Falls das Element allowsSkip innerhalb des Elements modifyContext instanziiert wird, so wird der Wert von allows_skip in dem neuen Kontext aktualisiert.
  • Falls das Element schema_mode innerhalb des Elements modifyContext instanziiert wird, so wird der Wert von schema_mode in dem neuen Kontext aktualisiert.
  • Einfluss auf dem Elementdekodierungsprozess
  • Die Werte von allows_skip und schema_mode beeinflussen den Elementdekodierungsprozess, wenn das Überspringmerkmal behandelt wird. Dieses Verhalten wird in [1] beschrieben.
  • Der Wert von schema_mode beeinflusst den Elementdekodierungsprozess, um zu wissen, ob das Element mit nur einem Schema oder mehreren Schemen kodiert ist. Dieser Mechanismus wird in [1] beschrieben.
  • Der Wert von allows_partial_instantiation beeinflusst den Elementdekodierungsprozess durch Hinzufügen eines speziellen Typs, des partiallyInstantiated-Typs, zu den möglichen Untertypen des Elements. Siehe [1].
  • Der Wert von allows_subtyping beeinflusst den Elementdekodierungsprozess und erlaubt einem Element oder einem Attribut im Falle eines Element-Polymorphismus (mit dem Attribut von xsi:Typ (xsi:type)) oder einer -Vereinigung, verschiedene mögliche Typen zu haben. Siehe [1].
  • 2. Beschreibung der Erfindung
  • 2.1 Erweiterung des Kontextmechanismus, um ein Rahmenwerk für eine Blattkompression bereitzustellen
  • Die Erfindung schlägt vor, den gegenwärtigen BiM-Kontextmechanismus zu erweitern, um ein neues und interessantes Merkmal zu unterstützen: das Verwenden von lokalen Kompressoren zum Komprimieren von Blättern eines Dokuments, um die Größe des sich ergebenden Bitstroms zu reduzieren.
  • Dieser Abschnitt beschreibt, wie der gegenwärtige BiM-Kontextmechanismus zu erweitern ist, um das Verwenden von lokalen Kompressoren zu unterstützen. Das ist typischer Weise eine neue Gruppe von Variablen, codingProperties, die mit spezifischen Semantik-, Ausbreitungs- und Kodier-Regeln verknüpft ist. Daher erweitert diese neue Gruppe der codingProperties den gegenwärtigen Kontext-Chunk.
  • Einführung
  • In einem Unterbaum können alle Instanzen eines oder mehrerer spezifizierter einfacher Typen mit einem oder mehreren spezifizierten Kompressoren komprimiert werden. Grundsätzlich definiert dies ein Abbilden zwischen einem Kompressor und einem oder mehreren einfachen Typen.
  • Außerdem:
    • – kann in einigen Fällen ein Kompressor einige externe Parameter benötigen
    • – kann ein Abbilden aktiviert/deaktiviert werden, um einen Kompressor in einigen Unterbäumen zu verwenden, aber nicht in anderen
  • Schließlich sollte ein Abbilden, um aktiviert/deaktiviert zu werden, verweisbar sein und daher eine eindeutige Identifizierung in einem Kontext aufweisen.
  • Daher kann jeder Kontext null, einen oder mehrere codecTypeMapper führen; wobei ein codecTypeMapper ein 4-plet ist, das aus einer Identifizierung, einem oder mehreren einfachen Typen, einem Codec, optionalen externen Codec-Parametern und einem Aktivierungszustand besteht.
  • Definitionen
  • CodecTypeMapper
  • Ein codecTypeMapper ist ein 4-plet bestehend aus:
    • – einer Identifizierung, die als ein eindeutiger Verweis-Schlüssel in einem Unterbaum/Kontext verwendet wird
    • – einem oder mehreren einfachen Typen, auf die das Abbilden anwendbar ist
    • – einem Codec
    • – optionalen externen Codec-Parametern (sind von dem Codec abhängig)
    • – einem Aktivierungszustand
  • Identifizierung
  • Die Identifizierung ist eine eindeutige Nummer, die ein Abbilden innerhalb eines Kontexts auf eine unzweideutige Weise identifiziert. Das BiM-Kodierschema schränkt die maximale Anzahl von codecTypeMappern in einem Kontext auf 32 ein.
  • Einfacher Typ
  • Alle in einem Schema definierten einfachen Typen können a priori durch jeden Codec kodiert werden, aber jeder Codec kann diese Auswahl einschränken. Zum Beispiel kann ein linearer Quantisierer, so wie im Dokument nachstehend definiert, nur mit numerischen einfachen Typen verwendet werden.
  • Ein einfacher Typ wird durch seinen Namen und die URL des zugehörigen Schemas identifiziert. Es sollten Präfixe des XML-Schemas verwendet werden, um auf das korrekte Schema hinzuweisen. Das BiM-Kodierschema definiert einen speziellen Typ, um dieses Paar zu kodieren; dieser Typ sollte als ein Paar von ganzen Zahlen kodiert werden; die erste ganze Zahl ist auf die gegenwärtige Anzahl von bekannten Schemata eingeschränkt (dieser Teil der Information kann in dem DecoderConfig-Teil [1] abgerufen werden) und die zweite ganze Zahl ist auf die Anzahl von globalen einfachen Typen eingeschränkt, die in dem entsprechenden Schema vorliegen.
  • Codec
  • Ein codec, was für Kompressor/Dekompressor steht, ist ein Modul, das Eingangsbits aufnimmt und Ausgangsbits schreibt. Es kann einige optionale externe Parameter benötigen.
  • Ein Codec wird durch einen Namen unter den Namen von nicht-abstrakten, in dem BiM-Kodierschema definierten Codecs identifiziert. Das in dem obigen Abschnitt definierte gegenwärtige BiM-Kodierschema definiert keinen nicht-abstrakten Codec, dieses tut aber der §2.2 des vorliegenden Dokuments.
  • Aktivierungszustand
  • Der Aktivierungszustand ist eine boolesche Kennung.
  • Semantische Regeln
  • CodecTypeMapper
  • Jeder Kontext:
    • – kann null, einen oder mehrere codecTypeMappers führen
    • – kann einen oder mehrere codecTypeMappers definieren
    • – kann einen oder mehrere bestehende codecTypeMapper aktivieren oder deaktivieren
  • Falls ein codecTypeMapper in einem Kontext definiert ist, verbleibt dieser in allen seinen Unterkontexten.
  • Ein bestehender codecTypeMapper kann innerhalb eines Kontexts weder gelöscht noch modifiziert werden (mit Ausnahme seines Aktivierungszustands).
  • Identifizierung
  • Die Identifizierung einer Abbildung muss unter allen codecTypeMappern eines Kontexts eindeutig sein.
  • Einfacher Typ
  • Wenn Sie in einem codecTypeMapper einen oder mehrere einfache Typen und einen Codec verknüpfen, so wird der Codec die einfachen Typen selbst und alle von diesen abgeleiteten einfachen Typen kodieren/dekodieren.
  • In einem Kontext darf höchstens ein einfacher Typ vorhanden sein, der mit einem Codec anwendbar ist.
  • Codec
  • Es gibt zwei Typen von Codecs: speicherlose Codecs und kontextuelle Codecs.
  • Ein speicherloser Codec ist ein Modul, das immer die gleichen Eingangsbytes in die gleichen Ausgangsbytes kodiert; unabhängig von der Historie des Codec. Ein typischer speicherloser Codec ist eine linearer Quantifizierer. Die BiM-Blatt-Kompression (siehe §2.2 des vorliegenden Dokuments) beschreibt einen solchen Codec.
  • Ein kontextueller Codec ist ein Modul, das die vorherigen, in diesen eingespeisten Bytes verwendet (somit den Kontext des Codec ändernd). Ein solcher Codec erzeugt nicht die gleichen Ausgangsbytes für die gleichen Eingangsbytes, die er empfängt. Ein typischer kontextueller Codec ist ein Zip-ähnlicher lokaler Codec, der im §2.2 des vorliegenden Dokuments beschrieben ist.
  • Ein speicherloser Codec führt zu keinen Problemen in der gegenwärtigen Kontextarchitektur, was aber ein kontextueller Codec im Falle eines überspringbaren Unterbaums tut. In solchen Fällen wird ein kontextueller Codec zurückgesetzt, um den Dekodierer nicht zu verwirren, wenn dieser vorher den Unterbaum übersprungen hat.
  • Aktivierungszustand
  • In jedem Unterbaum/Kontext kann ein codecTypeMapper aktiviert oder deaktiviert sein.
  • Dieser Mechanismus erlaubt es, einen codecTypeMapper in einer höheren Ebene des Dokumentenbaums zu definieren und diesen nur in den Unterbäumen zu aktivieren, in denen dieser verwendet wird, ohne den codecTypeMapper neu zu definieren.
  • Eine neue Kodiereigenschaft (codingProperty): codecTypeMapper
  • In diesem Teil fügen wir eine neue codingProperty zu der vorherigen Gruppe von Variablen des Kontextabschnitts hinzu, die vorher beschrieben wurde. Diese neue codingProperty wird als codecTypeMapper bezeichnet und ist eine Liste der vorherigen codecTypeMapper, die in dem vorherigen Abschnitt beschrieben wurden.
  • Neu involvierte codingProperty
  • Der Kontext führt eine Liste von codecTypeMapper:
  • Figure 00190001
  • Figure 00200001
  • Neue vorgegebene Werte
  • Es ist vorgegeben, dass es keinen codecTypeMapper in einem Unterbaum/Kontext gibt.
  • Falls ein codecTypeMapper innerhalb eines Kontexts definiert ist, müssen seine Identifizierungen, Codec und ein Wert von simple_type definiert sein. Falls diese nicht spezifiziert sind, wird der Zustand der Aktivierung eines neu definierten codecTypeMapper durch Vorgabe auf true gesetzt; das heißt, dass ein neu definierter codecTypeMapper als Vorgabe aktiviert wird.
  • Neue Ausbreitungsregeln
  • Regel 1: Bei der Erstellung eines neuen Kontexts ist die codedTypeMapper-Liste die Kopie ihres Vaterkontexts:
    • – der Wert der Identifizierung wird kopiert
    • – der Wert von simple_type wird kopiert
    • – der Codec-Wert wird gemäß der Regel 2 kopiert
    • – der Werte von codec_parameters werden kopiert
    • – der activation_state wird kopiert
  • Regel 2: Der Codec-Wert wird kopiert und
    falls:
    • – der Codec des Vaters codingProperty[i].codec ein kontextueller Codec ist
    • – und falls der gegenwärtige Kontext überspringbar ist
  • Dann
    wird von dem Dekodierer erwartet, eine neue Instanz des Kodex durch ein Kopieren der Instanz des Codecs des Vaters (nicht nur seines Werts) zu erstellen und diese zurückzusetzen.
  • Zum Beispiel würde ein ZLib-Codec kopiert und re-initialisiert werden, wenn ein übersprigngbarer Knoten betreten wird.
  • Neue dynamische Modifikationsregeln
  • Die Liste von codecTypeMapper kann innerhalb der Beschreibung dynamisch modifiziert werden:
    • – ein neuer codecTypeMapper kann definiert werden
    • – der activation_state eines bestehenden (somit verweisbaren) codecTypeMapper kann dynamisch modifiziert werden
  • Ein bestehender codecTypeMapper kann nicht gelöscht werden und seine Bestandteile können nicht dynamisch modifiziert werden (mit Ausnahme seines activation_state).
  • Neue Dekodierungsregeln
  • Die gleichen vorher genannten Regeln werden auf die Dekodierung eines C-Kontext-Chunks angewandt, dabei soll aber das neue, im Anhang 2 beschriebene Schema verwendet werden, um die neue dynamische Modifikationsfunktionalitäten des codecTypeMappers hinzuzufügen.
  • Informativer Teil
  • Beispiele
  • Das im Anhang 3 veranschaulichten Beispiel stellt die Definition eines aktivierten linearen Quantisierers (siehe §2.2 des vorliegenden Dokuments) in einer Beschreibung vor.
  • Das im Anhang 4 veranschaulichte Beispiel stellt die Definition eines deaktivierten linearen Quantisierers in einer Beschreibung vor.
  • 2.2 BiM-Blattkompression
  • Wir stellen nun den Mechanismus vor, der durch die Erfindung implementiert wird, um Daten mit verschiedenen Codecs zu kodieren. Genauer gesagt, veranschaulichen wir nun zwei Beispiele, eines, in dem ein linearer Quantisierungs-Codec verwendet wird, um beispielsweise Gleitkommawerte zu komprimieren, und das andere, in dem ein gzip-Codec verwendet wird, um beispielsweise Zeichenkettenwerte zu komprimieren.
  • Ein solcher Mechanismus ist eng mit dem Kodierkontext verwandt und erlaubt das Verwenden von mehreren anderen Typen des Codecs. Ferner erlaubt er, mit Merkmalen eines Kodierkontexts, zum Beispiel überspringbaren Unterbäumen, richtig zu handeln. Schließlich erlaubt er eine Wiederverwendung von Codecs in verschiedenen Kodierkontexten.
  • Einführung
  • Die BiM-Unterbaum-Kodierung [1] komprimiert nicht die Datenblätter einer Beschreibung. Gegenwärtig werden Werte von Blättern in Bezug auf deren Typen (IEEE 754 Floats und Doubles, UFT-Zeichenketten ...) kodiert.
  • In vielen Fällen kann es sinnvoll sein, einige klassische Kompressionstechniken wie lineare Quantisierung oder statistische Kompression zu verwenden, um die Kompressionsrate von BiM zu verbessern, ohne dabei seine Hauptmerkmale (datenstromlinienweise Syntaxanalyse, Merkmal des schnellen Überspringens, typenbezogene Dekodierung) zu verlieren.
  • Dieses Dokument stellt vor, wie eine Datenblattkompression eines Dokuments innerhalb des im §2.1 beschriebenen Kontextkodiermechanismus vollbracht werden kann, um bessere Kompressionsraten zu erreichen.
  • 2.2.1 Lineare Quantisierung
  • Definition
  • Lineare Quantisierung ist ein üblicher und verlustreicher Weg, um die Größe von kodierten Zahlen in dem Bitstrom zu reduzieren, wenn die Quelle der Information bekannt ist und folglich wenn Verluste gesteuert werden können.
  • Die Hülle eines abgetasteten Audiosignals, als ein Beispiel, ist oft mit einer präzisen Bitgrößen-Quantisierung bekannt, und diese Technik kann nutzbringend für eine Kodierung von MPEG-7-Audiobeschreibungen verwendet werden.
  • Falls ν eine ganze Zahl ist, kann diese mit νq mit nbits Bits kodiert werden, wobei:
    Figure 00240001
    wobei:
    • – νq der quantisierte, kodierte Wert von ν ist
    • – nbits die benötigte Präzision in Bits ist
    • – νmin der minimale einschließende Wert ist, den ν erreichen kann
    • – νmax der maximale einschließende Wert ist, den ν erreichen kann
  • Und der dekodierte Wert von ν ist v, mit:
    Figure 00240002
    wobei:
    • v der dekodierte, angenäherte Wert von ν ist
  • Integration mit dem Kontextmechanismus: der LinearQuantizerCodec
  • Lineare Quantisierung kann als ein Codec, wie in dem im §2.1 des vorliegenden Dokuments beschriebenen Kodierkontextmechanismus definiert, verwendet werden. Mit diesem Mechanismus kann eine lineare Quantisierung auf numerische Datenblätter von einem gewünschten einfachen Typ in jedem Unterbaum einer Beschreibung angewandt werden.
  • Der auf eine solche Art und Weise verwendete, mit dem linearen Quantisierungs-Codec verknüpfte Kodierkontextmechanismus agiert als der in MPEG-4 BIFS [3] verwendete QuantizationParameter-Knoten.
  • Einschränkung auf anwendbare einfache Typen
  • Gemäß der Definition eines Codec im §2.1 des vorliegenden Dokuments ist der Codec ein speicherloser Codec, der auf jeden der einfachen numerischen Typen einer Ordnung oder Nicht-Ordnung angewandt werden kann; dessen primitiver Typ eines XML-Schemas ein Float, Double oder eine dezimale Zahl ist.
  • Externe Parameter eines Codec
  • Der lineare Quantisierungs-Codec benötigt die folgenden 3 zwingend notwendigen Parameter:
    • – bitSize; die oben beschriebene Variable nbits
    • – minInclusive; die oben beschriebene Variable νmin
    • – maxInclusive; die oben beschriebene Variable νmax
  • Schemadefinition des Codec
  • Der lineare Quantisierugs-Codec ist ein neuer Codec vom Typ LinearQuantizerCodecType, der auf dem abstrakten Typ CodecType (siehe §2.1) basiert und das durch das im Anhang 5 vorgestellte Schema definiert ist, in dem Kodierkontext-Namensraum URL xmlns:cc=http://www.mpeg7.org/2001/BiMCoding.
  • Kodierung (informativ)
  • Ein numerisches Datenblatt vom Wert ν wird mit der vorzeichenlosen ganzen Zahl νq auf nbits Bits kodiert, wobei:
  • Figure 00260001
  • Dekodierung
  • Die vorzeichenlose ganze Zahl νq, die auf nbits Bits kodiert ist, sollte als ν dekodiert werden, wobei:
  • Figure 00260002
  • Beispiel (informativ)
  • Das im Anhang 6 veranschaulichte Beispiel stellt die Definition eines linearen Quantisierers in einer Beschreibung dar.
  • 2.2.2 Statistische Kompression
  • Klassische verlustfreie Kompressionsalgorithmen können als Codecs verwendet werden, wie in dem Kodierkontextmechanismus (siehe §2.1) definiert. Mit diesem Mechanismus können Datenblätter eines gewünschten einfachen Typs effizient im beliebigen Unterbaum einer Beschreibung komprimiert werden.
  • Dieser Codec ist für eine signifikante Reduzierung der Größe des Bitstroms nützlich, insbesondere, wenn die Beschreibung viele sich wiederholende oder ähnliche Zeichenketten enthält.
  • Definition
  • Klassische verlustfreie Kompressionsalgorithmen (wie Zip oder GZip) können im BiM verwendet werden, um beliebige Blätter einer Beschreibung zu komprimieren.
  • In den meisten Fällen jedoch, wenn Datenblätter kurze Zeichenketten sind, die weniger als 10 Zeichen enthalten, führt dieser zu schwachen Leistungen, da ge wöhnliche statistische Kompressionsalgorithmen einen größeren vorausschauenden Puffer benötigen.
  • Um eine optimale Kompressionsrate zu erreichen, müssen die Blätter eines Dokuments, bevor sie komprimiert werden, in einem kleinen Puffer gepuffert werden. Der nachfolgende Abschnitt definiert einen solchen gepufferten statistischen Kodierer, der auf einen zugrunde liegenden verlustfreien statistischen Kompressionsalgorithmus gestützt ist.
  • Definitionen eines gepufferten statistischen Kodierers
  • Ein gepufferter statistischer Kodierer stützt sich auf einem zugrunde liegenden statistischen Kodierer, der die folgenden generischen primitiven Verfahren enthalten sollte:
    • – initialize_stream(); das einen Komprimier- oder einen Dekomprimier-Strom initialisiert
    • – reset_model(); das das gegenwärtige statistische Model des Kodierers zurücksetzt
    • – feed_input_bytes(); das Eingangs-Dekomprimierbytes nimmt und diese in den Komprimierstrom reinsetzt
    • – flush_output_bytes(); das den Komprimierstrom durch Komprimieren der bereits bearbeiteten Eingangsbytes und durch Aussenden der entsprechenden komprimierten Ausgangsbytes leert
    • – decompress_input_bytes(); das eine spezifizierte Menge von eingegebenen komprimierten Bytes nimmt und diese durch Aussenden der entsprechenden dekomprimierten Ausgangsbytes dekomprimiert
  • Ein gepufferter Codec hat eine Länge von bufferSize Bytes, eine Bytearraybuffer-FIFO-Struktur.
  • Von der Seite eines Kodierers gibt der Wert bufferSize an, wie viele Eingangsbytes der Kodierer vor dem Leeren verarbeiten kann. Von der Seite eines Dekodiers ist dieses die minimale Puffergröße in Bytes, die benötigt wird, um den Bitstrom zu dekodieren, durch die API eines zugrunde liegenden statistischen Kodierers.
  • Der Puffer hat auch eine Variable fillingLevel, die den tatsächlichen Füllpegel des Puffers in Bytes enthält.
  • Verwenden der ZLib API als statistischer Kodierer
  • Die API der öffentlichen ZLib-Bibliothek [4], die in dem GZip-Kompressionsschema verwendet wird, stellt eine effiziente und nützliche API zum Verwenden einer statistischen Kompression auf Blätter eines Dokuments bereit.
  • Die ZLib API erfüllt die vorherigen generischen Verfahren mit folgender Abbildung aus:
    • – initialize_stream() kann mit den Zlib-Funktionen inflatelnit() oder deflatelnit() abgebildet werden, mit dem Effizienzwertparameter Z_DEFAULT_COMPRESSION.
    • – reset_model() kann mit einem Zlib-Aufruf inflateEnd() oder deflateEnd() und einem darauffolgenden Aufruf initialize_stream() abgebildet werden.
    • – feed_input_bytes() kann mit dem Zlib-Verfahren deflate() mit dem Parameter Z_NO_FLUSH abgebildet werden.
    • – flush_output_bytes() kann mit dem Zlib-Verfahren deflate() mit dem Parameter Z_SYNC_FLUSH abgebildet werden.
    • – decompress_input_bytes() kann mit dem Zlib-Verfahren inflate() abgebildet werden.
  • Der ZLib gepufferte Codec sollte mit dem Effizienzwert Z_DEFAULT_COMPRESSION initialisiert werden, wie in [4] definiert, was einen guten Kompromiss zwischen den Erfordernissen eines Speicher-Footprints und Kompressionseffizient bereitstellt.
  • Integration mit dem Kontextmechanismus: der ZLibCodec
  • Dieser Abschnitt beschreibt die Integration des vorherigen gepufferten statistischen Kodierers, der auf der ZLib API stützend innerhalb des Kodierkontextmechanismus definiert ist.
  • Einschränkung auf anwendbare einfache Typen
  • Gemäß der Definition eines Codec in §2.1 ist dieser Codec ein kontextueller Codec, der auf jeden Zeichenketten-Typ einer Ordnung oder Nicht-Ordnung angewandt werden kann. Der ZLibCodec ist auf dem zugrunde liegenden primitiven Kodieren von Blättern eines Dokuments, wie in [1] beschrieben, gestützt. Zum Beispiel werden int-Blätter mit einer ganzen vorzeichenlosen 32-Bit-Zahl kodiert, string mit einer UFT-8-Kodierung, float und double werden mit dem IEEE 754-Format kodiert, ... Daher wird der ZlibCodec das kodierte Blatt komprimieren
  • Externe Codec-Parameter
  • Der gepufferte ZLib-Codec benötigt keine externen Parameter, da die Effizienz der zugrundeliegenden ZLib auf Z_DEFAULT_COMPRESSION gesetzt ist und da der Parameter bufferSize auf Seite des Dekodierers nicht benötigt wird.
  • Definition des Schemas des Codec
  • Der ZLib-Codec ist ein neuer Codec vom Typ ZlibCodecType, der auf dem abstrakten Typ CodecType (siehe §2.1) basiert und durch das im Anhang 7 veranschaulichte Schema definiert ist, im Namensraum des Kodierkontexts.
  • Kodierung (informativ)
  • Bei der Aktivierung/Instanziierung des Codec:
    • – wird angenommen, dass die Struktur eines Puffers eines FIFO klar ist, sein fillingLevel wird auf 0 gesetzt
    • – wird die globale Variable referencable_chunk auf Null initialisiert
  • Die referencable_chunk sollte einen verweisbaren Chunk von Bits enthalten, die durch den Kodierer bereitgehalten werden müssen, da ihr Wert später während des Kodier-Prozesses bekannt sein wird. Die Signalisierungsfunktion signal_reference_chunk_known() könnte aufgerufen werden, wenn dieser Chunk bekannt ist.
  • Die Größe in Bytes eines jeden nicht-nil Chunks sollte während des Aufrufs flush_output_bytes() mit der standardisierten vorzeichenlosen, unbegrenzten ganzzahligen 4 + 1-Kodierung, wie in [1] definiert, vor dem Chunk selbst geschrieben werden.
  • Ein Eingang leaf ist der kodierte Wert eines textuellen leaf in Bezug auf seinen primitiven Typ. Die Länge des leaf in Bytes ist durch das Feld leaf.length gegeben. Zum Beispiel [1], ein string Blatt ist ein UTF-8-Code, vorausgegangen durch die Größe der Zeichenkette (kodiert mit der unbegrenzten Ganzzahl-Kodierung [1]) in Bytes; ein double-Blatt ist der 64-Bit-Wert des entsprechenden IEEE 754-Standards ...
  • Die folgende Funktion encode_leaf ist in der Lage, ein leaf in einem Chunk von Ausgangsbytes zu kodieren:
  • Figure 00300001
  • Figure 00310001
  • Dekodierung
  • Sei string_fifo ein Zeichenketten-FIFO.
  • Die folgenden Verfahren get() bzw. put() nehmen ein Element aus dem bzw. legen ein Element in den FIFO.
  • Das Verfahren isEmpfy() signalisiert, ob der Fifo leer ist
  • Sei sub die Funktion, die eine Unterzeichenkette nimmt.
  • Sei concat die Konkatinierungs-Funktion
  • Sei getDate() die Funktion, die das char[], das die Daten eines Blatts de-gzip enthält, zurückgibt.
  • Sei split(char[], char sep, Fifo, char[] remainder) das Verfahren, das ein Feld von Zeichen an jedem Separator ,sep' abspaltet und die abgespalteten Elemente der Zeichenkette in dem Fifo speichert, und den Restbestand zurückgibt (d.h. der letzte Chunk hat keinen ,sep', um diesen abzuschließen)
  • Figure 00320001
  • Figure 00330001
  • Figure 00340001
  • Bei einer Initialsierung ist string_fifo leer.
  • Bei der Aktivierung/Instanziierung des Codecs:
    • – wird erwartet, dass die Struktur von FIFO klar ist, ihre numberOfLeaves wird auf 0 gesetzt
    • – wird die Variable first_chunk auf true gesetzt
  • Sei das Byte des Separators 0x00.
  • Die folgende Funktion decode_leaf ist in der Lage, ein komprimiertes Blatt aus dem Bitstrom zu dekodieren:
  • Figure 00340002
  • Eine Dekodierung ist definiert durch:
    • 1. Falls der FIFO leer ist:
    • a. dekodiere die kodierten Daten,
    • b. staple in einem FIFO alle Elemente, die durch 0x00 getrennt sind
    • c. falls das letzte Zeichen nicht 0x00 ist, speichere die nicht abgeschlossene Zeichenkette temporär.
    • d. falls „last_element" nicht leer ist, füge es dem Anfang des ersten Elements im FIFO an
    • e. lege die nicht abgeschlossene Zeichenkette dieser Runde im last_element ab.
    • f. lösche und gebe das erste Element zurück.
    • 2. Falls der FIFO nicht leer ist, lösche und gebe das erste Element zurück. Das ist äquivalent zu der Aussage: „der FIFO ist nicht leer" und zu der Aussage „es sind keine kodierten Daten in dem gegenwärtigen Blatt vorhanden."
  • Beispiel (informativ)
  • Die im Anhang 8 gegebene Beschreibung ist ein Beispiel für die Verwendung des mit den Typen string und anyURI abgebildeten ZlibCodecType-Codecs.
  • Ergebnisse (informativ)
  • Die folgenden Figuren zeigen die Leistungen der Verwendung des ZLibCodec, um textuelle Blätter von Beschreibungen (solchen, die von den primitiven Typen string und anyURI eines XML-Schemas abgeleitet wurden) zu komprimieren. Ein Buffer mit bufferSize = 256 Bytes wurde während des Kodierprozesses verwendet.
  • Die verwendeten Dateien wurden von der MPEG7-MDS-Untergruppe bereitgestellt.
  • Figure 00360001
  • Wir werden nun schnell die gemäß der Erfindung implementierten Schritte zum Komprimieren des Inhalts der Blätter eines hierarchischen Baums beschreiben.
  • Schritt 1 besteht in einem Verknüpfen einer Kompressionskodiertechnik mit einem Inhaltstyp. So zum Beispiel kann eine lineare Quantisierung mit Gleitkommawerten verknüpft werden.
  • Im Schritt 2 wird ein Unterbaum innerhalb des hierarchischen Baums entsprechend der Struktur des betrachteten XML-Dokuments identifiziert.
  • Schritt 3 besteht in einem Zuordnen einer Kompressionskodiertechnik zu dem identifizierten Unterbaum.
  • Schritt 4 besteht dann in einem Prüfen, ob der Codec, der die Kompressionskodiertechnik durchführt, aktiviert ist oder nicht. Falls nein, wird keine Kompression (5) der Blätter des Unterbaums erreicht.
  • Falls ja, führt die Erfindung ein Komprimieren des Inhalts der Blätter des Unterbaums durch (6), deren Inhalt von dem mit der Kompressionskodiertechnik verknüpften (1) Inhaltstyp sind.
  • ANHANG 1
    Figure 00380001
  • ANHANG 2
    Figure 00390001
  • Figure 00400001
  • ANHANG 3
    Figure 00410001
  • ANHANG 4
    Figure 00420001
  • Figure 00430001
  • ANHANG 5
    Figure 00440001
  • ANHANG 6
    Figure 00450001
  • Figure 00460001
  • ANHANG 7
    Figure 00470001
  • ANHANG 8
    Figure 00480001
  • Figure 00490001
  • ANHANG 9
  • Quellenangabe
    • 1 – MPEG-7 Systems FCD, N4001, MPEG Singapore meeting, March 2001
    • 3 – ISO/IEC 14496-1, MPEG-4 Systems, N3850.
    • 4 – The ZLib API, http:///www.gzip.org/zlib/, RFC 1950, RFC 1951, RFC 1952 verfügbar auf http://www.cis.ohio-state.edu/cgi-bin/rfc/rfc1950.html

Claims (18)

  1. Verfahren zum Komprimieren eines ein Multimedia-Signal beschreibenden hierarchischen Baums, wobei der Baum Knoten und Blätter aufweist, welche mit Daten zumindest zweier verschiedener Arten, genannt Datentypen, verknüpft werden können, wobei das Verfahren eine Datenkompression zumindest einiger der Blätter durchführt, und wobei das Verfahren umfasst: – einen Schritt des Identifizierens (2) zumindest eines Unterbaums; – einen Schritt des Zuordnens (3) einer Kompressionskodiertechnik zu dem Unterbaum (den Unterbäumen) für zumindest einen Datentyp; – und einen Schritt des Durchführens (6) der dem Unterbaum zugeordneten Kompressionskodiertechnik, nur für diejenigen Blätter des Unterbaumes deren Daten von dem mit der Kompressionskodiertechnik verknüpften Typ sind, während die anderen Blätter des Unterbaums keiner Kompressionskodierung unterzogen werden.
  2. Verfahren nach Anspruch 1, das ein parametrisches Beschreiben der Kompressionskodiertechniken durchführt.
  3. Verfahren nach einem der Ansprüche 1 und 2, umfassend auch einen Schritt des Komprimierens der Struktur des Baums.
  4. Verfahren nach einem der Ansprüche 1 bis 3, wobei der Baum von dem BiM (Binären MPEG) Typ gemäß dem MPEG7-Standard ist.
  5. Verfahren nach Anspruch 4, wobei die Datentypen einfache Typen gemäß dem MPEG7-Standard sind.
  6. Verfahren nach einem der Ansprüche 1 bis 5, wobei eine der Kompressionskodiertechniken eine lineare Quantisierung durchführt.
  7. Verfahren nach einem der Ansprüche 1 bis 6, wobei eine der Kompressionskodiertechniken einen statistischen Kompressionsalgorithmus durchführt.
  8. Verfahren nach Anspruch 7, wobei der Algorithmus von dem GZip-Typ ist.
  9. Verfahren nach einem der Ansprüche 7 und 8, wobei der Algorithmus gleichzeitig für eine Gruppe von Daten durchgeführt wird, die den Daten zumindest zweier Blätter entsprechen.
  10. Verfahren nach einem der Ansprüche 1 bis 9, wobei der Baum die Struktur eines Dokuments vom XML (Extended markup language)-Typ repräsentiert.
  11. Verfahren nach einem der Ansprüche 1 bis 10, auch umfassend einen Schritt des Verknüpfens zumindest eines Kodierkontexts mit dem Unterbaum, wobei der Kodierkontext Informationsteile aufweist, die es erlauben, den Unterbaum während des Dekodierens des hierarchischen Baums zu überspringen.
  12. Verfahren nach Anspruch 11, wobei die Informationsteile umfassen: – einen Informationsteil, der die verwendete Kompressionskodiertechnik angibt; und/oder – einen Informationsteil, der angibt, ob der entsprechende Unterbaum komprimiert worden ist; und/oder – einen Informationsteil, der angibt, ob der entsprechende Unterbaum überspringbar ist; und/oder – einen Informationsteil, der angibt, dass zumindest ein Parameter der verwendeten Kompressionskodiertechnik modifiziert worden ist.
  13. Verfahren zum Dekodieren eines Multimediasignals, das gemäß dem Verfahren nach einem der Ansprüche 1 bis 12 komprimiert ist.
  14. Verfahren nach Anspruch 13, das einen Schritt des Auffrischens eines vorliegenden Dekodierungskontexts entsprechend einer durch das Signal übermittelten Kodierkontextinformation durchführt.
  15. Verfahren nach Anspruch 14, wobei der vorliegende Kontext zumindest einen Datentyp definiert, wobei das Verfahren einen Schritt des Durchführens einer mit dem Datentyp verknüpften Kompressionskodiertechnik umfasst, für die Blätter, die Daten des Datentyps umfassen.
  16. Signal repräsentativ für einen hierarchischen Baum, der gemäß dem Verfahren nach einem der Ansprüche 1 bis 12 komprimiert ist, wobei der Baum Knoten und Blätter aufweist, die mit Daten zumindest zweier verschiedener Arten, genannt Datentyp, verknüpft werden können, wobei der Baum auch zumindest einen Unterbaum aufweist, dem eine Kompressionskodiertechnik für zumindest einen Datentyp zugeordnet ist, wobei das Signal zumindest ein Feld aufweist, welches enthält: – die Blätter des Unterbaums, deren Daten von dem Datentyp sind, der mit der Kompressionskodiertechnik verknüpft ist, und die dem Kompressionskodieren unterzogen wurden; – die anderen Blätter der Unterbaums, deren Daten nicht von dem Datentyp sind, der mit der Kompressionskodiertechnik verknüpft ist, und die nicht dem Kompressionskodieren unterzogen wurden.
  17. Signal nach Anspruch 16, wobei das Signal auch umfasst: – zumindest ein Feld, das die Kompressionskodiertechnik angibt, welche dem Unterbaum (den Unterbäumen) für den zumindest einen Datentyp zugeordnet ist; – zumindest ein Feld, das den zumindest einen Datentyp angibt, welcher mit der Kompressionskodiertechnik für den Unterbaum (die Unterbäume) verknüpft ist.
  18. Signal nach Anspruch 17, wobei das Signal auch zumindest ein Feld aufweist, das zumindest einen Parameter der Kompressionskodiertechnik angibt, die dem Unterbaum (den Unterbäumen) für zumindest einen der Datentypen zugeordnet ist.
DE60123596T 2001-07-13 2001-07-13 Verfahren zur Komprimierung einer Baumhierarchie, zugehöriges Signal und Verfahren zur Dekodierung eines Signals Expired - Lifetime DE60123596T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP01460047A EP1276324B1 (de) 2001-07-13 2001-07-13 Verfahren zur Komprimierung einer Baumhierarchie, zugehöriges Signal und Verfahren zur Dekodierung eines Signals

Publications (2)

Publication Number Publication Date
DE60123596D1 DE60123596D1 (de) 2006-11-16
DE60123596T2 true DE60123596T2 (de) 2007-08-16

Family

ID=8183367

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60123596T Expired - Lifetime DE60123596T2 (de) 2001-07-13 2001-07-13 Verfahren zur Komprimierung einer Baumhierarchie, zugehöriges Signal und Verfahren zur Dekodierung eines Signals

Country Status (13)

Country Link
US (1) US20040267710A1 (de)
EP (1) EP1276324B1 (de)
JP (2) JP2004535034A (de)
KR (1) KR20040036897A (de)
CN (1) CN100493187C (de)
AT (1) ATE341901T1 (de)
AU (1) AU2002330359A1 (de)
BR (1) BRPI0211106B8 (de)
CA (1) CA2452639C (de)
DE (1) DE60123596T2 (de)
ES (1) ES2272429T3 (de)
MX (1) MXPA04000219A (de)
WO (1) WO2003007614A2 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7126955B2 (en) 2003-01-29 2006-10-24 F5 Networks, Inc. Architecture for efficient utilization and optimum performance of a network
US8159940B1 (en) 2004-11-11 2012-04-17 F5 Networks, Inc. Obtaining high availability using TCP proxy devices
KR100660028B1 (ko) * 2005-02-23 2006-12-20 인천대학교 산학협력단 데이터베이스 개념 구조에 기반한 xml 트리의 색인 및질의 방법
US8111694B2 (en) 2005-03-23 2012-02-07 Nokia Corporation Implicit signaling for split-toi for service guide
KR20080049019A (ko) * 2005-07-21 2008-06-03 이엑스피웨이 구조 문서를 압축하고 해제하는 방법 및 장치
US7783781B1 (en) 2005-08-05 2010-08-24 F5 Networks, Inc. Adaptive compression
US8275909B1 (en) 2005-12-07 2012-09-25 F5 Networks, Inc. Adaptive compression
US7882084B1 (en) 2005-12-30 2011-02-01 F5 Networks, Inc. Compression of data transmitted over a network
US8417833B1 (en) 2006-11-29 2013-04-09 F5 Networks, Inc. Metacodec for optimizing network data compression based on comparison of write and read rates
JP4703730B2 (ja) * 2007-01-19 2011-06-15 三菱電機株式会社 テーブル装置、可変長符号化装置、可変長復号装置及び可変長符号化復号装置
JP4360428B2 (ja) * 2007-07-19 2009-11-11 ソニー株式会社 記録装置、記録方法、コンピュータプログラムおよび記録媒体
KR101323439B1 (ko) * 2008-11-12 2013-10-29 보드 오브 트러스티스 오브 더 리랜드 스탠포드 주니어 유니버시티 특징 디스크립터를 표현하고 식별하는 방법, 장치 및 컴퓨터 판독가능 저장 매체
CN101741708B (zh) * 2008-11-13 2012-11-21 华为技术有限公司 一种存储数据的方法和装置
US8818024B2 (en) 2009-03-12 2014-08-26 Nokia Corporation Method, apparatus, and computer program product for object tracking
CN101557399A (zh) * 2009-05-20 2009-10-14 深圳市汇海科技开发有限公司 一种xmpp协议传输数据压缩与解压缩方法
RU2542946C2 (ru) 2009-11-19 2015-02-27 Нокиа Корпорейшн Способ и устройство для отслеживания и распознавания объектов с использованием дескрипторов, инвариантных относительно вращения
US9002859B1 (en) 2010-12-17 2015-04-07 Moonshadow Mobile, Inc. Systems and methods for high-speed searching and filtering of large datasets
CA2823839A1 (en) 2011-01-10 2012-07-19 Roy W. Ward Systems and methods for high-speed searching and filtering of large datasets
EP2557752B1 (de) 2011-08-11 2017-09-27 Siemens Aktiengesellschaft Verfahren und vorrichtung zum herstellen einer end-zu-end-kommunikation zwischen zwei netzwerken
US9171054B1 (en) 2012-01-04 2015-10-27 Moonshadow Mobile, Inc. Systems and methods for high-speed searching and filtering of large datasets
US8990204B1 (en) 2012-01-17 2015-03-24 Roy W. Ward Processing and storage of spatial data
US10521411B2 (en) 2016-08-10 2019-12-31 Moonshadow Mobile, Inc. Systems, methods, and data structures for high-speed searching or filtering of large datasets
CN107092656B (zh) * 2017-03-23 2019-12-03 中国科学院计算技术研究所 一种树状结构数据处理方法及系统
US11379420B2 (en) * 2019-03-08 2022-07-05 Nvidia Corporation Decompression techniques for processing compressed data suitable for artificial neural networks
CN113282776B (zh) * 2021-07-12 2021-10-01 北京蔚领时代科技有限公司 用于图形引擎资源文件压缩的数据处理系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995001677A1 (en) * 1993-06-30 1995-01-12 Codex, Inc. Method and apparatus for encoding and decoding compressed data in data communication
WO1997034240A1 (en) * 1996-03-15 1997-09-18 University Of Massachusetts Compact tree for storage and retrieval of structured hypermedia documents
EP0928070A3 (de) * 1997-12-29 2000-11-08 Phone.Com Inc. Syntaxstruktur bewahrende Kompression von HTML-Dokumenten
JP2000067348A (ja) * 1998-08-24 2000-03-03 Matsushita Electric Ind Co Ltd 携帯電話機及び携帯電話機による緊急通報システム
JP4003854B2 (ja) * 1998-09-28 2007-11-07 富士通株式会社 データ圧縮装置及び復元装置並びにその方法
GB9911099D0 (en) * 1999-05-13 1999-07-14 Euronet Uk Ltd Compression/decompression method
FR2813743B1 (fr) * 2000-09-06 2003-01-03 Claude Seyrat Procede de compression/decompression de documents structures
EP1223759A1 (de) * 2001-01-08 2002-07-17 Robert Bosch Gmbh Verfahren zur Erzeugung eines Erweiterungscodes für die binarische Beschreibung von Multimediadaten
FR2820563B1 (fr) * 2001-02-02 2003-05-16 Expway Procede de compression/decompression d'un document structure

Also Published As

Publication number Publication date
JP2009043267A (ja) 2009-02-26
ATE341901T1 (de) 2006-10-15
EP1276324B1 (de) 2006-10-04
AU2002330359A1 (en) 2003-01-29
EP1276324A1 (de) 2003-01-15
WO2003007614A2 (en) 2003-01-23
BR0211106A (pt) 2004-06-22
CN1528091A (zh) 2004-09-08
CA2452639A1 (en) 2003-01-23
BRPI0211106B1 (pt) 2016-10-18
DE60123596D1 (de) 2006-11-16
KR20040036897A (ko) 2004-05-03
BRPI0211106B8 (pt) 2017-04-11
CN100493187C (zh) 2009-05-27
WO2003007614A3 (en) 2003-10-16
US20040267710A1 (en) 2004-12-30
MXPA04000219A (es) 2005-04-19
ES2272429T3 (es) 2007-05-01
JP2004535034A (ja) 2004-11-18
CA2452639C (en) 2012-10-23
JP4884438B2 (ja) 2012-02-29

Similar Documents

Publication Publication Date Title
DE60123596T2 (de) Verfahren zur Komprimierung einer Baumhierarchie, zugehöriges Signal und Verfahren zur Dekodierung eines Signals
DE69226749T2 (de) System zur Kompression von sich bewegenden Videobildern mit mehrfachen Auflösungsmerkmalen
DE10392598T5 (de) Unterstützung von fortschrittlichen Codierungsformaten in Mediendateien
DE60109467T2 (de) Verfahren und vorrichtung zur übertragung von netzwerkinformationen durch sichere transkodierung
DE60213760T2 (de) Verfahren zur kompression und dekompression eines strukturierten dokuments
DE69318446T2 (de) Verfahren und Vorrichtung zur Datenkompression und -dekompression für eine Übertragungsanordnung
DE60310368T2 (de) Verfahren zur verhinderung von startkode-emulation und stopfdaten
EP1499998A2 (de) Generische datenstrombeschreibung
DE60107964T2 (de) Vorrichtung zur kodierung und dekodierung von strukturierten dokumenten
EP1522028A1 (de) Verfahren und vorrichtungen zum kodieren/dekodieren von strukturierten dokumenten, insbesondere von xml-dokumenten
DE10392586T5 (de) Allgemeine Anpassungsschicht für JVT-Video
WO2006005646A1 (de) Verfahren zum codieren eines xml-dokuments, sowie verfahren zum decodieren, verfahren zum codieren und decodieren, codiervorrichtung, decodiervorrichtung und vorrichtung zum codieren und decodieren
DE60008233T2 (de) Übertragung von profilierten mediadateien an kunden über ein netzwerk
DE112016004284T5 (de) Signalisierung von High Dynamic Range- und Wide Color Gamut-Inhalt in Transportströmen
DE19952683A1 (de) Vorrichtung und Verfahren zum Senden und Empfangen von Video-Daten
EP1472888B1 (de) Kontextsensitive kodierung und dekodierung eines videodatenstroms
EP1323313B1 (de) Verfahren und anordnung zum übertragen eines vektors
EP1616274B1 (de) Verfahren zur codierung eines strukturierten dokuments
DE60200377T2 (de) Datenkompression
WO2010112356A1 (de) Komprimierungsverfahren, dekomprimierungsverfahren, komprimierungseinheit, dekomprimierungseinheit sowie komprimiertes dokument
DE60100026T2 (de) Verfahren und Vorrichtung für fast verlustfreie verkettete Blocktransformkodierung
DE69801998T2 (de) Signal der animation einer grafischen szene, entsprechende vorrichtung und verfahren
DE10339498B4 (de) Audiodateiformatumwandlung
DE10248758B4 (de) Verfahren und Vorrichtungen zum Encodieren/Decodieren von XML-Dokumenten
DE69838821T2 (de) Verfahren und vorrichtung zur codierung eines videosignals

Legal Events

Date Code Title Description
8364 No opposition during term of opposition