WO1998033280A1

WO1998033280A1 - Verfahren zum kodieren und dekodieren von daten

Info

Publication number: WO1998033280A1
Application number: PCT/DE1997/000127
Authority: WO
Inventors: Gunter Logemann
Original assignee: Siemens Aktiengesellschaft
Priority date: 1997-01-24
Filing date: 1997-01-24
Publication date: 1998-07-30

Abstract

Es wird ein Verfahren zum Kodieren und Dekodieren von Daten beschrieben, wobei die Zuordnung von kodierten und unkodierten Daten unter Auswertung von Einträgen in über Indizes auffindbaren Elementen einer baumartig angelegten Datenstruktur erfolgt. Das beschriebene Verfahren zeichnet sich dadurch aus, daß eine Datenstruktur verwendet wird, deren Elemente zur Speicherung der Indizes einer Vielzahl von hierarchisch tiefer liegenden Elementen ausgelegt sind. Dadurch können Kodierungen und Dekodierungen mit maximaler Geschwindigkeit und effizient durchgeführt werden.

Description

Beschreibung

Verfahren zum Kodieren und Dekodieren von Daten

Die vorliegende Erfindung betrifft ein Verfahren gemäß dem Oberbegriff des Patentanspruchs 1, d.h. ein Verfahren zum Kodieren und Dekodieren von Daten, wobei die Zuordnung von kodierten und unkodierten Daten unter Auswertung von Einträgen in über Indizes auffindbaren Elementen einer baumartig angelegten Datenstruktur erfolgt.

Ein derartiges Verfahren ist beispielsweise aus der US 5 153 591 bekannt.

Durch das Kodieren und Dekodieren gemäß der US 5 153 591 soll ein Komprimieren und Dekomprimieren von (im beschriebenen Beispiel im ASCII-Format vorliegenden) Daten erfolgen. Sowohl das Komprimieren als auch das Dekomprimieren erfolgt unter Verwendung von baumartig angelegten Datenstrukturen, deren über zugeordnete Indizes ansprechbaren Elemente jeweils vorbestimmte Daten (im beschriebenen Beispiel ASCII-Zeichen oder ASCII-Zeichenfolgen) repräsentieren.

Von den besagten Datenstrukturen ist eine (erste) in einer zum Kodieren von Daten vorgesehenen Kodiereinheit, und eine weitere, inhaltlich mit der ersten Datenstruktur identische zweite Datenstruktur in einer zum Dekodieren von kodierten Daten vorgesehenen Dekodiereinheit gespeichert .

Beim Kodieren werden die zu kodierenden Daten in mehr oder weniger umfangreiche, gleich oder unterschiedlich große Teile aufgespalten, und diese Datenteile werden unter Nachschlagen in der in der Kodiereinheit verfügbaren Datenstruktur durch die Indizes der die betreffenden Datenteile repräsentierenden Datenstrukturelemente ersetzt. Umgekehrt werden beim Dekodieren die kodierten Daten in die Indizes, aus denen sie zusammengesetzt wurden, aufgespalten, und diese Indizes werden unter Nachschlagen in der in der Dekodiereinheit verfügbaren Datenstruktur durch die Daten er- setzt, welche durch die über die jeweiligen Indizes ansprechbaren Datenstrukturelemente repräsentiert werden.

Um die beim Komprimieren und Dekomprimieren ablaufenden Vorgänge und den Aufbau der dazu verwendeten Datenstrukturen besser verstehen zu können, wird das aus der US 5 153 591 bekannte Verfahren im folgenden ergänzend anhand eines praktischen Beispiels erläutert.

Es sei angenommen, daß die Zeichenfolge "abcababcabc" reprä- sentierende ASCII-Daten unter Verwendung einer in der Figur 3 veranschaulichten Datenstruktur komprimiert und anschließend wieder dekomprimiert werden sollen.

Vor der Erläuterung des eigentlichen Komprimierens und De- komprimierens soll zunächst auf den Aufbau der verwendeten Datenstruktur eingegangen werden.

Wie aus der Figur 3 ersichtlich ist, ist die verwendete Datenstruktur baumartig aufgebaut; sie weist eine Vielzahl von durch Kreise dargestellten Datenstrukturelementen 1 bis 8 auf .

Die Datenstrukturelemente 1 bis 8 enthalten eine Reihe von diese charakterisierenden Einträgen.

Die Einträge bestehen dabei jeweils aus einem dem betreffenden Datenstrukturelement zugeordneten Zeichen bzw. - allgemeiner ausgedrückt - Symbol und einer Reihe von auf benachbarte Datenstrukturelemente zeigenden Zeigern.

Den Elementen der in der Figur 3 gezeigten Datenstruktur ist entweder das Zeichen "a", das Zeichen "b", oder das Zeichen "c" zugeordnet; die Zeichen, welche den jeweiligen Datenstrukturelementen zugeordnet sind, sind in die die jeweiligen Datenstrukturelemente repräsentierenden Kreise eingeschrieben.

Durch die jeweiligen Datenstrukturelemente wird entweder das ihnen zugeordnete Zeichen oder eine sich aus beliebig vielen Zeichen zusammensetzende Zeichenfolge repräsentiert, wobei sich die besagte Zeichenfolge aus dem Zeichen, das dem be- treffenden Datenstrukturelement zugeordnet ist, und den Zeichen, die den hierarchisch über dem betreffenden Datenstrukturelement liegenden Datenstrukturelementen zugeordnet sind, zusammensetzt.

Die vorstehend bereits erwähnten, auf die benachbarten Datenstrukturelemente zeigenden Zeiger lassen sich in drei Klassen einteilen, nämlich in mit "P" bezeichnete Parent-Zeiger, mit "D" bezeichnete Abwärts-Zeiger, und mit "R" bezeichnete Rechts-Zeiger .

Jedes Datenstrukturelement kann (muß aber nicht) Einträge für einen Parent-Zeiger P, einen Abwärts-Zeiger D und einen Rechts-Zeiger R enthalten.

Der Parent-Zeiger P beinhaltet den Index des Datenstruktur- elements, dem das betreffende Datenstrukturelement untergeordnet ist. Der Abwärts-Zeiger D beinhaltet den Index eines der Elemente, die dem betreffenden Datenstrukturelement untergeordnet sind. Der Rechts-Zeiger R beinhaltet den Index eines der Elemente, die dem Datenstrukturelement, das dem betreffenden Datenstrukturelement übergeordnet ist, außer dem betreffenden Datenstrukturelement untergeordnet sind.

Jedem Datenstrukturelement ist ein Index zugeordnet, über welchen auf dieses gezielt zugegriffen werden kann; der Index möge im betrachteten Beispiel jeweils dem Bezugszeichen ent- sprechen, mit dem das betreffende Datenstrukturelement bezeichnet ist.

Eine Zusammenstellung der Indizes der Datenstrukturelemente, der den betreffenden Datenstrukturelementen zugeordneten Zeichen, der den betreffenden Datenstrukturelementen zugeordneten Zeiger und der durch die betreffenden Datenstrukturelemente repräsentierten Zeichenfolgen ist aus der nachfolgenden Tabelle ersichtlich:

Wie diese Tabelle zu lesen ist, wird beispielhaft anhand des Datenstrukturelements, dem der Index 4 zugeordnet ist, erläutert. Dem betreffenden Datenstrukturelement ist das Zeichen "b" zugeordnet (2. Spalte zu Index 4) . Es ist dem Element mit dem Index 1 untergeordnet (5. Spalte^' zu Index 4), welches seinerseits dem Zeichen "a" entspricht (2. Spalte zu Index 1) und keinem übergeordneten Element untergeordnet ist (5. Spalte zu Index 1), wodurch es (das Element mit dem Index 4) die Zeichenfolge "ab" repräsentiert (6. Spalte zu Index 4). Dem Element mit dem Index 4 ist das Element mit dem Index 7 (3. Spalte zu Index 4) untergeordnet, welches seinerseits dem Zeichen "a" entspricht (2. Spalte zu Index 7) und folglich die Zeichenfolge "aba" repräsentiert (6. Spalte zu Index 7). Dem Element mit dem Index 4 ist darüber hinaus das Element mit dem Index 8 untergeordnet (4. Spalte zu Index 7), welches seinerseits dem Zeichen "c" entspricht (2. Spalte zu Index 8) und folglich die Zeichenfolge "abc" repräsentiert (6. Spalte zu Index 8) .

Will man die vorstehend bereits genannte Zeichenfolge "abcababcabc" komprimieren, so muß diese Zeichenfolge zunächst in (Teil-) Zeichenfolgen zerlegt werden, die durch die vorhandenen Elemente der verwendeten Datenstruktur repräsentiert werden. Die Zerlegung führt beispielsweise zu den Teilzeichenfolgen "abc", "aba", "bc" und "abc".

Ersetzt man nun die einzelnen Teilzeichenfolgen durch die Indizes derjenigen Elemente der verwendeten Datenstruktur, durch welche die betreffenden Teilzeichenfolgen repräsentiert werden, so gelangt man zu der kodierten Zeichenfolge 8758.

Die ursprüngliche Zeichenfolge könnte auch in die Teilzeichenfolgen "abc", "ab", "abc" und "abc" zerlegt und als 8488 kodiert werden.

Bei der Dekodierung wird in umgekehrter Reihenfolge verfahren. D.h., die kodierte Zeichenfolge wird in die Indizes zerlegt, aus denen sie zusammengesetzt wurde, und diese Indizes werden durch die Teilzeichenfolgen ersetzt, welche durch die Datenstrukturelemente repräsentiert werden, denen die betref- fenden Indizes zugeordnet sind.

Bezüglich weiterer Einzelheiten zur Komprimierung und Dekomprimierung von Daten im allgemeinen und dem vorstehend beschriebenen Verfahren im besonderen wird auf die US 5 153 591 verwiesen.

Die wie beschrieben durchgeführte Komprimierung und Dekomprimierung von Daten erweist sich im Ergebnis als effektiv und anpassungsfähig. Die Erfahrung zeigt jedoch andererseits, daß die Komprimierung und/oder die Dekomprimierung bisweilen sehr zeitaufwendig sein können. Dies kann sich insbesondere dann, wenn die jeweils zu erzeugenden bzw. erzeugten Daten schnell weiterverarbeitet werden können (müssen) oder wenn sehr große Datenmengen zu komprimieren und/oder zu dekomprimieren sind, als erheblicher Nachteil erweisen.

Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, das Verfahren gemäß dem Oberbegriff des Patentanspruchs 1 derart weiterzubilden, daß dadurch zu bewerkstelligende Kodierungen und/oder Dekodierungen mit maximaler Geschwindigkeit effizient durchführbar sind.

Diese Aufgabe wird erfindungsgemäß durch die im kennzeichnenden Teil des Patentanspruchs 1 beanspruchten Merkmale gelöst.

Demnach ist vorgesehen, daß eine Datenstruktur verwendet wird, deren Elemente zur Speicherung der Indizes einer Vielzahl von hierarchisch tiefer liegenden Elementen ausgelegt sind.

Dadurch kann ohne Auswertung der einem momentan ausgewerteten Datenstrukturelement gegebenenfalls untergeordneten Datenstrukturelemente festgestellt werden, ob und gegebenenfalls welche Datenstrukturelemente dem momentan ausgewerteten Datenstrukturelement untergeordnet sind und welche Zeichen diesen untergeordneten (hierarchisch tiefer liegenden) Daten- Strukturelementen zugeordnet sind. Die Existenz und der Index bzw. das Nichtvorhandensein eines Datenstrukturelements , welches eine vorbestimmte Zeichenfolge repräsentiert, kann folglich in einer minimalen Anzahl von Überprüfungsschritten ermittelt werden.

Insbesondere kann das beim beschriebenen Stand der Technik erforderliche und in einer vorgegebenen Reihenfolge durchzuführende Durchsuchen der untergeordneten Datenstrukturelemente entfallen. Es wurde mithin ein Verfahren gefunden, durch welches Kodierungen und/oder Dekodierungen mit maximaler Geschwindigkeit effizient durchführbar sind.

Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand der Unteransprüche.

Die Erfindung wird nachfolgend anhand eines Ausführungsbei- spiels unter Bezugnahme auf die Zeichnung näher erläutert. Es zeigen

Figur 1 den prinzipiellen Aufbau einer zur Durchführung des erfindungsgemäßen Verfahrens geeigneten Datenstruktur,

Figur 2 den Aufbau einer zur Komprimierung und Dekomprimierung einer gegebenen Zeichenfolge nach dem erfindungsgemäßen Verfahren angelegten Datenstruktur, und

Figur 3 den Aufbau einer zur Komprimierung und Dekomprimierung einer gegebenen Zeichenfolge nach einem herkömmlichen Verfahren angelegten Datenstruktur.

Das im folgenden näher beschriebene Verfahren ist ein zum

Kodieren und Dekodieren von Daten geeignetes Verfahren, wobei die Art und der Umfang des Kodierens und des Dekodierens, das mit dem Kodieren und/oder dem Dekodieren verfolgte Ziel (Komprimierung/Dekomprimierung, Verschlüsselung/Entschlüsse- lung etc.) sowie die Art und der Umfang der zu kodierenden oder dekodierenden Daten grundsätzlich keinen Einschränkungen unterworfen sind.

Das Kodieren und Dekodieren nach dem erfindungsgemäßen Ver- fahren erfolgt wie beim herkömmlichen Verfahren unter Verwendung von baumartig angelegten Datenstrukturen, deren über zu- geordnete Indizes ansprechbaren Elemente jeweils vorbestimmte Daten repräsentieren.

Bei den Daten, die durch die jeweiligen Datenstrukturelemente repräsentiert werden, kann es sich um beliebig formatierte und beliebig umfangreiche Daten beliebiger Herkunft und beliebigen Inhalts handeln.

Von den besagten Datenstrukturen ist eine erste in einer Kodiereinheit, und eine mit der ersten Datenstruktur identische zweite Datenstruktur in einer Dekodiereinheit vorgesehen.

Die Kodiereinheit und die Dekodiereinheit können Bestandteil beliebiger Vorrichtungen sein. Sie werden insbesondere (aber bei weitem nicht ausschließlich) in DFÜ (Datenfern- übertragungs) -Einrichtungen vorgesehen sein.

Beim Kodieren werden die zu kodierenden Daten in mehr oder weniger umfangreiche, gleich oder unterschiedlich große Teile aufgespalten, und diese Datenteile werden unter Nachschlagen in der in der Kodiereinheit verfügbaren Datenstruktur durch die Indizes der die betreffenden Datenteile repräsentierenden Datenstrukturelemente ersetzt.

Umgekehrt werden beim Dekodieren die kodierten Daten in die Indizes, aus denen sie zusammengesetzt wurden, aufgespalten, und diese Indizes werden unter Nachschlagen in der in der Dekodiereinheit verfügbaren Datenstruktur durch die Daten er- setzt, welche durch die über die jeweiligen Indizes ansprechbaren Datenstrukturelemente repräsentiert werden. Hierzu werden, wie aus einem später noch beschriebenen praktischen Beispiel ersichtlich ist, ausgehend von dem durch einen jeweiligen Index bezeichneten Datenstrukturelement (bis zum Errei- chen des hierarchisch in der obersten Ebene liegenden Wurzel- elements) die dem betreffenden Datenstrukturelement unmittelbar oder mittelbar übergeordneten Datenstrukturelemente ermittelt .

Die vorstehend bereits erwähnten Datenstrukturelemente ent- halten wie die Datenstrukturelemente der herkömmlichen Datenstrukturen eine Reihe von diese charakterisierenden Einträgen, wobei die Einträge dabei wiederum jeweils aus einem dem betreffenden Datenstrukturelement zugeordneten Symbol und einer Reihe von auf benachbarte Datenstrukturelemente zei- genden Zeigern bestehen.

Zu den den jeweiligen Datenstrukturelementen zugeordneten Symbolen ist anzumerken, daß es sich dabei um beliebig formatierte und beliebig umfangreiche Daten beliebiger Herkunft und beliebigen Inhalts handeln kann.

Jedem der Datenstrukturelemente ist auch wiederum ein Index zugeordnet, über welchen auf dieses gezielt zugegriffen werden kann.

Bis hierher besteht zwischen den herkömmlichen und den erfindungsgemäßen Datenstrukturen weitgehend Übereinstimmung.

Unterschiedlich ist jedoch die Verknüpfung der einzelnen Datenstrukturelemente untereinander, was sich in der Anzahl und der Bedeutung der für die jeweiligen Datenstrukturelemente eingetragenen bzw. einzutragenden Zeiger bemerkbar macht .

Anders als bei der herkömmlichen Datenstruktur werden nur noch mit "P" bezeichnete Parent-Zeiger und mit "C" bezeichnete Child-Zeiger verwendet, wobei jedes Datenstrukturelement einen Parent-Zeiger P und eine vorbestimmte Vielzahl von Child-Zeigern C enthält.

Der Parent-Zeiger beinhaltet wiederum den Index des Daten- strukturelements, dem das betreffende Datenstrukturelement untergeordnet ist, und die Child-Zeiger beinhalten die Indizes der Elemente, die dem betreffenden Datenstrukturelement untergeordnet sind.

Sämtliche Datenstrukturelemente, die hierarchisch unmittelbar unter einem betreffenden Datenstrukturelement liegen, sind mit diesem direkt über Parent- und Child-Zeiger gekoppelt. Wie später noch genauer beschrieben werden wird, kann dadurch sehr schnell ermittelt werden, ob, wieviele und welche Daten- Strukturelemente einem betreffenden Datenstrukturelement untergeordnet sind.

Der prinzipielle Aufbau einer derart veränderten Datenstruktur ist in Figur 1 veranschaulicht.

Die Datenstruktur gemäß Figur 1 weist eine Tiefe von 3 auf. D.h., einem unter dem hierarchisch am höchsten stehenden Element (Wurzel-Element 11) ist eine Vielzahl von bis zu y hierarchisch tiefer liegenden untergeordneten Datenstruktur- elementen (Child-Elemente 21, 22 ... 2y) eingehängt, und unter diesen Child-Elementen 21, 22 ... 2y ist wiederum jeweils eine Vielzahl von bis zu y hierarchisch noch tiefer liegenden untergeordneten Datenstrukturelementen (Child- Elemente 31, 32, ... 3y) eingehängt bzw. einhängbar.

Den jeweils bis zu y Child-Elementen, die unter das Wurzel- Element oder ein übergeordnetes Child-Element eingehängt sind, sind jeweils unterschiedliche Symbole zugeordnet. Datenstrukturelemente, denen unterschiedliche Symbole zu- geordnet sind, werden im folgenden als Datenstrukturelemente unterschiedlichen Typs bezeichnet; Datenstrukturelementen des selben Typs sind die selben Symbole zugeordnet.

Anders als bei der eingangs beschriebenen herkömmlichen Datenstruktur sind die einem jeweiligen Datenstrukturelement untergeordneten Datenstrukturelemente jeweils direkt (und nicht wie bisher teilweise nur mittelbar über andere unter- geordnete Datenstrukturelemente) am betreffenden Datenstrukturelement eingehängt .

Zur praktischen Realisierung dieser strukturell veränderten Datenstruktur werden die jeweiligen Datenstrukturelement- Einträge wie folgt modifiziert:

P

Typ

Cl (Child- -Element Typ 1)

C2 (Child- -Element Typ 2)

•

Cy (Child- -Element Typ y⁾

Unverändert gegenüber bisherigen Datenstrukturelement-Einträ- gen umfassen die Einträge der neuartigen Datenstrukturelemente den (auf das hierarchisch übergeordnete Datenstrukturelement) zeigenden Parent-Zeiger P und das dem Datenstrukturelement zugeordnete Symbol (den Typ des Datenstrukturelements) .

Anders als bei bisherigen Datenstrukturelement-Einträgen sind keine Rechts-Zeiger R mehr, dafür aber Platz zum Eintragen einer der Anzahl der möglichen Typen von Datenstrukturelementen entsprechenden Anzahl von den Abwärts-Zeigern D entspre- chenden Child-Zeigern Cl, C2 ... Cy reserviert.

Die Vielzahl der Child-Zeiger Cl, C2 ... Cy ermöglicht es, daß sämtliche Datenstrukturelemente, die einem Datenstrukturelement untergeordnet sind, in dem betreffenden Datenstrukturelement aufgelistet bzw. registriert werden können.

Die Liste der Child-Zeiger Cl, C2 ... Cy ist vorzugsweise so angeordnet bzw. wird so beschrieben und verwaltet, daß eine feste Zuordnung zwischen dem Typ des untergeordneten Daten- strukturelements und der Position des auf dieses Datenstrukturelement zeigenden Child-Zeigers innerhalb der Child-Zei- ger-Liste besteht.

Diese Zuordnung ist vorzugsweise für alle Datenstrukturelemente gleich. D.h., daß beispielsweise ein untergeordnetes Datenstrukturelement vom Typ m durch einen Eintrag an der n- ten Stelle in der Child-Zeiger-Liste des übergeordneten Datenstrukturelements registriert wird, wobei der Einfachheit halber m gleich n ist.

Sind die Child-Zeiger nach dem Typ der durch diese bezeichneten Datenstrukturelemente sortiert, so gestaltet sich die Suche und das Auffinden von bestimmten untergeordneten Daten- Strukturelementen besonders einfach und schnell durchführbar.

Unabhängig davon lassen sich das Vorhandensein und der Index bzw. das Fehlen eines eine bestimmte Symbolkette repräsentierenden Datenstrukturelements jeweils von dem dem gesuchten Datenstrukturelement übergeordneten Datenstrukturelement aus ermitteln. Soll beispielsweise in Erfahrung gebracht werden, ob einem Datenstrukturelement ein Datenstrukturelement vom Typ x untergeordnet ist, so kann dies ganz einfach dadurch bewerkstelligt werden, daß an derjenigen Stelle der Child- Zeiger-Liste des übergeordneten Datenstrukturelements, welche für Child-Zeiger auf untergeordnete Datenstrukturelemente vom Typ x reserviert ist, das Vorhandensein oder Fehlen eines entsprechenden Eintrags überprüft wird.

Auf diese Weise können zu kodierende Symbolketten sehr schnell mit den Symbolketten, welche durch die Datenstrukturelemente einen vorhandenen Datenstruktur repräsentiert werden, verglichen und gegebenenfalls entsprechend kodiert werden .

Eine effiziente Möglichkeit zur Reduzierung des Speicherplatzbedarfes besteht darin, daß diejenigen Datenstruktur- elemente, denen keine Datenstrukturelemente mehr untergeordnet sind, aus der Datenstruktur gelöscht werden; die Wurzel- Elemente der Datenstruktur dürfen dabei jedoch nicht gelöscht werden .

Um das Löschen derartiger Datenstrukturelemente aus der erzeugten Datenstruktur schnell und einfach durchführen zu können, wird vorzugsweise einhergehend mit dem Erstellen der Datenstruktur eine Liste erzeugt, in welcher die Indizes der Datenstrukturelemente aufgelistet sind, denen keine weiteren Datenstrukturelemente mehr unter- bzw. nachgeordnet sind. Eine derartige Liste kann erstellt werden, indem die Indizes von neu erzeugten Child-Elementen dort eingetragen, und die Indizes der Elemente, an die ein Child-Element angehängt wird, aus der Liste gelöscht werden.

Zur Verdeutlichung des Unterschiedes zwischen dem vorstehend beschriebenen erfindungsgemäßen Verfahren und dem eingangs beschriebenen herkömmlichen Verfahren wird abschließend die Kodierung der Zeichenfolge "abcababcabc" erläutert.

Die Datenstruktur, mit Hilfe welcher die Kodierung durchgeführt werden soll, ist in Figur 2 veranschaulicht. Wie aus der Figur 2 ersichtlich ist, enthält die dort gezeigte Daten- Struktur Datenstrukturelemente 1 bis 8, wobei die Anzahl der Datenstrukturelemente, die den jeweiligen Datenstrukturelementen zugeordneten Indizes, die den jeweiligen Datenstrukturelementen zugeordneten Zeichen (deren Typ) und die durch die jeweiligen Datenstrukturelemente repräsentierten Zeichen- folgen identisch mit den entsprechenden Parametern der zur Durchführung des herkömmlichen Verfahrens verwendeten Datenstruktur gemäß Figur 3 sind.

Da den Datenstrukturelementen im betrachteten Beispiel "nur" entweder das Zeichen "a" (Datenstrukturelement Typ a) oder das Zeichen "b" (Datenstrukturelement Typ b) oder das Zeichen "c" (Datenstrukturelement Typ c) zugeordnet werden kann, sind die Datenstrukturelemente zum Speichern von drei Child-Zei- gern (Ca, Cb und Cc) ausgelegt; mehr als drei Child-Elemente kann ein Datenstrukturelement unter den gegebenen Umständen nicht haben.

Eine Zusammenstellung der (den jeweiligen Bezugszeichen entsprechenden) Indizes der Datenstrukturelemente, der den betreffenden Datenstrukturelementen zugeordneten Zeichen (der Typen der Datenstrukturelemente) , der den betreffenden Datenstrukturelementen zugeordneten Zeiger und der durch die betreffenden Datenstrukturelemente repräsentierten Zeichenfolgen ist aus der nachfolgenden Tabelle ersichtlich:

Das Lesen und Auswerten dieser Tabelle erfolgt vorzugsweise wie nachfolgend anhand des Datenstrukturelements, dem der Index 4 zugeordnet ist, erläutert wird. Dem betreffenden Datenstrukturelement ist das Zeichen "b" zugeordnet (2. Spalte zu Index 4) . Es ist dem Element mit dem Index 1 unter- geordnet (3. Spalte zu Index 4), welches seinerseits dem Zeichen "a" entspricht (2. Spalte zu Index 1) und keinem übergeordneten Element untergeordnet ist, also ein sogenanntes Wurzelelement darstellt (3. Spalte zu Index 1), wodurch es (das Element mit dem Index 4) die Zeichenfolge "ab" repräsen- tiert (7. Spalte zu Index 4) . Dem Element mit dem Index 4 sind die Elemente mit dem Index 7 (4. Spalte zu Index 4) und mit dem Index 8 (6. Spalte zu Index 4) untergeordnet, wobei das Element mit dem Index 7 dem Zeichen "a" entspricht (weil der Child-Zeiger auf dem für Ca reservierten Listenplatz steht) und folglich die Zeichenfolge "aba" repräsentiert und wobei das Element mit dem Index 8 dem Zeichen "c" entspricht (weil der Child-Zeiger auf dem für Cc reservierten Listenplatz steht) und folglich die Zeichenfolge "abc" repräsentiert .

Will man die vorstehend bereits genannte Zeichenfolge "abcababcabc" komprimieren, so muß diese Zeichenfolge wie beim herkömmlichen Verfahren zunächst in (Teil-) Zeichenfolgen zerlegt werden, die durch die vorhandenen Elemente der verwendeten Datenstruktur repräsentiert werden. Die Zerlegung führt beispielsweise zu den Teilzeichenfolgen "abc", "aba", "bc" und "abc" .

Um anhand der in der Figur 2 gezeigten Datenstruktur feststellen zu können, ob die bei der Zerlegung entstehenden Teilzeichenfolgen durch eines der Datenstrukturelemente repräsentiert wird und welcher Index dem betreffenden Daten- Strukturelement zugeordnet ist, muß nicht zu dem betreffende

Datenstrukturelement selbst gesprungen werden; die begehrten Informationen können bereits durch Auswertung der Einträge in dem dem betreffenden Datenstrukturelement übergeordneten Datenstrukturelement gewonnen werden.

Die dadurch gegenüber dem herkömmlichen Verfahren erzielbaren Vorteile treten bei der Kodierung der Teilzeichenfolge "abc" besonders deutlich hervor. Während beim erfindungsgemäßen Verfahren schon bei der Auswertung des Datenstrukturelements mit dem Index 4 zu dem Ergebnis kommen kann, daß die Zeichenfolge "abc" durch das Datenstrukturelement mit dem Index 8 repräsentiert wird, muß beim herkömmlichen Verfahren zuerst noch über das Datenstrukturelement mit dem Index 7 zum Datenstrukturelement mit dem Index 8 gesprungen werden, um schließlich unter Auswertung der dortigen Einträge zu dem selben Ergebnis kommen zu können.

Es wurde mithin ein Verfahren gefunden, durch welches zu bewerkstelligende Kodierungen und/oder Dekodierungen mit maximaler Geschwindigkeit effizient durchführbar sind.

Claims

Patentansprüche

1. Verfahren zum Kodieren und Dekodieren von Daten, wobei die Zuordnung von kodierten und unkodierten Daten unter Aus- wertung von Einträgen in über Indizes auffindbaren Elementen einer baumartig angelegten Datenstruktur erfolgt, d a d u r c h g e k e n n z e i c h n e t, daß eine Datenstruktur verwendet wird, deren Elemente zur Speicherung der Indizes einer Vielzahl von hierarchisch tie- fer liegenden Elementen ausgelegt sind.

2. Verfahren nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, daß die Elemente der Datenstruktur zur Speicherung der Indi- zes aller dem betreffenden Element unterordenbaren Datenstrukturelemente ausgelegt sind.

3. Verfahren nach Anspruch 1 oder 2, d a d u r c h g e k e n n z e i c h n e t, daß zur Speicherung der Indizes der hierarchisch tiefer liegenden Datenstrukturelemente eine Child-Zeiger-Liste vorgesehen ist.

4. Verfahren nach Anspruch 3 , d a d u r c h g e k e n n z e i c h n e t, daß das Listenelement, in welches ein Index eines hierarchisch tiefer liegenden Elements innerhalb der Child-Zeiger- Liste einzuschreiben ist, von dem Symbol abhängt, das dem hierarchisch tiefer liegenden Element zugeordnet ist.

5. Verfahren nach Anspruch 4 , d a d u r c h g e k e n n z e i c h n e t, daß die Zuordnung der Listenelemente der Child-Zeiger-Liste und der Symbole, die den durch die Indizes bezeichneten Datenstrukturelementen zuordenbar sind, entsprechend einer Sortierreihenfolge der Symbole festgelegt wird.

6. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß während der Erstellung der Datenstruktur eine Liste angefertigt wird, in welcher die Indizes aller Datenstrukturele- mente gespeichert sind, denen keine Datenstrukturelemente untergeordnet sind.

7. Verfahren nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, daß nach der Erstellung der Datenstruktur diejenigen Datenstrukturelemente, denen keine Datenstrukturelemente untergeordnet sind, gelöscht werden.