DE3709957A1 - Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung - Google Patents
Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherungInfo
- Publication number
- DE3709957A1 DE3709957A1 DE19873709957 DE3709957A DE3709957A1 DE 3709957 A1 DE3709957 A1 DE 3709957A1 DE 19873709957 DE19873709957 DE 19873709957 DE 3709957 A DE3709957 A DE 3709957A DE 3709957 A1 DE3709957 A1 DE 3709957A1
- Authority
- DE
- Germany
- Prior art keywords
- characters
- character
- usp
- compressed
- conversion memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Einsparung
von Speicherkapazität bei digitaler Informations
speicherung nach dem Oberbegriff des Patentanspruchs 1.
Bei der digitalen Informationsübertragung und -speicherung
müssen genormte Codes angewendet werden. Ein weltweit
angewendeter Code ist der amerikanische Standardcode
für den Informationsaustausch ASCII, wie er beispielsweise
im "Lexikon der Informatik und Datenverarbeitung", 1986,
R. Oldenbourg-Verlag GmbH, München auf Seite 40 dargestellt
ist. Dabei werden für jedes einzelne Zeichen 8 Bit,
entsprechend einem Byte beansprucht. Mit insgesamt 7 Bit
wird ein Zeichen definitiv beschrieben, während das 8,
mit P bezeichnete Bit zur Datenkontrolle dient. Mit 7 Bit
lassen sich 128 verschiedene Zeichen eindeutig festlegen.
Bei Anwendung des 8 Bits ergeben sich weitere 127
Möglichkeiten. Bei den bekannten Informationsübertragungs-
und -speichersystemen wird jedoch wie bereits erwähnt
für jedes einzelne Zeichen ein komplettes Byte benötigt,
wobei das 8. Bit lediglich zu Prüfungszwecken benutzt wird.
Die Aufgabe der Erfindung besteht darin, ein Verfahren
anzugeben, womit die für eine Informationsmenge benötigte
Speicherkapazität drastisch reduziert werden kann, wobei
die Zusammenarbeit auf ASCII-Basis arbeitenden Geräten
und Übertragungsverfahren gewährleistet ist.
Diese Aufgabe wird durch eine Merkmalskombination gelöst,
wie sie im Patentanspruch 1 angegeben ist.
Damit wird in vorteilhafter Weise erreicht, daß entweder
mehr Daten auf ein in seiner Kapazität begrenztes
Datenmedium untergebracht werden können, oder daß für
eine vorbestimmte Datenmenge ein weniger großer Bereich
eines Speichermediums beansprucht wird. Vorteilhafte
Weiterbildungen der Erfindung ergeben sich aus den
Unteransprüchen.
Ein Ausführungsbeispiel der Erfindung wird
nachfolgend anhand einer Zeichnung näher erläutert. Die
an einem Dateneingang DE ankommenden Daten werden zunächst
in einem Eingabezwischenspeicher EZ-SP abgelegt. Daran
angeschlossen ist eine Analyseeinrichtung AE, womit
festgestellt wird, welche aufeinanderfolgenden Zeichen
für eine Komprimierung geeignet sind. Zu diesem Zweck
werden jeweils beispielsweise zwei Zeichen einem Vergleicher
VG angeboten. Mit Hilfe einer Steuereinrichtung SE wird
ein Adreßzähler AZ gestartet, womit der Umsetzspeicher USP,
worin die für eine Komprimierung vorgesehenen Zeichenfolgen
abgelegt sind, zyklisch abgefragt wird. Wird eine
Übereinstimmung zwischen einer angebotenen Zeichenfolge
und einer aus dem Umsetzspeicher USP ausgelesenen Zeichen
folge erkannt, so wird der Adreßzähler AZ kurzzeitig
gestoppt und anstelle der aus mehreren Byte in den Massenspeicher
MSP eingetragen. Die Codierung dieses komprimierten
Zeichens entspricht dabei der Adresse, die der Adreßzähler AZ
erzeugt hatte. Wenn der Vergleicher VG nach dem Durchlaufen
eines Abfragezyklus beim Umsetzspeicher USP keine
Übereinstimmung feststellt, so werden die einzelnen
Informationszeichen unverändert in den Massenspeicher MSP
übernommen.
Die im Massenspeicher MSP abgelegte Information setzt sich
also zusammen aus unverändert übernommenen Zeichen und aus
in der vorbeschriebenen Weise komprimierten Zeichen. Ein
komprimiertes Zeichen entsteht beispielsweise dadurch,
daß die in Texten häufig aufeinanderfolgend vorkommende
Buchstabenkombination "en", wofür normalerweise zwei
ASCII-Zeichen, also zwei Bytes benötigt werden, zu einem
einzigen Zeichen zusammengefaßt werden. Dieses Byte wird
mit Hilfe des Umsetzspeichers USP in der zuvor beschriebenen
Weise gebildet, wobei die Codierung der 8 Bit dieses Byte z. B.
hexadezimal ausgedrückt FO entspricht. Wie bereits eingangs
erwähnt, lassen sich im Umsetzspeicher USP bis zu 127 derartige
komprimierte Zeichen ablegen. Die Zahl 127 ergibt sich
daraus, daß das beim ASCII-Code nicht benutzte 8. Bit
(P-Bit) bei der Komprimierung eingesetzt wird. Bei einem
komprimierten Zeichen ist also das 8. Bit im ASCII-Code
immer gesetzt. Dadurch ergibt sich eine heximale Adressierung
des Umsetzspeichers USP, die von hexadezimal 80 bis
hexadezimal FE reicht.
Wenn auf diese Weise beispielsweise jeweils zwei
aufeinanderfolgende Zeichen zusammengefaßt werden, so
lassen sich bei normalen Texten etwa 40% der
Speicherkapazität bei einem Massenspeicher einsparen.
Das Zusammenfassen von Buchstaben-Zeichen kann auch dadurch
geschehen, daß beispielsweise häufig vorkommende Doppelkon
sonanten wie nn oder mm ebenso zu einem Zeichen zusammen
gefaßt werden, wie Einzelbuchstaben, die häufig am Ende
eines Wortes vorkommen, wo dann der nachfolgende Leerschritt
in das komprimierte Zeichen mit einbezogen wird.
Nachfolgend wird beschrieben, wie die auf diese Weise
teilweise komprimierte Information aus dem Massenspeicher MSP
ausgelesen und dabei der ursprüngliche ASCII-Code
wiedergewonnen wird. Die aus dem Massenspeicher ausgelesene
Information wird zunächst einem Komprimierungserkenner
angeboten. Wird dabei am Vorhandensein des 8. Bits ein
komprimiertes Zeichen erkannt, so wird damit unmittelbar
der Umsetzspeicher USP adressiert. Der Umsetzspeicher
USP liefert dabei direkt die unter dieser Adresse abgelegten
beiden Original-ASCII-Zeichen. Diese Zeichen gelangen
in den Ausgabezwischenspeicher AZSP. Wird ein nicht
komprimiertes ASCII-Zeichen aus dem Massenspeicher MSP
ausgelesen, so wird dieses über den Komprimierungserkenner
KE direkt zum Ausgabezwischenspeicher AZ-SP weitergeleitet.
Auf diese Weise erscheint am Datenausgang DA beim
Auslesen des Ausgabezwischenspeichers AZ-SP wieder
der ursprüngliche ASCII-Code.
Noch weitergehende Einsparungen lassen sich dann erzielen,
wenn sehr viele gleiche Zeichen aufeinanderfolgend
eingespeichert werden sollen, wie dies beispielsweise
für die Darstellung von grafischen Anzeigen vorkommen
kann. Beim Erkennen von Grafikzeichen wird in einem
solchen Fall von der Analyseeinrichtung eine Umsetzung
vorgenommen, wobei eine Vielzahl gleicher Zeichen mit
insgesamt 3 Bytes dargestellt wird. Das erste Byte
stellt dabei einen Steuercode dar, der angibt, daß
die beiden folgenden Bytes eine größere Folge gleicher
Zeichen beschreiben. Das zweite Byte gibt verschlüsselt
die Zeichenlänge, d. h. die Anzahl der gleichen Zeichen an.
Das dritte Byte gibt im ASCII-Code das Zeichen selbst an.
Während bei normalen Texten eine Einsparung von etwa 40% bis
50% erzielbar ist, kann bei bestimmten Grafikdarstellungen
eine noch weitergehende Einsparung erzielt werden.
Die Einsparungen wirken sich beim erfindungsgemäßen
Verfahren so aus, daß auf einen vorgegebenen Datenträger,
beispielsweise Diskette, wesentlich mehr Information
untergebracht werden kann als dies bei normaler Codierung
möglich wäre. Somit kann in vielen Fällen ein einziger
Datenträger genügen, wo bei normaler Codierung bereits
zwei oder drei Datenträger notwendig wären.
Claims (8)
1. Verfahren zur Einsparung von Speicherkapazität bei
digitaler Informationsspeicherung, wobei die
Speicherung von Zeichen nach einem genormten Code
erfolgt und für jedes Zeichen ein Byte zur Verfügung
gestellt wird,
dadurch gekennzeichnet,
daß mit Hilfe eines Umsetzspeichers (USP) jeweils
mehrere Zeichen, z. B. Buchstaben, die in einer zu
speichernden Information aufeinanderfolgend oft
vorkommen und im Umsetzspeicher (USP) abgelegt sind,
zu einem einzigen komprimierten Zeichen zusammengefaßt
werden, dessen Codierung außerhalb eines für die
genormte Codierung benutzten Bereiches liegt, so daß
in einem Massenspeicher (MSP) jeweils nur ein Byte
für derartige Zeichen-Kombinationen erforderlich ist.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß der Umsetzspeicher (USP) sowohl für die Erzeugung
der komprimierten Zeichen als auch für die Wiedergewinnung
der ursprünglichen Zeichen benutzt wird.
3. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß eine Analyseeinrichtung (AE) vorgesehen ist,
womit zur Komprimierung geeignete Zeichenfolgen
erkannt werden.
4. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß Eingabezwischenspeicher (EZ-SP) und Ausgabezwischen
speicher (AZ-SP) vorgesehen sind für die vorübergehende
Aufnahme der ursprünglichen Zeichen.
5. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß ein Komprimierungserkenner (KE) vorgesehen ist,
der beim Ausspeichern von komprimierten Zeichen das
Ermitteln der ursprünglichen Zeichenfolge durch
Abfrage des Umsetzspeichers (USP) oder Entschlüsseln
von komprimierten Zeichenfolgen veranlaßt.
6. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß vorwiegend jeweils zwei Zeichen zusammengefaßt
werden.
7. Verfahren nach einem der Ansprüche 1 oder 2,
dadurch gekennzeichnet,
daß Zeichen auch mit Leerstellen (Blanks) zusammengefaßt
sein können.
8. Verfahren nach Anspruch 1,
dadurch gekennzeichnet,
daß größere Mengen von aufeinanderfolgenden gleichartigen
Zeichen durch die Analyseeinrichtung (AE) zu einer
komprimierten Zeichenfolge zusammengesetzt werden, die
aus einem außerhalb des normalen Codierungsbereichs
liegenden Steuercode, einem Zeichen für die Angabe
der Anzahl von gleichen Zeichen und dem betreffenden
Zeichen selbst besteht.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19873709957 DE3709957A1 (de) | 1987-03-26 | 1987-03-26 | Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19873709957 DE3709957A1 (de) | 1987-03-26 | 1987-03-26 | Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE3709957A1 true DE3709957A1 (de) | 1988-10-06 |
Family
ID=6324033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19873709957 Withdrawn DE3709957A1 (de) | 1987-03-26 | 1987-03-26 | Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE3709957A1 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2681966A1 (fr) * | 1991-09-27 | 1993-04-02 | Euro Cp Sarl | Procede de compression-decompression de donnees textuelles dans un reseau domotique. |
FR2717281A1 (fr) * | 1994-03-11 | 1995-09-15 | Neuron Data | Dispositif de codage de symboles tels que des caractères. |
DE19706268A1 (de) * | 1997-02-18 | 1998-08-20 | Christian Wenz | Dateiformatspezifisches Packverfahren |
-
1987
- 1987-03-26 DE DE19873709957 patent/DE3709957A1/de not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2681966A1 (fr) * | 1991-09-27 | 1993-04-02 | Euro Cp Sarl | Procede de compression-decompression de donnees textuelles dans un reseau domotique. |
FR2717281A1 (fr) * | 1994-03-11 | 1995-09-15 | Neuron Data | Dispositif de codage de symboles tels que des caractères. |
DE19706268A1 (de) * | 1997-02-18 | 1998-08-20 | Christian Wenz | Dateiformatspezifisches Packverfahren |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2751097C2 (de) | Schaltungsanordnung zum Erzeugen eines Kennsignals | |
DE3606869C2 (de) | Vorrichtung zur Datenkompression | |
DE2030760C2 (de) | Paritätsprüfschaltung für eine Speicherschaltung | |
DE2747498C2 (de) | Anordnung zum Erfassen und Speichern von Unterschriften | |
DE2723523A1 (de) | Kompression und dekompression von gespeicherten digitaldaten | |
DE2208664A1 (de) | Verfahren zur Decodierung eines vorsatzfreien Verdichtungscodes veränderlicher Länge | |
DE19621768A1 (de) | Telefon mit Aufnahmevorrichtung für eine Telefonspeicherkarte und Verfahren zum Übertragen von Daten einer Telefonspeicherkarte | |
DE3209187C2 (de) | Verfahren zur Darstellung eines Textes auf einer einzeiligen Anzeigevorrichtung eines Texterstellungsgerätes | |
EP0016973B1 (de) | Anzeigeeinrichtung für eine Textbearbeitungseinrichtung | |
DE2006672A1 (de) | Vorrichtung zur Sichtbarmachung von Daten | |
DE2054941A1 (de) | Anordnung zur Auswahl von Datensätzen | |
DE3709957A1 (de) | Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung | |
DE2636788C3 (de) | Datenspeicher für Datensichtgeräte | |
DE1233627B (de) | Anordnung zur Datenuebertragung durch Impulse unter Verwendung von Datenkompression und Datenexpansion | |
DE1234054B (de) | Byte-Umsetzer | |
DE2537576A1 (de) | Textbearbeitungseinrichtung | |
DE2748859C3 (de) | Schaltungsanordnung zum Speichern eines Textes | |
EP0690622A2 (de) | Verfahren zur Minimierung des Speicheraufwandes für Teletextdaten | |
DE3113189C2 (de) | Vorrichtung zur Umsetzung von digitalen Zeichencodes, die von einem Datenverarbeitungssystem empfangen oder geliefert werden | |
EP0051308A1 (de) | Verfahren und Schaltungsanordnung zur Formatierung einer Magnetspeicherplatte | |
DE3040166C1 (de) | Verfahren und Schaltungsanordnung zur Transformation der Zeichenbreite von Schriftzeichen | |
DE4435457C2 (de) | Verfahren zum Archivieren von Prozeßdaten | |
DE3047597C2 (de) | Anordnung zum Verteilen von Information und zum raschen und gezielten Auffinden von einen Adressenteil aufweisenden Informationseinheiten | |
DE3729942C2 (de) | ||
EP1111864A2 (de) | Kodierung von Haupt- und Zusatziformationen in einem Bussystem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8139 | Disposal/non-payment of the annual fee |