FR2681966A1 - Procede de compression-decompression de donnees textuelles dans un reseau domotique. - Google Patents

Procede de compression-decompression de donnees textuelles dans un reseau domotique. Download PDF

Info

Publication number
FR2681966A1
FR2681966A1 FR9111920A FR9111920A FR2681966A1 FR 2681966 A1 FR2681966 A1 FR 2681966A1 FR 9111920 A FR9111920 A FR 9111920A FR 9111920 A FR9111920 A FR 9111920A FR 2681966 A1 FR2681966 A1 FR 2681966A1
Authority
FR
France
Prior art keywords
character
bit
lexicon
bits
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR9111920A
Other languages
English (en)
Inventor
Jerome Gilbert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Euro CP Sarl
Original Assignee
Euro CP Sarl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Euro CP Sarl filed Critical Euro CP Sarl
Priority to FR9111920A priority Critical patent/FR2681966A1/fr
Publication of FR2681966A1 publication Critical patent/FR2681966A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention concerne un procédé qui permet d'augmenter le débit apparent des transmissions de données textuelles et de diminuer le volume global de mémoire nécessaire pour le stockage des textes et messages dans un réseau domotique. L'invention consiste à remplacer dans un texte (11), à chaque fois que c'est possible, une chaîne de caractères par un code permettant de la retrouver ultérieurement dans un lexique associé au procédé (12), (15) dont disposent tous les appareils devant assurer la restitution des textes (16).

Description

Procédé de compression-décompression de données textuelles dans un réseau domotique
L'invention concerne un procédé qui permet d'augmenter le débit apparent des transmissions de données textuelles et de diminuer le volume global de mémoire nécessaire pour le stockage des textes et messages dans un réseau domotique.
Le procédé selon l'invention permet d'obtenir un débit apparent élevé lors de la transmission de données textuelles alors que le débit réel du système de transmission est faible. Par exemple il est possible d'obtenir une vitesse moyenne de rafraîchissement d'écran sur un dispositif de visualisation proche de ce qu'il est habituel d'observer sur un terminal vidéotex en utilisant un système de transmission ayant un débit de 600 bits/S.
Il s'agit d'un procédé asymétrique qui privilégie volontairement l'émetteur de texte (201), (202), (205), catégorie à laquelle appartient la plupart des appareils fournisseurs de services rencontrés dans un réseau domotique (213). L'invention permet de réduire de manière significative la taille de mémoire (203), (204), (207), (209) utilisée pour le stockage des textes. Les terminaux capables restituer les textes (208) sont en revanche légèrement pénalisés par la nécessité de contenir dans leur mémoire le lexique associé au procédé (210). Cette légère pénalisation est acceptable car ces appareils disposent généralement d'une mémoire de taille importante et ils sont peu nombreux dans un réseau domotique.
Les textes comprimés reçus (206) ou stockés localement (209) sont restitués après décompression (211) au moyen d'une interface sensorielle (212), par exemple un dispositif de visualisation (215), un dispositif de restitution sonore (214) ou Braille (216).
Contrairement à d'autres procédés de compression-décompression de données existants, l'invention ne s'applique qu'à des données qui représentent du texte c'est à dire des chaînes de caractères alphanumériques et des caractères de contrôle.
Le procédé selon l'invention permet de comprimer du texte sans limitation de vocabulaire, quelque soit la langue utilisée dans l'ensemble des langues prévues lors de la mise en oeuvre du procédé.
L'absence de limitation de vocabulaire est obtenue en combinant dans le même ensemble de données textuelles des mots qui représentent des chaînes de caractères existant dans le lexique associé au procédé et des mots qui représentent des caractères élémentaires. Le taux de compression obtenu grâce au procédé varie en fonction de la fréquence d'apparition de mots se référant au lexique à l'intérieur du flux de données à traiter et de la taille des chaînes de caractères utilisées dans le lexique.
Les caractères alphanumériques et les codes de contrôle utilisés dans le système pour constituer les textes sont codés sur 7 bits par exemple en ASCII standard. Les mots qui sont gérés par le système sont des mots de 8 bits.
Le procédé selon l'invention utilise le bit, qui reste libre dans un mot de 8 bits lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, pour signifier si il s'agit d'un caractère élémentaire ou s'il s'agit d'un index correspondant de manière biunivoque à une chaîne de caractères contenue dans le lexique associé au procédé. Par exemple le 8ème bit d'un mot représentant du texte peut être celui dont l'état indique si il s'agit d'un caractère élémentaire, 8ème bit à 0, ou d'une référence au lexique, 8ème bit à 1, dans cet exemple les 7 autres bits représentent respectivement le code
ASCII d'un caractère élémentaire ou la valeur de l'index se référant au lexique.
La phase de compression de données textuelles consiste à remplacer, dans un texte (11) à stocker ou à transmettre, chaque chaîne de caractères qui figure dans le lexique (12) par un mot de 8 bits dont l'état du bit, qui reste libre lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, indique qu'il s'agit d'une référence au lexique et où les 7 bits restants représentent la valeur de l'index correspondant à la chaîne de caractères à comprimer; les chaînes de caractères qui ne figurent pas dans le lexique ne sont pas comprimées; elle restent constituées d'un ensemble de mots de 8 bits dont l'état du bit, qui reste libre lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, indique que les 7 bits restants représentent le code d'un caractère alphanumérique ou d'un caractère de contrôle. Le texte comprimé contient des mots (13) qui correspondent à des références au lexique ou, de manière non exclusive, des mots représentant des caractères élémentaires
La phase de décompression de données textuelles (14) consiste à remplacer les mots de 8 bits dont l'état du bit qui reste libre lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, indique qu'il s'agit d'une référence au lexique (15), par la chaîne de caractères extraite du lexique à partir de la valeur d'index fournie par les 7 bits restants du mot; les chaînes de caractères extraites du lexique sont encadrées par deux caractères élémentaires "espace" et sont incluses dans le flux de caractères élémentaires en respectant l'ordre d'arrivée; la phase de décompression restitue des textes (16) composés exclusivement de mots dont le 8ème bit indique qu'il s'agit de caractères élémentaires.
Le lexique contient autant de tables de chaînes de caractères que de langues gérées par le système dans lequel le procédé est mis en oeuvre; à chaque valeur d'index correspond dans chaque table une chaîne de caractères équivalente sur le plan sémantique aux chaînes contenues dans les autres tables pour cette valeur d'index. Les chaînes de caractères contenues dans les tables sont par exemple les mots ou groupes de mots les plus utilisés dans l'environnement domestique.
Un code représentatif de la langue utilisée par ltémetteur d'un texte est connu au moins des destinataires de ce texte dans le réseau et pendant un temps au moins égal à celui qui est nécessaire au traitement de ce texte par tous les destinataires. Ce code peut être par exemple distribué à tous les appareils du réseau en fonction du choix d'une langue par l'utilisateur sur un des appareil restituant les textes et ce code peut rester valide jusqu'à ce que l'utilisateur décide de changer de langue.
Les dessins annexés illustrent l'invention: - La figure 1 représente les phases de compression et de décompression du procédé.
- La figure 2 donne un exemple de réseau domotique où l'on trouve trois appareils appartenant à la catégorie fournisseurs de services et un appareil de restitution de données textuelles.
- La figure 3 illustre un exemple d'application du procédé où l'on compare le nombre de mots nécessaires au codage d'un petit texte sans compression puis en comprimant les mêmes données textuelles à l'aide du procédé selon l'invention. Le lexique utilisé pour les phases de compression et de décompression (31) contient autant de tables (33), (34), (35) que de langues gérées par le système dans lequel le procédé est mis en oeuvre.
Dans le lexique, chaque valeur de l'index (32) est associée à une chaîne de caractères dans chaque table et ces chaînes de caractères ont la même signification pour une valeur d'index donnée. Le nombre de valeurs possibles de l'index dépend du système dans lequel le procédé est mis en oeuvre. La langue choisie pour les textes dans l'exemple est le français, les appareils concernés ont pris connaissance de ce choix par un moyen extérieur au procédé et ils font tous référence aux tables contenant des chaînes de caractères ayant un sens en français.
Dans cet exemple le texte choisi a pu être comprimé, relativement au lexique donné, dans un rapport de 1:3,5 ce qui signifie que le procédé a permis de diviser par 3,5 la taille de mémoire nécessaire au stockage de ce texte et que si ce texte doit être transmis, il le sera au moins 3,5 fois plus vite. En réalité le gain en temps de transmission est plus difficile à évaluer que le gain en volume de données car il dépend de la manière dont les données sont transportées, si elles sont fractionnées en paquets, le gain en temps de transmission ne varie pas linéairement en fonction du volume de données. Dans la plupart des cas, le gain en temps de transmission apporté par le procédé est très nettement supérieur au gain en volume correspondant toutes choses étant égales par ailleurs.

Claims (5)

REVENDICATIONS
1. Procédé de compression-décompression de données textuelles dans un réseau domotique où les données sont gérées par mots de 8 bits, les caractères alphanumériques et de contrôle sont codés sur 7 bits et où des textes sont transmis par des appareils vers d'autres appareils du réseau; le procédé de compression-décompression de données textuelles est caractérisé par le fait que le bit, qui reste libre dans un mot de 8 bits lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, est utilisé pour signifier si il s'agit d'un caractère élémentaire ou s'il s'agit d'un index correspondant de manière biunivoque à une chaîne de caractères contenue dans un lexique.
2. Procédé selon la revendication précédente caractérisé en ce que la phase de compression de données textuelles consiste à remplacer, dans un texte à stocker ou à transmettre, chaque chaîne de caractères qui figure dans le lexique par un mot de 8 bits dont l'état du bit, qui reste libre lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, indique qu'il s'agit d'une référence au lexique et où les 7 bits restants représentent la valeur de l'index correspondant à la chaîne de caractères à comprimer; les chaînes de caractères qui ne figurent pas dans le lexique ne sont pas comprimées, elle restent constituées d'un ensemble de mots de 8 bits dont l'état du bit, qui reste libre lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, indique que les 7 bits restants représentent le code d'un caractère alphanumérique ou d'un caractère de contrôle.
3. Procédé selon l'une quelconque des revendications précédentes caractérisé en ce que la phase de décompression de données textuelles consiste à remplacer les mots de 8 bits dont l'état du bit qui reste libre lors du codage sur 7 bits d'un caractère alphanumérique ou d'un caractère de contrôle, indique qu'il s'agit d'une référence au lexique, par la chaîne de caractères extraite du lexique à partir de la valeur d'index fournie par les 7 bits restants du mot; les chaînes de caractères extraites du lexique sont encadrées par deux caractères élémentaires "espace" et sont incluses dans le flux de caractères élémentaires en respectant l'ordre d'arrivée; la phase de décompression restitue des textes composés exclusivement de mots dont le 8ème bit indique qu'il s'agit de caractères élémentaires.
4. Procédé selon l'une quelconque des revendications précédentes caractérisé en ce que le lexique contient autant de tables de chaînes de caractères que de langues gérées par le système dans lequel le procédé est mis en oeuvre; à chaque valeur d'index correspond dans chaque table une chaîne de caractères équivalente sur le plan sémantique aux chaînes contenues dans les autres tables pour cette valeur d'index.
5. Procédé selon la revendication 4 caractérisé en ce qu'un code représentatif de la langue utilisée par l'émetteur d'un texte est connu, au moins des destinataires de ce texte dans le réseau, et pendant un temps au moins égal à celui qui est nécessaire au traitement de ce texte par tous les destinataires.
FR9111920A 1991-09-27 1991-09-27 Procede de compression-decompression de donnees textuelles dans un reseau domotique. Pending FR2681966A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9111920A FR2681966A1 (fr) 1991-09-27 1991-09-27 Procede de compression-decompression de donnees textuelles dans un reseau domotique.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9111920A FR2681966A1 (fr) 1991-09-27 1991-09-27 Procede de compression-decompression de donnees textuelles dans un reseau domotique.

Publications (1)

Publication Number Publication Date
FR2681966A1 true FR2681966A1 (fr) 1993-04-02

Family

ID=9417364

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9111920A Pending FR2681966A1 (fr) 1991-09-27 1991-09-27 Procede de compression-decompression de donnees textuelles dans un reseau domotique.

Country Status (1)

Country Link
FR (1) FR2681966A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0633537A2 (fr) * 1993-06-30 1995-01-11 Microsoft Corporation Procédé et système pour chercher des données comprimées

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3709957A1 (de) * 1987-03-26 1988-10-06 Merk Gmbh Telefonbau Fried Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung
EP0286719A2 (fr) * 1986-12-04 1988-10-19 International Business Machines Corporation Méthode et dispositif pour la compression et l'expansion de textes
EP0456893A2 (fr) * 1990-05-14 1991-11-21 Robert Bosch Gmbh Méthode de compression de données

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0286719A2 (fr) * 1986-12-04 1988-10-19 International Business Machines Corporation Méthode et dispositif pour la compression et l'expansion de textes
DE3709957A1 (de) * 1987-03-26 1988-10-06 Merk Gmbh Telefonbau Fried Verfahren zur einsparung von speicherkapazitaet bei digitaler informationsspeicherung
EP0456893A2 (fr) * 1990-05-14 1991-11-21 Robert Bosch Gmbh Méthode de compression de données

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0633537A2 (fr) * 1993-06-30 1995-01-11 Microsoft Corporation Procédé et système pour chercher des données comprimées
EP0633537A3 (fr) * 1993-06-30 1995-08-23 Microsoft Corp Procédé et système pour chercher des données comprimées.

Similar Documents

Publication Publication Date Title
US5999949A (en) Text file compression system utilizing word terminators
US6377930B1 (en) Variable to variable length entropy encoding
US7529806B1 (en) Partitioning of MP3 content file for emulating streaming
KR100670815B1 (ko) 순차적 데이터 처리 기반의 유해 멀티미디어 서비스 차단장치 및 그 방법
US20020109615A1 (en) Method and apparatus for adaptive data compression
FR2820563A1 (fr) Procede de compression/decompression d'un document structure
EP0820151B1 (fr) Procédé et dispositif de compression et de décompression de messages
CN111339250A (zh) 新类别标签的挖掘方法及电子设备、计算机可读介质
CN101388731B (zh) 一种低速率等效语音水声通信技术
CN111698552A (zh) 一种视频资源的生成方法和装置
US8782273B2 (en) Apparatus and method for generating a data stream and apparatus and method for reading a data stream
KR101032744B1 (ko) 데이터를 송신 및 수신하기 위한 디바이스 및 방법과, 컴퓨터 프로그램 제품과, 캐리어 신호
FR2681966A1 (fr) Procede de compression-decompression de donnees textuelles dans un reseau domotique.
CN111383660A (zh) 一种网站不良信息监测系统及其监测方法
KR20020017966A (ko) 단어 기반 렌더 브라우저를 위한 데이터 처리 시스템에서웹 페이지를 대략 읽거나 속독하기 위한 방법 및 장치
CN110035031B (zh) 一种sql注入的检测方法及数据处理方法
CN108182191B (zh) 一种热点数据处理方法及其设备
FR2826804A1 (fr) Procede de compression de donnees et systeme de navigation
CN111914513A (zh) 一种rdp窗口标题文字识别的方法及装置
CN115543925B (zh) 文件处理方法、装置、电子设备和计算机可读介质
JP2021039293A (ja) 情報処理装置、情報処理方法及びプログラム
Alabish et al. A universal lexical steganography technique
CN112364642B (zh) 一种文本处理方法及装置
FR2781629A1 (fr) Procede de discrimination automatique d'un alphabet pour la restitution visuelle ou sonore d'un document html, et dispositif de gestion de documents html correspondant
EP2677708B1 (fr) Procédé de communication d'un message audiovisuel, et système de communication