KR100271861B1

KR100271861B1 - 데이타압축, 신장방법 및 장치와 이것을 사용한 데이타처리장치 및 네트워크시스템

Info

Publication number: KR100271861B1
Application number: KR1019970002076A
Authority: KR
Inventors: 세이이치 도묘; 히로시 요시우라; 요시아키 하츠토리; 유타카 오츠; 히로마사 무라카미
Original assignee: 가나이 쓰도무; 가부시키가이샤 히다치 세이사꾸쇼
Priority date: 1996-01-31
Filing date: 1997-01-24
Publication date: 2000-11-15
Also published as: JP3277792B2; AU702207B2; JPH09214352A; TW312771B; CN1205574C; CN1167951A; IN190446B; AU1230297A; SG55271A1; EP0788239A2; US5872530A; KR970059917A; EP0788239A3

Abstract

문자열등의 데이타를 이 데이타의 비트수보다 짧은 비트열로 변환하는 데이타압축, 신장방법 및 장치와 이것을 사용한 데이타처리장치 및 네트워크시스템에 관한 것으로서, 보다 높은 압축율을 실현할 수 있고, 압축한 데이타를 원래의 데이타로 신장하고, 데이타압축기능 및 신장기능을 구비한 데이타처리방법 및 장치를 제공하기 위해, 입력수단(221)에 의해 압축할 데이타(201)을 입력하고 이것을 입력비트열(202)로 분해하고, 판정수단(243) 및 참조수단(244)에 의해 입력비트열(202)를 검색키로 해서 정적사전(241)을 참조하고, 입력비트열(202)를 정적사전(241)의 비트열과 비교한 결과와 검색수단(233)에 의한 동적사전(231)의 검색의 결과로 부터 입력비트열(202)를 동적사전(231)에 등록할지 등록하지 않을지를 판정하고, 등록하는 경우에는 등록수단(234)에 의해 인덱스를 붙여서 등록하고, 출력수단(251)에 의해 입력비트열(202) 또는 이것에 일치한 인덱스를 압축데이타(205)로서 출력하는 구성으로 하였다.

이러한 구성에 의해, 동적사전에서는 압축하기 어려운 입력데이타의 선두부분에서도 압축율이 저하하지 않도록 하고, 또 출현빈도가 작은 문자열이 사전을 점령하는 것에 의한 압축율의 저하를 방지할 수 있다는 효과가 있다.

Description

데이타압축, 신장방법 및 장치와 이것을 사용한 데이타처리장치 및 네트워크시스템

본 발명은 문자열등의 데이타를 이 데이타의 비트수보다 짧은 비트열로 변환하는 데이타압축, 신장방법 및 장치와 이것을 사용한 데이타처리장치 및 네트워크시스템에 관한 것이다.

데이타의 압축기술은 하드디스크 등의 기억장치에서의 데이타의 점유량 및 통신에 있어서의 데이타의 전송량을 삭감하고, 기억장치나 통신로의 효율을 향상시키는 기술이다. 종래, 여러가지 데이타압축방법이 제안되어 있지만, 대표적인 방법으로서 데이타압축 핸드북(톱팬, 1994년)의 pp.221∼247에 기술되어 있는 바와 같은 LZ78 및 그 개량형이 있다.

LZ78 및 그 개량형은 다음의 기본적인 스텝으로 구성되는 것이고 미리 정한 규칙에 의해 데이타를 압축하는 수법이다.

(1) 입력데이타로 나타난 문자열을 기억한다. 이 기억한 문자열의 집합을 동적사전이라 한다.

(2) 동적사전 중의 문자열과 동일한 문자열이 입력데이타로 재차 나타난 경우에 출력데이타로서 그 문자열 대신에 동적사전에 있어서의 그 문자열의 인덱스(일반적으로는 정의 정수)를 출력한다.

(3) 축적한 문자열에 의해 동적사전이 가득찼을 때 그 이상의 문자열의 등록을 실행하지 않거나 또는 등록완료된 문자열을 삭제한다. 등록완료된 문자열을 삭제하는 경우 전체 문자열을 삭제하거나 또는 보다 오래된 문자열부터 차례로 삭제 한다.

상기 종래의 방법에 의하면, 여러개의 문자로 이루어지는 문자열이 하나의 인덱스로 치환되므로 데이타를 압축할 수 있다. 또, 상기에 의해 압축된 데이타는 상기의 규칙을 반대로 되돌리는 것에 의해 용이하게 신장변환이 가능하다.

상기 종래의 동적사전을 이용한 데이타압축방법에는 다음의 과제가 있다.

(1) 입력데이타 중에 처음 나타난 문자열은 아직 동적사전에 등록되어 있지 않다. 따라서, 인덱스로 치환하지 않고 입력한 문자열을 그대로 출력한다. 그 때문에, 입력데이타의 처음 부분에서는 압축율이 현저하게 낮다.

(2) 입력데이타 중의 문자열을 동적사전에 순차 등록하므로, 사전이 넘치는 경우가 있다. 이 때의 해결로서, 예를 들면 다음의 삭제수순을 든다.

(a) 사전에 문자열을 신규등록하지 않는다.

(b) 등록한 문자열을 전체 삭제하고 사전을 초기화한다.

(c) 보다 새로운 문자열을 보존하고 오래된 문자열을 삭제한다.

어떠한 삭제수순을 실행한 경우라도 이후의 동적사전에 존재하는 문자열이 입력데이타 중에서 재출현할 가능성이 높다고는 할 수 없다. 일반적으로, 입력데이타 중의 문자열이 동적사전중의 문자열과 합치하는 빈도가 낮으므로, 압축율이 저 하한다.

본 발명의 목적은 보다 높은 압축율을 실현할 수 있는 데이타압축방법 및 장치를 얻는 것이다.

본 발명의 다른 목적은 입력데이타의 최초의 부분에서도 압축율이 저하하지 않는 데이타압축방법 및 장치를 제공하는 것이다.

본 발명의 다른 목적은 출현빈도가 낮은 문자열이 사전의 대부분을 점령하는 것에 의한 압출율의 저하를 방지하는 데이타압축방법 및 장치를 제공하는 것이다.

본 발명의 다른 목적은 압축한 데이타를 원래의 데이타로 신장하는 데이타신장방법 및 장치를 제공하는 것이다.

본 발명의 다른 목적은 데이타압축기능 및 신장기능을 구비한 데이타처리방법 및 장치를 제공하는 것이다.

본 발명의 다른 목적은 데이타압축기능 및 신장기능을 구비한 네트워크시스템을 얻는 것이다.

제1도는 동적사전에 정적사전을 병용한 데이타압축 수순을 도시한 흐름도.

제2도는 동적사전에 정적사전을 병용한 데이타압축장치의 구성도.

제3도는 동적사전과 정적사전을 병용하여 비트길이가 보다 짧은 인덱스를 선택할 수 있게 되는 것을 설명하는 블럭도.

제4도는 입력비트열, 동적사전과 정적사전의 인덱스 중의 가장 짧은 데이타를 부호화하고 압축데이타로서 출력하는 것을 설명하는 블럭도.

제5도는 정적사전 우선방식에 의한 데이타압축방식을 도시한 흐름도.

제6도는 사전전환방식에 의한 데이타압축방식을 도시한 흐름도.

제7도는 정적사전과 일치한 경우에 동적사전에 비트열을 등록하지 않는 수순을 설명하는 흐름도.

제8도는 정적사전과 동적사전의 인덱스의 길이를 계산하고 동적사전의 인덱스가 짧은 경우에 비트열을 동적사전에 등록하는 수순을 도시한 흐름도.

제9도는 자연어, 프로그램언어, 기계어 중의 적어도 1개 이상의 문자열과 그 부가정보로 구성한 정적사전의 구축예를 도시한 도면.

제10도는 제9도의 상기 부가정보로서 언어상의 규칙을 포함한 정적사전의 구축예를 도시한 도면.

제11도는 부가정보의 별개의 구축예를 도시한 도면.

제12도는 이용도가 낮은 비트열을 삭제하고 등록할 수 있는 영역을 확보하는 수순을 도시한 흐름도.

제13도는 정적사전(241)의 부가정보를 사용해서 삭제하는 구성도.

제14도는 프로그램의 종류나 압축조건을 초기설정하는 것을 도시한 구성도.

제15도는 정적사전의 구축의 1실시예를 도시한 구성도.

제16도는 분산시스템 상에서 정적사전을 공유할 수 있는 경우의 본 발명을 실시하는 흐름도.

제17도는 분산시스템 상에서 정적사전을 공유할 수 없는 경우의 본 발명의 장치의 구성도.

제18도는 본 발명에 있어서의 압축데이타구조와 각 인덱스의 관계를 도시한 도면.

제19도는 동적사전에 정적사전을 병용한 데이타신장장치의 구성도.

제20도는 정적사전과 동적사전의 인덱스를 참조하면서 데이타를 신장하는 수순을 도시한 흐름도.

상기 목적을 달성하기 위해 본 발명은 다음의 구성을 취한다.

첫째, 동적사전과 정적사전을 병용하고, 정적사전은 등록내용을 변경하지 않도록 한다. 정적사전에는 출현빈도가 높고 비교적 긴 문자열과 그 인덱스를 등록해 둔다. 압축데이타로서는 동적사전의 인덱스에 부가해서 정적사전의 인덱스도 출력 한다.

구체적으로는 입력문자열(이하, 「입력비트열」 이라 한다), 동적사전의 인덱스, 정적사전의 인덱스 중의 어느 하나의 부호와 동적사전, 정적사전 중의 어느 한쪽을 복호용의 사전으로서 선택하기 위한 부호를 출력한다. 이 때, 입력비트열의 부호의 길이를 기억하고 정적사전을 검색할 때 입력비트열과 일치한 인덱스의 부호의 길이를 적어도 1개 기억하고, 동적사전에 등록할 때에 동일하게 일치한 인덱스의 부호의 길이를 기억하고, 상술한 입력비트열 및 인덱스 중에서 보다 짧은 부호를 압축데이타로서 출력한다.

또, 정적사전에서 대상으로 되는 비트열을 검출한 단계에서 정적사전의 인덱스를 출력하는 정적사전 우선방식을 채용해도 좋다.

또, 동적사전의 인덱스를 사용한 압축이 바람직하지 않은 부분, 즉 입력데이타의 최초의 부분 예를 들면 선두의 500바이트등이라고 한 부분에 대해서는 입력비트열의 코드 또는 정적사전의 인덱스를 사용해서 부호화한다는 사전전환방식을 채용해도 좋다.

이상의 어떠한 구성에 의해서도 상기 문제점(1)이 해소된다

둘째, 상기 문제점(2)를 해소하기 위해서, ① 이용도가 낮은 문자열을 동적사전에 등록하지 않도록 하는 것, ② 사전의 넘침을 예견하고 동적사전에서 이용도가 낮은 문자열을 삭제하는 것 중의 어느 하나의 구성을 취한다.

①에 대해서는 구체적으로는 입력비트열이 정적사전의 내용과 일치한 경우 그 입력비트열을 동적사전에 등록하지 않도록 한다.

또, 동적사전에 입력비트열을 등록했을 때의 인덱스를 사전 조사하고, 출력데이타로서 부호화한 경우에 동적사전의 인덱스가 정적사전의 인덱스에 비해 짧다고 판정한 경우에 등록하도록 해도 좋다.

또, 정적사전의 속성정보, 출현확률 또는 비트열간의 관련성 중의 적어도 1개를 부가정보로서 이용하고 이것에 따라서 입력비트열을 등록하지 않도록 해도 좋다.

②에 대해서는 구체적으로는 정적사전의 각 비트열을 속성정보, 출현확률 또는 비트열간의 관련성 중의 적어도 1개의 부가정보와 맞추어 정의하고, 부가정보를 이용해서 이용도가 낮은 적어도 1개의 비트열을 동적사전에서 삭제한다.

또, 동적사전의 사용사이즈의 상한값 또는 등록비트열수의 상한값의 적어도 한쪽을 기억함과 동시에 동적사전의 사용사이즈의 현재값 또는 등록비트열의 수의 현재값의 적어도 한쪽을 기억하고, 현재값이 상한값을 초과하는 “넘침”을 검출한 경우에 정적사전의 비트열의 부가정보를 참조해서 그것에 따라 동적사전의 비트열을 삭제하도록 해도 좋다.

이상의 어떠한 구성에 의해서도 상기 문제점(2)가 해소된다.

본 발명에 관한 데이타압축방법 및 장치를 실시하는 경우, 출현빈도가 높은 비트열을 포함하는 정적사전을 구축할 필요가 있다. 본 발명의 바람직한 장치의 형태로는 정적사전이 영어나 일본어등의 자연언어의 1개이상의 단위어 또는 그 일부, 프로그램언어의 1개이상의 예약어 또는 그 일부, 또는 기계어의 1개이상의 명령어 또는 그 일부 중의 적어도 1개이상을 포함하도록 한다. 특히, 정적사전의 내용은 자연언어의 문자열 또는 자연언어의 정규표현으로서의 문자열이고, 이것에 속성정보를 부가해서 품사, 어형변화, 어의, 어법 등을 정의한다.

또, 본 발명에 관한 데이타압축방법 및 장치를 실시하는 경우 정적사전 및 동적사전의 테이블구성이나 각각의 사전을 조작하는 프로그램의 선택에 배려할 필요가 있다. 특히, 본 발명의 바람직한 장치의 형태에서는 최대 2^10∼2^15(1K∼32K)개의 인덱스를 갖는 동적사전과 최대 2^12∼2^17(4K∼128K)개의 인덱스를 갖는 정적사전으로 구성한다. 또, 정적사전을 구축하는 프로그램, 동적사전에 입력비트열을 등록하는 프로그램 및 동적사전에 등록한 비트열을 삭제하는 프로그램을 선택하고, 각각에 대해서 데이타압축의 조건을 설정하는 초기설정 화면을 마련한다.

또, 본 발명에 관한 데이타압축방법 및 장치를 실시하는 경우 압축원와 복원지의 정적사전을 공유할 필요가 있다. 본 발명의 적용대상의 하나로서 네트워크를 거친 파일전송시의 데이타압축이 있고, 이것에 대해서 다음의 구성을 취할 수 있다. 복원지의 장치를 특정할 수 있는 경우에는 미리 정적사전을 공유할 수 있는 것을 확인한 후에 정적사전을 이용한다. 또는 정적사전의 범용인덱스를 마련해도 좋다. 이 경우, 압축원에서는 압축장치 고유의 인덱스에서 범용인덱스로 엔코드한 데이타를 압축하고 복원지로 전송한다 복원지에서는 데이타를 범용인덱스에서 복호장치 고유의 인덱스로 변환해서 복원한다.

이상, 본 발명에 관한 데이타압축방법에 의하면, 동적사전 단독에 의한 방법에 비해서 압축율을 향상시킬 수 있다.

[실시예]

이하, 입력비트열과 정적사전의 비트열을 비교한 결과를 기본으로 동적사전에 비트열을 등록하는 실시 형태의 1예(이하, 「실시예」 라 한다)를 설명한다. 또한, 본 발명은 본 실시예에 의해 한정되는 것은 아니다.

우선, 제1도, 제2도, 제7도 및 제8도를 사용해서 본 실시예의 개요를 설명한다.

제2도는 동적사전에 정적사전을 병용한 데이타압축장치의 구성도이다. 이 데이타압축장치(200)은 입력데이타(201)을 데이타량이 적은 압축데이타(205)로서 출력하는 것이고, 데이타처리장치로서의 컴퓨터장치, 예를 들면 퍼스널컴퓨터로 실현한다. 또는 컴퓨터장치와 네트워크 사이에 접속하는 전용장치에 의해 실현하도록 해도 좋다. 데이타압축장치(200)은 동적사전 제어부(230) 및 정적사전 제어부(240)을 갖고, 또 전체의 처리를 제어하는 제어부(220)을 갖는다. 제어부(220)은 예를 들면 OS를 탑재한 컴퓨터장치의 CPU로 구성된다. 제어부(220)은 또 압축하는 데이타의 입력수단(221) 및 압축한 데이타의 출력수단(251)도 제어한다.

동적사전 제어부(230)은 동적사전(231), 구축수단(232), 검색수단(233) 및 등록수단(234)를 갖는다. 동적사전(231)은 비트열과 인덱스를 저장하는 데이타베이스이고, 컴퓨터장치의 기억장치 예를 들면 컴퓨터장치에 내장한 하드디스크장치상에 구성된다. 구축수단(232), 검색수단(233) 및 등록수단(234)는 동적사전(231)을 조작하는 프로그램으로 구성된다.

이들 프로그램은 컴퓨터장치에 내장한 하드디스크장치상에 저장되고, 컴퓨터장치의 기동에 의해 주기억장치상으로 이동되어 CPU에 의해서 실행되는 것에 의해 소정의 기능을 달성한다.

정적사전 제어부(240)은 정적사전(241), 구축수단(242), 판정수단(243) 및 참조수단(244)를 갖는다. 정적사전(241)은 비트열과 인덱스를 저장하는 데이타베이스이고, 컴퓨터장치의 기억장치 예를 들면 컴퓨터장치에 내장한 하드디스크장치상에 구성된다. 구축수단(242), 판정수단(243) 및 참조수단(244)는 정적사전(241)을 조작하는 프로그램으로 구성된다.

입력수단(221) 및 출력수단(251)은 컴퓨터장치의 하드디스크장치와 같은 내장기억장치, 네트워크를 거친 원격의 파일시스템 또는 플로피디스크나 자기테이프와 같은 외부기억장치 사이의 데이타의 입력 및 출력을 각각 실행하는 프로그램(디바이스 드라이버)이다. 입력수단(221)은 입력데이타(201)을 입력해서 이것을 입력비트열(202)로 변환하여 출력한다. 출력수단(251)은 동적사전(231) 또는 정적사전(241)로 부터의 인덱스인 출력비트열(204)에 제어코드(203)을 붙인 것을 압축데이타(205)로서 출력한다.

제1도는 동적사전에 정적사전을 병용한 제2도의 장치상에서의 데이타압축 수순을 도시한 흐름도이다. 본 실시예에 있어서의 데이타압축의 수순은 정적사전(241)과 동적사전(231)을 구축하는 초기화처리(스텝100)과 데이타압축의 본 처리(스텝120)으로 이루어진다.

우선, 스텝(100)을 설명한다. 관리자가 압축대상으로 되는 파일이나 데이타를 지정한 코맨드를 투입하는 것에 의해, 처리를 개시한다(스텝101). 우선, 구축수단(242)를 사용해서 정적사전(241)을 구축한다(스텝102). 예를 들면, 워드프로세서의 사전이나 전자사전의 문자열을 기본으로 비트열과 인덱스를 정의한다. 다음에, 구축수단(232)를 사용해서 동적사전(231)을 초기화 즉 빈 또는 기정의 비트열을 등록해서 동적사전을 구축한다(스텝103). 동적사전(231)의 초기화에는 빈 비트열을 등록하는 경우와 기정의 비트열, 즉 ASCII코드나 JIS코드에 포함되는 알파벳이나 가타가나나 히라가나 등의 코드를 미리 기본비트열로서 등록하는 경우가 있다. 이용형태, 계산기의 기억용량 또는 인덱스를 검색할 때에 이용하는 해시테이블의 구조등에 의해 양자의 어느하나를 채용할 수 있다. 이상의 수순으로 초기화처리가 종료한다(스텝104).

또한, 본 실시예에서는 동적사전(231)에 앞서서 정적사전(241)을 구축했지만, 본 발명은 이것에 한정되는 것은 아니고 동적사전(231)의 구축을 정적사전(241)의 구축에 선행시켜도 좋다. 또, 동적사전(231)의 초기화에서 등록할 기정의 비트열로서 ASCII코드나 JIS코드에 포함되는 알파벳이나 가타가나나 히라가나등의 코드를 채용하도록 했지만, 본 발명은 이것에 한정되는 것은 아니고 소정의 규칙에 의해 문자를 일의적으로 지시해서 나타낼 수 있는 코드체계이면 어떠한 것이라도 좋다.

즉, 스텝(120)을 설명한다. 정적사전(241)의 구축을 확인하고 데이타 압축처리를 개시한다(스텝121). 우선, 압축할 데이타를 입력한다(스텝122). 예를 들면, UNIX로 실시하는 경우에는 명칭을 지정한 파일 또는 표준입력으로부터의 데이타를 입력한다. 입력수단(221)을 사용해서 입력데이타(201)을 블럭단위(예를 들면, 1블럭에서 64비트)로 입력비트열(202)로 분해한다(스텝123). 다음에, 판정수단(243) 및 그 연장에 의해 기동되는 참조수단(244)를 사용해서 입력비트열(202)를 검색키로 해서 정적사전(241)을 참조한다(스텝124). 그리고, 입력비트열(202)를 정적사전(241)의 비트열과 비교한다(스텝125).

비교한 결과와 검색수단(233)에 의한 동적사전(231)의 비트열검색의 결과를 기본으로 입력비트열(202)를 동적사전(231)에 등록할지 등록하지 않을지를 판정한다(스텝126). 등록하는 경우에는 등록수단(234)를 사용하여 입력비트열(202)를 식별하는 인덱스를 붙여서 등록하고(스텝127), 등록하지 않는 경우에는 아무것도 하지 않는다. 마지막으로 출력수단(251)을 사용해서 입력비트열(202) 또는 입력비트열(202)와 일치한 인덱스를 압축데이타(205)로서 출력한다(스텝128). 또, 입력데이타가 있는 경우에는 스텝(122)로 되돌아가고, 없는 경우에는 데이타 압축처리를 종료한다(스텝129, 130).

또한, 본 실시예에서는 한번 데이타압축처리(120)이 스텝(130)에서 종료하면, 다음에 입력되는 데이타에 대해서는 초기화처리(100)에 의해 정적사전(241)을 초기화하도록 하였지만, 본 발명은 이것에 한정되는 것은 아니고 반고정적으로 정적사전(241)을 구축해 두고 데이타압축처리(120)이 종료해도 정적사전(241)을 초기화하지 않도록 해도 좋다. 이와 같이 한 경우, 처리시간을 단축시킬 수 있다는 효과가 있다.

제7도 및 제8도를 사용해서 입력비트열과 정적사전의 비트열을 비교하는 처리(125)의 2가지의 실시예를 상세하게 설명한다.

제7도는 입력비트열이 정적사전(241) 중의 비트열과 일치한 경우에는 동적사전(231)에 상기 입력비트열을 등록하지 않는 것으로 하는 실시예를 도시한 흐름도이다. 입력비트열을 키로서 정적사전(241)을 검색하고(스텝701), 입력비트열이 정적사전(241)중의 비트열과 일치하는지 일치하지 않는지를 판단하고(스텝702), 일치하는 경우에는 상기 입력비트열을 동적사전(231)에 등록하지 않는다(스텝703). 일치하지 않는 경우에는 등록한다(스텝704). 본 실시예에 의하면, 동적사전에 등록되는 비트열을 감속시킬 수 있다.

제8도는 입력비트열이 정적사전(241) 중의 비트열과 일치한 경우에 정적사전(241) 및 동적사전(231)의 인덱스의 길이를 계산하고, 동적사전(231)의 인덱스 쪽이 짧게 되는 경우에 동적사전(231)에 상기 입력비트열을 등록하는 실시예를 도시한 흐름도이다. 제8도 중, 스텝(701)∼(704)는 제7도 중의 것과 공통이다. 입력비트열을 키로서 정적사전(241)을 검색하고(스텝701), 입력비트열이 정적사전(241) 중의 비트열과 일치하는지 일치하지 않는지를 판단하고(스텝702), 일치하는 경우에는 상기 입력비트열과 일치한 정적사전(241) 중의 비트열의 인덱스를 추출하고 그 길이를 기억함(스텝801)과 동시에 상기 입력비트열을 키로서 동적사전(231)을 검색하고 상기 입력비트열과 일치하는 비트열이 있는지 없는지를 판단한다(스텝811). 일치하는 비트열이 없는 경우에는 동적사전(231)의 비트열로서 등록한 경우에 할당할 인덱스를 예측하고, 그 길이를 계산해서 기억한다(스텝812). 일치하는 비트열이 있는 경우에는 등록하지 않는다(스텝703). 스텝(702)에서 「일치한다」고 판단되고 또한 스텝(811)에서 「없다」고 판단된 경우에는 스텝(801) 및 스텝(812)에서 기억한 각각의 인덱스의 길이를 비교하고(스텝802), 정적사전(241)의 인덱스 쪽이 짧은 경우(스텝803)에는 상기 입력비트열을 동적사전(231)에 등록하지 않고(스텝703), 그렇지 않은 경우(스텝803)에는 등록한다(스텝704). 스텝(702)에서 「일치하지 않는다」고 판단된 경우에는 상기 입력비트열을 동적사전(231)에 등록한다(스텝704).

본 실시예는 정적사전과 동적사전의 인덱스길이의 비교로부터, 다음회에 동일한 비트열이 출현했을 때 동적사전을 이용한 쪽이 높은 압축율을 기대할 수 있는 경우에 동적사전으로의 등록을 실행한다. 따라서, 본 실시예에 의하면 동적사전과 정적사전을 병용한 압축율 우선의 처리를 실행하게 되어 보다 높은 압축율의 데이타압축처리를 실현할 수 있다.

다음에, 제3도, 제4도, 제5도, 제6도 및 제18도를 사용해서 동적사전과 정적사전을 병용하여 압축데이타로서 어느 한쪽의 사전의 인덱스를 출력하는 처리(128)의 1실시예를 상세하게 설명한다

제3도는 동적사전과 정적사전을 병용하는 것에 의해 보다 짧은 비트길이의 인덱스를 선택할 수 있게 되는 것을 도시한 블럭도이다. 종래의 동적사전 단독사용의 방법에 비해서 압축데이타의 구조는 복잡하게 되지만 압축율이 향상하는 것을 나타낸다.

제3도는 평문(平文)(301)을 분해한 입력비트열과 정적사전에 정의하는 문자열이 일치하는 상태를 도시하고 있다. 일반적으로 정적사전에 비교적 비트길이가 긴 문자열(예를 들면, 알파벳 10개 이상으로 이루어지는 영단어)을 등록하고 또한 그 인덱스의 길이가 문자열의 길이에 비해서 짧은 정적사전의 인덱스를 출력하는 것에 의해 압축율의 향상을 기대할 수 있다.

본 실시예의 출력데이타예로서 압축데이타(304)가 있다. 압축데이타(304)는 사전의 인덱스 또는 비트열 직접의 코드(204)에 사전의 인덱스인지 비트열 직접의 코드인지를 구별하는 부호 및 동적사전(231)의 코드인지 정적사전(241)의 코드인지를 구별하는 부호로 이루어지는 제어코드(204)를 붙인 것의 열로 된다. 종래의 동적사전 단독에 의한 압축방식으로 얻어지는 압축데이타(305)에 비해서 복잡한 코드대계(大系)로 되지만, 정적사전의 인덱스의 길이가 짧으므로 전체로서는 압축데이타(304) 쪽이 압축데이타(305)보다 짧아진다.

제4도 및 제18도를 사용해서 가장 짧은 인덱스를 출력하는 수순을 실현하는 방법을 설명한다.

제18도는 본 실시예에 있어서의 압축데이타의 구조와 각 인덱스의 관계를 도시한 도면이다. 압축데이타(1801), (1811) 및 (1821)은 각각 입력비트열을 그대로 부호화한 경우, 동적사전의 인덱스를 부호화한 경우 및 정적사전의 인덱스를 부호화한 경우의 압축데이타의 구조를 나타낸다. 본 실시예에서는 이하 설명을 용이하게 하기 위해서 입력데이타가 영어의 문장이고 8비트코드계(ASCII코드)로 입력되어 있는 것으로 한다. 제어코드(1803), (1804), (1813), (1814), (1823) 및 (1824)는 압축데이타가 입력문자열의 코드, 동적사전의 인덱스, 정적사전의 인덱스 중의 어느 것의 종별인지를 나타내는 부호이고, 데이타본체에서는 이용되지 않는 비트열 예를 들면 이스케이프 시컨스등이다. 복호시에는 입력되는 압축데이타를 소정의 단위 예를 들면 8비트마다 분해하고, 이들의 제어코드를 식별해서 다음의 제어코드가 올 때까지의 비트열을 압축데이타의 데이타본체로서 처리한다. 압축데이타(1801)은 데이타본체(1802)가 제어코드(1803)과 제어코드(1804) 사이에 끼워지는 구조를 취한다. 데이타본체(1802)는 8비트 고정길이의 코드(411)에 의해 구성된다. 압축데이타(1811)은 제어코드(1815)가 부가된 데이타본체(1812)가 제어코드(1813)과 제어코드(1814) 사이에 끼워지는 구조를 취한다. 데이타본체(1812)는 동적사전(231)에 포함되는 가변길이의 인덱스에 의해 구성되고, 제어코드(1815)는 데이타본체(1812)를 구성하는 인덱스의 길이를 나타내는 8트의 부호이다. 예를 들면, 제4도의 예에서는 동적사전(231)의 인덱스는 모두 6비트의 코드로 나타내므로, 6비트코드계인 것을 제어코드(1815)로 설정한다. 압축데이타(1821)은 데이타본체(1822)가 제어코드(1823)과 제어코드(1824) 사이에 끼워지는 구조를 취한다. 데이타본체(1822)는 정적사전(241)에 포함되는 가변길이의 인덱스에 의해 구성된다.

제4도는 입력비트열의 코드와 동적사전 및 정적사전의 인덱스의 길이를 계산하고, 데이타길이가 가장 짧은 인덱스를 채용하는 것을 설명하는 블럭도이다. 본 실시예에서는 특히 문자수가 4문자 이상의 영단어를 정적사전에 등록하는 것으로 하고, 이와 같은 영단어의 압축에 대해서는 영문자를 1문자마다 코드화 또는 동적사전의 인덱스로 변환하는 것에 비해서 정적사전을 이용하는 쪽이 매우 유리하게 되도록 설정하고 있다. 판정수단(243)은 입력비트열의 각 코드 및 사전의 각 인덱스에서 각각의 비트길이를 계산해서 비교, 판정한다. 입력비트열(202)는 8비트코드계, 즉 8비트코드(411)과 비트열(412)로 이루어진다. 정적사전(241)은 최대길이 17비트의 인덱스(421)과 비트열(422)로 이루어진다. 동적사전(231)은 최대길이 6비트의 인덱스(431)과 비트열(432)로 이루어진다. 제어코드는 8비트로 한다. 예를 들면, 평문(401) 중의 일부의 단어 “This”를 압축하는 것으로 하고 이것을 입력비트열(202)의 코드(411), 동적사전(231)의 인덱스(431) 및 정적사전(241)의 인덱스(421)의 각 표현방법으로 나타낸 경우에 필요한 비트수를 계산한다. 입력비트열(202)의 코드(411)을 사용한 경우, 각 코드는 고정길이 8비트이므로 이것에 비트열을 구성하는 문자수(4)를 곱하고, 또 전후의 제어코드 8비트씩을 부가해서 48비트로 된다. 동적사전(231)의 인덱스(431)을 사용한 경우, 인덱스길이는 최대 6비트이므로, 6비트에 문자수(4)를 곱하고, 또 인덱스길이(6)을 나타내는 8비트 및 전후의 제어코드 8비트씩을 부가해서 48비트(최대값)으로 된다. 정적사전(241)의 인덱스(421)을 사용한 경우, 이 예에서는 “This”에 대응하는 인덱스가 8비트코드 “11111011”이므로, 전후의 제어코드 8비트씩과 합해서 24비트로 된다. 따라서, 이 경우 판정수단(243)에 있어서 정적사전(241)의 인덱스(421)을 사용한 부호화를 선택한다. 이 예에서는 동적사전(231)의 인덱스(431)이나 입력비트열(202)의 코드(411)을 선택하는 것에 비해서 압축데이타의 길이를 약 1/2로 할 수 있다.

이상의 실시예에서는 사전의 인덱스의 길이를 계산하고, 정적사전, 동적사전 중의 어느 하나를 선택하는 방법을 기술하였다. 이하, 다른 실시예로서 우선 입력비트열이 정적사전 중의 비트열과 일치한 경우에는 무조건 정적사전의 인덱스를 출력하는 정적사전 우선방식을 설명한다. 또, 다른 실시예로서 데이타 처리위치의 데이타 선두로 부터의 거리에 임계값을 마련하고, 임계값의 전후에서 사용하는 사전을 전환하는 사전스위치방식을 설명한다.

제5도는 입력비트열과 일치하는 정적사전(241)의 인덱스를 압축데이타로서 출력하는 수순을 도시한 흐름도이다. 본 실시예는 정적사전 우선방식의 예이고, 제1도의 입력비트열과 정적사전의 비트열을 비교하는 처리(125)의 1실시예이다.

우선, 정적사전(241)을 전부 검색하고(스텝501), 비트열이 일치한 경우(스텝502)에는 동적사전(231)에 등록이 불필요하다고 판단하고(스텝503), 정적사전(241)의 인덱스를 출력해야한다고 판정한다(스텝504). 비트열이 일치하지 않는 경우(스텝502)에는 동적사전(231)에 등록이 필요하다고 판단하고(스텝505), 입력비트열의 코드를 출력해야한다고 판정한다(스텝506).

제6도는 데이타처리위치의 데이타 선두로 부터의 거리에 임계값을 마련하고, 데이타의 선두부터 임계값 위치까지는 입력비트열과 정적사전을 이용하고, 임계값위치를 초과하면 입력비트열과 정적사전에 부가해서 동적사전도 이용한 부호화를 실행하여 압축데이타를 출력하는 수순을 도시한 흐름도이다. 본 실시예는 사전전환방식의 예로서 제1도 및 제4도에 도시한 데이타압축처리의 다른 실시예이다. 이 방식은 파일의 선두부분에서는 정적사전의 이용이 유효하다는 경험측에서 파일의 전방 부분, 즉 파일의 선두부터 임계값 위치까지를 정적사전의 인덱스로, 나머지 즉 임계값위치부터 파일의 말단까지를 동적사전의 인덱스로 처리한다는 방식이다 인덱스길이는 계산하지 않고 소정의 임계값 위치까지는 일률적으로 정적사전을 이용하는 점이 제1도의 스텝(125) 및 (126)에서 설명한 실시예와 다르다.

본 실시예는 사전구축의 초기화처리(100)의 이전에 임계값을 설정하는 초기스텝(601)∼(604)와 데이타의 압축처리(120)의 내부처리인 스텝(123)∼(128)까지의 처리에 상당하는 압축메인처리(611)∼(617)로 나누어진다.

우선, 초기스텝(601)∼(604)를 설명한다. 초기스텝에서는 임계값의 구체적인 값을 결정하기 위해서 입력데이타가 입력시에 사이즈를 알 수 있는 파일인지 또는 통신데이타와 같은 종단이 미정인 스트림데이타인지를 판별한다(스텝601). 파일의 경우에는 파일사이즈를 조사하고 전체 사이즈로 부터의 비율로 임계값을 계산 또는 파일사이즈의 대소에 의해 변칙적인 임계값을 선택한다(스텝602). 예를 들면, 전체 사이즈로 부터의 비율이 10%인 부분을 임계값으로 정한 경우 전체 사이즈가 통상의 크기, 예를 들면 10바이트이면 최초의 1바이트인 부분이 임계값으로 된다. 그러나, 전체 사이즈가 큰 경우 예를 들면 100바이트인 경우에는 통상이면 10바이트째를 임계값으로 하던 것을 변칙적으로 2∼3바이트째에 임계값을 설정한다. 스트림데이타의 경우에는 고정적인 초기값을 이용한다(스텝603). 이용하는 임계값이 결정되었다면 이것을 데이타압축처리에 의해 참조하는 레지스터에 설정한다(스텝604).

다음에, 압축메인처리(611)∼(617)을 설명한다. 데이타의 압축처리의 스텝(121)∼(123)에 이어서 입력비트열의 선두로 부터의 비트수를 적산하고(스텝611), 스텝(604)에서 설정한 임계값과 비교한다(스텝612). 임계값을 초과하지 않는 경우에는 입력비트열과 일치하는 정적사전 중의 비트열을 검색하고(스텝613), 그 인덱스를 부호화해서 출력한다(스텝615). 스텝(613)에서 일치하는 것이 없는 경우에는 입력비트열의 코드를 부호화해서 출력하고(스텝616), 동적사전에 상기 비트열을 등록한다(스텝127). 스텝(612)에서 임계값을 초과한 경우에는 입력비트열과 일치하는 동적사전 중의 비트열을 검색하고(스텝614), 그 인덱스를 부호화해서 출력한다(스텝617). 스텝(614)에서 일치하지 않는 경우에는 스텝(616), (127)로 처리를 이동한다.

이상의 처리를 종료하고, 또 다음의 입력데이타가 있는 경우(스텝129)에는 스텝(122)로 되돌아가고, 없는 경우(스텝129)에는 데이타압축처리를 종료한다(스텝130).

본 실시예에 의하면, 사전을 전환하는 제어코드의 삽입이 기본적으로는 2회로 된다. 즉, 임계값을 초과했는지 초과하지 않았는지의 코드와 일치하는 비트열이 사전에 존재하는지 존재하지 않는지의 코드의 2회의 코드삽입으로 좋다. 그 때문에, 처리가 간단하게 되고 소요시간이 단축된다는 효과가 있다. 또, 빈번하게 사전을 전환하는 경우에 비해서 제어코드수가 적어지므로 결과적으로 데이타압축율이 향상한다는 효과가 있다.

이상에서 기술한 장치 및 처리수순을 최적인 시스템으로 실현하는 방법으로서, 이하 제9도 및 제10도를 사용해서 설명한다. 구체적으로는 입력데이타(201)이 자연언어, 프로그램언어 또는 기계어 등으로 기술되는 실제의 경우를 고려해서 속성정보, 출현빈도 또는 문자열 상호의 관련성을 총합하고 언어상의 특성을 이용해서 압축율을 향상시키는 정적사전의 구성예를 설명한다.

제9도는 프로그램언어상의 1개 이상의 문자열과 그 부가정보로 구성한 정적사전의 실시예를 도시한 도면으로서, 특히 C언어의 제어구문에 사용되는 예약어와 그 부가정보로 구성한 정적사전(900)을 도시한 것이다. 본 실시예는 정적사전에 등록한 문자열(901)에 대해서 각각 2번 이상 출현하는 확률(902)를 부가정보로서 기술한 것에 특징이 있다. 예를 들면, 데이타압축의 대상이 C언어의 소오스 프로그램이라고 알고 있는 경우에는 사전(900)을 정적사전으로서 이용하는 것에 의해 정적사전 중의 인덱스를 출현하는 비율이 상숭하여 압축율의 향상을 기대할 수 있다. 출현확률(902)는 여러개의 C언어의 소오스 프로그램으로 사전에 조사하는 것에 의해 입력데이타의 내용에 의존하지 않고 기대값으로서 이용할 수 있다. 동적사전 중의 비트열을 등록 및 삭제하는 경우 이 출현확률의 대소를 등록 및 삭제의 우선순위로 하는 것에 의해 동적사전 중의 비트열과 입력비트열이 일치하는 확률도 높아진다고 고려되고, 더욱 압축율의 향상을 기대할 수 있다. 또, 이 예에서는 출현확률이 높은 것을 보다 비트길이가 짧은 인덱스(903)에 할당되고 있으므로 검색속도의 향상도 기대할 수 있다.

제10도는 상기 부가정보로서 언어상의 규칙을 포함한 정적사전의 구축예이다. 정적사전(1000)은 정적사전(900)을 확정해서 어법도 포함한 구성으로 한 것이다. 예를 들면, C언어에서는 제어문으로서 그 구문은 몇가지의 패턴으로서 기술할 수 있다. 여러개의 예약어를 관련지운 어법(1001)에 인덱스(1002)를 대응시킨다. 이 예에서는 인덱스(1002)로서 3자리수의 정수를 사용하고 있으므로, 여러개의 예약어로 이루어지는 어법 1조당의 부호길이로서는 인덱스(903)을 이용하는 경우보다 짧다. 또, 구문에 일치시킨 압축데이타 구조(1003)도 규정한다.

또한, 본 실시예에 있어서는 프로그램언어의 문자열과 그 부가정보로 정적사전을 구성했지만, 본 발명은 이것에 한정되는 것은 아니고 자연언어, 프로그램언어 또는 기계어의 적어도 1개 이상의 문자열과 그 부가정보로 구성해도 좋다.

이하, 제11도∼제13도를 사용해서 제9도 및 제10도에서 설명한 정적사전에 있어서 입력비트열과 정적사전의 비트열을 비교한 결과를 기본으로 동적사전에 비트열을 등록하지 않았거나 삭제한 실시예를 설명한다.

제11도는 다른 부가정보를 이용한 실시예이다. 정적사전(241)은 등록비트열(1101)이 나타내는 용어의 각각에 대응하는 분야를 식별하는 부가정보(1102) 및 인덱스(1103)을 포함한다. 입력데이타(201)을 처리해 가는 중에 판정수단(243)에서는 내용의 분석을 실행하고 어느 분야의 문서인지를 판정하고, 동적사전(231)에 등록하지 않는다. 또는 삭제수단(1301)을 사용해서 분야 이외의 비트열을 삭제한다.

제13도는 동적사전(231)에 등록의 상한값(1302)를 설정하고 판정수단(243)에 정적사전(241)의 부가정보를 이용해서 이용도가 낮은 비트열을 삭제하기 위한 규칙(1311)을 추가한 구성예이다. 제13도와 제2도의 다른 점은 등록수단에 있어서 넘침을 검출했을 때에 호출되는 삭제수단(1301), 동적사전(231)의 등록할 수 있는 비트열수를 규정하는 상한값을 설정하는 레지스터(1302) 및 정적사전(241)의 부가정보를 사용하여 이용도가 낮은지, 즉 삭제대상인지를 판정하기 위한 규칙(1311)을 갖는 점이다.

제12도는 제13도의 시스템장치에 있어서 제9도의 출현빈도의 부가정보를 이용한 삭제수순의 1실시예를 도시한 흐름도이다. 동적사전(231)에 입력비트열을 등록할 때(스텝127)에 넘침 검출하고 이용도가 낮은 비트열을 삭제해서 등록할 수 있는 영역을 확보한다. 우선, 입력비트열을 적산한 것과 상한값(1302)를 비교해서 동적사전의 넘침을 검출한 경우에는 삭제수단(1301)을 기동하여 스텝(1202)로 처리를 이동하고, 그렇지 않은 경우에는 종래대로 입력비트열의 등록을 실행한다(스텝1206). 본 실시예의 경우에는 설명을 간단하게 하기 위해서, 삭제수단(1301)은 입력한 비트열의 출현확률보다 낮은 출현확률을 갖는 비트열을 삭제대상으로 한다. 우선, 입력비트열의 부가정보인 출현확률(902)를 참조하여(스텝1202), 보다 출현확률이 낮은 비트열을 추출한다. 다음에, 동적사전(231)의 등록비트열을 검색하고(스텝1203), 보다 이용도가 낮은 것이 있었던 경우(스텝1204)에는 동적사전내에서 삭제한다(스텝1205).

제14도는 프로그램의 종류나 압축조건을 초기설정하는 것을 도시한 구성도이다. 본 실시예는 정적사전에서는 여러개의 구축수단(242), 동적사전에서는 여러개의 등록수단(234), 여러개의 삭제수단이 각각 있으므로, 프로그램의 종류나 조건을 이용자가 초기설정하는 것이 특징이다. (1400)은 압축장치(200)에 접속한 단말, (1401)은 단말(1400)의 설정화면, 예를 들면 조건을 표형식으로 나타내고 선택하는 화면이다. 데이타압축의 이용자는 설정화면(1401)을 거쳐서 구축수단(242), 등록수단(234) 또는 삭제수단(1301) 등의 실행프로그램을 선택한다. 그것과 함께, 예를 들면 상술한 임계값의 설정이나 동적사전으로의 비트열의 등록, 삭제의 기준 등을 맞추어서 설명한다.

제15도는 정적사전의 구축의 1실시예를 도시한 구성도이다. 본 실시예에서는 동적사전과 정적사전의 적용범위를 나누는 것에 의해, 사전을 병용하는 이점을 끌어내는 것이 특징이다. 그 때문에, 정적사전과 동적사전의 인덱스의 최대값의 설정에도 다음에 기술하는 조건이 필요하다. 정적사전에서는 비교적 비트길이가 긴 문자열을 다수 준비한다. 동적사전에서는 비트길이는 짧지만 출현빈도가 보다 높은 문자열을 등록한다. 특히, 동적사전의 경우에 비해 비트길이가 짧은 인덱스와 결합시켜 등록한다. 정적사전의 구축의 1실시예로서 2만어 정도의 워드프로세서의 사전FEP(Front End Processor)(1501), 10만어 정도의 영일사전이나 중일사전(1502) 또는 전문분야마다의 백과사전(1503) 중의 적어도 1개 이상의 데이타베이스를 사용해서 특정의 기준으로 예를 들면 공통으로 수록되어 있는 언어를 추출하여 정적사전(241)을 구축한다. 그 경우, 최대 2^10∼2^15(1K∼32K)개의 인덱스를 갖는 동적사전과 최대 2^12∼2^17(4K∼128K)개의 인덱스를 갖는 정적사전으로 구성하는 것이 최적이다.

제16도는 압축원과 복호지의 정적사전을 분산시스템상에서 공유할 수 있는 경우의 실시예를 도시한 흐름도이다. 사전의 초기화(100) 후, 데이타압축(120) 전에 복호지에 동일한 정적사전이 존재하는지 문의하는 처리를 실행하는 점에서 제1도의 실시예와 다르다. 우선, 압축처리를 실행하는 전제로서 네트워크에서 접속한 앞의 장치를 복호지로서 지정한다. 파일전송(FTP)에 본 실시예를 적용하는 경우에는 예를 들면 호스트명이나 IP어드레스를 실행하는 코맨드의 인수(引數)로서 지정한다. 복호지가 확정된 경우(스텝1601)에는 압축원과 복호지 사이에서 커넥션을 접속하고(스텝1602), 확정되지 않은 경우(스텝1601)에는 종료한다. 스텝(1602)에서의 접속후, 복호지에서의 정적사전의 파일명을 확인하고 정적사전의 버젼이나 구성요소를 조사한다. 그 결과에 따라서 복호지의 정적사전이 압축원의 정적사전과 동일한지 동일하지 않은지를 판정한다(스텝1603). 동일한 경우에는 동적사전(231)과 정적사전(241)의 병용방식을 채용한다(스텝1610). 다른 경우에는 새로 다른 방식 예를 들면 동적사전(231)만을 이용해서 압축하는 종래의 방식이나 압축원의 정적사전(241)을 복호지로 전송하는 방식등을 채용하고(스텝1604), 압축원과 복호지 사이의 커넥션을 절단한다(스텝1615). 스텝(1610) 후, 압축원에서 데이타를 압축하고(스텝120), 데이타를 송신한다(스텝1611). 복호지에서는 스텝(1610)의 압축방식에 상당하는 데이타복호방식을 채용한다(스텝1612). 복호지에서는 데이타를 수신하고(스텝1613), 그 데이타를 복호한다(스텝1614). 이상의 처리를 완료하고 압축원과 복호지 사이의 커넥션을 판단한다(스텝1615).

또한, 본 실시예는 스텝(1610)∼(1614)의 처리를 순차 실행하도록 했지만, 본 발명은 이것에 한정되는 것은 아니고 파이프라인적으로 각 스텝을 실행하도록 해도 좋다. 이와 같이 하는 것에 의해 처리속도가 향상한다는 효과가 있다.

이상에서 기술한 압축장치 및 수순을 사용해서 압축한 데이타(205)를 신장하는 신장장치 및 수순의 1실시예를 제19도 및 제20도에 도시한다.

제19도는 동적사전에 정적사전을 병용한 데이타신장장치의 구성도이다. 본 실시예에서는 제2도의 압축장치(200)에 상당하는 구성을 취하고, 압축장치(200)의 정적사전(241) 및 구축수단(242)를 공유하고 있는 것이 특징이다.

데이타신장장치(1900)은 입력데이타(205)를 데이타량이 적은 신장데이타(1905)로서 출력하는 것이고, 상기한 데이타압축장치(200)과 마찬가지로 데이타처리장치로서의 컴퓨터장치 예를 들면 퍼스널컴퓨터로 실현한다. 또는, 컴퓨터장치와 네트워크 사이에 접속하는 전용장치로 실현하도록 해도 좋다. 이 데이타신장장치(1900)은 동적사전 제어부(1930) 및 정적사전 제어부(1940)을 갖고, 또 전체의 처리를 제어하는 제어부(1920)을 갖는다. 제어부(1920)은 예를 들면 OS를 탑재한 컴퓨터장치의 CPU로 구성된다. 제어부(1920)은 또 신장하는 데이타의 입력수단(1921) 및 신장된 데이타의 출력수단(1951)도 제어한다.

동적사전 제어부(1930)은 동적사전(1931), 구축수단(1932), 검색수단(1933) 및 등록수단(1934)를 갖는다. 동적사전(1931)은 비트열과 인덱스를 저장하는 데이타베이스이고, 컴퓨터장치의 기억장치 예를 들면 컴퓨터장치에 내장한 하드디스크장치상에 구성된다. 구축수단(1932), 검색수단(1933) 및 등록수단(1934)는 동적사전(1931)을 조작하는 프로그램으로 구성된다.

이들 프로그램은 컴퓨터장치에 내장한 하드디스크장치상에 저장되고, 컴퓨터장치의 기동에 의해 주기억장치상으로 이동되고 CPU에 의해 실행되는 것에 의해 소정의 기능을 달성한다.

정적사전 제어부(1940)은 정적사전(241), 구축수단(242), 판정수단(1943) 및 참조수단(1944)를 갖는다. 정적사전(241)은 비트열과 인덱스를 저장하는 데이타베이스이고, 컴퓨터장치의 기억장치 예를 들면 컴퓨터장치에 내장한 하드디스크장치상에 구성된다. 구축수단(242), 판정수단(1943) 및 참조수단(1944)는 정적사전(241)을 조작하는 프로그램으로 구성된다.

이들 프로그램은 컴퓨터장치에 내장한 하드디스크장치상에 저장되고, 컴퓨터장치의 기동에 의해 주기억장치상으로 이동되어 CPU에 의해 실행되는 것에 의해 소정의 기능을 달성한다.

입력수단(1921) 및 출력수단(1951)은 계산기의 하드디스크와 같은 내장기억장치, 네트워크를 거친 원격의 파일시스템 또는 플로피디스크나 자기테이프와 같은 외부기억장치와의 사이의 데이타의 입력 및 출력을 각각 실행하는 프로그램(디바이스 드라이버)이다. 여기에서는 압축데이타(205)를 입력한다.

입력수단(1921)은 입력데이타(205)를 입력해서 이것을 입력비트열(1902)로 변환해서 출력한다. 출력수단(1951)은 동적사전(1931) 또는 정적사전(241)로 부터의 입력비트열(1902)에 대응하는 비트열을 출력비트열(1903)으로 하고 신장데이타(1905)로서 출력한다.

제20도는 제19도의 신장장치에 있어서의 정적사전(241)과 동적사전(1931)의 인덱스를 참조하면서 압축데이타를 신장하는 수순을 도시한 흐름도이다.

판정수단(1943)은 입력비트열(1902)를 입력하고, 정적사전(241)을 참조수단(244)를 거쳐서 정적사전에 포함되는 경우에는(스텝2001), 입력비트열(1902)에 대응하는 인덱스와 비트열을 참조하여(스텝2002) 비트열을 출력한다(스텝2003).

스텝(2001)에 있어서, 정적사전(241)에 대응하는 인덱스가 없으면 검색수단(1933)을 사용해서 동적사전(1931)을 검색하고(스텝2011), 동적사전에 포함되는 경우에는 입력문자열(1902)에 대응하는 동적사전(1931)의 인덱스와 비트열을 참조하여(스텝2012) 비트열을 출력한다(스텝2013). 또, 전회에 출력한 출력비트열과 이번에 출력한 출력비트열의 선두의 비트열(예를 들면 1바이트분)을 조합해서 동적 사전에 등록한다(스텝2014).

또한, 스텝(2011)에 있어서 동적사전(1931)에 입력문자열(1902)가 포함되지 않는 경우에는 불량인 입력문자열(1902)라고 간주하고 에러처리로서 종료한다(스텝 (2050).

이상 기술한 예에서는 실제로 정적사전이나 동적사전을 검색하고 입력비트열(1902)가 포함되는지 아닌지를 판정하지만, 입력비트열(1902)는 정확히 출력비트열(203)과 인덱스(204)에 상당하는 데이타구조를 갖는다. 미리 인덱스(204)의 정적사전(예 0∼1023)과 동적사전(예 1024∼)과 이용범위를 설정해 두는 것에 의해 사전을 검색하지 않고 고속으로 판정할 수 있는 것은 물론이다.

컴퓨터장치 또는 퍼스널컴퓨터장치 등의 데이타처리장치는 일반적으로는 이상 설명한 데이타압축장치(200), 데이타신장장치(1900)의 양장치를 구비한다. 그리고, 작성한 데이타를 데이타압축장치(200)을 이용해서 예를 들면 내장한 하드디스크장치에 저장하고, 이 데이타의 이용시에는 하드디스크장치에서 이 압축한 데이타를 리드하고 데이타신장장치(1900)에 의해 원래의 데이타로 신장하고 이것을 이용한다. 또한, 이 경우 정적사전(241)은 이 양장치에 있어서 공용가능하다. 경우에 따라서는 동적사전(231)도 공용가능하게 된다. 또, 데이타처리장치가 네트워크에 의해 상호 데이타의 수수가 가능하게 접속되어 있는 경우에 있어서는 한쪽의 데이타처리장치에서 데이타압축장치(200)에 의해서 데이타를 압축해서 전송하고, 이것을 수신한 데이타처리장치가 데이타신장장치(1900)에 의해 원래의 데이타로 신장하고 이것을 이용한다.

제17도는 분산시스템상에서 정적사전을 공유할 수 없는 경우의 실시예를 도시한 도면이다. 데이타압축장치(200)은 동적사전(231) 또는 정적사전(241)을 이용해서 데이타압축을 실행하고, 데이타복호장치(260)은 동적사전(261) 또는 정적사전(262)를 이용해서 데이타복호를 실행한다. 데이타압축장치(200)은 제2도에 있어서의 데이타압축장치(200)과 마찬가지이고, 평문(201)을 입력하고 압축데이타를 출력한다. 데이타복호장치(260)은 데이타압축장치(200)의 반대의 데이타변환을 실행하는 장치이고, 압축데이타를 입력하고 평문(201)을 출력한다. 데이타압축장치(200)은 엔코드수단(252)에 결합되고 엔코드수단(252)는 또 데이타전송수단(270)에 결합되어 있다. 데이타전송수단(270)은 네트워크를 거쳐서 데이타전송수단(271)과 접속되어 있다. 데이타전송수단(271)은 디코드수단(253)에 결합되고, 디코드수단(253)은 또 데이타복호장치(260)에 결합되어 있다. 또, 엔코드수단(252) 및 디코드수단(253)은 각각 정적사전코드 변환표(250) 및 (251)을 갖는다. 여기에서, 가령 “COMPUTER” 및 “THIS”라는 단어를 포함한 평문 데이타(201)이 입력되고, 정적사전(241)에 의해 압축처리된 것으로 한다. “COMPUTER” 및 “THIS”는 데이타압축장치(200)에 있어서 각각 인덱스 “251” 및 “357”로 변환되고, 압축데이타의 일부로서 엔코드수단(252)로 보내진다. 엔코드수단(252)는 이들을 수신하고 정적사전 코드변환표(250)을 참조해서 범용인덱스 “2047” 및 “1023”으로 변환한다. 범용인덱스로 변환된 압축데이타는 데이타전송수단(270), 네트워크 및 데이타전송수단(271)을 거쳐서 디코드수단(253)으로 보내진다. 디코드수단(253)은 이들을 수신하고 그 중에 포함되는 범용인덱스 “2047” 및 “1023”을 정적사전 코드변환표(251)을 참조해서 정적사전(262) 고유의 인덱스 “34” 및 “143”으로 변환한다. 인덱스 “34” 및 “143”을 포함하는 압축데이타는 데이타복호장치(260)으로 보내진다. 데이타복호장치(260)은 이 압축데이타를 수신하고 정적사전(262)를 이용해서 인덱스 “34” 및 “143”을 각각 “COMPUTER” 및 “THIS”로 변환하고 이들을 포함하는 문을 원래의 평문(201)로서 출력한다.

본 실시예에 의하면, 엔코드수단(252)와 디코드수단(253)에 정적사전(241) 및 (262)의 인덱스를 범용인 인덱스로 변환하는 정적사전 코드변환표(250) 및 (251)을 마련하고, 전송부분에서는 표준적인 코드형식을 정의하는 것에 의해 아키텍쳐가 다른 압축장치, 복호장치 사이에서의 데이타의 호환성을 보증할 수 있다는 효과가 있다.

또한, 본 실시예에서는 엔코드수단(252) 및 디코드수단(253)은 인덱스의 코드변환을 실행하는 것만으로 했지만, 본 발명은 이것에 한정되는 것은 아니고, 데이타의 암호화 및 복호화를 각각 조합해서 실행하도록 해도 좋다. 이렇게 하는 것에 의해, 데이타의 압축암호장치를 제공할 수 있고 네트워크상의 데이타보안을 확보한 압축데이타의 전송을 실현할 수 있다는 효과가 있다.

본 발명에 의하면, 동적사전에 의한 데이타압축방법으로 정적사전을 병용하는 것에 의해 동적사전 단독에 의한 압축방법에 비해서 압축율을 향상시킬 수 있다. 특히, 동적사전에 의한 압축이 실행되기 어려운 입력데이타의 최초 부분의 압축에 정적사전을 이용하는 것에 의해 더욱 압축율을 향상시킬 수 있다. 또, 동적사전과 정적사전을 구별하는 부호를 압축데이타의 인덱스에 부가하는 것에 의해 복호시의 사전의 전환처리를 용이하게 할 수 있다. 또, 입력비트열의 코드, 정적사전의 인덱스 또는 동적사전의 인덱스 중 가장 코드길이가 짧은 것을 부호화하고 압축데이타로서 출력하는 것에 의해 더욱 압축율을 향상시킬 수 있다. 또, 정적사전의 인덱스에 비해서 동적사전의 인덱스쪽이 짧아지는 경우에 한해서 입력비트열을 동적사전에 등록하는 것에 의해 동적사전의 사이즈를 최소로 할 수 있다. 특히, 정적사전의 내용과 일치한 비트열의 인덱스를 압축데이타로서 출력하고, 이것을 동적사전에 추가하지 않도록 하는 것에 의해 동적사전의 규모를 작게 할 수 있고, 인덱스의 길이도 짧아지므로 압축율을 더욱 높게 할 수 있다. 또, 입력비트열을 순차 동적사전에 등록하고 동적사전 중의 데이타량이 소정의 데이타량에 도달했을 때 이것 이후의 입력비트열에 대한 등록을 실행하지 않거나 필요에 따라서 동적사전에서 이용도가 낮은 비트열을 삭제하는 것 중의 어느 한쪽, 또는 양쪽의 방법을 취하는 것에 의해 동적사전에서 비트열이 넘치는 문제를 해결할 수 있다.

Claims

입력데이타를 입력비트열로 분해하는 스텝, 비트열과 상기 비트열보다 짧은 각각의 인덱스를 대응시킨 표데이타를 구비하는 제1 사전을 이용해서 상기 입력비트열에 대해 열검색을 실행하는 스텝, 상기 검색결과에 따라서 상기 제1 사전에 상기 입력비트열을 등록하는 스텝, 상기 입력비트열을 이 입력비트열의 코드 또는 이 입력비트열에 대응하는 상기 제1 사전의 인덱스로 변환하고 얻어진 코드 또는 인덱스를 압축데이타로서 출력하는 스텝, 입력후보로 되는 비트열과 인덱스를 미리 고정적으로 정의하는 것에 의해 구축되는 제2 사전을 이용해서 상기 입력비트열에 대해 열검색을 실행하는 스텝, 상기 입력비트열과 상기 제2 사전의 비트열을 비교하는 스텝 및 상기 비교결과에 따라서 상기 입력비트열을 상기 제1 사전에 등록하는 스텝을 포함하는 것을 특징으로 하는 데이타압축방법.
입력데이타를 입력비트열로 분해하고, 비트열과 상기 비트열보다 짧은 각각의 인덱스를 대응시킨 표데이타를 구비하는 제1 사전을 이용해서 상기 입력비트열에 대해 열검색을 실행하고, 상기 검색결과에 따라서 상기 입력비트열을 상기 제1 사전에 등록하고, 상기 입력비트열을 이 입력비트열의 코드 또는 이 입력비트열에 대응하는 상기 제1 사전의 인덱스로 변환하고 얻어진 코드 또는 인덱스를 압축데이타로서 출력하는 데이타압축장치에 있어서, 입력후보로 되는 비트열과 인덱스를 미리 고정적으로 정의하는 것에 의해 구축되는 제2 사전, 상기 제2 사전을 구축하는 수단, 상기 제2 사전의 내용을 참조하는 수단 및 상기 제1 사전으로의 비트열의 등록여부를 판정하는 판정수단을 갖고, 상기 판정수단의 결과에 따라서 상기 입력비트열을 상기 제1 사전에 등록하는 것을 특징으로 하는 데이타압축장치.
입력데이타를 입력비트열로 분해하는 스텝, 비트열과 상기 비트열보다 짧은 각각의 인덱스를 대응시킨 표데이타를 구비하는 제1 사전을 이용해서 상기 입력비트열에 대해 열검색을 실행하는 스텝, 상기 검색결과에 따라서 상기 제1 사전에 상기 입력비트열을 등록하는 스텝 및 상기 입력비트열을 이 입력비트열의 코드 또는 이 입력비트열에 대응하는 제1 사전의 인덱스로 변환하고 얻어진 코드 또는 인덱스를 압축데이타로서 출력하는 스텝을 포함하고, 상기 압축데이타로서 출력하는 스텝은 상기 입력비트열의 코드, 상기 제1 사전의 인덱스 및 입력후보로 되는 비트열과 인덱스를 미리 고정적으로 정의하는 것에 의해 구축되는 제2 사전의 인덱스를 포함하는 코드 중의 어느 하나 및 복호동작용의 사전으로서 이용되는 상기 제1 또는 제2 사전을 지정하는 코드를 출력하는 것을 특징으로 하는 데이타압축방법.
입력데이타를 입력비트열로 분해하는 스텝, 비트열과 상기 비트열보다 짧은 각각의 인덱스를 대응시킨 표데이타를 구비하는 제1 사전을 이용해서 상기 입력비트열에 대해 열검색을 실행하는 스텝, 상기 검색결과에 따라서 상기 제1 사전에 상기 입력비트열을 등록하는 스텝, 상기 입력비트열을 이 입력비트열의 코드 또는 이 입력비트열에 대응하는 상기 제1 사전의 인덱스로 변환하여 얻어진 코드 또는 인덱스를 압축데이타로서 출력하는 스텝, 상기 입력비트열의 코드 길이를 기억하는 스텝 및 상기 입력비트열이 일치하는 비트열의 제1 사전과 입력후보로 되는 비트열과 인덱스를 미리 고정적으로 정의하는 것에 의해 구축되는 제2 사전중의 적어도 한쪽에 대응하는 인덱스 길이를 기억하는 스텝을 포함하고, 상기 압축데이타로서 출력하는 스텝은 상기 입력비트열과 상기 인덱스를 구비하는 코드 중의 어느 하나 및 보다 길이가 짧은 코드를 출력하는 것을 특징으로 하는 데이타압축방법.
제3항에 있어서, 상기 입력비트열과 일치하는 비트열을 상기 제2 사전에서 검색한 경우에 압축데이타로서 상기 제2 사전의 인덱스를 출력하는 스텝을 더 포함하는 것을 특징으로 하는 데이타압축방법.
제3항에 있어서, 상기 제1 사전의 인덱스의 출력을 개시하는 임계비트수를 기억시키는 스텝, 입력비트열의 비트수 또는 입력회수 중의 적어도 어느 한쪽에 따라서 현재까지 처리한 처리비트수를 계산하는 스텝 및 상기 처리된 비트수가 상기 임계비트수를 초과한 경우에 상기 제1 사전의 인덱스를 압축데이타로서 출력하는 스텝을 더 포함하는 것을 특징으로 하는 데이타압축방법.
제1항에 있어서, 상기 입력비트열과 일치하는 비트열을 상기 제2 사전에서 검출한 경우에는 상기 제1 사전에 입력비트열의 등록을 실행하지 않는 스텝을 더 포함하는 것을 특징으로 하는 데이타압축방법.
제1항에 있어서, 상기 입력비트열과 상기 제2 사전의 비트열을 비교하는 스텝은 상기 제2 사전의 입력비트열과 일치하는 제1 인덱스의 길이를 기억하고, 상기 제1 사전에 상기 입력비트열을 등록하는 스텝은 상기 제1 사전에서 등록한 경우의 제2 인덱스의 길이를 계산하고, 상기 제2 인덱스가 상기 제1 인덱스보다 짧은 경우에는 상기 제2 인덱스를 상기 제1 사전에 등록하는 것을 특징으로 하는데이타압축방법.
제2항에 있어서, 상기 제2 사전은 영어나 일본어 등의 자연언어의 적어도 1개의 언어 또는 그 일부, 프로그램언어의 적어도 1개의 예약어 또는 그 일부 및 적어도 1개의 명령어 또는 기계어의 일부에서 선택된 적어도 1종류의 문자열을 구비하고, 상기 사전은 상기 문자열의 속성정보, 상기 문자열의 출현확률 및 상기 문자열간의 관련성에서 선택된 적어도 하나의 부가정보를 구비하는 것을 특징으로 하는 데이타압축장치.
제9항에 있어서, 상기 제2 사전은 자연언어의 문자열 또는 자연언어의 정규표현의 문자열을 구비하고, 상기 속성정보는 품사, 어형변화, 어의를 정의하고, 상기 문자열간의 관련성은 표현 또는 어법을 정의하는 것을 특징으로 하는 데이타압축장치.
제1항에 있어서, 데이타입력전에 입력후보로 되는 비트열과 인덱스를 정의하고 제2 사전을 구축하는 스텝에서는 상기 비트열과 인덱스와 함께 상기 비트열의 속성정보, 상기 비트열의 출현확률 및 상기 비트열간의 관련성에서 선택된 적어도 하나의 부가정보를 정의하고, 상기 입력비트열과 상기 제2 사전의 비트열을 비교하는 스텝에서는 상기 입력비트열의 부가정보를 기억하고, 상기 제1 사전에 상기 입력비트열을 등록하는 스텝에서는 상기 제2 사전의 부가정보에 따라서 입력비트열의 등록을 실행하지 않는 것을 특징으로 하는 데이타압축방법.
제1항에 있어서, 데이타입력전에 입력후보로 되는 비트열과 인덱스를 정의하고 제2 사전을 구축하는 스텝에서는 상기 비트열과 인덱스와 함께 상기 비트열의 속성정보, 상기 비트열의 출현확률 및 상기 비트열간의 관련성에서 선택된 적어도 하나의 부가정보를 정의하고, 상기 입력비트열과 상기 제2 사전의 비트열을 비교하는 스텝에서는 상기 입력비트열의 부가정보를 기억하고, 상기 제1 사전에 상기 입력비트열을 등록하는 스텝에서는 상기 제2 사전의 부가정보에 따라서 적어도 1개의 비트열을 삭제하는 것을 특징으로 하는 데이타압축방법.
제2항에 있어서, 상기 제2 사전은 비트열의 속성정보, 비트열의 출현확률 및 비트열간의 관련성에서 선택된 적어도 하나의 부가정보를 구비하고, 상기 장치는 상기 제2 사전의 부가정보에 따라서 상기 제1 사전에서 등록된 비트열을 삭제하는 적어도 1개 이상의 삭제수단 및 상기 제1 사전의 사용사이즈의 상한값 및 등록비트열수의 상한값에서 선택된 적어도 하나를 기억하고, 상기 입력비트열을 상기 제1 사전에서 검색하는 검색수단을 더 포함하고, 상기 삭제수단은 입력비트열의 누계가 상기 상한값을 초과한 것을 검출하는 검출수단을 실행하고, 상기 삭제수단은 상기 제2 사전의 부가정보를 참조하여 제1 사전에서 적어도 1개의 비트열을 삭제하는 것을 특징으로 하는 데이타압축장치.
제2항에 있어서, 상기 제2 사전을 구축하는 구축수단의 프로그램, 상기 제1 사전에 입력비트열을 등록하는 프로그램 또는 상기 제1 사전에 등록된 비트열을 삭제하는 프로그램을 선택하여 데이타압축의 조건을 설정하는 초기설정화면을 더 포함하는 것을 특징으로 하는 데이타압축장치.
제2항에 있어서, 상기 제1 사전은 최대 2¹⁰∼2¹⁵개의 인덱스를 갖고, 상기 제2 사전은 최대 2¹²∼2¹⁷개의 인덱스를 갖는 것을 특징으로 하는 데이타압축장치.
입력데이타를 입력비트열로 분해하는 스텝, 비어 있거나 또는 미리 정한 기본의 비트열로 이루어지는 제1 사전을 구축하는 스텝, 상기 입력비트열을 상기 제1 사전에서 검색하는 스텝, 상기 제1 사전에 상기 입력비트열을 등록하는 스텝, 상기 입릭비트열과 상기 제1 사전의 비트열중의 적어도 한쪽을 부호화하고 부호화한 결과를 압축데이타로서 출력하는 스텝, 데이타입력전에 입력후보로 되는 비트연과 인덱스를 정의하고 제2사전을 구축하는 스텝 및 제2 사전과 동일한 내용의 사전이 존재하는 것을 확인하고 제1 및 제2 사전의 인덱스를 출력하는 스텝을 포함하는 것을 특징으로 하는 데이타압축방법.
적어도 1개의 데이타압축장치와 적어도 1개의 데이타복호장치를 구비하는 분산시스템에서 사용되는 데이타 압축장치에 있어서, 상기 데이타압축장치는 입력데이타에 따라서 비트열을 등록하는 제1 사전과 미리 정의한 제2 사전을 이용해서 데이타를 압축하고, 상기 데이타복호장치는 상기 제1 사전 및 상기 제2 사전과 전부 또는 그 일부가 다른 제3 사전을 이용해서 데이타를 복호하고, 상기 데이타압축장치는 데이타를 상기 제2 사전과는 독립인 범용의 인덱스로 변환하는 엔코드수단 및 상기 범용인덱스를 송신하는 데이타전송수단을 갖고, 상기 데이타복호장치는 상기 범용의 인덱스를 수신하는 데이타전송수단 및 상기 범용의 인덱스를 상기 제3 사전의 인덱스로 변환하는 디코드수단을 갖는 것을 특징으로 하는 분산시스템의 데이타압축장치.
제1 비트열을 갖는 데이타를 상기 제1 비트열보다 길이가 짧은 제2 비트열로 압축변환하는 데이타 압축방법으로서, 미리 정한 규칙에 따라서 제1 비트열을 갖는 데이타를 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하는 스텝, 후보로 되는 각각의 입력데이타의 비트열과 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열을 미리 고정적으로 대응시킨 테이블에 따라서 상기 데이타를 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하는 스텝, 상기 제2 비트열과 상기 제3 비트열을 비교하는 스텝 및 비교의 결과, 보다 짧은 길이의 비트열중의 하나를 결정하고, 그 비트열을 압축변환된 비트열로서 출력하는 스텝을 포함하는 것을 특징으로 하는 데이타압축방법.
제18항에 있어서, 비교의 결과, 상기 비트열이 서로 동일한 경우에 미리 정한 한쪽의 변환결과를 압축변환된 비트열로서 출력하는 스텝을 더 포함하는 것을 특징으로 하는 데이타압축방법.
제1 비트열을 구비한 원래의 데이타를 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하고, 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 원래의 데이타를 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하여 원래의 데이타가 압축변환데이타로 변환된 압축변환데이타를 원래의 데이타로 신장하는 신장방법으로서, 미리 정한 규칙에 따라서 압축변환된 비트열중의 부분비트열을 미리 정한 신장규칙에 따라서 원래의 데이타의 비트열로 신장변환하는 스텝 및 후보로 되는 각각의 압축된 비트열을 상기 원래의 입력데이타의 비트열에 고정적으로 대응시킨 테이블을 이용해서 상기 테이블에 따라 압축변환된 비트열을 원래의 입력데이타의 비트열로 신장변환하는 스텝을 포함하는 것을 특징으로 하는 데이타신장방법.
제20항에 있어서, 압축변환에 이용하는 테이블과 신장변환에 이용하는 테이블은 동일한 형식의 테이블이고, 압축변환시에 상기 테이블을 이용해서 상기 후보로 되는 입력데이타의 비트열에서 짧은 비트열을 얻고, 신장변환시에 상기 테이블을 이용해서 압축된 짧은 비트열에서 후보로서의 원래의 입력데이타의 비트열을 얻는 것을 특징으로 하는 데이타신장방법.
제20항에 있어서, 압축변환시에 이용하는 테이블과 신장변환시에 이용하는 테이블은 원래의 테이블의 복제인 것을 특징으로 하는 데이타신장방법.
제1 비트열을 구비하는 입력데이타를 미리 정한 규칙에 따라서 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하는 제1 데이타압축부, 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 입력데이타를 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하는 제2 데이타압축부 및 상기 입력데이타를 상기 제1 및 제2 데이타압축부에 의해 상기 입력데이타의 비트열보다 길이가 짧은 비트열로 변환하는 압축제어부를 구비하는 것을 특징으로 하는 데이타압축장치.
제23항에 있어서, 상기 압축제어부는 상기 제1 데이타압축부에 의해 변환된 비트열과 상기 제2 데이타압축부에 의해 변환된 비트열을 비교하고, 보다 길이가 짧은 비트열중의 하나를 출력하는 것을 특징으로 하는 데이타압축장치.
제1 비트열을 갖는 입력데이타를 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하는 제1 데이타압축부 및 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 입력데이타의 비트열을 상기 제2 비트열 보다 길이가 짧은 제3 비트열로 변환하는 제2 데이타압축부에 의해서 압축변환된 데이타를 원래의 데이타로 신장하는 데이타 신장장치로서, 상기 압축변환된 비트열을 미리 정한 규칙에 따라서 원래의 입력데이타의 비트열로 신장변환하는 제1 데이타신장부, 입력후보로 되는 압축변환된 비트열을 상기 원래의 입력데이타의 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 압축변환된 비트열을 상기 원래의 입력데이타의 비트열로 신장하는 제2 데이타신장부 및 상기 압축변환된 비트열을 상기 제1 및 제2 데이타압축부에 따른 상기 원래의 입력데이타의 비트열로 신장하는 신장제어부를 구비해서 이루어지는 데이타신장장치.
제25항에 있어서, 상기 제2 데이타압축부의 테이블과 제2 데이타신장부의 테이블은 서로 동일한 형식의 테이블이고, 상기 제2 데이타압축부는 그의 테이블을 따라서 입력후보로서의 입력데이타의 비트열에서 짧은 비트열을 얻고, 상기 제2 데이타신장부는 그의 테이블을 따라서 압축된 짧은 비트열에서 상기 입력후보로서의 원래의 입력데이타의 비트열을 얻는 것을 특징으로 하는 데이타신장장치.
제25항에 있어서, 상기 제2 데이타압축부의 테이블은 상기 제2 데이타신장부의 테이블과 실질적으로 동일한 것을 특징으로 하는 데이타신장장치.
입력되는 데이타를 수신하는 입력부, 제1 비트열을 갖는 상기 입력부로 부터의 입력데이타를 미리 정한 규칙에 따라서 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하는 제1 데이타압축부, 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 입력데이타를 상지 제2 비트열보다 길이가 짧은 제3 비트열로 변환하는 제2 데이타압축부, 상기 입력데이타를 상기 제1 및 제2 데이타압축부에 의한 상기 입력데이타의 비트열보다 길이가 짧은 비트열로 변환하는 압축제어부 및 상기 압축제어부에 의해 변환된 비트열을 출력하는 출력부를 포함하는 것을 특징으로 하는 데이타처리장치.
제28항에 있어서, 상기 압축제어부는 상기 제1 데이타압축부에 의해 변환된 비트열과 상기 제2 데이타압축부에 의해 변환된 비트열을 비교하고, 보다 길이가 짧은 비트열중의 하나를 출력하는 것을 특징으로 하는 데이타처리장치.
제1 비트열의 입력데이타를 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하는 제1 데이타 압축부 및 후보로 되는 입력데이타의 비트열을 상기 후보로 되는 각각의 입력데이타의 비트열보다 길이가 팔은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 입력데이타의 비트열을 상기 제2 비트열보다 길이가 짧은 제3 비트열로 전환하는 제2 데이타압축부에 의해서 압축변환한 데이타를 입력으로서 수신하는 데이타처리장치로서, 상기 압축변환한 비트열을 미리 정한 규칙에 따라서 원래의 입력데이타의 비트열로 신장변환하는 제1 데이타신장부, 입력후보로서 압축변환된 비트열을 상기 원래의 입력데이타의 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 압축변환된 비트열을 상기 원래의 입력데이타의 비트열로 신장하는 제2 데이타신장부 및 상기 압축변환된 비트열을 상기 제1 및 제2 데이타압축부에 따른 상기 원래의 입력데이타의 비트열로 신장하는 신장제어부를 포함하는 특징으로 하는 데이타처리장치.
제30항에 있어서, 상기 제2 데이타압축부의 테이블과 상기 제2 데이타신장부의 테이블은 서로 동일한 형식의 테이블이고, 상기 제2 데이타압축부는 그의 테이블에 따라서 입력후보로서 입력데이타의 비트옅에서 짧은 비트열을 얻고, 상기 제2 데이타신장부는 그의 테이블에 따라서 압축된 짧은 비트열에서 상기 입력후보로서의 원래의 입력데이타의 비트열을 얻는 것을 특징으로 하는 데이타처리장치.
입력되는 데이타를 수신하는 입력부, 제1 비트열을 갖는 상기 입력부로부터의 입력데이타를 미리 정한 규칙에 따라서 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하고, 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 입력데이타를 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하고, 상기 변환된 비트열을 서로 비교하여 보다 길이가 짧은 비트열중의 하나를 출력하는 처리제어부 및 상기 압축제어부에 의해 변환된 비트열을 출력하는 출력부를 포함하는 것을 특징으로 하는 데이타처리장치.
입력되는 데이타를 수신하는 입력부, 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블, 제1 비트열을 갖는 상기 입력부로부터의 입력데이타를 미리 정한 규칙에 따라서 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하고, 후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블에 따라서 상기 입력데이타를 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하고, 상기 변환된 비트열을 서로 비교하여 보다 길이가 짧은 비트열중의 하나를 출력하는 처리제어부 및 상기 압축제어부에 의해 변환된 비트열을 출력하는 출력부를 포함하는 것을 특징으로 하는 데이타처리장치.
변환후보로 되는 각각의 입력데이타의 비트열을 상기 후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 제1 테이블, 제1 비트열을 갖는 데이타를 미리 정한 규칙에 따라서 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하고, 상기 데이타의 비트열을 상기 테이블에 따라서 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하고, 상기 변환된 비트열을 서로 비교하여 보다 길이가 짧은 비트열중의 하나를 압축변환된 비트열로서 출력하는 데이타압축부, 상기 압축변환된 각각의 비트열을 상기 원래의 데이타의 비트열에 미리 고정적으로 대응시키는 제2 테이블 및 상기 압축변환된 비트열을 미리 정한 규칙에 따라서 원래의 데이타의 비트열로 신장변환하고, 상기 압축변환된 비트열을 상기 테이블에 따라서 원래의 데이타의 비트열로 신장변환하는 데이타신장부를 포함하는 것을 특징으로 하는 데이타처리장치.
제34항에 있어서, 상기 제1 및 제2 테이블은 서로 동일하고, 상기 데이타압축부는 그의 테이블에 따라서 입력후보로서의 입력데이타의 비트열에서 짧은 비트열을 얻고, 상기 데이타신장부는 그의 테이블에 따라서 압축된 짧은 비트열에서 상기 입력후보로서의 원래의 입력데이타의 비트열을 얻는 것을 특징으로 하는 데이타처리장치.
여러개의 데이타처리장치가 네트워크 전송로를 거쳐서 서로 데이타전송 가능하게 접속된 네트워크시스템에 있어서, 여러개의 데이타처리장치에서 선택된 임의의 1개는 후보로 되는 각각의 데이타의 비트열을 상기 후보로 되는 입력데이타보다 길이가 짧은 비트열에 미리 고정적으로 대응시킨 테이블, 제1 비트열을 갖는 전송데이타를 미리 정한 규칙에 따라서 상기 제1 비트열보다 길이가 짧은 제2 비트열로 변환하고, 상기 전송데이타의 비트열을 상기 테이블에 따라서 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하고, 상기 변환된 비트열을 서로 비교하여 보다 길이가 짧은 비트열중의 하나를 압축변환된 비트열로서 출력하는 처리제어부 및 상기 처리제어부에서 압축변환한 비트열을 전송데이타로서 상기 네트워크로 송신하는 데이타전송부를 구비하고, 상기 여러개의 데이타처리장치에서 선택된 임의의 다른 1개는 상기 데이타전송부에서 압축된 데이타를 수신하는 데이타수신부, 압축변환한 각각의 비트열을 원래의 데이타의 비트열에 미리 고정적으로 대응시킨 테이블 및 상기 네트워크를 거쳐서 수신한 상기 압축변환된 비트열을 미리 정한 규칙에 따라서 원래의 데이타의 비트열로 신장변환하고, 상기 압축변환된 비트열을 상기 테이블에 따라서 원래의 데이타의 비트열로 신장변환하는 처리제어부를 구비하는 것을 특징으로 하는 네트워크시스템.
제36항에 있어서, 상기 여러개의 데이타처리장치에서 선택된 임의의 하나의 테이블과 임의의 다른 하나의 테이블은 서로 동일한 형식의 테이블이고, 상기 여러개의 데이타처리장치중의 임의의 하나는 그의 테이블에 따라서 입력후보로서의 입력데이타의 비트열에서 짧은 비트열을 얻고, 상기 여러개의 데이타처리장치중의 임의의 다른 하나는 그의 테이블을 따라서 압축된 짧은 비트열에서 입력후보로서의 원래의 입력데이타의 비트열을 얻는 것을 특징으로 하는 네트워크시스템.
제36항에 있어서, 상기 여러개의 데이타처리장치중의 임의의 하나의 테이블과 임의의 다른 하나의 테이블은 원래의 테이블의 복제인 것을 특징으로 하는 네트워크시스템.
제36항에 있어서, 상기 여러개의 데이타처리장치는 적어도 하나의 서버를 구비하고, 다른 데이타처리장치는 상기 서버에서 상기 테이블을 복제하고 복제된 테이블을 기억하는 것을 특징으로 하는 네트워크시스템.
제36항에 있어서, 상기 데이타전송부에서 상기 네트워크상으로 전송될 압축변환된 데이타는 암호시스템으로 표현되는 것을 특징으로 하는 네트워크시스템.
여러개의 데이타처리장치가 네트워크 전송로를 거쳐서 서로 데이타전송 가능하게 접속된 네트워크시스템에 있어서, 그들 사이에 데이타전송을 위해 여러개의 데이타 처리장치에서 선택된 적어도 2개의 데이타처리장치의 각각은 변환후보로 되는 각각의 데이타의 비트열을 상기 변환후보로 되는 입력데이타의 비트열보다 길이가 짧은 비트열에 미리 고정적으로 대응시키는 테이블, 제1 비트열을 갖는 전송데이타를 미리 정한 규칙에 따라서 상기 제1 비트열 보다 길이가 짧은 제 2비트열로 변환하고, 상기 전송데이타의 비트열을 상기 테이블에 따라시 상기 제2 비트열보다 길이가 짧은 제3 비트열로 변환하고, 상기 변환된 비트열의 조합에 따라서 전송데이타를 압축변환하고 압축된 데이타를 출력하는 제1 처리제어부, 상기 제1 처리제어부에서 압축변환한 비트열을 전송데이타로서 상기 네트워크로 송신하는 데이타전송부, 상기 데이타처리장치중의 하나에서 네트워크를 거쳐서 상기 압축된 데이타를 수신하는 데이타수신부 및 상기 데이타수신부에 의해 수신한 상기 압축변환된 비트열을 미리 정한 규칙에 따라서 원래의 데이타의 비트열로 신장변환하고, 상기 압축변환된 비트열을 상기 테이블에 따라서 원래의 데이타의 비트열로 신장변환하는 제2 처리제어부를 포함하는 것을 특징으로 하는 네트워크시스템.