JP2012533921A - データの圧縮方法 - Google Patents

データの圧縮方法 Download PDF

Info

Publication number
JP2012533921A
JP2012533921A JP2012520525A JP2012520525A JP2012533921A JP 2012533921 A JP2012533921 A JP 2012533921A JP 2012520525 A JP2012520525 A JP 2012520525A JP 2012520525 A JP2012520525 A JP 2012520525A JP 2012533921 A JP2012533921 A JP 2012533921A
Authority
JP
Japan
Prior art keywords
character
data
character string
storing
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012520525A
Other languages
English (en)
Inventor
ユン シク オー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ESTsoft Corp
Original Assignee
ESTsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ESTsoft Corp filed Critical ESTsoft Corp
Publication of JP2012533921A publication Critical patent/JP2012533921A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3088Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本発明はデータの圧縮方法に係り、さらに詳しくは、コンピュータデータを圧縮するに際して、文字列辞書を生成してインデックスを格納する方法と、文字列に対する圧縮コードを格納する方法とを併用することにより、圧縮率を向上させることのできるデータの圧縮方法に関する。本発明によれば、圧縮率が向上し、且つ、解凍時の速度が高くなるという効果がある。

Description

本発明は、データの圧縮方法に係り、さらに詳しくは、コンピュータデータを圧縮するに際して、文字列辞書を生成してインデックスを格納する方法と、文字列に対する圧縮コードを格納する方法とを併用することにより、圧縮率を向上させることのできるデータの圧縮方法に関する。
一般に、データ圧縮は、所定のフォーマットで定義されたデータを元のフォーマットよりも少数のデータビットを含む他のフォーマットに変換することである。元のデータが必要になる場合、データを元のフォーマットに復元するために、圧縮されたデータは解凍される。
データ圧縮は、損失型圧縮及び無損失型圧縮に大別できるが、その用語から分かるように、データは、無損失型圧縮を採用する場合に、圧縮及び解凍中に原形がそのまま保存される。無損失型圧縮とは異なり、損失型圧縮は、解凍されたデータが元のデータと正確に一致しないこともある。無損失型のデータ圧縮アルゴリズムは、辞書(dictionary)符号化及び統計符号化の類型に分類される。
最も汎用されている辞書符号化アルゴリズムは、レンペル−ジフ(Lempel−Ziv)アルゴリズム及びこれらの変形アルゴリズムである。特に、LZ77アルゴリズムは、ジフらによって1977年に発表された圧縮方式をいい、LZ78は、ジフらによって1978年に発表された圧縮方式をいう。
LZ77は、文字の繰り返されたシーケンスを、ポインターによるシーケンスの以前発生に対する参照で代替する原理に基づく。LZ78は、ストリングマッチングのために、ルックアップテーブル又は辞書のように、適応的に成長する参照源に基づいて入力データ文字のストリーム(stream)を符号化された値でパース(parse)する。
従来発表された圧縮アルゴリズムでは、文字列符号化(文字列エンコード)又は辞書符号化のうちのいずれか一方の方法のみを用いてデータを圧縮していた。圧縮に使われる方法が一つである場合には、データの性質に応じて、圧縮率及び速度が向上することもあるが、さらに悪化することもある。もし、2種類の方法を併用して圧縮及び解凍を行い、圧縮に際しては一層高い効率を示す方法によるエンコード結果を格納すれば、常に最高の速度及び効率を保証することが可能になると考えられる。
上述の問題点を解消するための本発明は、原データに含まれている文字列の中で、繰り返し現れる文字列は辞書テーブルに格納してインデックスのみが格納されるようにし、繰り返し現れないか、あるいは、繰り返し現れる回数が少ない文字列は文字列エンコード方式によりデータを圧縮して格納することにより、効率よい圧縮が行われるデータの圧縮方法を提供することを目的とする。
また、本発明は、文字列をエンコードするに際して、前文字の次にくる文字の確率を計算して一緒に格納することにより、検索や解凍速度が向上するデータの圧縮方法を提供することを目的とする。
さらに、本発明は、エンコード過程で現れる文字列の中で、最近現れた複数の文字をテーブルに格納することにより、圧縮率が高くなるデータの圧縮方法を提供することを目的とする。
上述の問題点を解消するために、本発明に係るデータの圧縮方法は、コンピュータデータを圧縮する方法であって、原データに含まれている文字列の中で2回以上現れる繰り返し文字列を取り出す第1ステップと、前記取り出された繰り返し文字列のハッシュ値を計算して辞書テーブルに格納し、前記繰り返し文字列をエンコードして圧縮データに格納する第2ステップと、前記原データに含まれている文字列の中で、前記繰り返し文字列を除く文字列をLZ77(Lempel−Ziv)方式によりエンコードして前記圧縮データに格納する第3ステップと、前記第3ステップのエンコード過程で、前文字の次に特定の文字がくる確率を計算して前記圧縮データに格納する第4ステップと、を含む。
本発明に係るデータの圧縮方法において、前記第4ステップは、特定の1文字よりなる前文字の次に特定の文字がくる確率を計算して格納する第4−1ステップと、各文字に与えられたASCII値を8で割った余りが同じ文字を束ねて文字群を形成し、前記文字群の次に特定の文字がくる確率を計算して格納する第4−2ステップと、からなることを特徴とする。
本発明に係るデータの圧縮方法において、前記第4ステップは、前記第4−1ステップ及び前記第4−2ステップで計算された確率の中で、より高い値の確率のみを格納することを特徴とする。
本発明に係るデータの圧縮方法は、前記第2ステップ又は前記第3ステップのエンコード過程で、最近現れた複数の文字列に対する一覧を作成し、前記複数の文字列に対する一覧とインデックスを前記圧縮データに格納する第5ステップをさらに含む。
本発明によれば、圧縮率が向上し、且つ、解凍時の速度が高くなるという効果がある。
本発明の実施形態による圧縮方法の過程を示す概念図である。 辞書テーブルに格納されている文字列をハッシュ値を用いて検索する方法を示す概念図である。 前文字の次に特定の文字がくる確率を計算する方法を示す概念図である。 特定の文字群の次に特定の文字がくる確率を計算する方法を示す概念図である。
以下、添付図面に基づき、本発明の実施形態によるデータの圧縮方法(以下、「圧縮方法」と称する。)を説明する。
図1は、本発明の実施形態による圧縮方法の過程を示す概念図である。
本発明の圧縮方法によって圧縮可能なデータの種類は、文書やテキストに限定されず、イメージや音楽、その他のマルチメディアデータがいずれも含まれ得る。
圧縮対象となる原データ102は、文字列格納方式及び辞書格納方式によって圧縮データ106に変換される。
エンコード時に現れた文字列につき、いくつかの長さ単位でハッシュテーブルを作成する。そして、繰り返し文字列に対しては、辞書テーブル104に格納しておく。
データの圧縮は、所定のブロック単位で行われる。ブロックのサイズは、圧縮の速度とは無関係であるが、圧縮率には影響を及ぼす。一般に、ブロックのサイズが大きくなるにつれて、圧縮率は良くなるものの、メモリ使用量は増える。圧縮の単位となるブロックのサイズは、圧縮率やファイルのサイズなどを考慮してユーザーが自由に設定することができる。
圧縮時及び解凍時におけるメモリ使用量は、次式で表わされる。
メモリ使用量(圧縮時)=ブロックのサイズ×2+ハッシュテーブルのサイズ
メモリ使用量(解凍時)=ブロックのサイズ×2
図2は、辞書テーブルに格納されている文字列をハッシュ値を用いて検索する方法を示す概念図であり、辞書テーブル104に格納されるハッシュテーブル104bの構造を示している。
ハッシュテーブル104bを生成する方法は、以下の通りである。
まず、原データ102において、各文字で始まる長さが2(2、4、8、16、32、…)に相当する文字列104aのハッシュ値(Hash)を計算して、ハッシュテーブル104bに格納する。計算されたハッシュ値に相当する文字列104aを対応付けて格納することが好ましく、文字列の長さ及びハッシュ値のサイズは、圧縮時に指定することができる。
文字列の長さが長いほど長い文字列がマッチングできるので圧縮率が高くなり、ハッシュ値のサイズが大きくなるほどハッシュの衝突が回避できるので圧縮率が高くなる。しかしながら、両値が大きくなるほどメモリ使用量は増え、特に、文字列の長さが長くなると計算量が増えるため、速度が遅くなる。
格納は、LZ77のように、(文字列間の間隔、文字列の長さ)の形で行う。ハッシュテーブル104bのインデックスを格納するような方式により格納を行うと、圧縮率を高めることはできるとはいえ、デコード時にもハッシュテーブル104bを作成することを余儀なくされるため、速度が圧縮時と同じ位に遅くなるという問題点がある。このため、本発明においては、通常の圧縮アルゴリズムでのように、(distance、length)方式により格納を行う。
原データ102に対するエンコード過程で生成されたハッシュ値と同じハッシュ値がハッシュテーブル104bにあるか否かを判断する。ハッシュテーブル104bに格納される文字列は、最大128の長さを有することができる。
辞書テーブル104の内部のハッシュテーブル104bを検索して同じハッシュ値が格納されている場合、同じ文字列が存在すると判断することができ、同じハッシュ値を有する文字列のインデックスを圧縮データ106に格納する。
辞書テーブル104に格納される文字列の数が多いほど圧縮率は良くなるが、その分多くの文字列又はハッシュ値を検索せねばならないため、速度に影響を及ぼしてしまう。また、むやみに辞書数を増やしてしまうと、格納すべきインデックスの種類が増えるため、圧縮率はそれ以上良くなくなるという状況に陥る。
圧縮データ106に文字を格納するとき、前文字の次にくる文字の確率(頻度)を計算して一緒に格納する。文字がくる確率を一緒に格納することにより、文字列に対するインデックスのビット数を減らして圧縮効率を向上させることができる。
文字がくる確率を求める方法は、2通りである。一つは、特定の1文字よりなる前文字の次に特定の文字がくる確率を計算することである。
図3は、前文字の次に特定の文字がくる確率を計算する方法を示す概念図であり、前文字が一つの文字である場合を示す。
例えば、エンコード過程で特定の文字「C」の次に「A」がくる確率がいくらであるかを計算して圧縮データ106に一緒に格納する。特定の文字がくる確率は、以前のステップで行われるエンコード過程で発生したケースを累積して計算する。もし、前文字の次に特定の文字がくる確率をあらかじめ計算して格納しておけば、解凍過程で辞書や文字列に対する検索範囲を絞ることができて、デコード時間が短縮されるという効果が得られる。
また、図4は、特定の文字群の次に特定の文字がくる確率を計算する方法を示す概念図である。
文字群とは、原データ102に含まれている文字列の次に特定の文字がくる確率を計算するために、文字列を所定の規則に即して分類したものを意味する。まず、それぞれの文字列を示すASCII値を求め、ASCII値を所定の数で割った余りが同じ文字列同士を束ねて同じ群を形成する。
もし、ASCII値を8で割った余りが同じ文字列同士で群を作るとしたとき、合計8個の文字群が作られる。本発明においては、8個の文字群が作られることを想定しているが、一層多くの文字群を作って使用してもよい。
図4に示すように、ASCII値を8で割った余りが同じ文字「A」、「B」、「C」の次に特定の文字「A」がくる確率を計算する。例えば、「A」、「B」、「C」のASCII値がそれぞれ「65」、「73」、「81」であるとしたとき、3文字のASCII値を8で割った余りはいずれも1となる。このため、「A」、「B」、「C」は余りが1である文字群に分類することができる。文字群ごとに計算された確率は、圧縮データ106に一緒に格納する。
最終的に圧縮を行うときには、2通りの方式の中で圧縮率がより高い方式を選択して圧縮を行う。すなわち、特定の前文字の次にくる文字の確率を求める方式と、特定の文字群の次にくる文字の確率を求める方式の中で、圧縮率がより高い方式を選択して圧縮を行い、圧縮データ106を解凍するときには、確率がより高かった方法を選択して解凍を行う。
しかしながら、圧縮データ106を格納するとき、2通りの方式の中で、どのような方式を選択して圧縮を行ったかを一緒に格納しないこともある。もし、特定の方式に対する選択有無を一緒に格納すれば、デコード速度は向上させることができるとはいえ、それに関する情報を一緒に格納せねばならないため、圧縮率が落ちてしまうという問題点がある。
圧縮方式に関する情報を格納しない場合には、デコード過程で2通りの方式の解凍を同時に行い、これらの中で圧縮率がより高い方式を選択して原データ102を再生する。
一方、本発明においては、圧縮時又は解凍時に最近現れたいくつかの値に関する情報を別途に格納して管理する。データのエンコード及びデコードの過程で同じ文字列は隣り合う位置で再び登場する可能性が高い。この場合に、新たに文字を検索したりエンコードをしたりすれば効率が落ちるため、あらかじめ設定された数に見合う分だけの文字列の履歴を格納して高速検索が行えるようにする。
エンコード過程で最近現れた複数の文字列に対して一覧を作成し、一覧に含まれている文字列に対するインデックスを生成する。そして、一覧とインデックスを圧縮データ106に一緒に格納する。
好ましくは、約10個〜約20個の文字列を格納するが、過去履歴に格納される文字列の数は当業者によって変更可能である。
以上、添付図面に基づき、本発明の好適な実施形態を説明したが、上述の本発明の技術的構成は、本発明が属する技術分野における当業者が本発明の技術的思想や必須的特徴を変更することなく他の具体的な形態で実施可能であるということが理解できるであろう。よって、上述の実施形態はあらゆる面で例示的なものであり、限定的なものではないということが理解できる筈であり、本発明の範囲は上記の詳細な説明の欄よりは、後述する特許請求の範囲によって開示され、特許請求の範囲の意味及び範囲ならびにその等価概念から導き出されるあらゆる変更又は変形された形態が本発明の範囲に含まれるものと解釈されるべきである。

Claims (3)

  1. コンピュータデータを圧縮する方法であって、
    原データに含まれている文字列の中で2回以上現れる繰り返し文字列を取り出す第1ステップと、
    前記取り出された繰り返し文字列のハッシュ値を計算して辞書テーブルに格納し、前記繰り返し文字列をエンコードして圧縮データに格納する第2ステップと、
    前記原データに含まれている文字列の中で、前記繰り返し文字列を除く文字列をLZ77(Lempel−Ziv)方式によりエンコードして前記圧縮データに格納する第3ステップと、
    前記第3ステップのエンコード過程で、前文字の次に特定の文字がくる確率を計算して前記圧縮データに格納する第4ステップと、
    を含み、
    前記第4ステップは、
    特定の1文字よりなる前文字の次に特定の文字がくる確率を計算して格納する第4−1ステップと、
    各文字に与えられたASCII値を8で割った余りが同じ文字を束ねて文字群を形成し、前記文字群の次に特定の文字がくる確率を計算して格納する第4−2ステップと、からなることを特徴とする、請求項1に記載のデータの圧縮方法。
  2. 前記第4ステップは、
    前記第4−1ステップおよび前記第4−2ステップで計算された確率の中で、より高い値の確率のみを格納することを特徴とする、請求項1に記載のデータの圧縮方法。
  3. 前記第2ステップまたは前記第3ステップのエンコード過程で、最近現れた複数の文字列に対する一覧を作成し、前記複数の文字列に対する一覧とインデックスを前記圧縮データに格納する第5ステップをさらに含む
JP2012520525A 2009-07-17 2010-06-01 データの圧縮方法 Pending JP2012533921A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2009-0065526 2009-07-17
KR1020090065526A KR101049699B1 (ko) 2009-07-17 2009-07-17 데이터의 압축방법
PCT/KR2010/003489 WO2011007956A2 (ko) 2009-07-17 2010-06-01 데이터의 압축방법

Publications (1)

Publication Number Publication Date
JP2012533921A true JP2012533921A (ja) 2012-12-27

Family

ID=43449926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012520525A Pending JP2012533921A (ja) 2009-07-17 2010-06-01 データの圧縮方法

Country Status (5)

Country Link
US (1) US20120130965A1 (ja)
EP (1) EP2455853A4 (ja)
JP (1) JP2012533921A (ja)
KR (1) KR101049699B1 (ja)
WO (1) WO2011007956A2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101862341B1 (ko) 2012-01-09 2018-05-30 삼성전자주식회사 데이터 압축 기능을 갖는 데이터 저장 장치
KR101956031B1 (ko) * 2012-10-15 2019-03-11 삼성전자 주식회사 데이터 압축 장치 및 방법, 데이터 압축 장치를 포함하는 메모리 시스템
KR101403356B1 (ko) * 2012-10-22 2014-06-05 (주)티베로 데이터 압축 장치, 데이터 압축 방법 및 그 방법을 위한 컴퓨터 판독 가능한 기록 매체
US9087070B2 (en) * 2013-01-31 2015-07-21 Yahoo! Inc. System and method for applying an efficient data compression scheme to URL parameters
US8912932B2 (en) 2013-03-14 2014-12-16 Lsi Corporation Lempel-Ziv data compression with shortened hash chains based on repetitive patterns
EP3041145B1 (en) * 2013-08-30 2019-04-10 Fujitsu Limited Data compression device, method, and program
US9753983B2 (en) 2013-09-19 2017-09-05 International Business Machines Corporation Data access using decompression maps
US9780805B2 (en) * 2014-10-22 2017-10-03 International Business Machines Corporation Predicate application through partial compression dictionary match
US10432217B2 (en) 2016-06-28 2019-10-01 International Business Machines Corporation Page filtering via compression dictionary filtering
CN109639285B (zh) * 2018-12-05 2023-06-13 北京安华金和科技有限公司 一种基于有限块排序压缩提高bzip2压缩算法速度的方法
US11050436B2 (en) * 2019-06-21 2021-06-29 Sap Se Advanced database compression
CN111817722A (zh) * 2020-07-09 2020-10-23 北京奥星贝斯科技有限公司 数据压缩方法、装置及计算机设备
CN116304056B (zh) * 2023-04-11 2024-01-30 山西玖邦科技有限公司 一种用于计算机软件开发数据的管理方法
CN117014519B (zh) * 2023-09-27 2023-12-29 北京融威众邦科技股份有限公司 一种数据传输方法及医院智能传输系统
CN117312613B (zh) * 2023-10-07 2024-03-08 杭州易靓好车互联网科技有限公司 基于云计算的订单数据智能管理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03102465A (ja) * 1989-09-16 1991-04-26 Nippon Telegr & Teleph Corp <Ntt> 文字連接確率辞書構成法
JPH0764765A (ja) * 1993-08-31 1995-03-10 Nec Corp データ圧縮装置及びデータ復元装置
JPH1155125A (ja) * 1997-08-01 1999-02-26 Fujitsu Ltd 文字データの圧縮・復元方法
JP2000124810A (ja) * 1998-08-13 2000-04-28 Fujitsu Ltd 符号化装置及び復号化装置
JP2002368625A (ja) * 2001-06-11 2002-12-20 Fuji Xerox Co Ltd 符号量予測装置、符号化選択装置および符号化装置ならびにその方法
WO2004062110A1 (ja) * 2002-12-26 2004-07-22 Fujitsu Limited データ圧縮方法、プログラム及び装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455576A (en) * 1992-12-23 1995-10-03 Hewlett Packard Corporation Apparatus and methods for Lempel Ziv data compression with improved management of multiple dictionaries in content addressable memory
US5635932A (en) * 1994-10-17 1997-06-03 Fujitsu Limited Lempel-ziv compression with expulsion of dictionary buffer matches
JP3267504B2 (ja) * 1996-03-26 2002-03-18 富士通株式会社 データ圧縮装置およびデータ復元装置
US5951623A (en) * 1996-08-06 1999-09-14 Reynar; Jeffrey C. Lempel- Ziv data compression technique utilizing a dictionary pre-filled with frequent letter combinations, words and/or phrases
JP3276860B2 (ja) * 1996-09-02 2002-04-22 富士通株式会社 データ圧縮/復元方法
US6122375A (en) * 1996-12-10 2000-09-19 Hitachi, Ltd. Hash value generating method and device, data encryption method and device, data decryption method and device
JP3337633B2 (ja) * 1997-12-03 2002-10-21 富士通株式会社 データ圧縮方法及びデータ復元方法並びにデータ圧縮プログラム又はデータ復元プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3421700B2 (ja) * 1998-01-22 2003-06-30 富士通株式会社 データ圧縮装置及び復元装置並びにその方法
US6070179A (en) * 1998-02-20 2000-05-30 International Business Machines Corporation Method and system for compressing unicode data within a data processing system
US6611213B1 (en) * 1999-03-22 2003-08-26 Lucent Technologies Inc. Method and apparatus for data compression using fingerprinting
JP2001282820A (ja) * 2000-01-25 2001-10-12 Sony Corp データ圧縮方法、検索方法、検索装置、データパケット信号および記録媒体
US6650261B2 (en) * 2001-09-06 2003-11-18 Xerox Corporation Sliding window compression method utilizing defined match locations
LV13012B (en) * 2002-03-22 2003-06-20 Datoru Drosibas Tehnologijas S Method and apparatus for lossless compression and decompression of data
US20040027606A1 (en) * 2002-08-12 2004-02-12 Simon Kao Selection of one best from several data-compressing methods
US7664323B2 (en) * 2005-01-28 2010-02-16 Microsoft Corporation Scalable hash-based character recognition
JP4456554B2 (ja) * 2005-10-31 2010-04-28 富士通株式会社 データ圧縮方法及び圧縮データ送信方法
KR20080026772A (ko) * 2006-09-21 2008-03-26 인하대학교 산학협력단 Lempel-Ziv 압축 방법의 복원 속도를 보완한압축 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03102465A (ja) * 1989-09-16 1991-04-26 Nippon Telegr & Teleph Corp <Ntt> 文字連接確率辞書構成法
JPH0764765A (ja) * 1993-08-31 1995-03-10 Nec Corp データ圧縮装置及びデータ復元装置
JPH1155125A (ja) * 1997-08-01 1999-02-26 Fujitsu Ltd 文字データの圧縮・復元方法
JP2000124810A (ja) * 1998-08-13 2000-04-28 Fujitsu Ltd 符号化装置及び復号化装置
JP2002368625A (ja) * 2001-06-11 2002-12-20 Fuji Xerox Co Ltd 符号量予測装置、符号化選択装置および符号化装置ならびにその方法
WO2004062110A1 (ja) * 2002-12-26 2004-07-22 Fujitsu Limited データ圧縮方法、プログラム及び装置

Also Published As

Publication number Publication date
WO2011007956A4 (ko) 2011-05-19
KR20110007865A (ko) 2011-01-25
EP2455853A2 (en) 2012-05-23
EP2455853A4 (en) 2013-07-10
US20120130965A1 (en) 2012-05-24
KR101049699B1 (ko) 2011-07-15
WO2011007956A3 (ko) 2011-03-24
WO2011007956A2 (ko) 2011-01-20

Similar Documents

Publication Publication Date Title
JP2012533921A (ja) データの圧縮方法
KR100894002B1 (ko) 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법
US8704685B2 (en) Encoding method, encoding apparatus, decoding method, decoding apparatus, and system
US7737869B2 (en) Symbol based data compression
WO2019153700A1 (zh) 编解码方法、装置及编解码设备
US7764202B2 (en) Lossless data compression with separated index values and literal values in output stream
US9397695B2 (en) Generating a code alphabet of symbols to generate codewords for words used with a program
US7511639B2 (en) Data compression for communication between two or more components in a system
JP5656593B2 (ja) 符号化データを復号する装置及び方法
US5010344A (en) Method of decoding compressed data
EP0435802B1 (en) Method of decompressing compressed data
Konecki et al. Efficiency of lossless data compression
Cannane et al. A compression scheme for large databases
US7750826B2 (en) Data structure management for lossless data compression
Hoang et al. Dictionary selection using partial matching
KR20160102593A (ko) 분포데이터의 블럭화를 이용한 허프만 부호화의 효율화 방법 및 그 장치
Zia et al. Two-level dictionary-based text compression scheme
Mahmood et al. An Efficient Text Database Compression Technique using 6 Bit Character Encoding by Table Look Up
JP3565147B2 (ja) 復号装置
Sidhu et al. An Advanced Text Encryption & Compression System Based on ASCII Values & Arithmetic Encoding to Improve Data Security
Kotze et al. An evaluation of the Lempel-Ziv-Welch data compression algorithm
CN117465471A (zh) 一种针对文本文件的无损压缩系统及其压缩方法
Adjeroh et al. Coders for the Burrows-Wheeler Transform
JP2002344326A (ja) 合成インデックスによるデータ圧縮方法及び圧縮データの完全復元方法
JP2014229926A (ja) データ変換方法、データ逆変換方法、装置、及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140220

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140520