JP4814999B2 - データ圧縮・復元方法及び圧縮・復元プログラム - Google Patents

データ圧縮・復元方法及び圧縮・復元プログラム Download PDF

Info

Publication number
JP4814999B2
JP4814999B2 JP2009551319A JP2009551319A JP4814999B2 JP 4814999 B2 JP4814999 B2 JP 4814999B2 JP 2009551319 A JP2009551319 A JP 2009551319A JP 2009551319 A JP2009551319 A JP 2009551319A JP 4814999 B2 JP4814999 B2 JP 4814999B2
Authority
JP
Japan
Prior art keywords
repetition
code
data
relative
compressed data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009551319A
Other languages
English (en)
Other versions
JPWO2009095956A1 (ja
Inventor
宣子 井谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2009095956A1 publication Critical patent/JPWO2009095956A1/ja
Application granted granted Critical
Publication of JP4814999B2 publication Critical patent/JP4814999B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/04Protocols for data compression, e.g. ROHC
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3086Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing a sliding window, e.g. LZ77

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、コンパクトに電子データを格納・通信するシステムを実現するためのデータ圧縮・復元技術に関する。
組込み機器におけるアプリケーションのリッチ化に伴い、アプリケーションの格納・通信において、データ量の増加が問題となっている。
このような場合に、データ圧縮技術を用い、データのロスなしに符号化を実施することでデータ量を削減する技術が知られている。
データ量削減により、メモリコスト削減、通信コスト削減及び省電力の効果がある。また、メモリバスや通信路に流すデータ量が減ることでシステム全体の高速化にも効果がある。
従来のデータ圧縮技術の一方式を図1に示す。この方式は、処理負荷が低くリーズナブルにデータ量を削減できる、LZ77方式と呼ばれる辞書型圧縮方式である。この方式では、データバッファから同じ文字列の繰返しであってできるだけ一致部分の長い繰返しが見つけられ、その繰返しが位置及び一致長で符号化される。
一方、アプリケーションは命令コードとデータとの混在から成っている。命令コードの部分は、複数バイト(例えば4バイト)で1ワードが表される。このため、例えば図2に示されるように、繰返しが見つかる箇所が、命令コード及びデータとも1ワード中の1バイト目及び3バイト目など、ワード中の同じ位置であることが多い。つまり、バイト単位での相対位置で見ると、4の倍数になることが多い(4バイトコードの場合)。
しかし、LZ77方式等の従来技術では、計算機処理がしやすいように、命令コード部分もデータ部分も一律に処理されているため、この規則性を取り込んだより効率的なデータ圧縮を行えなかった。
下記特許文献1に記載の従来技術は、文字列の繰り返しを、一致長と一致位置で符号化するLZ77タイプの符号化において、一致長が1の繰返しに対して相対位置が閾値以下のものを特別に符号化する点を特徴とするものである。
しかし、この従来技術は、状況に応じて符号化方式を切り替える機能は有しているが、命令コードとデータとが混在するようなアプリケーションを効率的に圧縮することはできない。
下記特許文献2に記載の従来技術は、LZ77タイプの符号化において、バイト表現上同じ数値列であっても解析部により意味が異なること(数字なのか文字なのか等)を検出し意味も考慮して一致を検出することを特徴とするものである。
しかし、この従来技術は、繰返し検索の前に意味論的に解析するためのパーサを使用しており、比較的重い処理とパーサ辞書が必要なため、携帯用アプリケーションのデータ圧縮には適さない。
特開2007−37115号公報 特開平8−69370号公報
本発明の課題は、命令コードを含む被圧縮データを効率よく圧縮して圧縮データを生成し、その圧縮データから被圧縮データを効率よく復元することにある。
本発明の第一の態様は、命令コードを含む被圧縮データの文字列の繰り返しであって最大長一致する部分列を検出し、前記部分列の位置と一致長とを組み合わせて符号化することにより圧縮データを生成するデータ圧縮方法又はプログラムを前提とする。
まず、被圧縮データから繰返し部分を順次検出し、その繰返し部分の相対一致位置が命令コードを表すバイト数である命令ワード長の倍数に相当する位置である第一の繰返しの状態か、そうではない第二の繰返しの状態かを判定する繰返し状態判定ステップが実行される。
繰返し部分が第一の繰返し状態である場合には、その繰返し部分に対応する相対一致位置を命令ワード長で割って得られる圧縮相対一致位置を示す値と、その繰返し部分の相対一致位置における一致長を示す値とを少なくとも含む第一の繰返し符号を生成し、それを圧縮データとして出力する第一の繰返し符号(ワード繰返し符号)生成ステップが実行される。
繰返し部分が第二の繰返し状態である場合には、その繰返し部分に対応する相対一致位置を示す値と、その繰返し部分の相対一致位置における一致長を示す値とを少なくとも含む第二の繰返し符号を生成し、それを圧縮データとして出力する第二の繰返し符号(バイト繰返し符号)生成ステップが実行される。
そして、第一及び第二の繰返し符号を切り替えるための切替え符号を生成し、それを圧縮データとして出力する切替え符号生成ステップが実行される。
上述の本発明の第一の態様において、第二の繰返し状態の後第一の繰返し状態が所定回数(T回)連続して続いた場合に、第一の繰返し符号への切替えを行うステップと、第一の繰返し状態の後第二の繰返し状態に1回でもなった場合に、第二の繰返し符号への切替えを行うステップとを、更に含むように構成することができる。
上述の本発明の第一の態様において、第一の繰返し符号生成ステップ又は第二の繰返し符号生成ステップにおいて、一致長が所定バイト数よりも小さい場合には、第一の繰返し符号又は第二の繰返し符号として被圧縮データのバイトデータをそのまま示す値を出力し、第一の繰返し符号又は第二の繰返し符号は被圧縮データのバイトデータをそのまま示す値が出力されているか否かを示すためのフラグを含むように構成することができる。
本発明の第二の態様は、命令コードを含む被圧縮データの文字列の繰り返しであって最大長一致する部分列を検出し、前記部分列の位置と一致長とを組み合わせて符号化することにより生成された圧縮データから被圧縮データを復元するデータ復元方法又はプログラムを前提とする。
第一及び第二の繰返し符号を切り替えるための切替え符号を圧縮データから抽出し、その抽出タイミングに基づいて下記の第一の繰返し部分復元ステップと第二の繰返し部分復元ステップとを切り替えて実行させる切替えステップが実行される。
第一の繰返し部分復元ステップは、相対一致位置を命令コードを表すバイト数である命令ワード長で割って得られる圧縮相対一致位置を示す値と、相対一致位置における一致長を示す値とを少なくとも含み圧縮データを構成する第一の繰返し符号から、圧縮相対一致位置と一致長を抽出し、その圧縮相対一致位置に命令ワード長を乗算して相対一致位置を算出し、既に復元されている被圧縮データから算出した相対一致位置と抽出した一致長とに対応する第一の繰返し部分を復元し、被圧縮データとして出力する。
第二の繰返し部分復元ステップは、相対一致位置を示す値と、相対一致位置における一致長を示す値とを少なくとも含み圧縮データを構成する第二の繰返し符号から、相対一致位置と一致長を抽出し、既に復元されている被圧縮データから抽出した相対一致位置と抽出した一致長とに対応する第二の繰返し部分を復元し、被圧縮データとして出力する。
上述の本発明の第二の態様において、第一の繰返し部分復元ステップ又は第二の繰返し部分復元ステップにおいて、第一の繰返し符号又は第二の繰返し符号に含まれるフラグが被圧縮データのバイトデータをそのまま示す値が出力されていることを示している場合に、第一の繰返し符号又は第二の繰返し符号に含まれるデータから被圧縮データのバイトデータをそのまま抽出し、被圧縮データとして出力するように構成することができる。
上述した本発明の第一及び第二の態様の構成により、CPUに対する命令コードの命令ワード長の特性を利用し、少ない処理負荷で命令コードの効率的な圧縮・復元が可能となる。これにより、例えば携帯端末や組込機器等のシステム起動時にCPUがRAM等から命令コードを読み出す時間を短縮できるので、ひいてはブート時間を短縮することができる。
データの繰返しをその位置と一致長で符号化する、従来のデータ圧縮技術の一方式の説明図である。 命令コードにおけるデータの規則性の説明図である。 本発明の実施形態の機能ブロック図である。 本発明の実施形態のプログラムが実行されるハードウェアの構成図である。 本発明の実施形態のデータ圧縮プログラムに対応する動作フローチャートである。 本発明の実施形態のデータ復元プログラムに対応する動作フローチャートである。 ワード繰返し符号とバイト繰返し符号の符号フォーマットを示す図である。 命令データエリアとデータエリアが混在する元データのバイト列の例に対して圧縮データの符号が生成される動作の説明図である。 符号出力部から出力される圧縮データの符号の例を示す図である。
以下、図面を参照しながら、本発明を実施するための最良の形態を詳細に説明する。
図3は、本発明の実施形態の機能ブロック図であり、図3(a)はデータ圧縮を行うための実施形態の機能ブロック図、図3(b)はデータ復元を行うための実施形態の機能ブロック図である。
まず、図3(a)のデータ圧縮側の機能ブロック図について説明する。
繰返し検出部302は、アプリケーション等の命令コードとデータが混在した被圧縮データである元データ301を例えば8キロバイト(8192バイト)分を順次一時保持し、その元データ301中の繰返しを検出する。
切替え判定部303は、繰返し検出部302が検出した繰返しが、命令コード部分に対応するワード繰返しなのか、データ部分に対応するバイト繰返しなのかを判定する。
切替え部304は、切替え判定部303の判定結果に基づいて、ワード繰返し符号生成部305による処理かバイト繰返し符号生成部306による処理かを切り替える。
ワード繰返し符号生成部305は、繰返し検出部302が検出した繰返し部分に対して、命令コード分に対応するワード単位での繰返し符号を生成する。
バイト繰返し符号生成部306は、繰返し検出部302が検出した繰返し部分に対して、データ部分に対応するバイト単位での繰返し符号を生成する。
切替え符号生成部307は、切替え部304が繰返し符号の切替えを行う境界部分において、切替え符号を生成する。
符号出力部308は、ワード繰返し符号生成部305、バイト繰返し符号生成部306、及び切替え符号生成部307が生成された各符号を合わせて、圧縮データ309として出力する。
以上のようにして得られた圧縮データ309は、例えば携帯電話や組込機器のROM記録媒体等に記憶される。
次に、図3(b)のデータ復元側の機能ブロック図について説明する。
例えば携帯電話や組込機器のROM記録媒体等から読み出された圧縮データ309は、符号入力部310に入力し、そこで符号が取り出される。
切替え符号検出部311は、ワード繰返し復号部313及びバイト繰返し復号部314が復号した符号中から、切替え符号を検出する。
切替え部312は、切替え符号検出部311が検出された切替え符号に基づいて、ワード繰返し復号部313又はバイト繰返し復号部314の何れかを動作させる。
ワード繰返し復号部313は、符号入力部310から入力されるワード繰返し符号を復号して命令コード部分を取り出し、それを元データ301として出力する。
バイト繰返し復号部314は、符号入力部310から入力されるバイト繰返し符号を復号してデータ部分を取り出し、それを元データ301として出力する。
図4は、図3(a)及び(b)に示される各機能ブロック構成が、図5及び図6に示される動作フローチャートの各動作に対応する各コンピュータプログラムによって実現される場合における、その各プログラムを実行する各コンピュータのハードウェア構成の一例を示す図である。
図4に示されるコンピュータは、CPU401、メモリ402、入力装置403、出力装置404、外部記憶装置405、可搬記録媒体409が挿入される可搬記録媒体駆動装置406、及びネットワーク接続装置407を有し、これらがバス408によって相互に接続された構成を有する。同図に示される構成は上記システムを実現できるコンピュータの一例であり、そのようなコンピュータはこの構成に限定されるものではない。
図4に示されるコンピュータは、それに搭載されるプログラムが、図3(a)に対応する図5の動作フローチャートの動作を実行する場合には、データ圧縮機能を実行するワークステーションやサーバ等のデータ圧縮作業用コンピュータであり、図3(b)に対応する図6の動作フローチャートの動作を実行する場合には、データ復元機能を実行する携帯電話やモバイル端末、或いは組込機器等のコンピュータである。
CPU401は、当該コンピュータ全体の制御を行う。メモリ402は、プログラムの実行、データ更新等の際に、外部記憶装置405(或いは可搬記録媒体409)に記憶されているプログラム又はデータを一時的に格納するRAM等のメモリである。メモリ402は、図4がデータ圧縮作業用コンピュータの構成である場合には、図5の動作フローチャートに対応するデータ圧縮プログラムとそれによって生成される圧縮データ309等を一時的に記憶し、図4が携帯電話や組込機器等のコンピュータの構成である場合には、図6の動作フローチャートに対応するデータ復元プログラムとそれが復元する圧縮データ309及び復元によって得られるアプリケーションプログラム+データ等の元データ301を一時的に記憶する。CUP401は、上記プログラムをメモリ402に読み出して実行することにより、全体の制御を行う。
入力装置403は、図4がデータ圧縮作業用コンピュータの構成である場合には、例えば、キーボード、マウス等及びそれらのインタフェース制御装置とからなり、図4が携帯電話や組込機器等のコンピュータの構成である場合には、携帯電話や組込機器等のテンキーとポインタデバイス等及びそれらのインタフェース制御装置とからなる。入力装置403は、ユーザによるキーボードやマウス等による入力操作を検出し、その検出結果をCPU401に通知する。
出力装置404は、図4がデータ圧縮作業用コンピュータの構成である場合には、ディスプレイ表示装置、印刷装置等及びそれらのインタフェース制御装置とからなり、図4が携帯電話や組込機器等のコンピュータの構成である場合には、携帯電話や組込機器等の画面表示装置及びインタフェース制御装置とかなる。出力装置404は、CPU401の制御によって送られてくるデータを表示装置や印刷装置に出力する。
外部記憶装置405は、図4がデータ圧縮作業用コンピュータの構成である場合には、例えばハードディスク記憶装置であり、図4が携帯電話や組込機器等のコンピュータの構成である場合には、ROMメモリディスク装置やRAMメモリディスク装置である。同装置405は、前述したプログラムや圧縮データ309、元データ301等の保存に用いられる。
可搬記録媒体駆動装置406は、図4がデータ圧縮作業用コンピュータの構成である場合には、光ディスクやCD、DVD等の可搬記録媒体409、図4が携帯電話や組込機器等のコンピュータの構成である場合には、SDRAM/マイクロSDRAM等の可搬記録媒体409を収容するもので、外部記憶装置405の補助の役割を有する。
ネットワーク接続装置407は、図4がデータ圧縮作業用コンピュータの構成である場合には、例えばLAN(ローカルエリアネットワーク)又はWAN(ワイドエリアネットワーク)の通信回線を接続するための装置であり、図4が携帯電話や組込機器等のコンピュータの構成である場合には、携帯電話通信回線やWANの通信回線を接続するための装置である。
本実施形態によるシステムは、図3(a)に示されるデータ圧縮機能を搭載した図5に示される動作フローチャートに対応するプログラム、又は図3(b)に示されるデータ復元機能を搭載した図6に示される動作フローチャートに対応するプログラムを、CPU401が実行することで実現される。そのプログラムは、例えば外部記憶装置405や可搬記録媒体409に記録して配布してもよく、或いはネットワーク接続装置407によりネットワークから取得できるようにしてもよい。
上述のハードウェア構成によって実現され、図3(a)に示されるデータ圧縮機能を搭載したプログラム、及び図3(b)に示されるデータ復元機能を搭載したプログラムの各動作について、図5及び図6の動作フローチャート、及び図7〜図9の動作説明図に沿って、以下に順次説明する。
上述の実施形態の構成において、まず、図3(a)又は図5のデータ圧縮機能の実行時には、切替え判定部303が、繰返し検出部302によって求められる相対一致位置の値を判定することにより、切替え部304に、ワード繰返し符号生成部305とバイト繰返し符号生成部306を切替えてさせて、各生成部に符号化を行わせる。
図2で説明したように、元データ301が命令コードとデータが混在したものである場合、命令コードの部分は例えば4バイトで1命令ワードが表され、その1命令ワードの単位で繰返しが見つかる可能性が高い。
そこで、本実施形態では、図3の繰返し検出部302が、現在符号化を行っているデータ部分と同じデータ部分即ち繰返し部分を、過去分8キロバイトのデータ中から探索する。そして、繰返し検出部302が、命令ワード長Nの倍数の位置で繰返しを見つけたときには、ワード繰返し符号生成部305が、ワード繰返し符号を生成する。
ワード繰返し符号生成部305は、図7の701として示されるように、命令ワード長Nの倍数位置の繰返し部分を、繰返しを示す値1を有する1ビットフラグと、相対一致位置と、一致長とからなるワード繰返し/繰返し符号701−1によって表現する。
図5の動作フローチャートでは、ステップS501で命令ワード長N=4がセットされた後(切替回数条件については後述する)、ステップS502−>S503−>S504−>S505−>S507−>S502のループ処理になる。
また、ワード繰返し符号生成部305は、ワード繰返しの探索中に、一致長が2バイトよりも小さいデータ部分を見つけたときには、その部分は非繰返し部分として、非繰返しを示す値0を有する1ビットフラグと、元データ301そのもの=生データとかなるワード繰返し/非繰返し符号701−2によって表現する。
図5の動作フローチャートでは、ステップS502−>S503−>S504−>S507−>S502のループ処理になる。
一方、図3の切替え判定部303が、繰返し検出部302における繰返しの検出動作において、過去分8キロバイトのデータ中から、命令ワード長Nの倍数位置以外の位置で繰返しを見つけたことを検知したときには、元データ301が命令コード部分からデータ部分に変化したと判定し、その検知結果に基づいて切替え部304が、ワード繰返し符号生成部305の動作からバイト繰返し符号生成部306の動作に切替えを行う。この結果、バイト繰返し符号生成部306が、バイト繰返し符号を生成する。
このとき、切替え部304は、バイト繰返し符号生成部306による符号生成動作に先立って、ワード繰返し符号生成部305に、ワード繰返し/繰返し符号701−1と同じ符号フォーマットで、ワード繰返し/切替え符号701−3を出力させる。この切替え符号は、例えば、1ビットフラグ=1、相対一致位置=0、一致長=0を有する特別な符号である。
図5の動作フローチャートでは、ステップS504−>S505−>S506−>S508の流れになる。
バイト繰返し符号生成部306は、図7の702として示されるように、命令ワード長Nの倍数位置以外の位置での繰返し部分を、繰返しを示す値1を有する1ビットフラグと、相対一致位置と、一致長とからなるバイト繰返し/繰返し符号702−1によって表現する。
図5の動作フローチャートでは、ステップS508−>S509の処理の後、S510−>S511−>S512−>S513−>S515−>S519−>S510のループ処理になる。
また、バイト繰返し符号生成部306は、バイト繰返しの探索中に、一致長が2バイトよりも小さいデータ部分を見つけたときには、その部分は非繰返し部分として、非繰返しを示す値0を有する1ビットフラグと、元データ301の生データとかなるワード繰返し/非繰返し符号702−2によって表現する。
図5の動作フローチャートでは、ステップS510−>S511−>S512−>S519−>S510のループ処理になる。
更に続いて、図3の切替え判定部303が、繰返し検出部302における繰返しの検出動作において、過去分8キロバイトのデータ中から、命令ワード長Nの倍数の位置で繰返しを見つけることができた状態が、切替え条件回数T回(例えば4回)続いたことを検知したときには、元データ301がデータ部分から再び命令コード部分に変化したと判定し、その検知結果に基づいて切替え部304が、バイト繰返し符号生成部306の動作からワード繰返し符号生成部305の動作に切替えを行う。この結果、ワード繰返し符号生成部305が、再びワード繰返し符号を生成する。
なお、切替え条件回数T回を判定する理由は、データ部分であるにもかかわらず、たまたま命令ワード長Nの倍数の位置で繰返しが検出される場合がある。このため、Tの数字を適切に設定することで、この誤認識による切替え符号の増大を抑制することができる。
図5の動作フローチャートでは、ステップS501とS509とS515の初期設定処理、及びステップS510−>S511−>S512−>S513−>S514−>S516−>S519−>S510のループ処理の後、ステップS510−>S511−>S512−>S513−>S514−>S516−>S517の流れになる。
このとき、切替え部304は、ワード繰返し符号生成部305による符号生成動作に先立って、バイト繰返し符号生成部306に、バイト繰返し/繰返し符号702−1と同じ符号フォーマットで、バイト繰返し/切替え符号702−3を出力させる。この切替え符号は、ワード繰返し符号からバイト繰返し符号への切替時の切替え符号と同様に、例えば、1ビットフラグ=1、相対一致位置=0、一致長=0を有する符号である。
図5の動作フローチャートでは、ステップS517−>S518−>S502の流れになる。
上述の実施形態の動作において、図7に示されるように、ワード繰返し/繰返し符号701−1及びバイト繰返し/繰返し符号702−1ともに、一致長は、例えば8バイトまでの一致を表現するために3ビットの符号で表現する。また、相対一致位置については、バイト繰返し/繰返し符号702−1では、従来のLZ77方式と同様に、過去8キロバイト分の中の相対一致位置を表現するために13ビット(2の13乗=8192バイト、8キロバイト)の符号で表現する。これに対して、ワード繰返し/繰返し符号701−1では、相対一致位置はかならず命令ワード長N、例えば4バイトの倍数位置となるため、過去8キロバイト分の中の相対一致位置を表現するために、4バイトよりも細かいバイト位置を表現するために必要な2ビット分を削減することができ、相対一致位置は11ビットの符号で表現することができる。一般的には、ワード繰返し/繰返し符号701−1では、相対一致位置を表現するのに必要なビット数は、次式で求めることができる。

log2 (探索過去データサイズ)−log2 (命令ワード長)

従って、元データ301が命令コードとデータが混在するような性質のデータである場合には、本実施形態のデータ圧縮方式により、命令コード部分の繰返しの相対一致位置を表現するために必要なビット数を、従来よりも{log2 (命令ワード長)}ビットだけ削減することが可能となる。また同時に、命令コードの繰返しに着目することにより、繰返しのヒット率も向上する。これらが、本発明に関連する大きな特徴である。
なお、図7に示されるように、繰返しの一致長が2バイトよりも小さい場合のワード繰返し/非繰返し符号701−2及びバイト繰返し/非繰返し符号702−2については、ともに生データが元データ301と同じ8ビット(=1バイト)で表現される。
図8は、命令データエリアとデータエリアが混在する元データ301のバイト列の例に対して圧縮データ309の符号が生成される動作の説明図である。
初めて、ワード繰返し符号生成部305による動作からスタートし、元データ301として命令コードエリアが入力される。
バイト番号の1〜6バイト目までは、過去データのワード繰返し部分がないため、ワード繰返し/非繰返し符号C1〜C6(図7の701−2に対応)として、元データ301の生データが出力される。なお、図7の1ビットフラグは省略されている。
図5の動作フローチャートでは、ステップS502−>S503−>S504−>S507−>S502のループ処理になる。
次に、バイト番号7及び8バイト目の(00,1C)は、命令ワード長N=4の倍数位置である4バイト前のバイト番号3及び4バイト目と一致する。そこで、ワード繰返し/繰返し符号C7(図7の701−1に対応)として、相対一致位置=4、一致長=2からなる符号が出力される。これを<4,2>と表記する。なお、図7の1ビットフラグは省略されている。
続くバイト番号9及び10バイト目の(E5,9D)は、命令ワード長N=4の倍数位置である4バイト前のバイト番号5及び6バイト目と一致する。そこで、ワード繰返し/繰返し符号C8=<4,2>が出力される。
図5の動作フローチャートでは、ステップS502−>S503−>S504−>S505−>S507−>S502のループ処理になる。
次のバイト番号11及び12バイト目は、ワード繰返し部分が検出できないため、ワード繰返し/非繰返し符号C9及びC10として、元データ301の生データが出力される。
図5の動作フローチャートでは、ステップS502−>S503−>S504−>S507−>S502のループ処理になる。
次のバイト番号13〜16バイト目の(E5,9D,00,1C)は、命令ワード長N=4の倍数位置である8バイト前のバイト番号5〜8バイト目と一致する。そこで、ワード繰返し/繰返し符号C11として、相対一致位置=8、一致長=4からなる符号<8,4>が出力される。
図5の動作フローチャートでは、ステップS502−>S503−>S504−>S505−>S507−>S502のループ処理になる。
次に、バイト番号17及び18バイト目の(9D,00)は、3バイト手前の14及び15バイト目と一致するが、これは命令ワード長N=4の倍数位置ではない。
そこで、切替え判定部303がバイト繰返し符号への切替えを判定し、これにより切替え部304がワード繰返し符号生成部305の動作からバイト繰返し符号生成部306の動作へ切替えを行う。
このとき、切替え部304は、バイト繰返し符号生成部306による符号生成動作に先立って、ワード繰返し符号生成部305に、ワード繰返し/繰返し符号701−1と同じ符号フォーマットで、ワード繰返し/切替え符号C12(図7の701−3に対応)として、相対一致位置=0、一致長=0を有する特別な符号<0,0>を出力させる。
図5の動作フローチャートでは、ステップS504−>S505−>S506−>S508の流れになる。
これに続いてバイト繰返し符号生成部306が動作を開始する。
バイト番号17及び18バイト目の(9D,00)は、3バイト手前の14及び15バイト目と一致する。そこで、バイト繰返し/繰返し符号C13(図7の702−1に対応)として、相対一致位置=3、一致長=2からなる符号が出力される。これを[3,2]と表記する。なお、図7の1ビットフラグは省略されている。
図5の動作フローチャートでは、ステップS508の処理である。
続くバイト番号19及び20バイト目の(9D,10)は、9バイト前のバイト番号10及び11バイト目と一致する。そこで、バイト繰返し/繰返し符号C14=[9,2]が出力される。
図5の動作フローチャートでは、ステップS508−>S509の処理の後、S510−>S511−>S512−>S513−>S515−>S519−>S510のループ処理になる。
図9は、図8で説明した動作及び図7の符号フォーマットに基づいて実際に図3の符号出力部308から出力される圧縮データ309の符号の例を示す図である。
図7の符号フォーマットでは、ワード繰返し符号701及びバイト繰返し符号702ともに、先頭に1ビットフラグが付加されているが、図9の符号出力例では、先頭の16ビット=2バイトからなる符号C0に、C1〜C16の16符号分の1ビットフラグがまとめて格納される。そして、それに続いて、C1〜C16の各符号が出力される。図9には図示していないが、16個の符号が出力されると再び、その次の16符号分の1ビットフラグがまとめて格納された16ビット=2バイトからなる符号が出力され、次の16個の符号が出力される。
1ビットフラグ群を格納した2バイトの符号C0に続いて、図8に示したワード繰返し/非繰返し符号C1とC2、図9には図示しないが符号C3〜C6(図8参照)、及び符号C9とC10が、それぞれ8ビット=1バイト幅で出力される。C1〜C6、C9、C10の各8ビットには、元データ301の1〜6バイト目、及び11及び12バイト目の生データ(図8参照)が格納される。
次に、符号C7、C8、及びC11は、ワード繰返し/繰返し符号であるため、C7、C8、及びC11の各相対一致位置4、4、及び8(図8参照)を命令ワード長N=4で割って得られる値=1、1、及び2が、各11ビットのデータとして格納され、C7、C8、及びC11の各一致長=2、2、及び4(図8参照)が、3ビットのデータとして格納される。
ただし、実際には、符号C7、C8、及びC11は、相対一致位置11ビット+一致長3ビット=14ビットではなく、メモリアクセスのしやすさを考慮して、それぞれ16ビット=2バイトのデータとして処理される。このため、図9に示されるように、各符号には、2ビットずつの保留ビットが存在することになる。
これらの2ビット×3=6ビット分の保留ビットは、ワード繰返し/繰返し符号の4符号目C12の相対一致位置を構成する11ビットの一部として使用される。即ち、符号C12を構成する8ビット=1バイトのデータのうち、5ビットと上記6ビット分の保留ビットとを会わせた11ビットによってC12の相対一致位置が表現され、残りの3ビットでC12の一致長が表現される。
ここで、C12は、図8に示されるように、ワード繰返し/切替え符号<0,0>を形成している。即ち、相対一致位置=0、一致長=0である。
符号C13は、バイト繰返し/繰返し符号であるため、C13の相対一致位置3(図8参照)が、13ビットのデータとして格納され、C13の一致長=2(図8参照)が、3ビットのデータとして格納される。これにより、符号C13は、16ビット=2バイトのデータを構成する。
図9に示されるようにして図3(a)又は図5のデータ圧縮機能によって生成された圧縮データ309は、図3(b)又は図6のデータ復元機能によって復元することができる。
まず、図3(b)の符号入力部310は、図9に示される圧縮データ309を、符号C0から順に入力し、ワード繰返し復号部313及びバイト繰返し復号部314にそれぞれ与える。
始めにワード繰返し復号部313が動作し、符号入力部310から始めに入力した16ビット=2バイトからなる1ビットフラグ群符号C0において、1〜6ビット目が値0であることを認識することによって、符号C0に続いて入力する6バイト分が、それぞれワード繰返し/非繰返し符号C1〜C6の各8ビット=1バイト(図9参照)であることを認識し、それぞれ各バイトに格納されている生データを元データ301として出力する。
図6の動作フローチャートでは、ステップS601−>S602−>S603−>S606−>S601のループ処理になる。
出力された元データ301は、最新の8キロバイト(8192バイト)分がメモリに常に保持される。
続いて、ワード繰返し復号部313は、符号入力部310から始めに入力した1ビットフラグ群符号C0において、7ビット目が値1であることを認識することによって、符号C6に続いて入力する16ビット=2バイトが、ワード繰返し/繰返し符号C7(図9参照)であることを認識し、その16ビットに格納されているデータのうち、下位3ビットを一致長として抽出し、その次の下位11ビットを相対一致位置として抽出し、残りの上位2ビットは後述する4符号目のワード繰返し/繰返し符号C12の復号のために、特には図示しないレジスタ等に保持する。そして、ワード繰返し復号部313は、前述のメモリに保持されている最新の8キロバイト分のデータのうち、上記抽出した相対一致位置を命令ワード長N=4倍して得られる実際の相対一致位置のデータから、上記抽出した一致長バイト分のデータを読み出して、それらを符号C7に対応する元データ301として出力する。
図6の動作フローチャートでは、ステップS601−>S602−>S603−>S604−>S606−>S601のループ処理になる。
ワード繰返し復号部313は、符号入力部310から始めに入力した1ビットフラグ群符号C0において、8ビット目が値1であることを認識することによって、符号C7に続いて入力する16ビット=2バイトが、ワード繰返し/繰返し符号C8(図9参照)であることを認識し、符号C7の場合と同様にして元データ301を復元して出力する。
図6の動作フローチャートでは、ステップS601−>S602−>S603−>S604−>S606−>S601のループ処理になる。
ワード繰返し復号部313は、符号入力部310から始めに入力した1ビットフラグ群符号C0において、9及び10ビット目が値0であることを認識することによって、符号C8に続いて入力する2バイト分が、それぞれワード繰返し/非繰返し符号C9及びC10の各8ビット=1バイト(図9参照)であることを認識し、それぞれ各バイトに格納されている生データを元データ301として出力する。
図6の動作フローチャートでは、ステップS601−>S602−>S603−>S606−>S601のループ処理になる。
ワード繰返し復号部313は、符号入力部310から始めに入力した1ビットフラグ群符号C0において、11ビット目が値1であることを認識することによって、符号C10に続いて入力する16ビット=2バイトが、ワード繰返し/繰返し符号C11(図9参照)であることを認識し、符号C7の場合と同様にして元データ301を復元して出力する。
図6の動作フローチャートでは、ステップS601−>S602−>S603−>S604−>S606−>S601のループ処理になる。
ワード繰返し復号部313は、符号入力部310から始めに入力した1ビットフラグ群符号C0において、12ビット目が値1であることを認識することによって、符号C11に続いて入力する1バイト分が、ワード繰返し/繰返し符号C12(図9参照)であることを認識する。この場合に、2バイト分ではなく1バイト分が入力されるのは、図9に示されるように、ワード繰返し/繰返し符号は、4符号に1符号は、直前の3符号によって生じる2ビット×3=6ビットの保留ビットと会わせて、8ビット=1バイトで符号化されるためである。この場合、ワード繰返し復号部313は、その8ビットに格納されているデータのうち、下位3ビットを一致長として抽出し、残りの上位5ビットと、直前の3符号の復号時にレジスタ等に保持してあった2ビット×3=6ビットの保留ビットとを会わせた11ビットを相対一致位置として検出する。
図9の例では、ワード繰返し符号C12は、相対一致位置=0、一致長=0のワード繰返し/切替え符号である。この状態が、図3(b)の切替え符号検出部311によって検出され、切替え部312に通知される。
この結果、切替え部312が、ワード繰返し復号部313からバイト繰返し復号部314に、復号動作を切り替える。
図6の動作フローチャートでは、ステップS601−>S602−>S603−>S604−>S605−>S607の処理になる。
バイト繰返し復号部314は、符号入力部310から始めに入力した1ビットフラグ群符号C0において、ワード繰返し復号部313から引き継がれた13ビット目が値1であることを認識することによって、符号C12に続いて入力する16ビット=2バイトが、バイト繰返し/繰返し符号C13(図9参照)であることを認識し、その16ビットに格納されているデータのうち、下位3ビットを一致長として抽出し、残りの上位13ビットを相対一致位置として抽出する。そして、バイト繰返し復号部314は、前述のメモリに保持されている最新の8キロバイト分のデータのうち、上記抽出した相対一致位置のデータから、上記抽出した一致長バイト分のデータを読み出して、それらを符号C13に対応する元データ301として出力する。
図6の動作フローチャートでは、ステップS607の処理の後、S608−>S609−>S610−>S611−>S614−>S608のループ処理になる。
図9には特には図示されていないが、バイト繰返し復号部314は、符号入力部310から入力した1ビットフラグ群符号において、値0であることを認識した1ビットフラグについては、それに対応して入力する8ビット=1バイトのデータがバイト繰返し/非繰返し符号であることを認識し、その1バイトに格納されている生データを元データ301として出力する。
図6の動作フローチャートでは、S608−>S609−>S610−>S614−>S608のループ処理になる。
また、バイト繰返し復号部314は、復号したバイト繰返し/繰返し符号から抽出された相対一致位置と一致長がそれぞれ値0である場合には、図3(b)の切替え符号検出部311によって、その符号がバイト繰返し/切替え符号(図7の702−3に対応)であると検出され、切替え部312に通知される。
この結果、切替え部312が、バイト繰返し復号部314からワード繰返し復号部313に、復号動作を切り替える。
図6の動作フローチャートでは、S608−>S609−>S610−>S611−>S612−>S613−>S601の処理になる。
ワード繰返し復号部313及びバイト繰返し復号部314は、16個分の符号を処理したら、次に符号入力部310から入力した16ビット=2バイトのデータを、図9の符号C0と同様の1ビットフラグ群符号として処理し、その次に入力する16個分の符号の処理のために前述の符号C0の場合と同様の処理を行う。
従って、元データ301が命令コードとデータが混在するような性質のデータである場合には、本実施形態のデータ圧縮方式により、命令コード部分の繰返しの相対一致位置を表現するために必要なビット数を、従来よりも{log2 (命令ワード長)}ビットだけ削減することが可能となる。これらが、本発明に関連する大きな特徴である。
以上説明した実施形態では、符号化にあたって、相対一致位置や一致長及び生データ等をそのままビット表現しているが、これらをハフマン符号や算術符号で符号化してもよい。
以上の実施形態により、元データが命令コードとデータが混在するような性質のデータである場合に、本実施形態のデータ圧縮方式により命令ワード長の倍数位置で符号化を行うことにより、命令コード部分の繰返しの相対一致位置を表現するために必要なビット数を、従来よりも{log2 (命令ワード長)}ビットだけ削減することが可能となる。
また、切替え符号を利用することで、復元時の処理負荷をあげることなく、圧縮率改善を得ることが可能となる。

Claims (8)

  1. 命令コードを含む被圧縮データの文字列の繰り返しであって最大長一致する部分列を検出し、前記部分列の位置と一致長とを組み合わせて符号化することにより圧縮データを生成するデータ圧縮方法であって、
    前記被圧縮データから繰返し部分を順次検出し、該繰返し部分の相対一致位置が前記命令コードを表すバイト数である命令ワード長の倍数に相当する位置である第一の繰返しの状態か、そうではない第二の繰返しの状態かを判定する繰返し状態判定ステップと、
    前記繰返し部分が前記第一の繰返し状態である場合には、該繰返し部分に対応する前記相対一致位置を前記命令ワード長で割って得られる圧縮相対一致位置を示す値と、該繰返し部分の前記相対一致位置における一致長を示す値とを少なくとも含む第一の繰返し符号を生成し、それを前記圧縮データとして出力する第一の繰返し符号生成ステップと、
    前記繰返し部分が前記第二の繰返し状態である場合には、該繰返し部分に対応する前記相対一致位置を示す値と、該繰返し部分の前記相対一致位置における一致長を示す値とを少なくとも含む第二の繰返し符号を生成し、それを前記圧縮データとして出力する第二の繰返し符号生成ステップと、
    前記第一及び第二の繰返し符号を切り替えるための切替え符号を生成し、それを前記圧縮データとして出力する切替え符号生成ステップと、
    を含むことを特徴とするデータ圧縮方法。
  2. 前記第二の繰返し状態の後前記第一の繰返し状態が所定回数連続して続いた場合に、前記第一の繰返し符号への切替えを行うステップと、
    前記第一の繰返し状態の後前記第二の繰返し状態に1回でもなった場合に、前記第二の繰返し符号への切替えを行うステップと、
    を更に含むことを特徴とする請求項1に記載のデータ圧縮方法。
  3. 前記第一の繰返し符号生成ステップ又は前記第二の繰返し符号生成ステップにおいて、前記一致長が所定バイト数よりも小さい場合には、前記第一の繰返し符号又は前記第二の繰返し符号として前記被圧縮データのバイトデータをそのまま示す値を出力し、前記第一の繰返し符号又は前記第二の繰返し符号は前記被圧縮データのバイトデータをそのまま示す値が出力されているか否かを示すためのフラグを含む、
    ことを特徴とする請求項1又は2の何れか1項に記載のデータ圧縮方法。
  4. 命令コードを含む被圧縮データの文字列の繰り返しであって最大長一致する部分列を検出し、前記部分列の位置と一致長とを組み合わせて符号化することにより生成された圧縮データから前記被圧縮データを復元するデータ復元方法であって、
    相対一致位置を前記命令コードを表すバイト数である命令ワード長で割って得られる圧縮相対一致位置を示す値と、前記相対一致位置における一致長を示す値とを少なくとも含み前記圧縮データを構成する第一の繰返し符号から、前記圧縮相対一致位置と前記一致長を抽出し、該圧縮相対一致位置に前記命令ワード長を乗算して前記相対一致位置を算出し、既に復元されている前記被圧縮データから前記算出した相対一致位置と前記抽出した一致長とに対応する第一の繰返し部分を復元し、前記被圧縮データとして出力する第一の繰返し部分復元ステップと、
    前記相対一致位置を示す値と、前記相対一致位置における一致長を示す値とを少なくとも含み前記圧縮データを構成する第二の繰返し符号から、前記相対一致位置と前記一致長を抽出し、既に復元されている前記被圧縮データから前記抽出した相対一致位置と前記抽出した一致長とに対応する第二の繰返し部分を復元し、前記被圧縮データとして出力する第二の繰返し部分復元ステップと、
    前記第一及び第二の繰返し符号を切り替えるための切替え符号を前記圧縮データから抽出し、その抽出タイミングに基づいて前記第一の繰返し部分復元ステップと前記第二の繰返し部分復元ステップとを切り替えて実行させる切替えステップと、
    を含むことを特徴とするデータ復元方法。
  5. 前記第一の繰返し部分復元ステップ又は前記第二の繰返し部分復元ステップにおいて、前記第一の繰返し符号又は前記第二の繰返し符号に含まれるフラグが前記被圧縮データのバイトデータをそのまま示す値が出力されていることを示している場合に、前記第一の繰返し符号又は前記第二の繰返し符号に含まれるデータから前記被圧縮データのバイトデータをそのまま抽出し、前記被圧縮データとして出力する、
    ことを特徴とする請求項4に記載のデータ復元方法。
  6. 命令コードを含む被圧縮データの文字列の繰り返しであって最大長一致する部分列を検出し、前記部分列の位置と一致長とを組み合わせて符号化することにより圧縮データを生成するコンピュータに、
    前記被圧縮データから繰返し部分を順次検出し、該繰返し部分の相対一致位置が前記命令コードを表すバイト数である命令ワード長の倍数に相当する位置である第一の繰返しの状態か、そうではない第二の繰返しの状態かを判定する繰返し状態判定機能と、
    前記繰返し部分が前記第一の繰返し状態である場合には、該繰返し部分に対応する前記相対一致位置を前記命令ワード長で割って得られる圧縮相対一致位置を示す値と、該繰返し部分の前記相対一致位置における一致長を示す値とを少なくとも含む第一の繰返し符号を生成し、それを前記圧縮データとして出力する第一の繰返し符号生成機能と、
    前記繰返し部分が前記第二の繰返し状態である場合には、該繰返し部分に対応する前記相対一致位置を示す値と、該繰返し部分の前記相対一致位置における一致長を示す値とを少なくとも含む第二の繰返し符号を生成し、それを前記圧縮データとして出力する第二の繰返し符号生成機能と、
    前記第一及び第二の繰返し符号を切り替えるための切替え符号を生成し、それを前記圧縮データとして出力する切替え符号生成機能と、
    を実行させるためのプログラム。
  7. 前記第二の繰返し状態の後前記第一の繰返し状態が所定回数連続して続いた場合に、前記第一の繰返し符号への切替えを行う機能と、
    前記第一の繰返し状態の後前記第二の繰返し状態に1回でもなった場合に、前記第二の繰返し符号への切替えを行う機能と、
    を更に実行させるための請求項6に記載のプログラム。
  8. 命令コードを含む被圧縮データの文字列の繰り返しであって最大長一致する部分列を検出し、前記部分列の位置と一致長とを組み合わせて符号化することにより生成された圧縮データから前記被圧縮データを復元するコンピュータに、
    相対一致位置を前記命令コードを表すバイト数である命令ワード長で割って得られる圧縮相対一致位置を示す値と、前記相対一致位置における一致長を示す値とを少なくとも含み前記圧縮データを構成する第一の繰返し符号から、前記圧縮相対一致位置と前記一致長を抽出し、該圧縮相対一致位置に前記命令ワード長を乗算して前記相対一致位置を算出し、既に復元されている前記被圧縮データから前記算出した相対一致位置と前記抽出した一致長とに対応する第一の繰返し部分を復元し、前記被圧縮データとして出力する第一の繰返し部分復元機能と、
    前記相対一致位置を示す値と、前記相対一致位置における一致長を示す値とを少なくとも含み前記圧縮データを構成する第二の繰返し符号から、前記相対一致位置と前記一致長を抽出し、既に復元されている前記被圧縮データから前記抽出した相対一致位置と前記抽出した一致長とに対応する第二の繰返し部分を復元し、前記被圧縮データとして出力する第二の繰返し部分復元機能と、
    前記第一及び第二の繰返し符号を切り替えるための切替え符号を前記圧縮データから抽出し、その抽出タイミングに基づいて前記第一の繰返し部分復元ステップと前記第二の繰返し部分復元ステップとを切り替えて実行させる切替え機能と、
    を実行させるためのプログラム。
JP2009551319A 2008-01-31 2008-01-31 データ圧縮・復元方法及び圧縮・復元プログラム Expired - Fee Related JP4814999B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/000121 WO2009095956A1 (ja) 2008-01-31 2008-01-31 データ圧縮・復元方法及び圧縮・復元プログラム

Publications (2)

Publication Number Publication Date
JPWO2009095956A1 JPWO2009095956A1 (ja) 2011-05-26
JP4814999B2 true JP4814999B2 (ja) 2011-11-16

Family

ID=40912328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009551319A Expired - Fee Related JP4814999B2 (ja) 2008-01-31 2008-01-31 データ圧縮・復元方法及び圧縮・復元プログラム

Country Status (4)

Country Link
US (1) US8164490B2 (ja)
JP (1) JP4814999B2 (ja)
GB (1) GB2469955B (ja)
WO (1) WO2009095956A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5895545B2 (ja) * 2012-01-17 2016-03-30 富士通株式会社 プログラム、圧縮ファイル生成方法、圧縮符号伸張方法、情報処理装置、および記録媒体
US9467294B2 (en) 2013-02-01 2016-10-11 Symbolic Io Corporation Methods and systems for storing and retrieving data
US9628108B2 (en) 2013-02-01 2017-04-18 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
US10133636B2 (en) 2013-03-12 2018-11-20 Formulus Black Corporation Data storage and retrieval mediation system and methods for using same
US9817728B2 (en) 2013-02-01 2017-11-14 Symbolic Io Corporation Fast system state cloning
US9304703B1 (en) 2015-04-15 2016-04-05 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
KR20160070512A (ko) 2014-12-10 2016-06-20 삼성전자주식회사 반도체 장치 및 그 동작 방법
US10061514B2 (en) 2015-04-15 2018-08-28 Formulus Black Corporation Method and apparatus for dense hyper IO digital retention
WO2019126072A1 (en) 2017-12-18 2019-06-27 Formulus Black Corporation Random access memory (ram)-based computer systems, devices, and methods
US20190377804A1 (en) * 2018-06-06 2019-12-12 Yingquan Wu Data compression algorithm
US10725853B2 (en) 2019-01-02 2020-07-28 Formulus Black Corporation Systems and methods for memory failure prevention, management, and mitigation
CN110995753A (zh) * 2019-12-19 2020-04-10 中国电力科学研究院有限公司 用电信息采集系统中远程通信报文的组合压缩方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000188692A (ja) * 1998-12-22 2000-07-04 Toshiba Corp データ処理方法
JP2002043950A (ja) * 2000-07-21 2002-02-08 Canon Inc 符号化方法および装置並びに復号化方法および装置
JP2004328097A (ja) * 2003-04-22 2004-11-18 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP2006295853A (ja) * 2005-04-14 2006-10-26 Sony Corp 符号化装置、復号装置、および、符号化方法ならびに復号方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953723A (en) * 1993-04-02 1999-09-14 T.M. Patents, L.P. System and method for compressing inverted index files in document search/retrieval system
US5572206A (en) 1994-07-06 1996-11-05 Microsoft Corporation Data compression method and system
JPH08139610A (ja) * 1994-11-09 1996-05-31 Copcom Co Ltd プログラム圧縮装置およびプログラム圧縮方法
US5959560A (en) * 1997-02-07 1999-09-28 Said; Amir Data compression via alphabet partitioning and group partitioning
US6885319B2 (en) * 1999-01-29 2005-04-26 Quickshift, Inc. System and method for generating optimally compressed data from a plurality of data compression/decompression engines implementing different data compression algorithms
US6819271B2 (en) * 1999-01-29 2004-11-16 Quickshift, Inc. Parallel compression and decompression system and method having multiple parallel compression and decompression engines
US7417568B2 (en) * 2000-10-03 2008-08-26 Realtime Data Llc System and method for data feed acceleration and encryption
US6577254B2 (en) * 2001-11-14 2003-06-10 Hewlett-Packard Development Company, L.P. Data compression/decompression system
JP4630080B2 (ja) * 2005-01-31 2011-02-09 富士通株式会社 データ復元方法およびデータ復元プログラム
US7215259B2 (en) * 2005-06-03 2007-05-08 Quantum Corporation Data compression with selective encoding of short matches
KR100750165B1 (ko) * 2006-02-22 2007-08-17 삼성전자주식회사 압축률 향상을 위해 개선된 컨텍스트 모델 선택을 사용하는cabac 부호화 방법 및 장치, 그리고 cabac복호화 방법 및 장치
US7733249B2 (en) * 2007-01-18 2010-06-08 Qin Zhang Method and system of compressing and decompressing data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000188692A (ja) * 1998-12-22 2000-07-04 Toshiba Corp データ処理方法
JP2002043950A (ja) * 2000-07-21 2002-02-08 Canon Inc 符号化方法および装置並びに復号化方法および装置
JP2004328097A (ja) * 2003-04-22 2004-11-18 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP2006295853A (ja) * 2005-04-14 2006-10-26 Sony Corp 符号化装置、復号装置、および、符号化方法ならびに復号方法

Also Published As

Publication number Publication date
WO2009095956A1 (ja) 2009-08-06
US20100289676A1 (en) 2010-11-18
GB2469955A (en) 2010-11-03
GB201012425D0 (en) 2010-09-08
US8164490B2 (en) 2012-04-24
JPWO2009095956A1 (ja) 2011-05-26
GB2469955B (en) 2012-09-12

Similar Documents

Publication Publication Date Title
JP4814999B2 (ja) データ圧縮・復元方法及び圧縮・復元プログラム
US6879271B2 (en) Method and apparatus for adaptive data compression
JP3009727B2 (ja) 改良形データ圧縮装置
WO2019153700A1 (zh) 编解码方法、装置及编解码设备
JP3634711B2 (ja) 入力データストリームの圧縮方法とその装置
US20030012400A1 (en) PPM-based data compression
JP2000269822A (ja) データ圧縮装置、及びデータ復元装置
JP2003524983A (ja) 複数コーダを用いる最適化ロスレス圧縮のための方法及び装置
JP2536422B2 (ja) デ―タ圧縮装置及びデ―タ復元装置
JP4093193B2 (ja) データ圧縮方法及びプログラムならびにデータ復元方法及び装置
Anto et al. A Compression System for Unicode Files Using an Enhanced Lzw Method.
JP4093200B2 (ja) データ圧縮方法及びプログラムならびにデータ復元方法及び装置
JP4953145B2 (ja) 文字列データ圧縮装置及びその方法並びに文字列データ復元装置及びその方法
JP4497029B2 (ja) データ符号化装置,およびデータ符号化方法
US11967975B1 (en) Method and apparatus for recursive data compression using seed bits
JP3265268B2 (ja) 文字列圧縮方式
JPH06274311A (ja) データ圧縮装置及びデータ復元装置
JP2007293461A (ja) データ圧縮プログラム
JP4345438B2 (ja) 辞書データ圧縮装置、電子辞書装置及びプログラム
JP2003318739A (ja) データシーケンスを圧縮するシステム、方法、およびコンピュータ読み取り可能媒体
JP4329493B2 (ja) 辞書データ圧縮装置、電子辞書装置及びプログラム
JPH06291677A (ja) データ圧縮装置及びデータ復元装置
JPH05244015A (ja) データの圧縮方式
JPH0621827A (ja) データ圧縮装置及びその方法
JP2002344326A (ja) 合成インデックスによるデータ圧縮方法及び圧縮データの完全復元方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110826

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees