JPH08223054A - データ符号化/復号化方法及び装置 - Google Patents

データ符号化/復号化方法及び装置

Info

Publication number
JPH08223054A
JPH08223054A JP7023019A JP2301995A JPH08223054A JP H08223054 A JPH08223054 A JP H08223054A JP 7023019 A JP7023019 A JP 7023019A JP 2301995 A JP2301995 A JP 2301995A JP H08223054 A JPH08223054 A JP H08223054A
Authority
JP
Japan
Prior art keywords
data
appearance frequency
context
frequency
updating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7023019A
Other languages
English (en)
Other versions
JP3302210B2 (ja
Inventor
Kimitaka Murashita
君孝 村下
Yoshiyuki Okada
佳之 岡田
Shigeru Yoshida
茂 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP02301995A priority Critical patent/JP3302210B2/ja
Priority to US08/525,076 priority patent/US5650783A/en
Publication of JPH08223054A publication Critical patent/JPH08223054A/ja
Application granted granted Critical
Publication of JP3302210B2 publication Critical patent/JP3302210B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 入力データを過去に出現したデータの履歴に
応じて可変長符号化することによりデータの圧縮を行な
うデータ圧縮方法、装置及び符号データを過去に復号化
したデータの履歴に応じて復号するデータ復号方法及び
装置に関し、データを高速に符号化・復号化できるデー
タ符号化・復号化方法及び装置を提供することを目的と
する。 【構成】 符号化・復号化の度に累積頻度保持部に保持
された符号化・復号化されたシンボルに対応する累積頻
度を比較部11-9により閾値保持部11-8に保持された
閾値と比較し、累積頻度が閾値以上のときには頻度、累
積頻度、頻度順位を更新するソート部11-5,頻度更新
部11-6,累積頻度更新部11-7の動作を制御するアッ
プデートコントロール部11-10 の動作を停止させ、頻
度、累積頻度、頻度順位の更新を停止する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータ符号化・復号化方
法及び装置に係り、特に、入力データを過去に出現した
データの頻度に応じて可変長符号化することによりデー
タの圧縮を行なうデータ圧縮方法、装置及び符号データ
を過去に復号化したデータの履歴に応じて復号するデー
タ復号化方法及び装置に関する。
【0002】近年、文字コード、ベクトル情報、画像な
ど様々な種類のデータがコンピュータで扱われるように
なっており、扱われるデータ量も急速に増加してきてい
る。大量のデータを扱うときは、データの中の冗長な部
分を省いてデータ量を圧縮することで、記憶容量をへら
したり、速く伝送したりできるようになる。様々なデー
タを1つの方式でデータ圧縮できる方法としてユニバー
サル符号化が提案されている。ここで、本発明の分野は
文字コードの圧縮に限らず、様々なデータに適用できる
が、以下では情報理論で用いられている呼称を踏襲し、
データの1WORD単位を文字といいデータが任意ワー
ドつながったものを文字列と呼ぶようにする。
【0003】テキストデータやファイル等を圧縮する方
式には、データ系列の類似性を利用した辞書型符号化方
式と、データ列の出現頻度を利用した確率統計型符号化
方式がある。確率統計型符号化の代表的な手法として算
術符号化がある。情報源の文字の出現頻度が分かってい
る場合に最大の効率で圧縮できるといわれている方法で
ある。この方法は、従来良く用いられているハフマン符
号のように、1文字づつばらばらに符号化せずに、文字
列全体をつなぎ目無しの符号語として符号化する事で、
圧縮効果を高めている。算術符号化の名前は、符号語が
〔0.11011…〕のように、2進数の小数点以下の
数値で表現され、それが計算で求められることから来て
いる。
【0004】これらの符号化、復号化には多くのステッ
プが必要となるため、処理に時間を有し、処理を高速化
しにくい。このため、ステップを簡略化し、処理を高速
化することが要求されている。
【0005】
【従来の技術】算術符号化としては一般に2値算術符号
化と3値以上の多値算術符号化とがある。なお、2値算
術符号化及び多値算術符号化の詳細については例えば、
文献“Arithmetic Coding for
Data Compression”JAN H.WI
TTEN他著Commun.of ACM Vol.3
0 No.6 p.520−540,及び;“Ah A
daptive Dependency Source
Model for Data Compressi
on Scheme”D.M.ABRAHAMSON著
Commun.of ACM,Vol.32 No.
1 p.77−83を参照のこと。
【0006】多値算術符号化では図13に示すように例
えば、文字の事象(以下、シンボルと称す)を符号化し
ようとする場合、0≦P<1(以下〔0,1)と記述)
の数直線をシンボルの数で分割する。このとき、数直線
上でのシンボルの幅(区間)はシンボルの出現(符号
化)頻度に比例して設定される。
【0007】最初に出現したシンボルの区間を選択し、
次に選択したシンボルの区間を〔0,1)と同様に全シ
ンボルの数で分割する。このとき、各シンボルの幅(区
間)は最初のシンボルに続く、次のシンボルの出現(符
号化)頻度に比例して設定される。
【0008】さらに、分割した区間について最初のシン
ボルに続き、出現したシンボルの区間を選択する例えば
図13(A)に示されるように区間が分割されていると
“abe”なる文字列は図13(B)に示すように区間
分割され区間が設定される。以後、全入力データについ
て処理を繰り返すことで符号化する文字列の区間を決定
することができる。圧縮符号としては、最終的に定まっ
た文字列の区間内の任意の点を2進表示で出力する。
【0009】出現頻度に応じた区間の分割方法として
は、文字列の実際の出現頻度によらず、予め設定した出
現頻度に従って分割する静的符号化方式(stati
c),最初に全文字列を走査して得た出現頻度で分割す
る準適応型符号化方式(semi−adaptiv
e),文字が出現する毎に頻度を再計算し、1文字毎に
区間を再設定する適応型符号化方式(adaptiv
e)がある。本発明は、データ形式に依存せず、1パス
で符号化が行なえる適応型圧縮方式(adaptiv
e)にかかるものである。
【0010】staticあるいはsemi−adap
tive符号化の場合、入力に現われる全てのシンボル
は文脈の木に登録されており、このシンボルによって予
め区間は分割されている。しかし、adaptive符
号化の場合、入力に現われるシンボルを符号化しながら
追加登録していく。また、adaptive符号化の場
合、文脈木上に予め“未登録”を意味するコード(以
下、エスケープコードまたはESCと称する)を登録す
る。出現した文字が文脈木上に登録されていないとき
は、ESCと生データとを出力する。同時に、文脈木内
にシンボルを新規に登録すると同時に、出現頻度を再計
算し、区間を求めた出現頻度にしたがって再分割する。
復元側では、符号から区間内の1点を求め、その点のシ
ンボルを求めることで符号を復号する。
【0011】さらに圧縮率を高めるためには入力文字と
直前の文字との依存関係を取り入れた条件付き出現確率
を動的可変長符号化するいわゆる確率統計型符号化によ
り行なわれる。図11に確率統計型符号化のブロック図
を示す。入力データは文脈収集部16に供給される。文
脈収集部では入力データから文字列の前後関係の文脈を
収集すると共にすでに収集した文脈より条件付き確率を
求める。文脈収集部16で求められた条件付き確率は動
的可変長符号化部17に供給される。動的可変長符号化
部17は文脈収集部16から供給される入力データに応
じた条件付き確率の区間を出力データとして出力する。
【0012】図12に文脈収集部16によって収集され
た入力データの文脈の構成図を示す。文脈収集部16で
は入力データから文字列の前後関係の文脈を対象となる
入力データ(シンボル)、直前のシンボル、2文字前の
シンボルというように枝分かれした文脈木という木構造
で保持し、各シンボルがアクセスされるごとに出現回数
を計数しておき、計数された出現回数に基づいて条件付
き確率を求める。
【0013】なお、条件付き確率を求める文脈収集の方
法には(1)固定次数の文脈、(2)ブレンディング
(Blending)文脈の2つの方法がある。なお、
ここで、次数とは文脈(条件)の文字数をいう。 (1)固定次数の文脈は条件付き確率の条件を固定の文
字数にする方法である。例えば2次の文脈では直前2文
字につながる文字の文脈を収集し、条件付き確率p(y
|x1 ,x2 )を符号化する。ここで、yは注目符号化
文字、x1 ,x 2 はそれぞれ直前の第1文字、第2文字
である。
【0014】(2)ブレンディング文脈は注目文字の直
前の次数を固定せずに出やすい場合には次数を上げ、出
にくい場合には低い次数のままとし、文脈の次数を入力
データに適応させて伸ばす方法である。上記固定次数の
場合、直前の条件文字列が出にくい場合は条件付き確率
の推定は不確かになり、逆に直前の条件付き文字列が出
やすい場合は条件付き確率の推定は正確であり、さらに
次数を上げ得る可能性を残す。一般に、高次の文脈を使
うほど文字間の相関が大きいデータは高圧縮率が得られ
るが、逆に高次文脈を使うほど文字間が小さくなるデー
タではかえって圧縮率が悪くなる。ブレンディング文脈
では文脈の次数を入力データに適応させて伸ばすため、
固定次数の文脈による符号化に比べて高圧縮率が得られ
る。
【0015】多値算術符号化では出現頻度に応じた区間
分割を行なうために、図14(A)に示すようにシンボ
ル毎に各変数を辞書として持つ必要がある。辞書では各
シンボルは出現頻度の高いものから順に並べられてお
り、あるシンボルが現われたとき、シンボルを符号化
後、そのシンボルの新しい出現頻度に従って並び換える
必要がある。例えば図14(A)においてシンボルAを
符号化したとき、シンボルAの出現頻度が増加した場
合、辞書で図14(B)に示すようにシンボルAと同一
頻度の最上位に位置するシンボルNをシンボルAと入れ
替えることにより新しい出現頻度に従った頻度順に並び
換えられる。
【0016】ところが、辞書の区間分割を行なうための
変数には最下位順位からの累積頻度があり、この累積頻
度の更新はシンボルAが符号化された場合、図14
(C)に示すように入れ替え後のシンボルAの上位に位
置する全てのシンボルの累積頻度をインクリメント(+
1)することにより行なわれる。
【0017】図15に従来の一例のブロック図を示す。
図16に従来の一例の更新処理のフローチャートを示
す。符号化装置16は過去に供給された入力データ(シ
ンボル)に応じて形成された文字列(文脈)の木が保持
された文脈木保持部16−1、入力データ(シンボル)
が供給され、供給された入力データ(シンボル)を文脈
木保持部16−1に保持された文脈木に基づいて符号化
を行なう符号化部16−2、文脈木を構成するシンボル
の累積頻度が保持された累積頻度保持部16−3、各シ
ンボル毎の出現頻度が保持された頻度保持部16−4、
文脈木保持部16−1に保持された文脈木、及び、頻度
保持部16−4に保持された各シンボルの頻度を読み出
し、頻度の順に文脈木を形成し直すソート部16−5、
頻度保持部16−4の頻度を更新する頻度更新部16−
6、累積頻度保持部16−3の累積頻度を更新する累積
頻度更新部16−7、ソート部16−5、頻度更新部1
6−6、累積頻度更新部16−7を制御し、符号化部1
6−2にシンボルが供給される毎に頻度、累積頻度、文
脈木書換等の動作制御を行なうアップデートコントロー
ル部16−8より構成される。
【0018】シンボルKが符号化されると(ステップS
-1),アップデートコントロール部16−8はソート
部16−5を制御して検索したシンボルNと符号化され
たシンボルKとを入れ替え、頻度更新部16−6を制御
してシンボルKの頻度に+1を加算する(ステップS5
-4,S5-5)。
【0019】次にアップデートコントロール部16−8
は累積頻度更新部16−7を制御して入れ替えた順序
で、シンボルKの1つ上位に位置するシンボルにポイン
タを移動させ、ポインタにより指示されたシンボルの累
積頻度に+1を加算する(ステップS5-6,S5-7)。
【0020】次にアップデートコントロール部16−8
はポインタの指示するシンボルが最上位のシンボルか、
否かを判断し(ステップS1-8)、ステップS5-6,S
-7を繰り返すことにより符号化されたシンボルKから
上位の全シンボルの累積頻度に+1を加算する。
【0021】以上のように従来はシンボルの符号化の度
に、ステップS5-3,S5-8によりシンボルの頻度及び
累積頻度の更新が実施されていた。
【0022】
【発明が解決しようとする課題】しかるに、従来のデー
タ圧縮・復元方法では入力データ(シンボル)が入力さ
れる毎に出現頻度及び累積頻度を更新し、シンボルを出
現頻度の高い順に並び換える処理(アップデート処理)
を行っていたため、更新すべきシンボル数が多いシンボ
ルなどでは処理に時間がかかり、処理速度の低下の原因
となっていた。
【0023】本発明は上記の点に鑑みてなされたもの
で、処理を高速化できるデータ符号化・復号化方法及び
装置を提供することを目的とする。
【0024】
【課題を解決するための手段】図1に本発明の原理図を
示す。図1(A)はデータ符号化装置のブロック図を示
す。符号化手段1は入力データを文脈保持・更新手段2
に保持された文脈に基づいて符号化する。
【0025】文脈保持・更新手段2は入力データを符号
化するのに必要な文脈を保持していると共にデータ入力
の毎に文脈の更新を行なう。更新制御手段3は入力デー
タの出現頻度に応じて文脈保持・更新手段2の文脈の更
新の実行を制御する。
【0026】図1(B)はデータ復号化装置のブロック
図を示す。復号化手段4は符号データが供給され、供給
された符号データを文脈保持・更新手段5に保持された
文脈に応じて復号化する。文脈保持・更新手段5は復号
されたデータの出現頻度及び出現順位が保持され、符号
データの復号の毎に出現頻度及び出現頻度順位を更新す
る。
【0027】更新制御手段6は復号されたデータの出現
頻度に応じて文脈保持・更新手段5の更新動作を停止さ
せる。
【0028】
【作用】本発明の請求項1によれば、入力データ符号化
時に入力データの出現頻度に応じて文脈更新の有無を制
御することにより、文脈の傾向がわかったところで、文
脈更新を停止させることができ不必要な文脈更新が行な
われないため、処理を高速化できる。
【0029】本発明の請求項2によれば、所定次数以下
の文脈について文脈更新を停止させることにより、更新
回数の多い低次の文脈についてのみ、文脈の頻度更新を
停止させることができるため、符号化するデータの圧縮
効率の低下を最小限に抑えられる。
【0030】請求項3によれば、入力データ符号化時に
入力データの出現頻度に応じて文脈更新の有無を制御す
ることにより、文脈の傾向がわかったところで、文脈更
新を停止させることができ不必要な文脈更新が行なわれ
ないため、符号化処理を高速化できる。
【0031】請求項4によれば、入力データの出現頻度
を閾値保持手段に保持された所定の閾値と比較手段によ
り比較し、比較手段の比較結果に応じて出現頻度及び出
現順位の更新を停止する更新停止手段を制御して出現頻
度及び出現頻度順位の更新を停止させることにより、必
要以上の出現頻度及び出現頻度順位の更新処理を行なわ
ずに済むため、符号化処理の高速化が可能となる。
【0032】請求項5によれば、所定次数以下の文脈に
ついて文脈更新を停止させることにより、更新回数の多
い低次の文脈についてのみ、文脈の頻度更新を停止させ
ることができるため、復号化されるデータの圧縮効率の
低下を最小限に抑えられる。請求項6によれば、符号の
復号化時にシンボルの出現頻度に応じて文脈更新の有無
を制御することにより出力シンボルの文脈の傾向がわか
ったところで文脈更新を停止させることができ、不要な
更新を行なう必要がなくなるため、処理を高速化でき
る。
【0033】請求項7によれば、所定次数以下の文脈に
ついて文脈更新を停止させることにより更新回数の多い
低次の文脈についてのみ、更新を停止させることができ
るため、圧縮効率の低下を最小限に抑えられる。請求項
8によれば、符号の復号化時にシンボルの出現頻度に応
じて文脈更新の有無を制御することにより出力シンボル
の文脈の傾向がわかったところで文脈更新を停止させる
ことができ、不要な更新を行なう必要がなくなるため、
比較的簡単な構成で処理を高速化できる。
【0034】請求項9によれば、入力データの出現頻度
を閾値保持手段に保持された所定の閾値と比較手段によ
り比較し、比較手段の比較結果に応じて出現頻度及び出
現頻度順位の更新を停止する更新停止手段を制御して出
現頻度及び出現頻度順位の更新を停止させることによ
り、必要以上の出現頻度及び出現頻度順位の更新処理を
行なわずに済むため、復号化処理の高速化が可能とな
る。
【0035】請求項10によれば、所定次数以下の文脈
について文脈更新を停止させることにより、更新回数の
多い低次の文脈についてのみ、文脈の頻度更新を停止さ
せることができるため、復号化されるデータの圧縮効率
の低下を最小限に抑えられる。
【0036】
【実施例】図2に本発明の第1実施例のブロック図を示
す。符号化装置11の入力端子T IN1 には符号化しよう
とする入力データ(シンボル)が供給される。符号化装
置11は入力された入力データを例えば、多算術符号化
方式により符号化し、符号データとして出力する。
【0037】符号化装置11で符号化された符号データ
は記録再生装置、通信装置等の中間媒体12を介して復
号化装置13の入力端子TIN2 に供給される。復号化装
置13は中間媒体12を介して供給された符号データを
符号化装置11とは逆の処理により復元し、復号データ
として出力する。
【0038】図3に本発明のデータ符号化装置の一実施
例のブロック構成図を示す。符号化装置11は過去に供
給された入力データ(シンボル)に応じて形成された文
字列(文脈)の木が保持された文脈木保持部11-1,入
力データ(シンボル)が供給され、供給された入力デー
タ(シンボル)を文脈木保持部11-1に保持された文脈
木に基づいて符号化を行う符号化部11-2,文脈木を構
成するシンボルの累積頻度が保持された累積頻度保持部
11-3,各シンボル毎の出現頻度が保持された頻度保持
部11-4,文脈木保持部11-1に保持された文脈木、及
び、頻度保持部11-4に保持された各シンボルの出現頻
度を読み出し、頻度の順に文脈木を形成し直すソート部
11-5,頻度保持部11-4の出現頻度を更新する頻度更
新部11 -6,累積頻度保持部11-3の累積頻度を更新す
る累積頻度更新部11-7,頻度、累積頻度の更新、及
び、文脈木の書き換えを停止する累積頻度の閾値を保持
する閾値保持部11-8,累積頻度保持部11-3に更新さ
れつつ保持されている累積頻度と閾値保持部11-8に保
持された閾値とを比較し、累積頻度が閾値未満のときは
ローレベルで、閾値以上となったときハイレベルとなる
比較出力信号を出力する比較部11-9,ソート部1
-5,頻度更新部11-6,累積頻度更新部11-7を制御
し、符号化部11-2にシンボルが供給される毎に出現頻
度、累積頻度、文脈木書換等の動作制御を行なうと共に
比較部11-9からの比較出力信号レベル(ハイ/ロー)
に応じて制御の動作/停止が制御されるアップデートコ
ントロール部11-10 より構成される。
【0039】符号化部11-2では直前までに符号化した
文字列(文脈)と入力データとの組み合わせ(シンボ
ル)を文脈木保持部11-1に出力する。文脈木保持部1
-1では、該シンボルが登録されているとき、該シンボ
ルの出現頻度順位を符号化部11-2に出力する。登録さ
れていないときは、未登録コード(ESC)の頻度順位
を符号化部11-2に出力し、次数を下げて登録シンボル
があるまで処理を繰り返す。符号化部11-2は、受け取
った(ESCがあればESCと)シンボルの出現頻度順
位を符号として出力する。一方、比較部11-9では符号
化したシンボルの文脈内の全シンボルの総累積頻度と閾
値保持部11-8に保持されている閾値とを比較する。比
較結果はアップデートコントロール部11-10 へ出力さ
れる。比較結果が“閾値以下”であった場合、アップデ
ートコントロール部11-10 は頻度更新部11-6,累積
頻度更新部11-7,ソート部11-5へアップデート処理
を行なうよう制御信号を送る。
【0040】具体的には、頻度更新部では符号化したシ
ンボルの出現頻度をインクリメント(+1)する。ソー
ト部11-5では、(インクリメント前の)シンボルの出
現頻度と同一頻度のシンボルのうち最上位に位置してい
るシンボルを検索し、そのシンボルと位置を入れ替える
(図14で説明したように)。累積頻度保持部11-3
は、入れ替えたシンボルより上位に位置する全てのシン
ボルの累積頻度値をインクリメント(+1)する。比較
結果が“閾値以上”であった場合これらの処理は一切行
なわれない。
【0041】図4に本発明の一実施例の符号化装置11
の頻度及び累積頻度の更新処理のフローチャートを示
す。シンボルKが符号化されると(ステップS1-1)、
シンボルKの文脈Pの累積頻度が比較部11-9に供給さ
れ、閾値保持部11-8に保持された閾値と比較される。
【0042】比較部11-9では例えば、累積頻度が閾値
より小さければ、ローレベル、大きければ、ハイレベル
の信号を出力する。アップデートコントロール部11
-10 では比較部11-9からローレベルの信号、が供給さ
れるとシンボルKの文脈Pの総累積頻度が閾値以下であ
ると判別し、ソート部11-5を制御して、シンボルKと
同一出現頻度のシンボルのうち、出現頻度順位の最上位
に位置するシンボルNを検索する(ステップS1-2,S
-3)。
【0043】アップデートコントロール部11-10 はソ
ート部11-5を制御して検索したシンボルNと符号化さ
れたシンボルKとを入れ替え頻度更新部11-6を制御し
てシンボルKの頻度に+1を加算する(ステップS
-4,S1-5)。次にアップデートコントロール部11
-10 は累積頻度更新部11-7を制御して入れ替えた順序
で、シンボルKの1つ上位に位置するシンボルにポイン
タを移動させ、ポインタにより指示されたシンボルの累
積頻度に+1を加算する(ステップS1-6,S1-7)。
【0044】次にアップデートコントロール部11-10
はポインタの指示するシンボルが最上位のシンボルか、
否かを判断し(ステップS1-8),ステップS1-6,S
-7を繰り返すことにより符号化されたシンボルKから
上位の全シンボルの累積頻度に+1を加算する。
【0045】以上、ステップS1-3,S1-8によりシン
ボルの出現頻度及び累積頻度の更新が実施される。ま
た、ステップS1-2でシンボルKの文脈Pの総累積頻度
が閾値以上となると、比較部11-9からアップデートコ
ントロール部11-10 にハイレベルの信号が供給され、
アップデートコントロール部11-10 は比較部11-9
らのハイレベル信号に応じてシンボルKの出現頻度、及
び、総累積頻度が閾値に達し、これ以上の頻度、及び、
総累積頻度の更新は不要と判断してステップS1-3〜S
-8のシンボルの頻度及び累積頻度の更新は行なわな
い。
【0046】なお、各次数毎にアップデート時の平均累
積加算回数を調査すると、2次文脈では平均1.5 回、1
次文脈では平均8.4 回、0次文脈に至っては平均48.5回
の加算処理を行っていることが判明しており、2次、1
次に比べ、0次の加算回数は圧倒的に多くなっている。
【0047】このため、本実施例のようにアップデート
を閾値までとする制御は0次文脈のシンボルについての
み行なうだけでも加算回数を大幅に低下できる。この場
合、アップデートを行なわないことによって生じる圧縮
効率の低下を最小限に抑えられる。
【0048】図5に本発明の一実施例の復号化装置のブ
ロック図を示す。同図中、図3と同一構成部分には同一
符号を付し、その説明は省略する。復号化装置13は符
号化装置11で符号化されたデータを元のデータに復元
する。
【0049】復号化装置13は復号部13-1以外の部分
は符号化装置11と同じで、符号化装置11が入力デー
タに応じて文脈木を生成するのに対し、復号化処理装置
13では符号データを復号した結果の復号データにより
文脈木を生成する。図6に本発明の一実施例の復号化装
置13の頻度及び累積頻度の更新処理のフローチャート
を示す。
【0050】シンボルKが復号化されると(ステップS
-1)、シンボルKの文脈Pの累積頻度が比較部11-9
に供給され、閾値保持部11-8に保持された閾値と比較
される。比較部11-9では例えば、累積頻度が閾値より
小さければ、ローレベル、大きければ、ハイレベルの信
号を出力する。
【0051】アップデートコントロール部11-10 では
比較部11-9からローレベルの信号、が供給されるとシ
ンボルKの文脈Pの総累積頻度が閾値以下であると判別
し、ソート部11-5を制御して、シンボルKと同一出現
頻度のシンボルのうち、出現頻度順位の最上位に位置す
るシンボルNを検索する(ステップS2-2,S2-3)。
【0052】アップデートコントロール部11-10 はソ
ート部11-5を制御して検索したシンボルNと符号化さ
れたシンボルKとを入れ替え頻度更新部11-6を制御し
てシンボルKの頻度に+1を加算する(ステップS
-4,S2-5)。次にアップデートコントロール部11
-10 は累積頻度更新部11-7を制御して入れ替えた順序
で、シンボルKの1つ上位に位置するシンボルにポイン
タを移動させ、ポインタにより指示されたシンボルの累
積頻度に+1を加算する(ステップS2-6,S2-7)。
【0053】次にアップデートコントロール部11-10
はポインタの指示するシンボルが最上位のシンボルか、
否かを判断し(ステップS2-8),ステップS2-6,S
-7を繰り返すことにより符号化されたシンボルKから
上位の全シンボルの累積頻度に+1を加算する。
【0054】以上、ステップS2-3,S2-8によりシン
ボルの出現頻度及び累積頻度の更新が実施される。ま
た、ステップS1-2でシンボルKの文脈Pの総累積頻度
が閾値以上となると、比較部11-7からアップデートコ
ントロール部11-10 にハイレベルの信号が供給され、
アップデートコントロール部11-10 は比較部11-9
らのハイレベル信号に応じてシンボルKの出現頻度、及
び、総累積頻度が閾値に達し、これ以上の出現頻度、及
び、総累積頻度の更新は不要と判断してステップS2-3
〜S2 -8のシンボルの出現頻度及び累積頻度の更新は行
なわない。
【0055】図7に本発明の符号化装置の変形例のブロ
ック構成図を示す。同図中、図3と同一構成部分には同
一符号を付し、その説明は省略する。本変形例の符号化
装置14は符号化部14-1及びアップデートコントロー
ル部14-2の処理が図3に示す符号化装置11とは異な
る。
【0056】本変形例の符号化装置14の符号化部14
-1はアップデートコントロール部14-2に対してシンボ
ルの符号化の終了を示す信号の他に何次で符号化された
かを示すデータを供給する。アップデートコントロール
部14-2ではシンボルの符号化の終了に応じて後述する
出現頻度及び累積頻度及び出現頻度順位の更新を行な
う。
【0057】図8に本発明の一実施例の符号化装置の変
形例の出現頻度及び累積頻度の更新処理のフローチャー
トを示す。シンボルKが符号化されると(ステップS3
-1)、符号化部14-1から供給される符号化次数を検知
する(ステップS3-2)。ここで符号次数が予め設定し
ておいた次数0次のときにはシンボルKの文脈Pの累積
頻度が比較部11-9に供給され、閾値保持部11-8に保
持された閾値と比較される。
【0058】比較部11-9では例えば、累積頻度が閾値
より小さければ、ローレベル、大きければ、ハイレベル
の信号を出力する。アップデートコントロール部11
-10 では比較部11-9からローレベルの信号、が供給さ
れるとシンボルKの文脈Pの総累積頻度が閾値以下であ
ると判別し、ソート部11-5を制御して、シンボルKと
同一出現頻度のシンボルのうち、出現頻度順位の最上位
に位置するシンボルNを検索する(ステップS3-3,S
-4)。
【0059】アップデートコントロール部11-10 はソ
ート部11-5を制御して検索したシンボルNと符号化さ
れたシンボルKとを入れ替え頻度更新部11-6を制御し
てシンボルKの頻度に+1を加算する(ステップS
-5,S3-6)。次にアップデートコントロール部11
-10 は累積頻度更新部11-7を制御して入れ替えた順序
で、シンボルKの1つ上位に位置するシンボルにポイン
タを移動させ、ポインタにより指示されたシンボルの累
積頻度に+1を加算する(ステップS3-7,S3-8)。
【0060】次にアップデートコントロール部11-10
はポインタの指示するシンボルが最上位のシンボルか、
否かを判断し(ステップS3-9),ステップS3-7,S
-8を繰り返すことにより符号化されたシンボルKから
上位の全シンボルの累積頻度に+1を加算する。
【0061】以上、ステップS3-4,S3-9によりシン
ボルの出現頻度及び累積頻度の更新が実施される。ま
た、ステップS3-3でシンボルKの文脈Pの総累積頻度
が閾値以上となると、比較部11-9からアップデートコ
ントロール部11-10 にハイレベルの信号が供給され、
アップデートコントロール部11-10 は比較部11-9
らのハイレベル信号に応じてシンボルKの出現頻度、及
び、総累積頻度が閾値に達し、これ以上の出現頻度、及
び、総累積頻度の更新は不要と判断してステップS3-4
〜S3 -9のシンボルの出現頻度及び累積頻度の更新は行
なわない。
【0062】また、ステップS3-2で、符号化次数が予
め設定しておいた次数0次以外、つまり高次で符号化さ
れた場合にはステップS3-4〜S3-9が実行され、シン
ボルの出現頻度によらず、常に出現頻度、累積頻度、出
現頻度順位の更新が行なわれる。
【0063】図9に本発明の一実施例の符号化装置の変
形例の符号化装置により符号化された符号データを復号
する復号化装置のブロック図を示す。同図中、図5と同
一構成部分には同一符号を付し、その説明は省略する。
本変形例の復号化装置15は復号化部15-1はアップデ
ートコントロール部15-2に対してシンボルの復号化の
終了を示す信号の他に何次で復号化されたかを示すデー
タを供給する。アップデートコントロール部15-2では
シンボルの復号化の終了に応じて後述する出現頻度及び
累積頻度及び出現頻度順位の更新を行なう。
【0064】図10に本発明の一実施例の符号化装置の
変形例の出現頻度及び累積頻度の更新処理のフローチャ
ートを示す。シンボルKが符号化されると(ステップS
-1)、符号化部15-1から供給される符号化次数を検
知する(ステップS4-2)。ここで符号次数が予め設定
しておいた次数0次のときにはシンボルKの文脈Pの累
積頻度が比較部11-9に供給され、閾値保持部11-8
保持された閾値と比較される。
【0065】比較部11-9では例えば、累積頻度が閾値
より小さければ、ローレベル、大きければ、ハイレベル
の信号を出力する。アップデートコントロール部15-2
では比較部からローレベルの信号、が供給されるとシン
ボルKの文脈Pの後累積頻度が閾値以下であると判別
し、ソート部11-5を制御して、シンボルKと同一出現
頻度のシンボルのうち、出現頻度順位の最上位に位置す
るシンボルNを検索する(ステップS4-3,S4-4)。
【0066】アップデートコントロール部15-2はソー
ト部11-5を制御して検索したシンボルNと符号化され
たシンボルKとを入れ替え頻度更新部を制御してシンボ
ルKの頻度に+1を加算する(ステップS4-5,S
-6)。次にアップデートコントロール部15-2は累積
頻度更新部11-7を制御して入れ替えた順序で、シンボ
ルKの1つ上位に位置するシンボルにポインタを移動さ
せ、ポインタにより指示されたシンボルの累積頻度に+
1を加算する(ステップS4-7,S4-8)。
【0067】次にアップデートコントロール部15-2
ポインタの指示するシンボルが最上位のシンボルか、否
かを判断し(ステップS4-9),ステップS4-7,S4
-8を繰り返すことにより符号化されたシンボルKから上
位の全シンボルの累積頻度に+1を加算する。
【0068】以上、ステップS4-4,S4-9によりシン
ボルの出現頻度及び累積頻度の更新が実施される。ま
た、ステップS4-3でシンボルKの文脈Pの総累積頻度
が閾値となると、比較部11-9からアップデートコント
ロール部15-2にハイレベルの信号が供給され、アップ
デートコントロール部15-2は比較部からのハイレベル
信号に応じてシンボルKの出現頻度、及び、総累積頻度
が閾値に達し、これ以上の出現頻度、及び、総累積頻度
の更新は不要と判断してステップS4-4〜S4-9のシン
ボルの出現頻度及び累積頻度の更新は行なわない。
【0069】また、ステップS4-2で、符号化次数が予
め設定しておいた次数0次以外、つまり高次で符号化さ
れた場合にはステップS4-4〜S4-9が実行され、シン
ボルの出現頻度によらず、常に出現頻度、累積頻度、出
現頻度順位の更新が行なわれる。
【0070】なお、上記実施例ではアップデートの有無
を決定する閾値は1つに設定したが、各文脈毎に複数個
の閾値を保持してもよい。文脈の下に登録されるシンボ
ル数は文脈に依存する。例えば英文TEXTの場合、
“ ”(スペース),“,”(カンマ),“.”(ピリ
オド)などの文脈の下には多くのシンボルが出現する。
文字の出現頻度に応じて閾値を個別に設定することで、
符号化効率の低下を最小限に抑えることができる。
【0071】また、文脈毎では処理が複雑になるため次
数毎に処理してもよい、文脈によって差はあるが、一般
的に高次の次数ほど文脈の下のシンボルの登録数は少な
く、アップデートの処理時間も短いが、低次になるほど
登録数が多くなり、アップデートの処理時間は増大す
る。そのため、文脈毎ではなく次数毎に処理すること
で、効率の良い処理を行なうことができる。特に0次で
は初期の段階から全てのシンボル(0x00〜0xff
のデータと特種コードEOF)が登録されているため、
他の次数に比べて非常に処理時間が長くなる。そのた
め、0次についてのみ本方式の制御を行なうだけで高い
効果が期待できる。0次だけの場合、制御も非常に簡単
であり、回路規模の増加も最小ですむ。
【0072】
【発明の効果】上述の如く、本発明の請求項1によれ
ば、入力データ符号化時に入力データの出現頻度に応じ
て文脈更新の有無を制御することにより、文脈の傾向が
わかったところで、文脈更新を停止させることができ不
必要な文脈更新が行なわれないため、処理を高速化でき
る等の特長を有する。
【0073】本発明の請求項2によれば、所定次数以下
の文脈について文脈更新を停止させることにより、更新
回数の覆い低次の文脈についてのみ、文脈の頻度更新を
停止させることができるため、圧縮効率の低下を最小限
に抑えられる等の特長を有する。
【0074】請求項3によれば、入力データ符号化時に
入力データの出現頻度に応じて文脈更新の有無を制御す
ることにより、文脈の傾向がわかったところで、文脈更
新を停止させることができ不必要な文脈更新が行なわれ
ないため、符号化処理を高速化できる等の特長を有す
る。
【0075】請求項4によれば、入力データの出現頻度
を閾値保持手段に保持された所定の閾値と比較手段によ
り比較し、比較手段の比較結果に応じて出現頻度及び出
現順位の更新を停止する更新停止手段を制御して出現頻
度及び出現順位の更新を停止させることにより、必要以
上の出現頻度及び出現順位の更新処理を行なわずに済む
ため、符号化処理の高速化が可能となる等の特長を有す
る。
【0076】請求項5によれば、所定次数以下の文脈に
ついて文脈更新を停止させることにより、更新回数の多
い低次の文脈についてのみ、文脈の頻度更新を停止させ
ることができるため、復号化されるデータの圧縮効率の
低下を最小限に抑えられる等の特長を有する。
【0077】請求項6によれば、符号の復号化時にシン
ボルの出現頻度に応じて文脈更新の有無を制御すること
により出力シンボルの文脈の傾向がわかったところで文
脈更新を停止させることができ、不要な更新を行なう必
要がなくなるため、処理を高速化できる等の特長を有す
る。
【0078】請求項7によれば、所定次数以下の文脈に
ついて文脈更新を停止させることにより更新回数の多い
低次の文脈についてのみ、更新を停止させることができ
るため、圧縮効率の低下を最小限に抑えられる等の特長
を有する。請求項8によれば、符号の復号化時にシンボ
ルの出現頻度に応じて文脈更新の有無を制御することに
より出力シンボルの文脈の傾向がわかったところで文脈
更新を停止させることができ、不要な更新を行なう必要
がなくなるため、比較的簡単な構成で復号化処理を高速
化できる等の特長を有する。
【0079】請求項9によれば、入力データの出現頻度
を閾値保持手段に保持された所定の閾値と比較手段によ
り比較し、比較手段の比較結果に応じて出現頻度及び出
現順位の更新を停止する更新停止手段を制御して出現頻
度及び出現順位の更新を停止させることにより、必要以
上の出現頻度及び出現順位の更新処理を行なわずに済む
ため、復号化処理の高速化が可能となる等の特長を有す
る。
【0080】請求項10によれば、所定次数以下の文脈
について文脈更新を停止させることにより、更新回数の
多い低次の文脈についてのみ、文脈の頻度更新を停止さ
せることができるため、復号化されるデータの圧縮効率
の低下を最小限に抑えられる等の特長を有する。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の一実施例のブロック図である。
【図3】本発明の一実施例の符号化装置のブロック図で
ある。
【図4】本発明の一実施例の符号化装置の動作フローチ
ャートである。
【図5】本発明の一実施例の復号化装置のブロック図で
ある。
【図6】本発明の一実施例の復号化装置の動作フローチ
ャートである。
【図7】本発明の他の実施例の符号化装置のブロック図
である。
【図8】本発明の他の実施例の符号化装置の動作フロー
チャートである。
【図9】本発明の他の実施例の復号化装置のブロック図
である。
【図10】本発明の他の実施例の復号化装置の動作フロ
ーチャートである。
【図11】確率統計型符号化装置のブロック図である。
【図12】文脈木の構造を説明するための図である。
【図13】多値算術符号化の動作説明図である。
【図14】アップデート処理の動作説明図である。
【図15】従来の一例のブロック図である。
【図16】従来の一例の動作説明図である。
【符号の説明】
1 符号化手段 2,5 文脈保持・更新手段 3,6 更新制御手段 4 復号化手段 11 符号化装置 12 中間媒体 13 復号化装置 11-1 文脈木保持部 11-2 符号化部 11-3 累積頻度保持部 11-4 頻度保持部 11-5 ソート部 11-6 頻度更新部 11-7 累積頻度更新部 11-8 閾値保持部 11-9 比較部 11-10 アップデートコントロール部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力データの出現頻度及び出現頻度順位
    を該入力データの入力毎に更新し、該入力データを過去
    に出現した該入力データの出現頻度及び出現頻度順位に
    基づいて可変長符号化するデータ符号化方法において、 前記出現頻度及び前記出現頻度順位の更新を前記出現頻
    度が予め決められた所定の値まで行ない、 前記出現頻度が予め決められた所定の閾値となってから
    後は該所定の閾値となったときの出現頻度及び出現頻度
    順位に応じて入力データを符号化することを特徴とする
    データ符号化方法。
  2. 【請求項2】 前記所定の閾値は入力データ毎に決めら
    れていることを特徴とする請求項1記載のデータ符号化
    方法。
  3. 【請求項3】 入力データの出現頻度及び出現頻度順位
    を該入力データの入力毎に更新しつつ符号化する文脈保
    持・更新手段と、入力データが供給され、該文脈保持・
    更新手段を参照し、該入力データの出現頻度及び出現頻
    度順位に応じた可変長符号を生成する符号化手段とを具
    備するデータ符号化装置において、 前記入力データの出現頻度が予め決められた所定の閾値
    となってから後は、前記文脈保持・更新手段による出現
    頻度及び出現頻度順位の更新を停止させる更新制御手段
    を有することを特徴とするデータ符号化装置。
  4. 【請求項4】 前記更新制御手段は前記所定の閾値を保
    持する閾値保持手段と、 前記閾値保持手段に保持された前記所定の閾値と前記文
    脈保持・更新手段に保持された前記出現頻度とを比較す
    る比較手段と、 前記比較手段の比較結果に応じて前記文脈保持・更新手
    段の更新を停止させる更新停止手段とを有することを特
    徴とする請求項3記載のデータ符号化装置。
  5. 【請求項5】 前記閾値保持手段は前記入力データ毎に
    設定が可能な構成とされ、 前記比較手段は前記入力データ毎に前記閾値保持手段に
    保持された前記閾値とそれに対応して前記文脈保持・更
    新手段に保持された前記出現頻度とを比較し、 前記更新停止手段は前記比較手段の比較結果に応じて前
    記文脈保持・更新手段の対応する出現頻度の更新を停止
    させることを特徴とする請求項4記載のデータ符号化装
    置。
  6. 【請求項6】 可変長符号化された符号データを過去に
    復号化したデータの出現頻度及び出現順位に応じて復号
    化するデータ復号方法において、 前記出現頻度及び出現頻度順位の更新を前記出現頻度が
    予め決められた所定の閾値となるまで行ない、 前記出現頻度が予め決められた所定の値となってから後
    は該所定の閾値となったときの出現頻度及び出現頻度順
    位に応じて前記符号データを復元することを特徴とする
    データ復号方法。
  7. 【請求項7】 前記所定の閾値は前記復号化されたデー
    タ毎に予め決められていることを特徴とする請求項6記
    載のデータ復号化方法。
  8. 【請求項8】 復号された復号データの出現頻度及び出
    現頻度順位を該復号データの入力毎に更新しつつ保持す
    る文脈保持・更新手段と、符号データが供給され、該文
    脈保持・更新手段を参照することにより、該符号データ
    に応じた復号データを検索し、復号データとして出力す
    る復号化手段とを具備するデータ復号化装置において、 前記復号データの出現頻度が予め決められた所定の値を
    越えたとき、前記文脈保持・更新手段による出現頻度及
    び出現頻度順位の更新を停止させる更新制御手段を有す
    ることを特徴とするデータ復号化装置。
  9. 【請求項9】 前記更新制御手段は前記所定の閾値を保
    持する閾値保持手段と、 前記閾値保持手段に保持された前記所定の閾値と前記文
    脈保持・更新手段に保持された前記出現頻度とを比較す
    る比較手段と、 前記比較手段の比較結果に応じて前記文脈保持・更新手
    段の更新を停止させる更新停止手段とを有することを特
    徴とする請求項8記載のデータ復号化装置。
  10. 【請求項10】 前記閾値保持手段は前記入力データ毎
    に設定が可能な構成とされ、 前記比較手段は前記入力データ毎に前記閾値保持手段に
    保持された前記閾とそれに対応して前記文脈保持・更新
    手段に保持された前記出現頻度とを比較し、 前記更新停止手段は前記比較手段の比較結果に応じて前
    記文脈保持・更新手段の対応する出現頻度の更新を停止
    させることを特徴とする請求項9記載のデータ復号化装
    置。
JP02301995A 1995-02-10 1995-02-10 データ符号化/復号化方法及び装置 Expired - Fee Related JP3302210B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP02301995A JP3302210B2 (ja) 1995-02-10 1995-02-10 データ符号化/復号化方法及び装置
US08/525,076 US5650783A (en) 1995-02-10 1995-09-08 Data coding/decoding device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02301995A JP3302210B2 (ja) 1995-02-10 1995-02-10 データ符号化/復号化方法及び装置

Publications (2)

Publication Number Publication Date
JPH08223054A true JPH08223054A (ja) 1996-08-30
JP3302210B2 JP3302210B2 (ja) 2002-07-15

Family

ID=12098783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02301995A Expired - Fee Related JP3302210B2 (ja) 1995-02-10 1995-02-10 データ符号化/復号化方法及び装置

Country Status (2)

Country Link
US (1) US5650783A (ja)
JP (1) JP3302210B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5986594A (en) * 1996-09-11 1999-11-16 Canon Kabushiki Kaisha Image compression by arithmetic coding with learning limit
US7536054B2 (en) 2003-02-19 2009-05-19 Ishikawajima-Harima Heavy Industries Co., Ltd. Image compression device, image compression method, image compression program, compression encoding method, compression encoding device, compression encoding program, decoding method, decoding device, and decoding program

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3566441B2 (ja) * 1996-01-30 2004-09-15 シャープ株式会社 テキスト圧縮用辞書作成装置
JP3267504B2 (ja) * 1996-03-26 2002-03-18 富士通株式会社 データ圧縮装置およびデータ復元装置
JP3276860B2 (ja) * 1996-09-02 2002-04-22 富士通株式会社 データ圧縮/復元方法
US5912636A (en) * 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
US5808572A (en) * 1997-05-22 1998-09-15 National Science Council Method and apparatus for finite-length arithmetic coding
KR100281321B1 (ko) * 1998-03-26 2001-02-01 전주범 적응적인 산술 부호화 및 그 복호화 방법
DE19834472A1 (de) * 1998-07-30 2000-02-03 Rohde & Schwarz Verfahren zum komprimierten Codieren von Datensymbolen
CN100459489C (zh) * 2000-11-29 2009-02-04 朗迅科技公司 可变大小的密钥以及使用该密钥的方法和装置
FR2842672B1 (fr) * 2002-07-22 2005-01-28 Inst Nat Rech Inf Automat Dispositif et procede de decodage robuste de codes arithmetiques
JP4240283B2 (ja) * 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
US6954501B2 (en) * 2003-02-17 2005-10-11 Xvd Corporation Method and apparatus for object based motion compensation
KR100959532B1 (ko) * 2003-12-18 2010-05-27 엘지전자 주식회사 Cavlc 복호 방법
WO2009108776A1 (en) * 2008-02-29 2009-09-03 California Institute Of Technology Method and components for simultaneous processing of multiple functions
US8975922B2 (en) 2008-02-29 2015-03-10 California Institute Of Technology Method and apparatus for simultaneous processing of multiple functions
US8817875B2 (en) * 2009-08-13 2014-08-26 The Johns Hopkins University Methods and systems to encode and decode sequences of images
CN104579360B (zh) * 2015-02-04 2018-07-31 华为技术有限公司 一种数据处理的方法和设备
US9614546B2 (en) * 2015-08-09 2017-04-04 Armoya Yuksek Teknoloji Arastirmalari Elektronik Sanayi Ve Ticaret Anonim Sirketi Data compression and decompression method
US10219005B2 (en) * 2017-06-28 2019-02-26 HCL Technologies Italy S.p.A. System and method for real-time compression of data frames
CN114978421B (zh) * 2022-05-05 2023-10-27 煤炭科学研究总院有限公司 动态编码方法、装置及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL86993A (en) * 1988-07-05 1991-07-18 Ibm Israel Method of generating a compressed representation of a source data string
IL91158A (en) * 1989-07-28 1993-01-31 Ibm Israel Method and system for arithmetic coding and decoding
US5254990A (en) * 1990-02-26 1993-10-19 Fujitsu Limited Method and apparatus for compression and decompression of data
US5550540A (en) * 1992-11-12 1996-08-27 Internatioal Business Machines Corporation Distributed coding and prediction by use of contexts
US5357250A (en) * 1992-11-20 1994-10-18 International Business Machines Corporation Adaptive computation of symbol probabilities in n-ary strings
US5546080A (en) * 1994-01-03 1996-08-13 International Business Machines Corporation Order-preserving, fast-decoding arithmetic coding arithmetic coding and compression method and apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5986594A (en) * 1996-09-11 1999-11-16 Canon Kabushiki Kaisha Image compression by arithmetic coding with learning limit
US7536054B2 (en) 2003-02-19 2009-05-19 Ishikawajima-Harima Heavy Industries Co., Ltd. Image compression device, image compression method, image compression program, compression encoding method, compression encoding device, compression encoding program, decoding method, decoding device, and decoding program

Also Published As

Publication number Publication date
US5650783A (en) 1997-07-22
JP3302210B2 (ja) 2002-07-15

Similar Documents

Publication Publication Date Title
JPH08223054A (ja) データ符号化/復号化方法及び装置
JP3305190B2 (ja) データ圧縮装置及びデータ復元装置
Nelson et al. The data compression book 2nd edition
RU2464630C2 (ru) Двухпроходное хеш извлечение текстовых строк
Witten et al. Arithmetic coding for data compression
KR100894002B1 (ko) 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법
JP3309031B2 (ja) 短ブロックのデータを圧縮、伸長するための方法、及び装置
US20110181448A1 (en) Lossless compression
US7305541B2 (en) Compression of program instructions using advanced sequential correlation
JPH09162748A (ja) データ符号化方法、データ復号方法、データ圧縮装置、データ復元装置、及びデータ圧縮・復元システム
JPH09275349A (ja) データ圧縮装置及びデータ復元装置
Said Comparative Analysis of Arithmetic Coding Computational Complexity.
US11362671B2 (en) Systems and methods of data compression
JP5812188B2 (ja) プログラム、圧縮データ生成方法、伸張方法、情報処理装置、および記録媒体
JPH07336237A (ja) データ情報を圧縮するためのシステムおよび方法
CN114567332A (zh) 一种文本二次压缩方法、装置、设备及计算机可读存储介质
JPS61242122A (ja) 文字データ・ストリームの適応的圧縮方法
US20100321218A1 (en) Lossless content encoding
JPH08167852A (ja) データ圧縮方法及び装置
JP5570409B2 (ja) データ圧縮装置及びデータ圧縮方法及びデータ圧縮プログラム
Said et al. Arithmetic coding
Cannane et al. General‐purpose compression for efficient retrieval
US7053803B1 (en) Data compression
Williams Performance Overhead of Lossless Data Compression and Decompression Algorithms: A Qualitative Fundamental Research Study
Pathak et al. Data compression scheme of dynamic Huffman code for different languages

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020409

LAPS Cancellation because of no payment of annual fees