JP2023553832A

JP2023553832A - コンピュータメモリにおける値類似性を利用するためのシステム、方法、及びデバイス

Info

Publication number: JP2023553832A
Application number: JP2023532372A
Authority: JP
Inventors: アンジェロスアレラキス; アレクサンドラアンゲルド; エリックシントルン; ペールステンストレーム
Original assignee: ゼロポイントテクノロジーズアーベー
Priority date: 2020-12-01
Filing date: 2021-12-01
Publication date: 2023-12-26
Also published as: US20240028510A1; CN116529705A; KR20230124941A; CA3203482A1; EP4256710A1; EP4256710A4; SE2051404A1; SE544557C2; WO2022119493A1

Abstract

データ圧縮方法（２２００）が開示され、この方法は、各データブロックが複数のデータ値を含む複数のデータブロックを取得（２２１０）するステップを含む。この方法は、取得された複数のデータブロックのベースデルタ符号化（２２２０）を実行し、デルタ値とは、データ値とベース値との差を意味する。この方法は、複数のデータブロックのデータ値の中から、前記複数のデータブロックに共通するセットのグローバルベース値を決定する（２２３０）ことを含む。セットのグローバルベース値は、前記セットのグローバルベース値におけるグローバルベース値に関して、複数のデータブロックのデータ値のデルタ値を最小化するように選択される。方法は、セットのグローバルベース値において、複数のデータブロックの個々のデータ値を符号化するステップ（２２４０）を含む。
【選択図】図２２

Description

本主題は、概して、電子コンピュータ内のメモリにおけるデータ圧縮の分野に関する。

データ圧縮は、頻度の高いデータの集まりを、頻度の低いデータの集まりよりも効率的に符号化することによって、データをより効率的に格納して、転送する一般的な技法である。一般的に、データをより効率的に格納して、転送することは、多くの理由から注目されている。コンピュータメモリ、例えば、処理デバイスが動作するデータやコンピュータ命令を保持するメモリ、例えば、メインメモリやキャッシュメモリにおいて、前記データをより効率的に、例えばＫ倍格納することは、前記メモリのサイズを潜在的にＫ分の１に小さくすることができ、１つのメモリから別のメモリへのデータ転送に潜在的にＫ分の１少ない通信容量を使用し、コンピュータシステム内又はコンピュータシステム間、及び／又はメモリ間で前記データを格納及び転送するためのエネルギー消費を潜在的にＫ分の１に少なくすることができるため、興味深い。あるいは、データ圧縮を伴わない場合よりも、Ｋ倍多いデータを利用可能なコンピュータメモリに潜在的に格納することができる。これは、より多くのメモリを追加する必要なしに、コンピュータの性能を潜在的にＫ倍高くできるので興味深いが、コスト高になることも、あるいはリソース制約により単純に望ましくないこともある。別の例として、スマートフォン、タブレット、ラップ／デスクトップ、又はセットトップボックスは、サイズと重さが制限されている。その理由は、スマートフォン、タブレット、ラップ／デスクトップ、又はセットトップボックスがより大きく、あるいはより多ければ、エンドユーザにとってあまり価値がない可能性があるからである。したがって、そのような製品の市場価値を潜在的に低下させる。それでも、メモリ容量をより多くして、あるいはメモリ通信帯域幅をより高くして利用可能にすることで、潜在的に製品の市場価値を高めることができる。その理由は、メモリ容量又はメモリ通信帯域幅をより多くすることで、製品をより高性能にすることができるので、その有用性がより高まるからである。

要約すると、コンピュータ化された製品の一般的なランドスケープにおいて、隔離されたデバイス又は相互接続されたデバイスも含め、データ圧縮によって、潜在的に性能を高め、エネルギー消費を削減し、利用可能なメモリ通信帯域幅を増加させ、あるいはメモリによって消費されるコストを削減し、面積を小さくすることができる。したがって、データ圧縮は、本明細書で言及されるものを超える広範囲なコンピュータ化された製品において幅広い有用性を有する。

従来技術における圧縮メモリシステムは、典型的には、ディスクからメモリページを読み出すことによって、又はメモリ割り当てを通じて、メモリページをその作成時に圧縮する。圧縮は、ソフトウェアルーチン又はハードウェアアクセラレータによって、様々な周知の方法を使用して行うことができる。プロセッサがメモリからデータを要求するとき、データは、典型的には、要求元のプロセッサに提供する前に、最初に解凍されなければならない。そのような要求は、クリティカルなメモリアクセスパス上で終わる可能性があるので、解凍は、典型的には、メモリアクセス時間への影響が少ないように、ハードウェアによって加速される。

メモリアクセス時間への影響を少なくして、さらに、メモリオブジェクト、例えば、メモリのページ内のデータを効果的に圧縮することができるように、データは、典型的には、データブロック毎に圧縮される。ここで、データブロックは、６４バイトとすることができるが、それより少なくても多くてもよい。データブロックは、いくつかの値、例えば、整数、又は浮動小数点値（ｆｌｏａｔｓと呼ばれることもある）、あるいは他のデータタイプを含んでもよい。例えば、６４バイトのデータブロックは、１６個の３２ビットの整数又は浮動小数点を含んでもよい。

圧縮技法は、可逆にすることも、不可逆にすることもできる。可逆圧縮技法は、可逆方式で圧縮された値が解凍された後に正確に復元できるように情報を保存する。対照的に、不可逆圧縮技法は、情報の全てを保存するわけではない。他方で、値が不可逆方式で圧縮される場合、その値は、解凍された後に正確に復元されない。元の値と復元された値との差は、圧縮誤差と呼ばれる。課題は、その誤差をいかに小さく抑えるかである。

従来技術から知られているデルタ圧縮と呼ばれる可逆圧縮技法の１つのファミリーでは、採用されるアプローチは、数値的に近いデータ値の集合における値類似性を利用することである。前記データ値の集合に数値的に近いベース値を選択することによって、各個々の値とベース値との間の差（デルタ値と呼ばれる）を追跡するだけでよい。

例えば、ベース－デルタ－即値圧縮（以下、ＢＤＩと称する）では、データブロックのベース値は、前記データブロックに関連する値の中で任意にピッキングされる。データブロックは、ブロック内の各値と前記ベース値との間の差を追跡し続けることによって圧縮される。データブロック内の全ての値が数値的に類似している場合、前記差は、小さくなる。例えば、データブロックが４つの値１００，９８，１０２及び１０５を含み、第一の値（１００）がベース値としてピッキングされる場合、差は、０、－２、２及び５となる。

差（以降、デルタ値と呼ぶ）及びベース値を格納するだけで、例示的なデータブロックをよりコンパクトに格納することが可能である。この例では、元のブロックは、４×３２＝１２８ビットの格納を必要とするが、ＢＤＩは、理想的には、デルタ値の範囲が［－８，７］であると仮定すると、３２＋３×４＝４４ビットしか必要とせず、デルタ値を格納するために４ビットが必要となる。これによって、圧縮度（又は比と呼ばれることもある）は、１２８／４４＝３倍となる。

ＢＤＩは、元の値／デルタ値から／にベース値を単純に減算／加算することによって、データブロックを圧縮／解凍するハードウェア加速圧縮及び解凍デバイスによって実装できるので魅力的である。しかしながら、これは、データブロック内の値が数値的に類似している場合にのみ効果的に機能する。そうでなければ、デルタ値を符号化するために必要とされるメタデータは、圧縮からのゲインを相殺する可能性がある。例えば、それぞれ４つの値を有する２つのブロックＢ１及びＢ２を考え、Ｂ１は、値１００、１０２、２０５、２０８を含み、Ｂ２は、２００、２０２、１０５、１０８を含むものとする。ＢＤＩは、Ｂ１のベース値として１００をピッキングして、デルタ値を０，２，１０５及び１０８として符号化してもよい。対照的に、ＢＤＩは、Ｂ２のベース値として２００をピッキングし、デルタ値を０、２、－９５、及び－９２として符号化してもよい。明らかに、この例では、デルタ値を符号化するためのメタデータの量が多いほど、ＢＤＩの圧縮有効性が低下することがある。ベース値がＢ１とＢ２との間で共有されている場合、メタデータを削減できる可能性がある。

この特許開示が対処する困難な問題は、複数のデータブロックに格納されたデータセットが与えられると、複数のデータブロックによって共有され得るベース値のセットを選択できるシステム、方法、及びデバイスをどのように考案するかである。第一の課題は、前記複数のデータブロックの中から、メタデータの量を減らすベース値のセットを選択して、複数のデータブロックの中でデルタ値を効果的に符号化するように構成された方法及びデバイスを考案することである。第二の課題は、ハードウェアアクセラレータを介して圧縮及び解凍プロセスを効果的に管理するように構成された方法及びデバイスをどのように考案するかである。

ベース値を選択することは、デルタ値が明示的に符号化される符号化スキームにつながる。しかしながら、デルタ値は、コンパクトに符号化され得る反復値を意味する値冗長性を示すことがある。例えば、２つの例示的なデータブロックを再び考え、Ｂ１は、値１００、１０２、２０５、２０８を含み、Ｂ２は、値２００、２０２、１０５、１０８を含むものとする。ベース値が１００及び２００である場合、Ｂ１のデルタ値は、０、２、５及び８であり、Ｂ２のデルタ値は、０、２、５及び８である。この例は、デルタ値が値冗長性を明らかにし、これを利用できることを示している。具体的には、Ｂ１におけるデルタ値ｋは、この例では、Ｂ２におけるデルタ値ｋと同じである。

本特許開示は、さらに、従来技術の方法を使用して組み合わせて符号化されたデルタ値の値冗長性を利用するように構成されたシステム、方法、及びデバイスをどのように考案するかの問題に対処する。

浮動小数点値に適用される不可逆圧縮技法のファミリーにおいて、目標は、切り捨てによって最下位ビットを無視することによって、高い圧縮度（又は比と呼ばれることもある）を達成することである。例えば、仮数のｎ個の最下位ビットを無視することができる。切り捨ての効果は、仮数における残りのビットの情報エントロピーが実質的に減少し、浮動小数点値のサイズを効果的に低減するために、デルタ圧縮又は既存の圧縮技法の任意の他のファミリーを使用可能にすることである。残念ながら、切り捨ては、高い誤差率を招く可能性がある。本発明は、最終的に、浮動小数点数における仮数の無視されるｎ個の最下位ビットをどのように表すかを選択することによって、浮動小数点値に対する高い圧縮比及び実質的に低い誤差率を維持するように構成されたシステム、方法及びデバイスをどのように考案するかの問題に対処する。

本発明の第一の態様は、各データブロックが複数のデータ値を含む複数のデータブロックを取得するステップを含むデータ圧縮方法である。本方法は、取得された複数のデータブロックのベースデルタ符号化を実行するステップを含み、デルタ値はデータ値とベース値との間の差を意味し、この実行するステップは、最初に、複数のデータブロックのデータ値の中で、前記複数のデータブロックに共通のセットのグローバルベース値を決定することによって行われる。セットのグローバルベース値は、セットのグローバルベース値におけるグローバルベース値に対して、複数のデータブロックのデータ値のデルタ値を最小にするように選択される。次いで、方法は、複数のデータブロックの個々のデータ値を符号化するステップを含み、この符号化するステップは、セットのグローバルベース値において、個々のデータ値ごとに、個々のデータ値に数値的に最も近く、したがって最小のデルタ値をもたらす１つのグローバルベース値を選択するステップと、符号化された個々のデータ値のために、選択された１つのグローバルベース値及び結果として生じるデルタ値を表すメタデータを生成するステップとによって行われる。

本発明の第二の態様は、取得された、複数のデータブロックのベースデルタ符号化を実行するためのデータ圧縮デバイスであり、各データブロックは複数のデータ値を含み、デルタ値は、データ値とベース値との間の差を意味する。データ圧縮デバイスは、複数のデータブロックのデータ値の中から、複数のデータブロックに共通のセットのグローバルベース値を決定するように構成されたアナライザユニットを備える。セットのグローバルベース値は、セットのグローバルベース値におけるグローバルベース値に対して複数のデータブロックのデータ値のデルタ値を最小にするように選択される。データ圧縮デバイスは、複数のデータブロックの個々のデータ値の符号化を、セットのグローバルベース値において、個々のデータ値ごとに、個々のデータ値に数値的に最も近く、したがって最小のデルタ値をもたらす１つのグローバルベース値を選択することと、符号化された個々のデータ値のために、選択された１つのグローバルベース値及び結果として生じるデルタ値を表すメタデータを生成することによって行うように構成されたエンコーダユニットをさらに備える。

本発明の第三の態様は、データ解凍方法であり、この方法は、本発明の第一の態様によるデータ圧縮方法によって生成されたメタデータを取得するステップと、取得されたメタデータによって表されるグローバルベース値及びデルタ値から、各データブロックが複数のデータ値を含む複数のデータブロックを再構築するステップとを含む。

本発明の第四の態様は、デコーダユニットを備えるデータ解凍デバイスであり、デコーダユニットは、本発明の第二の態様によるデータ圧縮デバイスによって生成されたメタデータを取得し、取得されたメタデータによって表されるグローバルベース値及びデルタ値から、各データブロックが複数のデータ値を含む複数のデータブロックを再構築するように構成される。

本発明の第五の態様は、１つ以上のメモリと、本発明の第二の態様によるデータ圧縮デバイスと、本発明の第四の態様によるデータ解凍デバイスとを備えるシステムである。

本発明の第六の態様は、処理デバイスによってロードされ実行されると、本発明の第一の態様による方法を実行させるコード命令を含むコンピュータプログラム製品である。代替又は追加として、本発明の第六の態様は、その上に格納されたコード命令を含むコンピュータプログラムを含むコンピュータ可読ストレージ媒体として見ることができ、コード命令は、処理デバイスによってロードされ実行されると、本発明の第一の態様による方法を実行させる。

本発明の第七の態様は、処理デバイスによってロードされ実行されると、本発明の第三の態様による方法を実行させるコード命令を含むコンピュータプログラム製品である。代替又は追加として、本発明の第七の態様は、その上に格納されたコード命令を含むコンピュータプログラムを含むコンピュータ可読ストレージ媒体として見ることができ、コード命令は、処理デバイスによってロードされ実行されると、本発明の第三の態様による方法を実行させる。

本発明のさらなる態様は、コンピュータメモリ圧縮方法である。本方法は、ベース値のセットを選択することに関して、コンピュータメモリコンテンツを分析するステップを含む。本方法は、データブロック内の各値についてデルタ値を最小化するベース値をピッキングするベース値のセットに関して、デルタ値によって全てのデータブロック内の値を表現することによって、前記コンピュータメモリコンテンツを符号化するステップも含む。本方法は、ハフマン符号化又は算術符号化等の従来技術から知られている任意のエントロピーベース又は重複排除ベースの圧縮方法を使用して、デルタ値の間の値冗長性をどのように利用するかをさらに含んでもよい。さらに、確立されたベース値のセットを使用してデルタ符号化で圧縮されたデータ値を解凍するための方法が提示され、この方法では、デルタ値は、エントロピーベース又は重複排除ベースの圧縮方法を使用して符号化される。

本発明の別の態様は、コンピュータメモリ圧縮デバイスである。デバイスは、各データブロックにおける任意のベース値を使用することと比較して、複数のデータブロックにおけるデルタ値のサイズを低減するためにベース値のセットを選択するように構成されたアナライザユニットを備える。デバイスは、また、複数のデータブロックに共通の選択されたベース値のセットを使用して、前記コンピュータメモリコンテンツを符号化して、各値のデルタ値を確立するように構成されたエンコーダユニットも備える。エンコーダユニットは、符号化されたコンピュータメモリコンテンツのデータ値を表すメタデータと、データ値を解凍するように構成されたデバイスとを提供するように、さらに構成される。エンコーダユニットは、また、ハフマン符号化又は算術符号化又は重複排除ベース等の従来技術から知られている任意のエントロピーベースの圧縮方法を使用して、よりコンパクトにデルタ値を符号化するように構成され、デバイスは、確立されたベース値のセットを使用して、デルタ符号化で圧縮されたデータ値を解凍するように構成され、デルタ値は、エントロピーベース又は重複排除ベースの圧縮方法を使用して符号化される。

開示される実施形態の他の態様と、目的、特徴、及び利点については、以下の詳細な特許開示、添付の従属請求項、及び図面から明らかになるであろう。

一般に、請求項で使用される全ての用語は、本明細書で別様に明示的に定義されない限り、当技術分野におけるそれらの通常の意味に従って解釈されるべきである。「１つの／その［要素、デバイス、構成要素、手段、ステップ等］」への全ての言及は、特に明示的に述べられていない限り、要素、デバイス、構成要素、手段、ステップ等の少なくとも１つの事例を指すものとしてオープンに解釈されるべきである。本明細書に開示される任意の方法のステップは、明示的に述べられていない限り、開示される正確な順序で行われる必要はない。

例示的なコンピュータシステムであって、１つ以上の処理ユニットを有するマイクロプロセッサチップと、３つのレベルの例示的なキャッシュ階層と、１つ以上のオフチップメモリに接続された１つ以上のメモリコントローラとを備えるものを示す。図１におけるような例示的なコンピュータシステムであって、メモリ内のデータ及び命令を圧縮するように構成されたものを示す。データブロックのセットと、その中に値を備える例示的なメモリページを示す。複数のデータブロック内の値の間でグローバル値を確立するように構成されたアナライザを示す。複数のデータブロック内のデータ値の間でグローバルベース値を確立する方法を示す。セットのグローバルベース値を使用してデータブロックを圧縮する方法を示す。セットのグローバルベース値を使用してデータブロックを圧縮するように構成されたエンコーダを示す。グローバルベース値を有する値を符号化するためのメタデータフォーマットを示す。セットのグローバルベース値を使用してデータブロックを解凍する方法を示す。セットのグローバルベース値を使用してデータブロックを解凍するように構成されたデバイスを示す。エントロピーベースの符号化を使用してデルタ値をコンパクトに符号化する方法を示す。エントロピーベースの符号化を使用してデルタ値を符号化するように構成されたデバイスを示す。グローバルベース値を使用するエントロピーベース符号化デルタ値のメタデータフォーマットを示す。エントロピーベースの符号化を使用してデルタ値を復号する方法を示す。エントロピーベースの符号化を使用してデルタ値を復号するように構成されたデバイスを示す。データ値の先頭の０又は１をランレングス符号化するためのメタデータフォーマットを示す。ビットプレーン変換を適用することによって複数のデータ値における先頭の０又は１をランレングス符号化するための手順を示す。精度を高めるために複数の最下位仮数ビットを最も共通のシンボルで置き換えるための手順を示す。デルタ値の差の最上位ビットのインデックスを表すように構成されたデバイスを示す。最小デルタ値のベース値を有効にし、その値を符号化するように構成されたデバイスを示す。図１３に示すメタデータフォーマットの改良としてグローバルベース値を使用するエントロピーベース符号化デルタ値のメタデータフォーマットを示し、エントロピーベース符号化又は重複排除のいずれかがベースポインタインデックス値に別々に適用されている。本発明によるデータ圧縮方法を示す。本発明によるデータ圧縮デバイスを示す。本発明によるシステムを示す。デルタ値の上限を有するセットのグローバルベース値を使用してデータブロックを圧縮する方法を示す。デルタ値の上限を有するセットのグローバルベース値を使用してデータブロックを符号化するように構成されたデバイスを示す。全てのデータワードが同じである場合に、前記ワードをベースとして使用してデータブロックを圧縮する方法を示す。全てのデータワードが同じである場合を含む異なる符号化を含む符号化を表すためのメタデータフォーマットを示す。全てのデータワードが同じである場合に、前記ワードをベースとして使用してデータブロックを符号化するように構成されたデバイスを示す。全てのデータワードが同じである場合に、データブロックを解凍するように構成されたデバイスを示す。ベース値のエントロピーベース符号化を使用してデータブロックを圧縮する方法を示す。

本文書は、コンピュータメモリ内のデータを圧縮するためのシステム、方法、デバイス、及びコンピュータプログラム製品を開示し、これらは、グローバルベース値を識別し、エントロピーベースの符号化を使用してデルタ値をコンパクトに格納することによって、コンピュータメモリ内の値をコンパクトに符号化するために値類似性を利用する圧縮アプローチのファミリーを用いる。

コンピュータシステム１００の例示的な実施形態を図１に示す。このシステムは、マイクロプロセッサチップ１１０と、Ｍ１１５１、Ｍ２１５２からＭＫ１５３で示される１つ以上のメモリモジュールと、を備える。マイクロプロセッサチップは、離散システムであっても、あるいは任意の利用可能な技術においてシステムオンチップ（ＳｏＣ）上に統合されてもよい。マイクロプロセッサ１１０は、ＣＰＵ又はコアと呼ばれることもあるＰ_１１３１、Ｐ_２１３２からＰ_Ｎ１３３で示される１つ又は複数の処理ユニットと、メモリ階層と、を備える。一方、メモリ階層は、複数のキャッシュレベル、例えば、図１に例示的に示され、Ｃ１、Ｃ２、及びＣ３と示されるような３つのレベルを備える。これらのレベルは、同じ又は異なるメモリ技術、例えば、ＳＲＡＭ、ＤＲＡＭ、又は、任意のタイプの不揮発性技術、例えば、位相変更メモリ（ＰＣＭ）を含む技術で実装することができる。キャッシュレベルの数は、異なる実施形態において変化してもよく、例示的な実施形態１００は、３つのレベルを示し、その最後のキャッシュレベルがＣ３１２０である。これらのレベルは、何らかの種類の相互接続手段（例えば、バス又は任意の他の相互接続ネットワーク）を使用して接続される。例示的実施形態では、レベルＣ１及びＣ２は、Ｐ_ｉ（例えば、図１のＰ_１）と表されるそれぞれの処理ユニットｉにプライベートであり、それによってのみアクセス可能である。代替実施形態は、任意の数のプライベートキャッシュレベルを有することができること、又は代替として、全てのキャッシュレベルが、図１の第三のレベルＣ３１２０によって図示されるように共有されることは、当業者に周知である。キャッシュ階層におけるデータの包含に関して、任意の実施形態が可能であり、当業者によって理解され得る。例えば、Ｃ１をＣ２に含むことができるが、Ｃ２は、レベルＣ３に関して非包括的であり得る。当業者は、代替実施形態を理解することができる。図１のコンピュータシステム１００は、ＭＣＴＲＬ１１４１、ＭＣＴＲＬ２１４２、及びＭＣＴＲＬＬ１４３と表される１つ又は複数のメモリコントローラを備える。最後のキャッシュレベル（図１のＣ３）は、メモリコントローラに接続され、次いで、メモリコントローラは、１つ又は複数のメモリモジュールに接続される。メモリコントローラは、マイクロプロセッサチップ１１０上に集積することも、あるいはマイクロプロセッサチップの外部に実装することもできる。最後に、コンピュータシステムは、１つ以上のタスクを実行する。タスクは、特定のシステム上で実行することができる任意のソフトウェアアプリケーション又はその一部とすることができる。

図１の実施形態によって例示されるようなコンピュータシステムは、レベル（例えば、図１のＣ１、Ｃ２、及びＣ３）にかかわらず、Ｍ１１５１～ＭＫ１５３と表されるメモリ及びキャッシュメモリの容量が限られていることに悩まされることがある。キャッシュ容量が限られているので、メモリ階層内の次のレベルでサービスされなければならないメモリ要求の割合が高くなる可能性があり、性能の低下やエネルギー消費の増加を招く。この問題を軽減するために、キャッシュ容量を増やすことが考えられ、それによって、メモリ階層の次のレベルによってサービスされる必要がある要求の数を減らすことができる。マイクロプロセッサチップ上のキャッシュレベルの容量を増加させると、いくつかの問題を招くことになる。第一に、キャッシュアクセス要求時間が長くなり、性能低下につながる可能性がある。第二に、より大きいキャッシュへのアクセス要求において消費されるエネルギーは、潜在的により高い可能性がある。第三に、より大きなキャッシュレベルを実現するために、マイクロプロセッサチップ上でより多くのシリコン又は同等の材料を使用することは、処理能力の低下と引き換えにする必要があり得る。したがって、上記で特定された問題なしに、キャッシュ容量を増やすことが望ましい。メモリ容量が限られていると、同様の問題があり、メモリ階層のストレージレベルとして典型的に実現されるメモリ階層の次のレベルでサービスされなければならないメモリ要求が高くなり得る。そのようなストレージレベルアクセスは、より遅く、かなりの性能低下とエネルギー消費をもたらすことになる。メモリ容量が増加すると、これらの欠点を軽減することができる。しかしながら、メモリ容量が増加すると、コンポーネントレベルでも、あるいはエネルギー消費の意味合いでもコンピュータシステムのコストを増加させる可能性がある。さらに、メモリが多いと、より多くの空間を消費することになり、これは、特に、例えば、モバイルコンピュータ（例えば、タブレット、スマートフォン、ウェアラブル、及びインターネットに接続された小型コンピュータ化デバイス）を含むフォームファクタ制約製品におけるコンピュータシステムの有用性を制限し得る。

本特許開示は、前述の例示的なメモリ階層圧縮のどのレベルで適用されるかが異なるいくつかの実施形態を考慮する。第一の実施形態は、メインメモリにおいて適用される本発明の圧縮方法を考慮する。しかしながら、他の実施形態も、当業者によって理解され得る。そのような実施形態も、本特許開示に明示的に包含されなくても、企図されることが意図されている。

第一の開示される実施形態に関して、メインメモリ容量が限られていることの問題を考慮する場合、図１の例示的なシステムは、データ及び命令がメインメモリ内で圧縮できるように構成することができる。図２は、そのようなコンピュータシステム２００の一例を示す。追加されたものは、マイクロプロセッサチップ２１０上のコンピュータメモリ圧縮デバイス２０５である。コンピュータメモリ圧縮デバイス２０５は、４つの機能ブロックを備える。これらのブロックは、ロケータ（アドレス変換）ユニット２１１と、エンコーダ（コンプレッサ）ユニット２１２と、デコーダ（デコンプレッサ）ユニット２１３と、アナライザユニット２１４とを備える。

以下により詳細に説明するように、アナライザユニット２１４は、コンピュータメモリ内のデータのメモリオブジェクト、例えば、複数のデータブロックを含むページ内の複数のデータブロック内のデータ値をコンパクトに符号化するためのグローバルベース値を確立することに関して、コンピュータメモリコンテンツを分析するように構成される。これらの点に関して、データ値は、典型的には、メモリオブジェクトよりも細かい粒度であり、メモリオブジェクトは、典型的には、コンピュータメモリコンテンツ全体よりも細かい粒度である。メモリオブジェクトは、典型的には、複数のデータブロックを含んでもよく、データブロックは、典型的には、整数若しくは浮動小数点値又は任意の他のタイプのメモリワード（別名、データワード）等の複数のデータ値を含んでもよい。

エンコーダユニット２１２は、グローバルベースのセットに関してデルタ値を作成することによってメモリオブジェクトの全てのデータブロックを符号化するように、また任意選択で、エントロピーベースの圧縮方法を使用してデルタ値を符号化するように構成される。エンコーダユニット２１２は、符号化されたコンピュータメモリコンテンツのメモリオブジェクトのデータブロックを表すメタデータを提供するように、さらに構成される。メタデータは、データ値ごとに使用されたグローバルベース値への参照によってデルタ値がどのように符号化されたかを反映する。そのようなメタデータの例は、例えば、図８のボックス８６０及び８７０に見られる。ロケータユニット２１１は、メタデータを使用して、符号化されたコンピュータメモリコンテンツ内のメモリオブジェクトの位置を特定するように構成される。

コンピュータメモリ圧縮デバイス２０５は、一方の側のメモリコントローラ及び他方の側の最終レベルキャッシュＣ３に接続される。アドレス変換ユニット２１１の目的は、従来の物理アドレスＰＡを圧縮アドレスＣＡに変換し、圧縮メモリにメモリブロックを配置することである。当業者は、そのようなアドレス変換が必要とされるのは、従来のメモリページ（例えば、４ＫＢ）が、圧縮メモリ内の従来のメモリページのサイズよりも小さい任意のサイズに圧縮され得るためであることを認識する。エンコーダ（コンプレッサ）ユニット２１２の目的は、修正され、最終レベルキャッシュから追い出されたメモリブロックを圧縮することである。メモリシステムの性能への影響を無視できるようにするために、圧縮は高速でなければならず、典型的には専用の圧縮器ユニットによって加速される。同様に、メモリブロックがプロセッサによって要求され、キャッシュレベル、例えば、例示的な実施形態ではＣ１、Ｃ２及びＣ３のいずれにおいても利用可能でないとき、そのメモリブロックは、メモリから要求されなければならない。アドレス変換ユニット２１１は、ブロックの位置を特定するが、ブロックがキャッシュ階層、例えば、Ｃ１にインストールされる前に、ブロックを解凍しなければならない。デコンプレッサユニット２１３の目的は、メモリシステムの性能への影響を無視できるようにするために、このプロセスを加速することである。

（グローバルベース値を選択するためのメモリコンテンツの分析）
図３は、メモリの一部分と、そこに含まれる値との例示的なスナップショットを示す。３１０は、６つの例示的なデータブロックＢＬ１、ＢＬ２、…、ＢＬ６（３１１、３１２、…、３１６）と、それらが含む値とを示す。例えば、データブロック３１１（ＢＬ１）は、値１００、１０２、２０５、及び２０８を含むのに対し、データブロック３１３（ＢＬ３）は、値２０５、２０８、１００、及び１０２を含む。３２０は、３１０の例示的なデータブロックに含まれる各値の頻度のヒストグラムを示し、出現する値が列３２１に、出現する回数、すなわち、頻度が列３２２にある。値２００は、ＢＬ２３１２、ＢＬ４３１４及びＢＬ５３１５で３回出現するのに対し、値４００は、ＢＬ６３１６で１回しか出現しないことが分かる。

図４は、メモリの一部分、例えば、ページ内の各値又は値のサブセットの頻度のヒストグラムを確立するように構成されたデバイス４２０を示す。これは、図２のアナライザ２１４の一部とすることができる。デバイス４２０は、値タグアレイ４２１と、値頻度アレイ４２５とを備える。メモリの部分で、各値の出現頻度に関して解析されるべき部分をスキャンすることができる。これは、例えば、その部分の位置の全て又はサブセットから読み出すプロセッサ、又はメモリの部分の全ての値の全て又はサブセットをスキャンするように構成されたデバイスを有することによって行うことができる。解析されるメモリの部分の各値は、メモリ値として表されるレジスタ４１０に入れることができる。レジスタは、この実施形態ではキャッシュとして編成されるデバイス４２０にインデックス付けするために使用することができる。

例示的なキャッシュ様構造は、Ｎ個のエントリを含み、各エントリは、値タグアレイエントリ、例えば、４２３（ＶＴ２）及び値頻度アレイエントリ、例えば４２７（ＶＦ２）を含む。当業者は、キャッシュが直接マッピングされるように構成され得ること、すなわち、メモリ値レジスタ４１０に含まれるメモリ値とデバイス４２０内のエントリとの間に１対１の対応があることを認識する。

あるいは、キャッシュは、セットアソシアティブであるように構成することができ、すなわち、メモリ値レジスタ４１０に含まれるメモリ値とデバイス４２０内のエントリとの間に１対多の対応関係がある。それにもかかわらず、レジスタ４１０に含まれるメモリ値は、デバイス４２０にインデックス付けすることができる。レジスタ４１０のメモリ値のタグビットが、ダイレクトマップ構成（ｄｉｒｅｃｔ－ｍａｐｐｅｄｃｏｎｆｉｇｕｒａｔｉｏｎ）の場合は１と一致すれば、あるいはセットアソシアティブ構成（ｓｅｔ－ａｓｓｏｃｉａｔｉｖｅｃｏｎｆｉｇｕｒａｔｉｏｎ）の場合は４２０のいずれかのエントリと一致すれば、４２０にヒットがある。ヒットがある場合、対応する値頻度アレイエントリがインクリメントされる。例として、エントリ４２３（ＶＴ２）がレジスタ４１０のメモリ値と一致すると仮定する。次に、４２７（ＶＦ２）が選択される。ＶＦ２が１５を含む場合、それは１６にインクリメントされる。レジスタ４１０のメモリ値がデバイス４２０に含まれない場合、エントリが作成されなければならない。ダイレクトマップ構成の場合、選択されたエントリに存在する値を置換する。セットアソシアティブ構成の場合、複数のエントリが存在することができ、その中から選択して置換する。当業者であれば、多くの置換ポリシーの中から、例えば、ＬＲＵ（Ｌｅａｓｔ－Ｒｅｃｅｎｔｌｙ－Ｕｓｅｄ）又はＦＩＦＯ（Ｆｉｒｓｔ－Ｉｎ－Ｆｉｒｓｔ－Ｏｕｔ）を選択できることを認識しているが、このデバイスに特有なものは、最低頻度値と呼ばれる開示されたポリシーであり、すなわち、値頻度アレイ４２５内の最低カウントを有するエントリが置換のために選択される。

メモリの部分内の全ての意図された値がスキャンされたとき、デバイス４２０は、図３の値－頻度ヒストグラム３２０の推定を含む。一実施形態では、デバイス４２０は、個々のエントリ、例えば、エントリ４２６（ＶＦ１）と併せてエントリ４２２（ＶＴ１）が、メモリにアクセスするコンピュータ命令によって、すなわち、命令をロードして、格納するコンピュータ命令によって読み取られ得るように構成される。これにより、コンテンツをデバイス４２０からメモリ４３０に移動できる可能性が広がる。図２に見られるように、デバイス４２０は、アナライザ２１４の一部とすることができ、アナライザ２１４は、メモリコントローラ１４１（ＭＣＴＲＬ１）、１４２（ＭＣＴＲＬ２）又は１４３（ＭＣＴＲＬ３）を介してメモリデバイス１５１（Ｍ１）、１５２（Ｍ２）又は１５３（Ｍ３）のいずれかに接続される。

ここで、デバイス４２０によって確立された値－頻度ヒストグラムが、分析されたメモリオブジェクト、例えばページと呼ばれるメモリの部分に含まれる値の全てのデルタ値を最小化するために、いくつかのベース値を選択するためにどのように使用され得るかを説明する。

図５は、複数のデータブロック内のデータ値の間で、グローバルベース値を確立する方法を示す。選択するベース値の数をＢであると仮定する。採用されるアプローチは、最初に、メモリオブジェクト内で出現する値の範囲をＮ個の固定サイズのビンに分割することである。例として、値が１，２，…，１００の範囲であると仮定する。４つのビンが選択される場合、範囲は、４つのビン：１，２，…，２５と、２６，２７，…，５０と、５１，５２，…，７５と、７６，７７，…，１００とに分割される。

方法５２０の第一のステップは、値をそれらの頻度と共に最低値から最高値にソートすることである。第二のステップ５３０は、いくつのビンＮ及びいくつのグローバルベース値Ｂを考慮するかを確立することである。ベース値の数を適度に低い数に保つために、Ｂは、Ｎ以下である。例として、Ｎは４であるように選択され得、Ｂは４であるように選択され得、ビン当たり最大１つのグローバルベース値をもたらす。この例では、ボックス５３０で述べる、最大のＮ（ＭａｘＮ）が４であり、最大のＢがＮである場合、（Ｎ，Ｂ）と示されるＮとＢの全ての可能な組合せが考慮されるべきであり、すなわち、（Ｎ，Ｂ）＝（１，１）、（２，１）、（２，２）、（３，１）、（３，２）、（３，３）、（４，１）、（４，２）、（４，３）、（４，４）が考慮される。第二のステップ５３０は、全てのこれらの組合せが考慮されることを保証する。

第三のステップ５４０は、複数の組合せ（Ｎ，Ｂ）のうちの１つを考慮し、各ビンにおけるグローバルベース値を確立する。当業者は、先行技術から公知のクラスタリング方法、例えば、ｋ平均クラスタリング（ｋ－ｍｅａｎｓｃｌｕｓｔｅｒｉｎｇ）を選択するであろう。しかしながら、ｋ平均は、クラスタ内の全ての値までの距離を最小化するグローバル値を選択する。これは、必ずしも圧縮比を最大化するわけではない。これを実現するために、３つの値：１、１及び７のクラスタを考える。ｋ平均は、ベース値を平均値（１＋１＋７）／３＝３として選択する。ベース値と最初の２つの値との間の距離は２であり、バイナリ表記で符号化するために２ビットを必要とするが、ベース値と最後の値との間の距離は、４であり、３ビットを必要とする。したがって、合計で２＋２＋３＝７ビットが必要とされる。同じである最初の２つの値がベース値としてピッキングされる場合、それらまでの距離は、ゼロであり、第三の値までの距離は、６であり、３ビットしか必要としない。ベース値として値の１つを選択することによって、圧縮比は、前記ベース値として値の平均を選択するよりも高くなる。

したがって、方法の第三のステップ５４０は、まず、値の範囲をＮ個のビンに分割する。Ｂ≦ＮであるＢ個のグローバルベース値では、最も高い累積値頻度を有するＢ個のビンのそれぞれに、ベース値が割り当てられる。前記Ｂ個のビンのそれぞれにおいて、ベース値は、そのビンにおける最高頻度の値を割り当てられる。第四のステップ５５０は、後述する図６の方法に従ってデルタ値を確立するために、最も近いベース値を使用することによってメモリオブジェクト内の全てのデータ値を圧縮する。圧縮比、すなわち、圧縮メモリオブジェクトのサイズに対する非圧縮メモリオブジェクトのサイズの比が確立され、記録される。

第五のステップ５６０では、考慮すべきビンの数Ｎとグローバルベース値の数Ｂとのさらなる組合せがあるかどうかを決定する。さらなる組合せがある場合、次のステップは、プロセス５３０の第二のステップに戻ることになる。さらなる組合せがない場合、第六のステップ５７０は、最も高い圧縮比をもたらすＮ個のビンとＢ個のグローバルベース値との組合せをピッキングし、プロセスは５８０で終了する。

（グローバルベース値を使用するメモリコンテンツの圧縮及び解凍）
ここで、例えば、図５に関連して説明した方法を用いて確立されたセットのグローバルベース値を用いてデータブロックを圧縮する方法を考える。プロセスは、６１０で開始する。この目的のために、図６に示される方法は、第一のステップ６２０で、メモリオブジェクト、例えば、ページ、又はデータブロックにおける複数のデータ要素と、第一の値を考慮することによって表す値とを考慮する。

グローバルベース値は、グローバルベース値テーブルと呼ばれるテーブルに格納されると仮定される。前記テーブル内の各エントリは、インデックスに関連付けられる。例えば、前記テーブルがＮ個のエントリを有する場合、インデックスは、ｌｏｇ_２Ｎビットによって表すことができる。本方法の第二のステップ６３０は、選択された値をグローバルベース値テーブル内のグローバルベース値の全てと比較し、前記データ値に数値的に最も近いベース値、すなわち、前記ベース値と前記データ値との間の差（デルタ値として示される差）が最も小さいベース値を選択する。

前記データ値は、図８に開示された方法でデータ値を符号化するためにメタデータによって示されるベース値インデックス及びデルタ値によって符号化される。データ値が圧縮される場合（８６０）及び圧縮されない場合（８７０）に対応する２つのメタデータフォーマット８６０及び８７０が存在する。ボックス８６０のように圧縮されたブロックを考慮すると、第一のフィールド８１０は、データ値が圧縮されることを示す単一のビットＣである。フィールド８２０は、グローバルベース値テーブル内のグローバルベース値を選択するために使用されるベースポインタインデックスを含む。第三のフィールド８２５（符号）は、次のフィールドが非負であるか否かを含む単一のビットである。最後に、デルタ値で示される８３０は、デルタ値を含む。明示的な符号ビットを有することによって、デルタ値が非負である場合、又は負である場合に、デルタ値をベース値からの距離として解釈することが可能になる。これにより、後述の提案されるデバイスが簡素化される。

データ値が圧縮されていない場合、メタデータフォーマット８７０が使用される。全てのデータを圧縮することができるが、デルタ値が予め設定された閾値未満である場合にのみデータを圧縮する実施形態も検討する。そうでない場合、Ｃ８４０はクリアされ、第二のフィールド８５０は非圧縮データ値を含む。そうでない場合、Ｃ８４０が設定される。

図６及び第四のステップ６５０に戻ると、メモリオブジェクト又はデータブロック内に考慮すべきデータ値がさらにある場合、次の値が考慮され、第二のステップ６３０が選択される。考慮すべきデータ値がそれ以上ない場合、方法は、ステップ６６０で終了する。

図６に示す方法の実施形態では、データ値は、常に、最も近いベース値を考慮することによって、デルタ値によって符号化される。しかしながら、大きすぎるデルタ値を許容すると、データ値のうちのいくつかが全く圧縮されなかった場合よりも、圧縮比が低くなることがある。代替実施形態では、上限デルタ値ＵＢと表記されるデルタ値に境界を置き、対応するデルタ値が前記上限デルタ値以下である場合にのみ値を圧縮することができる。圧縮されていない値は、それらのデルタ値が上限デルタ値よりも大きいので、外れ値（ｏｕｔｌｉｅｒｖａｌｕｅｓ）と呼ばれる。

図２５は、各ベース値に関連する最大デルタ値（以下、ＭＤと示す）の存在下でデルタ値を選択するための方法を示す。上限デルタ値ＵＢは、最大デルタ値ＭＤ以下の閾値である。有利には、最大デルタ値（ｔｈｅｍａｘｉｍｕｍｄｅｌｔａｖａｌｕｅ）ＭＤは、ｎビットを有する最も大きな二進数（ｔｈｅｌａｒｇｅｓｔｂｉｎａｒｙｎｕｍｂｅｒ）によって定義され、ｎ＝ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅ－ｌｏｇ２（Ｂ）である。ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅパラメータは、所与の目標圧縮比から生じる符号化されたデータ値のビットで表される最小サイズである。Ｂは、セットのグローバルベース値におけるベース値の数である。例えば、目標圧縮比が２であり、３２ビットのデータ値を有する場合、ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅは１６ビットになる。例として、Ｂが１２８である場合、１６－ｌｏｇ_２１２８＝９ビットを使用し、ＭＤ＝２^９－１＝５１１となる。目標圧縮比が１．５であり、依然として３２ビットのデータ値を有する場合、ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅは２１ビットとなる。目標圧縮比が２であるが、データ値が６４ビット値である場合、ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅは３２ビットとなる。これらは、当業者が理解するように、単なる非限定的な例であり、最大デルタ値ＭＤを定義する他の方法も可能である。

図２５に示す方法２５００は、２５１０で開始し、例えば、ベース値のセット内の各ベース値について、図６に示す方法によりベース値のセットが確立されている２５２０と仮定する。そのベース値に関連する全てのデータ値は、ベースに関連する値のセットの中で最も大きなデルタ値（ｔｈｅｌａｒｇｅｓｔｄｅｌｔａｖａｌｕｅ）である上限デルタ値（ＵＢ）を確立する２５３０と見なされる。最大デルタ値であるＵＢがＭＤより大きい場合、ＵＢは、ＭＤに設定される２５４０。プロセスは、ベース値の各々に対して繰り返され２５５０、全てのベース値が考慮されたときに終了する２５６０。

各ベース値に対してＵＢを確立すると、データ値は、デルタ値がＵＢ以下である場合、その最も近いベース値に対するデルタとして符号化される。そうでない場合、データ値は、圧縮されない。

ここで、図６に関連して説明した方法に従って、セットのグローバルベース値を使用してデータブロックを圧縮するように構成されたエンコーダ７００を示す図７に注目する。例として、データブロック７１０に含まれる２つの値７１１（Ｖ０）及び７１２（Ｖ１）を考える。データ値を符号化するデバイス７００のこの例示的な実施形態は、それぞれＢ０、Ｂ１、Ｂ２及びＢ３に対応する４つのエントリ７２２，７２３，７２４及び７２５を有するグローバルベース値テーブル７２０を備える。グローバルベース値テーブル７２０は、グローバルベース値のうちの１つを目下の値に対して最小の差で選択するために、データ値７２１を格納するように構成される。

グローバルベース値テーブルは、さらに、任意のグローバルベース値エントリとデータ値７２１との間の差が確立され得るように構成される。一実施形態では、これは、グローバルベース値エントリとデータ値との間の減算を実行することによって、アソシアティブに並列に行うことができる。ベース値とデータ値との間の差は、レジスタ７３２，７３３，７３４及び７３５に格納され、データ値７２１とベース値エントリ７２２（Ｂ０）との間の差は、７３２（Ｄｉｆｆ）に格納され、データ値７２１とベース値エントリ７２４（Ｂ２）との間の差は、７３４（Ｄｉｆｆ）に格納される。図８のデルタ値フィールド８３０は、ベース値からの距離（非負又は負）として解釈されることに留意されたい。

図１９及び図２０に示すデバイスの残りは、複数の差を使用して最小の差を確立し、前記差に対応するベース値テーブルエントリを選択するように構成される。

ここで、図１９に注目する。差を格納する図７の複数のレジスタ７３０は、図１９の１９１０で再び示す。例示的実施形態では、各差レジスタ１９１１，１９１２，１９１３及び１９１４（Ｄｉｆｆ）は、Ｉ３、Ｉ２、Ｉ１、及びＩ０と表される４つのビットを備え、Ｉ０は、最下位ビットである。インデックスブロック１９２１，１９２２，１９２３及び１９２４の目的は、どの１つが差の最上位ビットであるか、すなわち、非ゼロである最上位ビットであるかを確立することである。差レジスタと同数のインデックスブロックがある。インデックスブロックの真理値表を１９３０に示す。例えば、１９３２における第三の入力ベクトル「０１ＸＸ」を考えると、Ｘは、任意のバイナリ値「０」又は「１」を表す。ここで、ビットＩ２は、最上位（非ゼロ）ビットであり、出力（Ｕ１，Ｕ０）＝（１，０）をもたらす。別の例として、第一のビットベクトル「０００１」において、Ｉ０は、最上位（非ゼロ）ビットであり、出力（Ｕ１，Ｕ０）＝（０，０）をもたらす。

ここで、最上位非ゼロビットのインデックス符号化は、別のブロック変換（ｂｌｏｃｋＣｏｎｖｅｒｔ）１９２５，１９２６，１９２７及び１９２８に供給される。変換の目的は、後述する最小の差の抽出に用いるビット列を作成することである。変換ブロックの真理値表をボックス１９４０に示す。これは、入力１９４１として、インデックスブロック（Ｕ１、Ｕ０）からの最上位ビットのインデックス符号化を有し、出力として、真理値表１９４２（入力）及び１９４３（出力）に従うビット列を有する。例えば、入力（１，０）について、出力（Ｘ３，Ｘ２，Ｘ１，Ｘ０）は、（０，１，１，１）である。一般に、インデックスによって指される最上位ビット及び全ての下位ビットは、「１」に設定される。

図２０は、データ値を符号化するために必要な追加の機能を示す。図１９の複数の変換機能ブロック１９２５，１９２６，１９２７及び１９２８は、図２０の２０１１、２０１２、２０１３、２０１４に再び描かれている。２０２０は、各変換ブロックに対して１つのレジスタを備え、変換ブロックからの出力を含むビット列を格納する。例として、レジスタ２０２２，２０２３，２０２４及びレジスタ２０２５は、ビット列「０１１１」、「０００１」、「１１１１」及び「００１１」を含む。２０２０の目的は、最も小さい最上位ビット、すなわち、最上位ビットから数えて「１」である第一のビットを有するビット列を確立することである。これは、論理ＡＮＤを列ごとに適用することによって確立することができる。例えば、全てのＸ３ビットに適用される論理積は、「０」をもたらすが、Ｘ０に適用される論理積は、「１」をもたらす。したがって、レジスタ２０２１は、列ごとの論理積演算を適用した後、最小の差に対応するビット列を含むことになる。

最後のステップは、レジスタ２０２１を使用して、最小の差又はデルタをもたらすベース値テーブルエントリを確立することである。これは、２０３０及び２０４０において行われる。２０３０は、２０２０で確立されたビット列に適用される複数の優先度エンコーダ２０３１，２０３２，２０３３，２０３４及び２０３５を備える。優先度エンコーダの出力は、差又はデルタ値における最上位ビットのビット位置のインデックスである。優先度エンコーダの代替として、１９２０のインデックスブロック、例えば、ブロック１９２１からの出力（Ｕ１，Ｕ０）を使用することができる。２０４０で、全てのインデックスがレジスタ２０２１のインデックスと並列に比較される。同じである１つのインデックスは、どのベース値エントリが最小の差をもたらすかを一意に確立し、そのエントリを取り出すためにイネーブル信号に変換することができる。これは、決定ボックス２０４１，２０４２，２０４３及び２０４４によって示される。対応するベース値エントリを可能にするベース値に対して同じ距離を示す複数のインデックスが存在し得る。次いで、ランダム選択に頼る最低又は最高のエントリ番号を選択することができる。

当業者は、データ値が任意のベース値と同じである場合、優先度デコーダが意味のあるインデックス値を出力することができないことを知っている。１つの解決策は、図１９のインデックスブロック１９２１，１９２２，１９２３及び１９２４への入力信号（Ｉ３、Ｉ２、Ｉ１、Ｉ０）に適用されるゼロ比較器によって、この場合を検出することである。次いで、前記ゼロ比較器の出力信号は、図２０の決定ボックス２０４１，２０４２，２０４３及び２０４４における決定を優先する。例えば、２０４１及び２０４２が最小インデックスとの一致を確立し、２０４３がゼロ比較一致を報告する場合、２０４３が勝利する。最後に、複数のエントリがゼロ比較を報告する場合、最高又は最低のエントリ番号を有する、又はランダム選択によるベース値レジスタが、１つのベース値レジスタを有効にする。

ここで、図２５に示す代替方法に戻ると、データ値は、最も近いベース値によって形成されるデルタ値が上限値以下である場合にのみ符号化される。図２６は、図２５に関連して説明した方法に従ってセットのグローバルベース値を使用してデータブロックを圧縮するように構成されたエンコーダ２６００を示す。これは、図６の方法に従ってデータ値を圧縮するように構成されたエンコーダから適合される。例として、データブロック２６１０に含まれる２つの値２６１１（Ｖ０）及び２６１２（Ｖ１）を考える。データ値を符号化するデバイス２６００のこの例示的な実施形態は、それぞれＢ０、Ｂ１、Ｂ２、及びＢ３に対応する４つのエントリ２６２２，２６２３，２６２４及び２６２５を有するグローバルベース値テーブル２６２０を備える。ベース値、それぞれＢ０～Ｂ３２６２２～２６５５だけを格納するのとは対照的に、図２５に示す方法によって確立されている各ベース値に関連する上限デルタ値も格納する。目下の値に対する最小の差を有するグローバルベース値のうちの１つ、及びその関連付けられた上限値を選択するために、グローバルベース値テーブル２６２０は、データ値２６２１を格納するように構成される。

グローバルベース値テーブルは、さらに、任意のグローバルベース値エントリとデータ値２６２１との間の差が確立され得るように構成される。一実施形態では、これは、グローバルベース値エントリとデータ値との間の減算を実行することによって、アソシアティブに並列に行うことができる。ベース値とデータ値との間の差は、レジスタ２６３２，２６３３，２６３４及び２６３５に格納され、データ値２６２１とベース値エントリ２６２２（Ｂ０）との間の差は、２６３２（Ｄｉｆｆ）に格納され、データ値２６２１とベース値エントリ２６２４（Ｂ２）との間の差は、２６３４（Ｄｉｆｆ）に格納される。図８のデルタ値フィールド８３０は、ベース値からの距離（非負又は負）として解釈されることに留意されたい。

前述の図１９及び図２０で説明されるデバイスの残りは、複数の差を使用して最小の差を確立し、前記差に対応するベース値テーブルエントリを選択するように構成される。図２６のデバイスは、最後のステップとして、差がベース値に関連する上限値以下である場合、確立されたベース値テーブルエントリ及び差を符号化のために使用する。これは、選択されたベース値に対応するベース値レジスタＢ０～Ｂ３２６２２～２６２５のいずれかから取り出すことができる。２６６０は、最終的に、確立された差を前記上限値と比較し、差が前記上限値以下である場合にのみ符号化を生成する。

ここで、図８のメタデータレイアウト８００に戻る。データ値が圧縮されない場合、Ｃビット８４０は、クリアされ、データ値は、圧縮されない８５０。

別の実施形態では、高スループットで値を符号化することが望ましい。この目的のために、例示的なパイプラインレジスタが機能ブロック間に配置され、そのようなパイプライン化されたデバイスの例を示すために破線７０１として表される。

代替実施形態では、デルタ値のサイズをさらに小さくすることができる。デルタ値のための固定量の空間、例えば、１６ビットを確保することが有利である。しかしながら、デルタ値が通常小さい場合、未使用ビットは、「０」（あるいは、２の補数表現では「１」）となる。図８のメタデータフォーマットに戻ると、開示される発明は、ベースポインタインデックス値をデルタ値と連結する。０（又は１）のストライク（ｓｔｒｉｋｅ）をよりコンパクトに符号化することによって、連結されたフィールドのサイズをさらに小さくすることができる。

一実施形態では、図８のデルタ値フィールド８３０は、最上位ビットから第一の非ゼロビットまでの０の数（あるいは、２の補数表現において、最上位ビットからゼロである最初のビットまでの１の数）をカウントすることによって符号化され得る。このような０又は１のストライクは、ランレングス符号化することができる。例えば、図１６は、１３ビットのデルタ値１６１１を示し、最上位１０ビットが、０であり、その後に１が続く。メタデータフォーマット１６２０は、ランレングス符号化が使用されることを示すためのコード１６２１（ＣＯＤＥ）と、それに続くゼロの数（バイナリ表記では１０１０）１６２２と、それに続く非ゼロ部分１６２３とを用いて、ランレングス符号化を使用してどのようにデルタ値が符号化されたかを示す。

代替実施形態では、複数の近傍値が多数の先行する０（又は１）を有する場合、最初に複数の値の最上位ビットを考慮し、次いで２番目の上位ビットを考慮すること等によって、０の数をランレングス符号化することができる。例えば、図１７は、４つの例示的な値１７１０，１７２０，１７３０及び１７４０を考慮する。第一の値の２０個の最上位ビット１７１０は、０であるが、第二の値１７２０、第三の値１７３０及び第四の値１７４０は、それぞれ１９、２１及び２１ビットの最上位ビットゼロを有する。

４つの例示的な値１７１０，１７２０，１７３０及び１７４０について、最上位ビットから始まり、次いで次の最上位ビットから始まる、複数の値にわたる列ごとのゼロのストライクを調べることによって、１９の最上位ビットはゼロである。前記ゼロをランレングス符号化することによって、複数のデルタ値をより効果的に圧縮することができる。これは、当業者によってビットプレーン圧縮として知られている。そのような方法及びデバイスと、本特許開示に開示される方法及びデバイスとの組合せもまた、検討される。

図１７は、また、ビットプレーン圧縮を、グローバルベースを用いる開示されたデルタ符号化方法と組み合わせるときのメタデータ１７５０のためのフォーマットの実施形態も示す。ここでは、４つの値の例示的なブロックのメタデータが示されている。サイズ１７５１は、任意のデルタ値の最も大きなサイズを示す。これは、例えば、ランレングス符号化を用いることによって、ブロック内の全ての値においてゼロである最上位ビットの数をカウントすることによって決定することができる。各個々の値に関連するベース値は、ＢＰ１１７５２、ＢＰ２１７５４、ＢＰ３１７５６及びＢＰ４１７５８において符号化される。最後に、各個々の値に関連するデルタ値は、Ｄ１１７５３、Ｄ２１７５５、Ｄ３１７５７及びＤ４１７５９において符号化される。他のメタデータフォーマットも可能であり、例えば、図８の例示的なメタデータフォーマットの実施形態で使用されるように、ブロックが圧縮されているか否かを符号化する専用ビットを有することも可能である。

企図しているのは、本開示におけるデルタ圧縮を含む任意の圧縮方法、エントロピーベースの圧縮、重複排除ベースの圧縮、又は当業者に知られている任意の圧縮方法を適用する前の準備ステップとして広く適用可能なシステム、方法、及びデバイスである。

一例として、データ値が浮動小数点数である場合を考える。浮動小数点数を考慮する不可逆圧縮技法のファミリーでは、仮数におけるエントロピーが低減され、より高い圧縮比を与えるので、仮数におけるＮ個の最下位ビットを無視することが有利であり得ることが当業者には知られている。先行技術から知られている方法及びそれを行うように構成された関連するデバイスは、単に切り捨てる、すなわち、Ｎ個全ての最下位ビットを０（又は同様に１）と見なす。Ｎ個のゼロビットの大部分が０（又は１）である場合、切り捨ては、小さな誤差をもたらす。しかしながら、切り捨ては、特にＮ個の最下位ビットの大部分が非ゼロである場合に、著しい誤差をもたらし得る。

例えば、図１８は、４つの浮動小数点値１８１０，１８２０，１８３０及び１８４０の仮数を示す。各仮数は、２４のビットを含む。Ｎが４に選択される場合、４つの最下位ビットの切り捨ては、ゼロになる。これは、４つの最下位ビットの大部分が１である仮数１８１０及び１８３０に対して、大きな誤差をもたらすことになる。

一実施形態は、Ｎ個の最下位ビットのゼロの数をカウントするように構成された方法及びデバイスを考慮する。ゼロが多数である場合、Ｎ個ビット全ては、ゼロとして表される。一方、非ゼロが多数である場合、Ｎ個のビット全ては、０として表される。最後に、結合が存在する場合、Ｎ個の最後のビットは、１又は０のいずれかとして符号化され得る。例えば、仮数１８１０及び１８３０の最下位ビットは、それぞれ「１」に設定された単一のビット１８５０及び１８７０によって表され、最下位ビットは、それぞれ「０」に設定された単一のビット１８６０及び１８８０によって表される。さらに、この技法を用いて、また、デルタ値をよりコンパクトに符号化するために、ランレングス符号化を適用する前述の技法と組み合わせた任意の実施形態を企図する。

ここで、差をセットのグローバルベース値に符号化することによって、圧縮されたデータブロックを解凍する方法に注目する。このような方法を図９に示す。この方法は、図８のメタデータを使用して符号化されたデータ値に適用される。データ値が圧縮される場合、メタデータフォーマット８６０が適用され、フィールド８１０は、ブロックがＣ＝１によって圧縮されることを指定し、フィールド８２０，８２５及び８３０は、それぞれ、ベースポインタインデックス、符号ビット、及びデルタ値を備える。他方、データ値が圧縮されない場合、メタデータフォーマット８７０が適用され、フィールド８４０は、データ値がＣ＝０によって圧縮されないことを指定し、フィールド８５０は、非圧縮データ値を含む。

図９に戻ると、プロセス９００の第一のステップ９２０は、図８のフィールド８１０及び８４０、Ｃを検査する。データ値が圧縮されていない場合、すなわちＣ＝０である場合、次のステップは、９３０となり、データ値は、図８のフィールド８５０から取り出すことができ、その後、プロセスは、９６０で終了する。データ値が圧縮される場合、プロセスの次のステップは、９４０である。ここで、グローバルベース値は、グローバルベース値テーブルにインデックス付けするために、図８のフィールド８２０を使用することによって取り出される。図９の次のステップ９４０において、グローバルベース値８２０は、データ値を復元するために、図８の符号ビット８２５を考慮してデルタ値８３０に加算される。当業者は、９００に描写されるプロセスが、メモリオブジェクト、例えば、ページ、又はデータブロック内に含まれる数のデータ値に対して繰り返され得ることを認識する。

図１０は、図９のプロセスに従ってセットのグローバルベース値を使用してデータブロックを解凍するように構成されたデバイスを示す。例示的なデバイス１０００は、入力として、図８のメタデータフィールドに従って複数の符号化を使用する。例示的なデバイスでは、図面１０００によれば、２つの符号化された値１０１１（Ｅ０）及び１０１２（Ｅ１）がある。ベースポインタインデックスフィールド８２０は、複数のグローバルベース値エントリのうちの１つを選択する。例示的なデバイス１０００では、４つのグローバルベース値エントリ１０２１（Ｂ０）、１０２２（Ｂ２）、１０２３（Ｂ３）、及び１０２４（Ｂ４）がある。エントリのうちの１つが選択され、そのエントリ内のグローバルベースポインタ値がベース値レジスタ１０３１にコピーされる。図８のデルタ値フィールド８３０は、デルタ値レジスタ１０３３にコピーされる。次に、デバイスは、ベース値１０３１をデルタ値１０３２に加算するように構成される。その和は、レジスタ１０３２にロードされ、そこで、元の値が取り出される。

別の実施形態では、高スループットで値を復号化することが望ましい。この目的のために、例示的なパイプラインレジスタが機能ブロック間に配置され、そのようなパイプライン化されたデバイスの例を示すために破線１００１として表される。

（エントロピーベースの符号化スキームを使用するデルタ値の圧縮及び解凍）
ここで、グローバルベースを使用するデルタ符号化よりも高い圧縮度を提供することができる実施形態に注目する。あるシナリオでは、複数のデータブロックは、全く同じ値を含むことがある。それらは、同じグローバルベース値を使用して符号化することができ、同じデルタ値を有することができる。しかしながら、異なるグローバルベース値を使用していても、依然として同じデルタ値を使用することができる。次の特許開示の目的は、出現頻度の高いデルタ値を、出現頻度の低いデルタ値よりも少ないビット数で符号化することである。

図１１は、エントロピーベースの符号化を使用してデルタ値をコンパクトに符号化することができる方法を示す。プロセスは、ボックス１１１０で開始する。図８に示すメタデータに従ってグローバルベース値を用いたデルタ符号化を使用して個々の値が符号化されているメモリオブジェクト又はデータブロックを考える。概して、本方法の目的は、メモリオブジェクト又はデータブロック内の複数の符号化値のデルタ値の頻度のヒストグラムを最初に確立することである。この目的のために、１１２０は、プロセスを開始し、第二のステップ１１３０で、第一のデルタ値の出現回数がインクリメントされる。このプロセスは、全てのデルタ値が考慮されていない限り、ステップ１１４０で、繰り返される。全てのデルタ値が考慮されると、プロセスは、ステップ１１５０に進み、そこで、目的は、デルタ値のエントロピーベースの符号化を確立することである。当業者は、ハフマン符号化及び算術符号化等の選択方法が複数あることを認識する。そのようなエントロピーベースの符号化技法に共通するのは、この場合はデルタ値であり得る各シンボルの相対頻度についてのヒストグラム情報を必要とすることである。

図１２は、図１１で説明した方法をサポートするために、エントロピーベースの符号化を使用してデルタ値を符号化するように構成されたデバイスを示す。図８のメタデータに従って、デルタ符号化された各データ値は、レジスタ１２１０（符号化メモリ値）にロードされる。コンピュータは、ロード及び格納命令を用いて、このレジスタにアクセスすることができると仮定する。図８のデルタ値フィールド８３０は、次に、抽出され、レジスタ１２２０にコピーされる。デバイス１２６０は、各デルタ値の頻度、すなわち出現回数をカウントするように構成された多くの実施形態のうちの１つである。レジスタ１２２０は、キャッシュとして編成されるデバイス１２６０にインデックスすることができる。例示的なキャッシュ様構造は、Ｎ個のエントリを含み、各エントリは、デルタ値タグアレイエントリ、例えば、１２３２（ＤＶＴ２）と、デルタ値頻度アレイエントリ、例えば、１２４２（ＤＶＦ２）とを含む。当業者は、キャッシュが直接マッピングされるように構成され得ること、すなわち、デルタ値レジスタ１２２０に含まれるメモリ（データ）値とデバイス１２６０内のエントリとの間に１対１の対応があることを認識する。

あるいは、キャッシュは、セットアソシアティブであるように構成することができ、すなわち、デルタ値レジスタ１２２０に含まれるメモリ（データ）値とデバイス１２６０内のエントリとの間に１対多の対応がある。いずれにせよ、レジスタ１２２０に含まれるデルタ値は、デバイス１２６０にインデックス付けする。１２６０において、レジスタ１２２０のメモリ値内のタグビットが１つ（ダイレクトマップ構成の場合）又は複数のエントリのうちの１つ（セットアソシアティブ構成の場合）に一致する場合、１２６０においてヒットがある。ヒットの場合、対応するデルタ値頻度アレイエントリがインクリメントされる。例として、エントリ１２３２（ＤＶＴ２）がレジスタ１２２０のデルタ値と一致すると仮定する。次に、１２４２（ＤＶＦ２）が選択される。ＤＶＦ２が１５を含む場合、それは、１６にインクリメントされる。レジスタ１２２０のデルタ値がデバイス１２６０に含まれない場合、エントリが作成されなければならない。

ダイレクトマップ構成の場合、選択されたエントリに存在する値を置換する。セットアソシアティブ構成の場合、複数のエントリが存在し、そこから選択して置換する。当業者であれば、多くのスキームの中から、例えば、ＬＲＵ（Ｌｅａｓｔ－Ｒｅｃｅｎｔｌｙ－Ｕｓｅｄ）又はＦＩＦＯ（Ｆｉｒｓｔ－Ｉｎ－Ｆｉｒｓｔ－Ｏｕｔ）置換スキームを選択できることを認識しているが、このデバイスに特有なものは、最低頻度デルタ値使用と呼ばれるポリシーであり、すなわち、デルタ値頻度アレイ１２４０内の最も低いカウントを有するエントリが選択される。

メモリオブジェクト内の全ての値がスキャンされたとき、デバイス１２６０は、デルタ値頻度の推定を含む。デバイス１２６０は、個々のエントリ、例えば、エントリ１２４１（ＤＶＦ１）と関連するエントリ１２３１（ＤＶＴ１）が、いわゆるロード命令を通じてコンピュータ命令によって読み取られ得るように構成することができる。これは、コンテンツをデバイス１２６０からメモリ１２５０に移動する可能性を開く。図２に見られるように、デバイス４２０は、メモリコントローラ１４１（ＭＣＴＲＬ１）、１４２（ＭＣＴＲＬ２）又は１４３（ＭＣＴＲＬ３）を介して、メモリデバイス１５１（Ｍ１）、１５２（Ｍ２）又は１５３（Ｍ３）のいずれかに接続されるアナライザ２１４の一部であり得る。

デルタ値頻度情報がメモリにコピーされると、それをさらに分析し、ハフマン符号化又は算術符号化等の従来技術から知られている任意のエントロピーベースの符号化スキームを使用して符号化を生成することができる。さらに、重複排除ベースの圧縮技法を適用することもできる。

図１３は、グローバルベース値を使用するエントロピーベース符号化デルタ値のメタデータを示す。メタデータ１３００は、２つのフォーマット１３６０及び１３７０があり、それぞれデータ値が圧縮されるときと圧縮されないときに、使用される。圧縮するかどうかは、デルタが事前設定された閾値よりも低いかどうかに基づいても、あるいは何らかの他の基準に従ってもよい。そのような方法及びデバイスも企図される。

データ値が圧縮される場合、第一のフィールド１３１０（Ｃ）は、１に設定される。次の３つのフィールド１３２０，１３２５及び１３３０は、図８のメタデータのように、ベースポインタインデックスを符号化する。フィールド１３２５は、単一のビットで符号化することができるデルタ値の符号ビットを符号化する。１３３０は、選択されたエントロピーベースの符号化スキームについてのデルタ値のエントロピーベースの符号化を含む。他方、圧縮されない場合、第一のフィールド１３４０（Ｃ）は、ゼロに設定される。次いで、フィールド１３５０は、非圧縮データを含む。

ここで、エントロピーベースの符号化を用いて符号化されたデルタ値を復号する方法に注目する。図１４は、エントロピーベースの符号化を使用してデルタ値を復号するための方法１４００を示す。プロセスは、ボックス１４１０で開始する。目的は、ボックス１４２０に示すように、１つ又は複数のデータブロック内の全ての符号化されたデルタ値を復号することである。第一のステップは、デルタ値が圧縮される場合、図１３のフィールド１３３０を抽出することである。次いで、符号化されたデルタ値は、ボックス１４３０で選択されたエントロピーベースの符号化スキームを使用して利用可能なコードと照合される。デルタ値が復号されると、グローバルベース値は、図１３のフィールド１３２０を使用して、グローバルベース値テーブルから取り出される。値が圧縮されない場合、ステップ１４３０で、何のアクションも行われない。符号化された値がさらにある限り、決定ボックス１４４０に示すように、このプロセスは、繰り返される。値がそれ以上ない場合、プロセスは、ボックス１４５０で終了する。

図１５は、図１４の方法に従ってエントロピーベースの符号化を使用してデルタ値を復号するように構成されたデバイス１５００を示す。例示的なデバイス１５００は、入力として、図１３のメタデータフィールドに従って符号化された複数の値を使用する。例示的なデバイスでは、図面１５００によれば、２つの符号化された値１５１１（Ｅ０）及び１５１２（Ｅ１）がある。デバイス１５２０は、デルタ値１５２１のエントロピーベースの符号化を抽出し、そうするように構成されたデバイス１５２２を使用して、選択されたエントロピーベースの符号化スキームに従ってデルタ値を復号するように構成される。デバイス１５２２は、当業者に一般によく知られているように、任意の適切なデコンプレッサによって実装され得る。例えば、国際公開第２０２０／１３０９２９号の図３及び図７にそれぞれ開示されるハフマンデコンプレッサ３００又は７００を参照し、その内容は、参照によりその全体が本明細書に組み込まれる。最終結果は、図８のメタデータフォーマットに従って、デルタ符号化されたデータ値になる。ベースポインタインデックスフィールド８２０は、複数のグローバルベース値エントリのうちの１つを選択する。例示的なデバイス１５００では、４つのグローバルベース値エントリ１５３１（Ｂ０）、１５３２（Ｂ２）、１５３３（Ｂ３）、及び１５３４（Ｂ４）がある。これらのエントリのうちの１つが選択され、そのエントリ内のグローバルベースポインタ値は、ベース値レジスタ１５４１にコピーされる。図８のデルタ値フィールド８３０は、デルタ値レジスタ１５４３にコピーされる。次に、デバイスは、ベース値１５４１をデルタ値１５４３に加算するように構成される。その和は、レジスタ１５４２にロードされ、そこで、元の値が取り出される。

別の実施形態では、高スループットで値を復号することが望ましい。この目的のために、例示的なパイプラインレジスタは、機能ブロック間に配置され、そのようなパイプライン化されたデバイスの例を示すために破線１５０１として表される。

さらに別の実施形態では、エントロピーベースの符号化を図１３の１３２０におけるベースポインタインデックス値に別々に適用することができる。これによって、あるベース値が別のベース値よりも頻繁に使用されるとき、より高い圧縮をもたらすことができる。図２１は、図１３のメタデータフォーマットと、本特許に開示されるように構成された方法及びデバイスのいずれかを使用して、ベースポインタ値２１１５の頻度を分析するように、一実施形態がどのように選択し得るかを示す。

追加の実施形態では、重複排除を適用することができる。これは、ある値又はデータブロック全体が別のデータ値又は別のデータブロックと同じであるとき、より高い圧縮をもたらす。図２１は、さらに、図１３のメタデータフォーマットと、本特許に開示されるように構成される方法及びデバイスのいずれかを使用して、ベースポインタ値２１２５の間の重複の出現を分析するために、一実施形態がどのように選択し得るかを示す。同じアプローチをデルタ値に適用することができる。ここで、本特許に開示されるように構成された方法及びデバイスのいずれかを使用して、デルタ値の間の重複の出現を分析することを選択することができる。

図１１に示す方法の代替又は追加として、データのブロック内の全てのデータ値が同じである場合、それらのうちのいずれかを単一ビットを伴うベースデータ値として使用し、全ての値が同じであることを描写することができる。図２７は、この原理に基づく圧縮方法２７００を示す。プロセスは、２７１０で開始する。第一のステップは、ベースをデータブロック２７２０内の第一のデータ値と同じ値に設定することである次に、データブロック内に残っているデータ値のそれぞれは、それをベース２７４０と比較することによって考慮される２７３０。現在のデータ値がベースと同じである場合、プロセスは、考慮すべき値がさらにある限り２７５０、次のデータ値を考慮することによって継続する。他方、２７４０に戻ると、現在のデータ値がベースと同じでない場合、プロセスは終了し、データブロックは圧縮されない２７６０。全てのデータ値が考慮され、ベースと同じであることが分かった場合、プロセスは終了し２７７０、データブロックは圧縮される。

図２８は、図２７の２８６０に示す方法を使用してデータのブロックがどのように圧縮されるかの例示的なレイアウトを示し、あるいは、それに加えて、前記方法がブロックを圧縮することができないが、代わりに、ブロック内の各値がフォーマット２８７０を使用して圧縮される図６に示す方法に従ってブロックを圧縮する場合、又はいずれの方法もフォーマット２８８０を使用して各非圧縮データ値を格納するブロックをそのまま圧縮できない場合を示す。

図２７に示す方法を使用して圧縮されるブロックでは、全てのデータ値は、同じである。したがって、ブロックは、同じ値の１つのインスタンス、すなわち、ベース値２８２０を格納することによって圧縮される。前記方法が使用されることを確立するために、２ビットコードＣ２８１０は、１０に設定される。他方、図６による方法が使用される場合、各データ値は、選択されたベース値へのデルタを用いて符号化される。選択されたベース値は、フィールド２８７６において符号化されてもよく、デルタは、フィールド２８７８において符号化されてもよく、符号ビットは、符号フィールド２８７７において符号化されてもよい。前記方法が使用されることを確立するために、Ｃフィールド２８７５は、１１に設定される。最後に、前記方法のいずれもデータブロックを圧縮できない場合、全てのデータ値は、非圧縮フォーマットで格納され、２８８０のレイアウトが使用される。ここで、各値は、圧縮されずに格納され、Ｃフィールド２８８５は、００に設定される。図２７の方法のみが使用される場合、考慮すべき最適化は、データブロック全体に対して単一のＣフィールドを使用することである。

したがって、データ圧縮方法は、複数のデータブロックの中の個々のデータブロックの全てのデータ値が同じ値を有するかどうかを決定し、同じ値を有する場合、前記同じ値を、グローバルベース値２８２０及びこれを示す第一の値を有するメタデータ２８１０として使用して、個々のデータブロック全体を符号化するステップとを含んでもよい。同じ値を有しない場合、個々のデータブロックのデータ値は、第三の値を有するメタデータ２８８５によって示される非圧縮データ値を除いて、これを示す第二の値を有するメタデータ２８７５を使用して、本文書に開示されるような方法（すなわち、選択されたグローバルベース値及び結果として生じるデルタ値を伴う、例えば、図６の方法）で符号化されてもよい。

図２９は、図２７に示す方法及び図２８に示すメタデータレイアウトを用いてデータのブロックを圧縮するように構成されたデバイスを示す図である。デバイス２９００への入力は、データブロックであり、図２９の例示的な実施形態では、データブロックは、４つのデータワード：Ｗ１２９１０、Ｗ２２９２０、Ｗ３２９３０及びＷ４２９４０を含む。デバイス２９５０は、全てのデータワードが同じ値を含むか否かを確立するように構成される。前記デバイスは、それらが同じであれば、論理１を、同じでなければ、論理０を出力として残す。ワードｎのビットｉをＷｎ［ｉ］とする。全てのデータワードの意味が同じであるということは、ワード内の全てのビットについて、Ｗ１［ｉ］＝Ｗ２［ｉ］＝Ｗ３［ｉ］＝Ｗ４［ｉ］であることを意味する。デバイス２９５０がＸＯＲ及びＡＮＤゲートを用いてどのように構築され得るかを、当業者は認識する。出力信号は、２９６０及び２９７０で示される２つのラッチのイネーブル入力に接続される。データブロック内の全てのワードが同じである場合、Ｗ１２９１０の内容は、次のクロック信号２９８０でベース値ラッチ２９６０にラッチされる。同様に、全てのデータワードが同じである場合、図２８のメタデータフォーマット２８６０の２つのメタデータビットは、「１」及び「０」でなければならない。「１」及び「０」を２ビットラッチ２９７０にラッチするために、前記ラッチは、また、次のクロック信号２９８０で「１」及び「０」にラッチするデバイス２９５０によって制御されるイネーブル信号を有する。Ｃが「１」及び「０」ではないが、別の論理２ビット値を有する場合、他の符号化、例えば、図２８のメタデータレイアウト２８００内の２８７０又は２８８０を生成できることを、当業者は認識する。

図３０は、図２７に示す方法及び図２８に示すメタデータレイアウトを用いて、データのブロックを解凍するように構成されたデバイスを示す。デバイス３０００への入力は、メタデータＣ３０１０及びベース値３０９０である。図２８のレイアウト２８６０に従ってＣ＝１０である場合、ベース値は、ブロック内の全てのデータワードにコピーされる。デバイス３０００内の例示的なデータブロックは、４つのデータワードＷ１３０４０、Ｗ２３０５０、Ｗ３３０６０、及びＷ４３０７０を含む。それらは、イネーブル信号Ｅを有するラッチとして構成され、イネーブル信号Ｅは、次のクロック信号ＣＬＫ３０８０において、Ｅ信号が論理値１を有する場合、ベース値レジスタ３０９０の内容を全てのラッチに転送する。Ｅ信号は、ＡＮＤゲート３０３０への入力信号の１つに接続されたインバータゲート３０２０によって確認されるＣ３０１０が１０である場合にのみ、論理値１を有する。Ｃが１０ではないが別の論理値を有する場合、ワードラッチＷ１～Ｗ４３０４０，３０５０，３０６０及び３０７０にそれぞれ異なる値のセット、；例えば、図２８のメタデータレイアウト２８８０に従う非圧縮ワードのセットをロードすることが可能であることを当業者は認識するであろう。

ベース値は、典型的には、ベース値ポインタ（別名、ベース値インデックス）を使用して、Ｎ個のベース値が与えられた場合、参照当たりｌｏｇ_２Ｎビットを使用して、それらの全てを格納するテーブルに符号化される。いくつかのベース値が、他のベース値よりも実質的に頻繁に使用されることが起こり得る。その場合、ハフマン符号化又は算術符号化等のエントロピーベースの符号化スキームを使用して、ベース値ポインタを符号化することが有益である。図３１は、エントロピーベースの符号化スキームを使用して、ベース値ポインタを符号化する方法を示す。

図３１を参照すると、プロセスは、３１１０で開始する。全体的なプロセスは、例えば、図５に関連して記載された方法によって確立された全てのベース値を考慮する。各ベース値（又はそのベース値ポインタ）が使用される回数は、３１３０において各ベース値に対して確立される。全てのベース値が考慮されたとき、プロセスは、決定ボックス３１４０の後、３１５０に進む。エントロピーベースの符号化は、全てのベース値が使用される回数に基づいており、より頻繁に使用されるベース値に対して、より頻繁に使用されるベース値よりも短いコードをもたらす。符号化が確立されると、プロセスは、３１６０で終了する。

図７のように明示的にベース値ポインタを格納するブロックを圧縮するデバイスの教示により、図３１に示す方法でデータのブロックを圧縮するように構成されたデバイスを構築することが可能である。図７に戻ると、図２０でさらに詳述されるデバイス７５０のタスクは、選択されたベース値に対するベース値ポインタが明示的に格納される符号化を作成することである。図３１に記載される方法は、ベース値ポインタとエントロピーベースの符号化との間の１対１のマッピングを確立する。このテーブルは、圧縮が有効にされたときにロードされるデバイス内の小さなテーブルに格納することができる。したがって、ベース値ポインタが７５０において確立されると、このポインタは、そのベース値ポインタの対応する符号化をピックアップするために、テーブルにインデックス付けすることができる。

ブロックを解凍し、図８のようにベース値ポインタを明示的に格納するデバイスの教示によって、図３１に示す方法でデータのブロックを解凍するように構成されたデバイスを構築することも可能である。図１０は、そのような符号化を解凍するためのデバイスの実施形態を示す。ここで、例示的なブロックは、４つのベース値Ｂ０１０２１、Ｂ１１０２２、Ｂ３１０２３及びＢ４１０２４を使用し得る２つの値Ｅ０１０１１及びＥ１１０１２を有する。これらのベース値は、符号語とベース値との間の１対１のマッピングを有する任意のエントロピーベースの符号化スキームを使用して符号語に符号化される。前述の符号化デバイスにおけるように、ベース値符号化のセットと、ベース値を取り出すために符号化を使用してそれにインデックス付けするベース値とを含む小さいテーブルを有することが可能である。そのようなデバイスは、１０２０で使用されるベース値を取り出すために、図１０のボックス１０２０の左側に組み込まれ得る。適切なデバイスの一例は、米国特許第１０８４６２１８号に開示される解凍デバイスであり、その全体は、参照により本明細書に組み込まれる。

一般に、本特許開示はセットのグローバルベース値を決定し、ベースデルタ符号化を使用することによって、それぞれが複数のデータ値を含む複数のデータブロックを圧縮する方法及び圧縮するように構成されたデバイスを教示する。さらに、本特許開示は、デルタ値単体、又はベース値単体、又は一緒に適用される従来技術からのエントロピーベース及び重複排除ベースの符号化技法と組み合わせて圧縮するように構成される方法及びデバイスを教示する。全てのそのような実施形態が企図される。

当業者が前述の説明から理解するように、本発明は、図２２の２２００で見ることができるデータ圧縮方法を提供する。方法２２００は、複数のデータブロックを取得すること２２１０を含み、各データブロックは、複数のデータ値を含む。方法２２００は、取得された複数のデータブロックのベースデルタ符号化を実行するステップ２２２０をさらに含み、デルタ値は、複数のデータブロックのデータ値の中から、複数のデータブロックに共通のセットのグローバルベース値を決定すること２２３０によって、データ値とベース値との間の差を意味する。セットのグローバルベース値は、セットのグローバルベース値におけるグローバルベース値に対して複数のデータブロックのデータ値のデルタ値を最小にするように選択される。

方法２２００は、次いで、複数のデータブロックの個々のデータ値を符号化するステップ２２４０を含み、この符号化は、セットのグローバルベース値において、個々のデータ値ごとに、個々のデータ値に数値的に最も近く、したがって、最小のデルタ値をもたらす１つのグローバルベース値を選択するステップ２２５０と、符号化された個々のデータ値に対して、選択された１つのグローバルベース値及び結果として生じるデルタ値を表すメタデータを生成するステップ２２６０とによって行われる。

本明細書の教示から当業者には明らかなように、セットのグローバルベース値は、以下のデータ値：
ａ）デルタ符号化されるべき複数のデータブロックに現れる（「共通」、「グローバル」）データ値と、
ｂ）複数のデータブロックのデータ値が、後続の符号化ステップ２２４０において定義される方法でセットのグローバルベース値を使用することによってベースデルタ符号化されるとき、最小のデルタ値（最も高い圧縮比）をもたらすデータ値と、
を含む。

したがって、複数のデータブロックのグローバル値のセットに対するデルタ値を最小化するグローバル値のセットを決定することは、共通の一般的な知識に属し、クラスタリング方法として知られている。例えば、１つの周知のクラスタリング方法は、Ｋｍｅａｎｓである（ＳｔｕａｒｔＰ．Ｌｌｏｙｄ，ＬｅａｓｔＳｑｕａｒｅｓＱｕａｎｔｉｚａｔｉｏｎｉｎＰＣＭ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ，Ｖｏｌ．ＩＴ－２８，Ｎｏ．２，ｐｐ．１９２，１９８２年３月、参照）。

図４及び図５を特に参照して説明されたように、セットのグローバルベース値を決定するステップ２２３０は、取得された複数のデータブロックを分析して、複数のデータブロック内のデータ値に関する値頻度情報を確立するステップと、複数のデータブロック内のそれらの値頻度とともにデータ値をソートするステップとを含んでもよい。次いで、Ｎ＝１，…，Ｎｍａｘ及びＢ＝１，…，Ｎ（式中、Ｎは値ビンの数であり、Ｂは候補ベース値の数である）の各特定の組合せについて、ソートされたデータ値は、Ｎ個のビンに分割される。最も高い累積値頻度を有するＢ個のビンについて、候補ベース値が、各ビンについて、そのビンにおいて最も高い値頻度を有するデータ値として割り当てられる。次いで、取得された複数のデータブロックのデータ値のベースデルタ符号化が、特定の組合せのためのベースデルタ符号化圧縮比を決定するために、Ｂ個のビンのための候補ベース値を使用して実行される。全ての特定の組合せの中で、最大圧縮比をもたらす値ビンと候補ベース値との組合せが特定される。特定された組合せの候補ベース値は、セットのグローバルベース値として選択される。

開示された実施形態から明らかなように（例えば、図６の説明を参照）、各グローバルベース値は、好ましくは、セットのグローバルベース値における一意のベース値インデックスを有する。複数のデータブロックの個々のデータ値を符号化するステップ２２４０は、次いで、生成されたメタデータ内の選択されたグローバルベース値をそのベース値インデックスによって表すステップを含む。

さらに、複数のデータブロックの個々のデータ値を符号化するステップ２２４０は、各データブロック内の各データ値について、選択されたベース値から生じるデルタ値が閾値を超えるかどうかを決定するステップと、閾値を超える場合、選択されたグローバルベース値及び結果として生じるデルタ値によってメタデータを表す代わりに、それが非圧縮であるという表示とともに、データ値そのものを含むようにメタデータを生成するステップを含んでもよい。

上記で説明したように、本発明の実施形態は、デルタ値のランレングス符号化を含んでもよい。したがって、データ圧縮方法２２００は、最上位バイナリ０：ｓ又は１：ｓのストライクを含むベースデルタ符号化されたデータ値のデルタ値をランレングス符号化するステップを、生成されたメタデータ内のデルタ値をａ）最上位バイナリ０：ｓ又は１：ｓのストライクの長さを示すデータと、ｂ）デルタ値の残り（非ストライク部分）との組合せで表すことによって行うことを、さらに含んでもよい。

同様に、本発明の実施形態は、デルタ値のビットプレーン圧縮を含んでもよい。この目的のために、データ圧縮方法２２００は、デルタ値のシーケンス内の各デルタ値が特定の最小長の最上位バイナリ０：ｓ又は１：ｓのストライクを含むことを識別し、生成されたメタデータ内のデルタ値のシーケンス内のデルタ値を、ａ）識別された最小長を示すデータと、ｂ）デルタ値のシーケンスにおけるデルタ値の残り（非ストライク部分）との組合せによって表すことによって、ベースデルタ符号化されたデータ値のデルタ値のシーケンスにビットプレーン圧縮を適用するステップをさらに含んでもよい。

上記で説明したように、本発明の有利な実施形態は、デルタ値及び／又はベース値インデックスを圧縮することを含む。したがって、データ圧縮方法２２００は、ベースデルタ符号化されたデータブロックのうちの１つ以上のデータブロックのベースデルタ符号化されたデータ値のデルタ値／ベース値インデックスを取得するステップと、次いで、取得されたデルタ値／ベース値インデックスの間の値冗長性を利用することによって、ベースデルタ符号化された前記１つ以上のデータブロックの第二段階のデータ圧縮を実行するステップと、をさらに含んでもよい。

第二段階のデータ圧縮は、ハフマン符号化又は算術符号化等のように、エントロピーベースの符号化を実行するステップを含むことが好ましく、これは、取得されたデルタ値／ベース値インデックスの相対頻度情報を確立し、確立された相対頻度情報に基づいて、取得された各デルタ値／ベース値インデックスに対するコードを選択し、ベースデルタ符号化されたデータ値ごとに生成されたメタデータにおいて、選択されたコードによってデルタ値／ベース値インデックスを表すことによって行われる。ベース値インデックス（又はベース値ポインタ）に対してエントロピーベースの符号化を実行することの代替として、ベース値そのものに対してエントロピーベースの符号化を実行してもよい。これは、ベース値と１対１にマッピングされたベース値インデックスとして使用され得るベース値符号語をもたらす。

あるいは、第二段階のデータ圧縮は、重複排除ベースの圧縮を実行することを含んでもよく、これは、取得されたデルタ値／ベース値インデックスの中の１つ以上の重複を識別することと、生成されたメタデータにおいて、識別された各重複デルタ値／ベース値インデックスを、重複デルタ値／ベース値インデックスと同じデルタ値を有する符号化された個々のデータ値へのポインタ又はその識別子によって表すこととによって行われる。

複数のデータブロックを取得するステップ２２１０は、典型的には、コンピュータメモリＣ１～Ｃ３、Ｍ１～Ｍｋ、２４１０からメモリオブジェクトを読み出すステップを含んでもよく（図２４参照）、前述の複数のデータブロックは、メモリオブジェクトに含まれ、方法２２００は、生成メタデータをコンピュータメモリに格納するステップをさらに含む。メモリオブジェクトは、例えば、コンピュータメモリＣ１～Ｃ３、Ｍ１～Ｍｋ、２４１０内のページであってもよい。あるいは、メモリオブジェクトは、例えば、キャッシュライン又はメモリページとは異なるサイズの別のメモリオブジェクトであってもよい。

関連するコンピュータプログラム製品は、コード命令を含み、コード命令は、処理デバイス（例えば、図２のＰ_１、Ｐ_２又はＰ_３のようなＣＰＵ）によってロードされ実行されると、上述のデータ圧縮方法２２００を実行させる。

図２３は、（図２のコンピュータメモリ圧縮デバイス２０５に対応し得る）関連データ圧縮デバイス２３００を示し、これは、本明細書で説明するように、取得された複数のデータブロックのベースデルタ符号化を実行するためのものである。各データブロックは、複数のデータ値を含み、デルタ値は、データ値とベース値との間の差を意味することを想起されたい。データ圧縮デバイス２３００は、（図２のユニット２１４に対応し得る）アナライザユニット２３１０と、（図２のユニット２１２に対応し得る）エンコーダユニット２３２０とを備える。

アナライザユニット２３１０は、複数のデータブロックのデータ値の中から、複数のデータブロックに共通のセットのグローバルベース値を決定するように構成される。セットのグローバルベース値は、セットのグローバルベース値におけるグローバルベース値に対して複数のデータブロックのデータ値のデルタ値を最小にするように選択されることを想起されたい。

エンコーダユニット２３２０は、複数のデータブロックの個々のデータ値の符号化を、セットのグローバルベース値において、個々のデータ値ごとに、個々のデータ値に数値的に最も近く、したがって最小のデルタ値をもたらす１つのグローバルベース値を選択することと、符号化された個々のデータ値に対して、選択された１つのグローバルベース値及び結果として生じるデルタ値を表すメタデータを生成することによって行うに構成される。

データ圧縮デバイス２３００は、そのアナライザユニット２３１０及びエンコーダユニット２３２０とともに、データ圧縮方法２２００及びその実施形態について上述したような追加又は改良された機能のいずれか又は全部を実行するように構成されてもよい。

関連するデータ解凍方法は、データ圧縮方法２２００によって生成されたメタデータを取得するステップと、取得されたメタデータによって表されるグローバルベース値及びデルタ値から、各データブロックが複数のデータ値を含む複数のデータブロックを再構築するステップとを含む。さらに、関連するコンピュータプログラム製品は、処理デバイス（例えば、図２のＰ_１、Ｐ_２又はＰ_３のようなＣＰＵ）によってロードされ実行されると、このデータ解凍方法を実行させるコード命令を含む。

対応して、関連するデータ解凍デバイス２４３０（図２４参照）は、（図２のユニット２１３に対応し得る）デコーダユニットを備える。デコーダユニット（例えば、２０５）は、データ圧縮デバイス２３００（例えば、２０５）によって生成されたメタデータを取得し、取得されたメタデータによって表されるグローバルベース値及びデルタ値から、各データブロックが複数のデータ値を含む複数のデータブロックを再構築するように構成される。

図２４は、１つ以上のメモリ２４１０と、データ圧縮デバイス２４２０（図２３のデバイス２３００及び／又は図２のデバイス２０５に対応し得る）と、上で参照したようなデータ解凍デバイス２４３０とを備えるシステム２４００を開示する。

システム２４００は、典型的には、コンピュータシステム（例えば、図２のコンピュータシステム２００）であってもよく、１つ以上のメモリ２４１０は、キャッシュメモリ（例えば、Ｃ１～Ｃ３）、ランダムアクセスメモリ（例えば、Ｍ１～Ｍｋ）、二次ストレージデバイス、又はデータバッファであってもよい。

本発明について、主に、その異なる実施形態を参照して上記で説明してきた。しかしながら、当業者によって容易に理解されるように、本文書に開示されるもの以外の他の実施形態も、添付の特許請求の範囲によって定義される本発明の範囲内で等しく可能である。

Claims

データ圧縮方法（２２００）であって、
各データブロックが複数のデータ値を含む複数のデータブロックを取得するステップ（２２１０）と、
取得された前記複数のデータブロックのベースデルタ符号化を実行するステップ（２２２０）であって、デルタ値は、データ値とベース値との間の差を意味する、ステップと、
を含み、前記実行するステップ（２２２０）は、
前記複数のデータブロックの前記データ値の中から、前記複数のデータブロックに共通のセットのグローバルベース値を決定するステップ（２２３０）であって、前記セットのグローバルベース値は、前記セットのグローバルベース値におけるグローバルベース値に対して前記複数のデータブロックの前記データ値のデルタ値を最小化するように選択される、ステップと、
前記複数のデータブロックの個々のデータ値を符号化するステップ（２２４０）と、によって行われ、前記符号化するステップ（２２４０）は、
前記セットのグローバルベース値において、各個々のデータ値に、前記個々のデータ値に数値的に最も近く、結果として、最小のデルタ値をもたらす１つのグローバルベース値を選択するステップ（２２５０）と、
選択された前記１つのグローバルベース値及び結果としてもたらされた前記デルタ値を表すために、符号化された前記個々のデータ値のためのメタデータを生成するステップ（２２６０）と、
によって行われる、ステップと、を含む、データ圧縮方法。
前記セットのグローバルベース値を決定するステップ（２２３０）は、
取得された前記複数のデータブロックを分析して、前記複数のデータブロック内の前記データ値に関する値頻度情報を確立するステップと、
前記複数のデータブロック内で前記データ値をそれらの値頻度とともに、ソートするステップと、
Ｎ＝１，…，ＮｍａｘとＢ＝１，…，Ｎとの各特定の組合せであって、Ｎは値ビンの数であり、Ｂは候補ベース値の数である、各特定の組合せに対して、
ソートされた前記データ値をＮ個のビンに分割するステップと、
最も高い累積値頻度を有するＢ個のビンに対して、各ビンに対する候補ベース値を、そのビンにおいて最も高い値頻度を有する前記データ値として割り当てるステップと、
前記Ｂ個のビンについての前記候補ベース値を用いて取得された前記複数のデータブロックの前記データ値のベースデルタ符号化を実行して、前記特定の組合せについてのベースデルタ符号化圧縮比を決定するステップと、
全ての前記特定の組合せの中で、最大圧縮比をもたらす値ビンと候補ベース値との前記組合せを識別するステップと、
識別された前記組合せの前記候補ベース値を前記セットのグローバルベース値として選択するステップと、
を含む、請求項１に記載のデータ圧縮方法。
各グローバルベース値は、前記セットのグローバルベース値における一意のベース値インデックスを有し、前記複数のデータブロックの前記個々のデータ値を符号化するステップ（２２４０）は、
生成された前記メタデータ内の選択された前記１つのグローバルベース値をそのベース値インデックスによって表すステップ
を含む、請求項１又は２に記載のデータ圧縮方法。
前記複数のデータブロックの前記個々のデータ値を符号化するステップは、各データブロックについて、
前記データブロック内の各データ値について、選択された前記ベース値から生じるデルタ値が閾値（ＵＢ）を超えるかどうかを決定するステップと、
超える場合、選択された前記１つのグローバルベース値及び結果として生じる前記デルタ値によって前記データ値を表す代わりに、前記データ値そのものを、それが非圧縮であることの表示とともに含むようにメタデータを生成するステップと、
を含む、請求項１～３のいずれか一項に記載のデータ圧縮方法。
前記閾値（ＵＢ）は、ｎビットを有する最も大きな二進数によって定義される最大デルタ値（ＭＤ）以下であり、
ｎ＝ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅ－ｌｏｇ２（Ｂ）、
ｍｉｎ＿ｃｏｍｐｒｅｓｓｅｄ＿ｖａｌｕｅ＿ｓｉｚｅは、所与の目標圧縮比から生じる符号化された前記データ値の最小ビットサイズであり、
Ｂは、前記セットのグローバルベース値における前記ベース値の数である、
請求項４に記載のデータ圧縮方法。
前記閾値（ＵＢ）は、前記セットのグローバルベース値におけるそれぞれのベース値について、
前記それぞれのベース値に関連する最も大きなデルタ値が前記最大デルタ値（ＭＤ）未満である場合、前記最も大きなデルタ値として定義され、
そうでない場合、前記最大デルタ値（ＭＤ）として定義される、請求項５に記載のデータ圧縮方法。
最上位バイナリ０：ｓ又は１：ｓのストライクを含むベースデルタ符号化された前記データ値のデルタ値をランレングス符号化するステップを、
最上位バイナリ０：ｓ又は１：ｓのストライクの長さを示すデータと、
前記デルタ値の残りの部分（非ストライク部分）と
の組合せで表すことによって行うことをさらに含む、請求項１～６のいずれか一項に記載のデータ圧縮方法。
ビットプレーン圧縮をベースデルタ符号化された前記データ値のデルタ値のシーケンスに適用するステップ
をさらに含み、前記適用するステップは、
デルタ値の前記シーケンスにおける各デルタ値が、特定の最小長の最上位バイナリ０：ｓ又は１：ｓのストライクを含むことを識別するステップと、
生成された前記メタデータにおけるデルタ値の前記シーケンスの前記デルタ値を、
特定された最小長さを示すデータと、
デルタ値の前記シーケンスにおける前記デルタ値の残りの部分（非ストライク部分）と
の組合せによって、表すステップと、
によって行われる、請求項１～６のいずれか一項に記載のデータ圧縮方法。
ベースデルタ符号化された前記データブロックのうちの１つ以上のデータブロックのベースデルタ符号化された前記データ値の前記デルタ値を取得するステップと、
取得された前記デルタ値の間の値冗長性を利用することによって、ベースデルタ符号化された前記１つ以上のデータブロックの第二段階のデータ圧縮を実行するステップと、
をさらに含む、請求項１～８のいずれか一項に記載のデータ圧縮方法。
前記第二段階のデータ圧縮は、エントロピーベースの符号化を実行するステップを含み、前記実行するステップは、
取得された前記デルタ値の相対頻度情報を確立するステップと、
確立された前記相対頻度情報に基づいて、取得された各デルタ値に対するコードを選択するステップと、
ベースデルタ符号化された各データ値について生成された前記メタデータにおいて、選択された前記コードによって前記デルタ値を表すステップと、
によって行われる、請求項９に記載のデータ圧縮方法。
前記エントロピーベースの符号化は、
ハフマン符号化と、
算術符号化と、
からなる群から選択される、請求項１０に記載のデータ圧縮方法。
前記第二段階のデータ圧縮は、重複排除ベースの圧縮を実行するステップを含み、前記実行するステップは、
取得された前記デルタ値のうちの１つ以上の重複を識別するステップと、
生成された前記メタデータにおいて、各識別された重複デルタ値を、前記重複デルタ値と同じデルタ値を有する符号化された個々のデータ値へのポインタ又はその識別子によって表すステップと、
によって行われる、請求項９に記載のデータ圧縮方法。
ベースデルタ符号化された前記データブロックのうちの１つ以上のデータブロックのベースデルタ符号化された前記データ値の前記ベース値インデックスを取得するステップと、
取得された前記ベース値インデックス間の値冗長性を利用することによって、ベースデルタ符号化された前記１つ以上のデータブロックの第二段階のデータ圧縮を実行するステップと、
をさらに含む、請求項３、又は請求項３に従属する請求項４～１２のいずれか一項に記載のデータ圧縮方法。
前記第二段階のデータ圧縮は、エントロピーベースの符号化を実行するステップを含み、前記実行するステップは、
取得された前記ベース値インデックスの相対頻度情報を確立するステップと、
確立された前記相対頻度情報に基づいて、取得された各ベース値インデックスに対するコードを選択するステップと、
各ベースデルタ符号化されたデータ値について生成された前記メタデータにおいて、選択された前記コードによって前記ベース値インデックスを表すステップと、
によって行われる、請求項１３に記載のデータ圧縮方法。
前記エントロピーベースの符号化は、
ハフマン符号化と、
算術符号化と、
からなる群から選択される、請求項１４に記載のデータ圧縮方法。
前記第二段階のデータ圧縮は、重複排除ベースの圧縮を実行するステップを含み、前記実行するステップは、
取得された前記ベース値インデックスのうちの１つ以上の重複を識別するステップと、
生成された前記メタデータにおいて、各識別された重複ベース値インデックスを、前記重複ベース値インデックスと同じベース値インデックスを有する符号化された個々のデータ値へのポインタ又はその識別子によって表すステップと、
によって行われる、請求項１３に記載のデータ圧縮方法。
前記方法は、
前記複数のデータブロックの中の個々のデータブロックの全てのデータ値が同じ値を有するかどうかを決定し、同じ値を有すれば、前記同じ値を、グローバルベース値（２８２０）及びこれを示す第一の値を有するメタデータ（２８１０）として使用して、個々のデータブロック全体を符号化するステップと、
同じ値を有しない場合、第三の値を有するメタデータ（２８８５）によって示される請求項４に記載の非圧縮データ値を除き、これを示す第二の値を有するメタデータ（２８７５）を使用して、請求項１～１６のいずれか一項に記載の方法を用いて、個々のデータブロックのデータ値を符号化するステップと、
を含む、請求項１～１６のいずれか一項に記載のデータ圧縮方法。
前記複数のデータブロックを取得するステップは、コンピュータメモリ（Ｃ１～Ｃ３、Ｍ１～Ｍｋ；２４１０）からメモリオブジェクトを読み出すステップであって、前記複数のデータブロックが前記メモリオブジェクトに含まれる、ステップを含み、
前記方法は、生成された前記メタデータを前記コンピュータメモリに格納するステップをさらに含む、請求項１～１７のいずれか一項に記載のデータ圧縮方法。
前記メモリオブジェクトは、前記コンピュータメモリ（Ｃ１～Ｃ３、Ｍ１～Ｍｋ；２４１０）内のページである、請求項１８に記載のデータ圧縮方法。
取得された複数のデータブロックのベースデルタ符号化を実行するためのデータ圧縮デバイス（２３００；２０５）であって、各データブロックは複数のデータ値を含み、デルタ値はデータ値とベース値との間の差を意味し、前記データ圧縮デバイス（２３００；２０５）は、
前記複数のデータブロックの前記データ値のうち、前記複数のデータブロックに共通するセットのグローバルベース値を決定するように構成されたアナライザユニット（２３１０；２１４）であって、前記セットのグローバルベース値は、前記セットのグローバルベース値におけるグローバルベース値に関して、前記複数のデータブロックの前記データ値のデルタ値を最小化するように選択される、アナライザユニット（２３１０；２１４）と、
前記複数のデータブロックの個々のデータ値を符号化するように構成されたエンコーダユニット（２３２０；２１２）であって、前記符号化は、前記セットのグローバルベース値において、各個々のデータ値に対して、前記個々のデータ値に数値的に最も近く、したがって最小のデルタ値をもたらすグローバルベース値を選択することと、選択された前記グローバルベース値及び結果として生じる前記デルタ値を表すために、符号化された前記個々のデータ値のメタデータを生成することと、によって行われる、エンコーダユニット（２３２０；２１２）と、
を備える、データ圧縮デバイス（２３００；２０５）。
前記アナライザユニット（２３１０；２１４）は、前記セットのグローバルベース値を決定するように構成され、前記セットのグローバルベース値の決定は、
取得された前記複数のデータブロックを分析して、前記複数のデータブロック内の前記データ値に関する値頻度情報を確立するステップと、
前記複数のデータブロック内で前記データ値をそれらの値頻度とともに、ソートするステップと、
Ｎ＝１，…，ＮｍａｘとＢ＝１，…，Ｎとの各特定の組合せであって、Ｎは値ビンの数であり、Ｂは候補ベース値の数である、各特定の組合せに対して、
ソートされた前記データ値をＮ個のビンに分割するステップと、
最も高い累積値頻度を有するＢ個のビンに対して、各ビンに対する候補ベース値を、そのビンにおいて最も高い値頻度を有する前記データ値として割り当てるステップと、
前記Ｂ個のビンについての前記候補ベース値を用いて取得された前記複数のデータブロックの前記データ値のベースデルタ符号化を実行して、前記特定の組合せについてのベースデルタ符号化圧縮比を決定するステップと、
全ての前記特定の組合せの中で、最大圧縮比をもたらす値ビンと候補ベース値との前記組合せを識別するステップと、
識別された前記組合せの前記候補ベース値を前記セットのグローバルベース値として選択するステップと、
によって行われる、請求項２０に記載のデータ圧縮デバイス（２３００；２０５）。
各グローバルベース値は、前記セットのグローバルベース値における一意のベース値インデックスを有し、前記エンコーダユニット（２３２０；２１２）は、生成された前記メタデータにおいて選択された前記１つのグローバルベース値をそのベース値インデックスによって表すことによって、前記複数のデータブロックの前記個々のデータ値を符号化するように構成される、請求項２０又は２１に記載のデータ圧縮デバイス（２３００；２０５）。
前記エンコーダユニット（２３２０；２１２）は、前記複数のデータブロックの前記個々のデータ値を、各データブロック内の各データ値について、選択された前記ベース値から生じる前記デルタ値が閾値を超えるかどうかを決定し、前記閾値を超える場合、選択された前記１つのグローバルベース値及びその結果生じるデルタ値によって表現する代わりに、前記データ値そのものを、それが非圧縮であることの表示とともに含むように前記メタデータを生成することによって符号化するように構成される、請求項２０～２２のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）。
前記エンコーダユニット（２３２０；２１２）は、請求項７に記載の方法で定義されるように、デルタ値をランレングス符号化するようにさらに構成される、請求項２０～２３のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）。
前記エンコーダユニット（２３２０；２１２）は、請求項８の方法で定義されるように、ビットプレーン圧縮を適用するようにさらに構成される、請求項２０～２３のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）。
前記エンコーダユニット（２３２０；２１２）は、請求項９～１２のいずれか一項に記載の方法で定義されるように、取得された前記デルタ値の間の値の冗長性を利用することによって、ベースデルタ符号化された前記１つ以上のデータブロックの第二段階のデータ圧縮を実行するようにさらに構成される、請求項２０～２５のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）。
前記エンコーダユニット（２３２０；２１２）は、請求項１３～１６のいずれか一項に記載の方法で定義されるように、取得された前記ベース値インデックスの間の値の冗長性を利用することによって、ベースデルタ符号化された前記１つ以上のデータブロックの第二段階のデータ圧縮を実行するようにさらに構成される、請求項２２又は請求項２２に従属する請求項２３～２６のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）。
コンピュータメモリ（Ｃ１～Ｃ３，Ｍ１～Ｍｋ；２４１０）からメモリオブジェクトを読み出すことによって前記複数のデータブロックを取得するように構成されたロケータユニット（２１１）をさらに備え、前記複数のデータブロックは、前記メモリオブジェクト内に構成され、生成された前記メタデータを前記コンピュータメモリに格納するように構成された、請求項２０～２７のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）。
前記メモリオブジェクトは、前記コンピュータメモリ（Ｃ１～Ｃ３、Ｍ１～Ｍｋ；２４１０）内のページである、請求項２８に記載のデータ圧縮デバイス（２３００；２０５）。
データ解凍方法であって、
請求項１～１９のいずれか一項に記載のデータ圧縮方法によって生成された前記メタデータを取得するステップと、
各データブロックが複数のデータ値を含む複数のデータブロックを、取得された前記メタデータによって表される前記グローバルベース値及び前記デルタ値から再構築するステップと、
を含む、データ解凍方法。
デコーダユニット（２１３）を備えるデータ解凍デバイス（２４３０）であって、前記デコーダユニット（２１３）は、請求項２０～２９のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５）によって生成された前記メタデータを取得し、取得された前記メタデータによって表される前記グローバルベース値及び前記デルタ値から、各データブロックが複数のデータ値を含む複数のデータブロックを再構築するように構成される、データ解凍デバイス（２４３０）。
１つ以上のメモリ（２４１０）と、請求項２０～２９のいずれか一項に記載のデータ圧縮デバイス（２３００；２０５；２４２０）と、請求項３１に記載のデータ解凍デバイス（２４３０）と、を備えるシステム（２４００）。
前記システムは、コンピュータシステム（２００）であり、前記１つ以上のメモリ（２４１０）は、
キャッシュメモリ（Ｃ１～Ｃ３）と、
ランダムアクセスメモリ（Ｍ１～Ｍｋ）と、
二次ストレージデバイスと、
データバッファと、
からなる群から選択される、請求項３２に記載のシステム（２４００）。
処理デバイスによってロードされ、実行されると、請求項１～１９のいずれか一項に記載の方法を実行させるコード命令を含む、コンピュータプログラム製品。
処理デバイスによってロードされ、実行されると、請求項３０に記載の方法を実行させるコード命令を含む、コンピュータプログラム製品。