JP2002533960A

JP2002533960A - 進化アルゴリズムによる符号圧縮

Info

Publication number: JP2002533960A
Application number: JP2000590103A
Authority: JP
Inventors: デヴィッドスハッフェルイェー; エーマシアスキース; イェーエシェルマンラリー
Original assignee: Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1998-12-21
Filing date: 1999-12-13
Publication date: 2002-10-08
Also published as: EP1055196A2; WO2000038112A3; WO2000038112A2; US6260031B1; CA2322138A1; TW472238B

Abstract

(57)【要約】マクロ置換に基づく符号圧縮を、進化アルゴリズムプロセスによって管理する。好適実施形態において、マクロ置換の組のランダム母集団を発生し、圧縮有効性を各々の組に関して評価する。このランダム母集団を”親”の対に分割し、親の各対は”子”の対を発生する。前記子の各々によって与えられえる圧縮の有効性を評価し、”適者生存”アルゴリズムを用い、最高の圧縮有効性を有する個体を認識する。これらの好適な個体を、子の対を発生する親の対に分割し、最高圧縮有効性個体を、次の世代に関する親であると選択する。このプロセスを、その後の世代が無意味な改善を示すまで続け、最高の個体を解として選択する。

Description

【発明の詳細な説明】

【０００１】発明の背景１．発明の分野本発明は、データ記憶の分野に関係し、特に、効率的な記憶に関するデータお
よびプログラミング符号の圧縮に関係する。

【０００２】２．関連技術の説明この「情報時代」において、記憶または通信されている情報量は増え続けてい
る。しかしながら、記憶および通信における進歩にもかかわらず、情報記憶およ
び通信の効率を、情報それ自身を圧縮することによって最適化する必要性が依然
として存在する。例えば、小型計算装置における物理的空間は、貴重なリソース
であり、実際上の制限を有する。アプリケーションプログラムおよびデータファ
イルに必要な記憶を最小にすることは、特に、小型計算装置、通信装置、電子機
器等のような、制限された記憶リソースを有する装置およびシステムのためにな
る。同様に、制限されたバンド幅の通信チャネルを、所定の量の情報を通信する
のに必要なデータ要素数を減らすことによって、より効率的に使用することがで
きる。

【０００３】データセット内の情報を圧縮する１つの方法は、辞書参照方法である。前記デ
ータセット内で繰り返される列を表す記号を、辞書において規定する。前記デー
タセットにおける前記列の各々の発生を、前記列を表す記号によって置き換える
。前記代用記号および前記辞書に関するオーバヘッドが、元の列の存在よりも少
ない記憶空間を消費する場合、記憶空間における節約が達成される。図１は、こ
のような圧縮を示す。非圧縮データセット１００を、圧縮データセット１１０に
、ユニーク記号Ａ、Ｂ、ＣおよびＤに関連し、各々非圧縮列１００における記号
の列‘ｅｃ’、‘ａａｂ’、‘ｃａｄ’および‘ｄａｂ’を表すマクロ辞書１２
０を形成することによって変換する。一般的な述語と一致して、他の記号によっ
て置き換えられる記号の列をマクロと呼び、マクロ列をこれらのマクロ記号によ
って置き換えることをタイリングと呼ぶ。列‘ａｃ’１０１に対応するマクロＡ
を、１０１’において繰り返されるデータセット１０１における第１列として認
識する。列‘ａａｂ’１０２に対応するマクロＢを、１０２’において繰り返さ
れるデータセット１００における次の列として認識する。列‘ｃａｄ’１０３に
対応するマクロＣを、１０３’において繰り返されるデータセット１００におけ
る次の列として認識する。列‘ｄａｂ’１０４に対応するマクロＤを、１０４’
、１０４”において繰り返されるデータセット１００における次の列として認識
する。原データセット１００を、圧縮データセット１１０に、マクロ列‘ａｃ’
、‘ａａｂ’、‘ｃａｄ’および‘ｄａｂ’の各々の発生１０１、１０１’、１
０２、１０２’、１０３、１０３’、１０４、１０４’、１０４”を、これらの
対応する記号Ａ、Ｂ、ＣおよびＤに各々置き換えることによって変換する。原デ
ータセット１００は、圧縮データセット１１０およびマクロ辞書１２０から、マ
クロ記号Ａ、Ｂ、Ｃ、Ｄの各々の発生を対応するマクロ列‘ａｃ’、‘ａａｂ’
、‘ｃａｄ’および‘ｄａｂ’に置き換えることによって再生可能である。

【０００４】原データセット１００は２８記号を含む。圧縮データセット１１０は１２記号
を含み、辞書１２０は１１記号を含む。データセット１００、１１０および辞書
１２０に関する記憶要求が記憶されている記号の数に直接比例するとすると、図
１の圧縮は、結果として、１８％の記憶要求節減を生じる（（２８−（１２＋１
１））／２８）。同様に、原データセット１００を、制限されたバンド幅の通信
チャネルを経て通信しようとする場合、圧縮データセット１１０および辞書１２
０の伝送は、結果として、１８％のバンド幅節減を生じる。

【０００５】当業者には明らかなように、上述した記憶および通信要求における節減は、マ
クロ記号によって置き換えられる列の選択に依存する。例えば、マクロ列‘ｅｃ
’１０１、１０１’をマクロ記号Ａによる置き換えに選択しない場合、マクロ列
‘ｃａａｂ’を、記号ｃをマクロ列１０２、１０２’に含めることによって形成
することができ、結果として、辞書１２０および圧縮データセット１１０におけ
る記号数が減少する。他のマクロ列グループ化は、辞書１２０または圧縮データ
セット１１０における記号数を増加させるかもしれず、減少させるかもしれない
。

【０００６】どの列をマクロとして選択するかを決定する一般的な方法は、”グリーディ（
ｇｒｅｅｄｙ：貪欲）”アルゴリズムに基づく。価値を各々の可能なマクロ列に
関連付け、前記グリーディアルゴリズムは、その名が暗示するように、最も高い
価値を有する列を選択する。その後、次に最も高い価値を有する次のマクロ列を
選択し、同様に続ける。図２は、データセット１００において繰り返される列に
関する価値の決定の一例を示す。データセット１００における４つの記号までの
各々の繰り返される列を、すべての他の列に関係なく、価値に関して評価する。
例えば、データセット１００において１０１、１０１’で２回現れる列‘ｅｃ’
を考える。この列を辞書１２０におくことは、２つの記号を必要とし、マクロ列
‘ｅｃ’の発生１０１、１０１’をマクロ記号Ａで置き換えることは、発生１０
１、１０１’あたり１つの記号を節約する。したがって、列‘ｅｃ’を使用する
ことの価値は、図２のライン２０１において示すようにゼロである（２回の発生
×発生あたり１つの記号の節約−辞書における２つの記号）。他方において、列
‘ｃａ’は、データセット１００において４回生じ、図２のライン２０２に示す
ように２の価値を有する（４回の発生×発生あたり１記号の節約−辞書における
２記号）。同様に、図２のライン２０５に示すように、列‘ａｂｃａ’はデータ
セット１００において２回生じ、５の価値を有する（３回の発生×発生あたり３
記号の節約−辞書における４記号）。当業者には明らかなように、前記マクロ記
号がサイズにおいて前記データセットにおける原記号より小さいまたは大きい場
合、または、前記辞書における原記号の記憶がより多くのまたはより少ない記憶
資源を要求する場合、各々の列の価値の決定は、相当して影響を受ける。

【０００７】各々の列の”価値”を、多数の方法において規定することができる。上記例に
おいて、前記価値を、単に記憶要求における節減として規定した。マクロの価値
は、例えば、特定の列の置き換えに関する困難さまたは時間ペナルティ等に基づ
いてもよい。すなわち、例えば、短い列は長い列よりも置き換えるのが簡単また
は速いかもしれず、したがって、長い列の価値を、単に記憶要求に基づく価値と
比較して減らしてもよい。しかしながら、前記価値を規定し、前記グリーディア
ルゴリズムを使用し、最高の前記規定された価値を有する列を選択することによ
って、前記圧縮処理の規定された価値を最高にしようとする。しかしながら、当
業者には既知のように、最高の価値を有する列を選択することは、最終解が最高
の価値を発生することを必ずしも保証しない。

【０００８】図３は、図２に示す規定された価値決定を使用し、前記グリーディアルゴリズ
ムをデータセット１００に用いた結果を示す。列‘ａｂｃａ’は、上記で規定し
たように、５の記号節約を有する最高の価値を有する。‘ａｂｃａ’の各々の発
生３０１、３０１’、３０１”を圧縮データセット３１０においてマクロ記号Ａ
３０１、３０１’、３０１”によって置き換えることは、結果として、合計記号
数（圧縮データセット３１０における１９記号に加え、辞書（図示せず）におい
て‘ａｂｃａ’を記憶するための４記号）における５記号の節減を生じる。前記
グリーディアルゴリズムによれば、圧縮データセット３１０において繰り返され
る列は認識され、評価される。所定の列の価値は、圧縮データに用いる場合と、
原データセットに用いる場合とで異なるかもしれないことに注意されたい。最低
価値という言葉を、一般に、処理が続くにつれて変化するかもしれないパラメー
タの価値を規定するのに使用し、前記最低価値を、前記処理における所定の時点
における価値とする。前記グリーディアルゴリズムは、圧縮データセット３１０
に関して最も高い最低価値を有する列を選択し、次の圧縮データセットを、前記
選択された列をそのマクロブロックに置き換えることによって発生する。その後
、この次の圧縮データセットに関する最も高い最低価値を有する列を認識し、選
択し、他の圧縮データセットをこの選択されたマクロ列を使用して形成する。こ
の反復される圧縮−再評価−選択プロセスは、その後の選択の最低価値があるカ
ットオフ値を超えるまで、または、マクロ列のある最大値を超えるまで続く。図
３の例において、‘ａｂｃａ’をマクロとして選択するのに応じて、図２のすべ
ての３タプル（文字列の並び）および４タプルの最低価値は、図２の３タプルま
たは４タプルが圧縮データセット３１０において繰り返されないため、ゼロにな
る。２タプル列‘ｅｃ’、‘ｄｅ’、‘ａｂ’および‘ｅｄ’は圧縮データセッ
ト３１０において繰り返されるが、各々はゼロの最低価値を有する（２回の発生
×発生あたり１記号−辞書における２記号）。したがって、前記グリーディアル
ゴリズムは終了し、その解として圧縮データセット３１０を与え、合計記号要求
は２３になる。上述し、図６に示したように、この例においてグリーディアルゴ
リズムによって与えられる解は次善である。

【０００９】最適な解を、すべての可能なマクロ列選択と、前記可能なマクロ選択のすべて
の可能な適用とを徹底的に評価することによって見つけることができる。すなわ
ち、例えば、マクロ列‘ａｂｃａ’がデータセット１００において３回発生する
。図３は、マクロ列‘ａｂｃａ’の選択と、このマクロ列の各発生の置き換えと
に基づく圧縮を示す。他の可能な圧縮は、列‘ａｂｃａ’の選択と、このマクロ
の最初の２回の発生のみの置き換えか、最後の２回の発生の置き換えか、第１お
よび第３の発生の置き換えである。同様に、前記３回の発生の各々を単独で置き
換えてもよい。このように、この１列は、７つの可能な選択の評価を単独で要求
する。これらの７つの可能な選択を、すべての他の繰り返される列のすべてのそ
の後の可能な選択に関して評価しなければならない。前記解が２、３および４タ
プル列のみの使用に限定されるとしても、１７００記号を含むデータセットは、
徹底的な探索に１０^１３１を超える評価を要求するかもしれず、１８００記号を
含むデータセットは１０^４２５を超える評価を要求するかもしれないと見積もら
れる。

【００１０】最低価値を決定する特定の方法を仮定すれば、前記グリーディアルゴリズムは
、非常に少ない数の可能な選択を評価する。図３の例において、前記グリーディ
アルゴリズムは、データセット１００の圧縮に関して数１００の可能な選択のう
ち１つの可能な選択を評価した。前記グリーディアルゴリズムは、よい解を見つ
けるのに幾分有効であるが、よりよい結果を、評価の範囲を拡張し、可能な選択
のより大きい標本化を含むことによって得られると考えられる。

【００１１】発明の簡単な要約本発明の目的は、圧縮を行うのに利用可能な可能な選択の多数の標本化に基づ
く符号圧縮方法および装置を提供することである。本発明の他の目的は、改善さ
れた圧縮を与える可能性がより高い標本を選択する方法を提供することである。

【００１２】これらおよび他の目的を、進化アルゴリズムプロセスによる圧縮選択の選択に
従う符号圧縮方法および装置を提供することによって達成する。好適実施形態に
おいて、圧縮選択の組のランダムな母集団を発生し、各々の圧縮有効性を評価す
る。このランダム母集団を”親”の対に分割し、親の各々の対は”子”の対を発
生する。子の発生において、前記親は、これらの圧縮選択を、自然の親子間の全
般的な特徴の伝達と同様に伝える。前記子の各々によって与えられる圧縮の有効
性を評価し、”適者生存”アルゴリズムを用いて、最も高い圧縮有効性を有する
”個体”を認識する。これらの好適な個体を、子の対を発生する親の対に分割し
、最高の圧縮有効性の個体を、次の発生に関する親であると選択する。子のプロ
セスを、その後の発生が無意味な改善を示すまで続け、最高の個体を解として選
択する。代わりの実施形態において、探索空間をさらに拡張するために、ランダ
ム変化を、その後の発生が無意味な改善を示す場合に導入し、前記プロセスを繰
り返す。

【００１３】発明の詳細な説明反復する子発生プロセスによって動作するある種類のアルゴリズムが開発され
ている。これらの反復子発生プロセスを、一般に、進化アルゴリズムと呼び、発
生アルゴリズム、変異アルゴリズム等を含む。代表的な進化アルゴリズムにおい
て、特定の属性または遺伝子を、所定のタスクを行う能力に関連付けて仮定し、
遺伝子の異なった組み合わせは、前記タスクを行う有効性の異なったレベルを生
じる。前記進化アルゴリズムは、特に、前記属性の組み合わせと前記タスクを行
う有効性との間の関係が閉じた形式の解を持たない問題に有効である。

【００１４】前記子発生プロセスを使用し、遺伝子のどの特定の組み合わせが所定のタスク
を行うのに最も有効なのかを、統制試行錯誤探索を使用して決定する。遺伝子ま
たは属性の組み合わせを、染色体と呼ぶ。前記進化アルゴリズムの発生アルゴリ
ズムクラスにおいて、生殖−組み換えサイクルを使用し、子の世代を繁殖させる
。前記生殖−組み換えサイクルの生殖段階において、異なった染色体を有する母
集団のメンバーは、つがい、子を発生する。これらの子は、親メンバーから渡さ
れた属性を、代表的に、各親からの遺伝子のあるランダムな組み合わせとして有
する。古典的な発生アルゴリズムにおいて、所定のタスクを行うのに他よりも有
効な個体に、つがって子を発生するのにより高い機会を与える。すなわち、子が
、親が効果的に所定の仕事を行うことを可能にしたどちらの遺伝子でも相続する
であろうという希望で、好適な染色体を有する個体に子を発生するのにより高い
機会を与える。前記生殖−組み換えサイクルの組み換え段階は、所定のタスクを
行う有効性を示すこれらに関する優先権に基づいて、親の次の世代の形成を行う
。このようにして、所定のタスクを行うのに有効な属性を有する子の数は、各世
代と共に増加する傾向にある。無性生殖、変異等のような、子を発生する他の方
法の例を使用しても、所定のタスクを行う改善された能力の増加する見込みを有
する子の発生が生じる。

【００１５】本開示の文脈において、前記母集団は、マクロ置換に関する属性の異なった組
み合わせを反映する染色体を有するメンバーから成る。マクロ置換に関する属性
のいくつかの組み合わせは、データセットを圧縮するのに、他の組み合わせより
有効である。本発明によれば、圧縮に関して他よりも有効な染色体を有するメン
バーから子を発生することによって、前記データセットを圧縮する子の有効性を
有効に上昇させる。

【００１６】本発明によって用いることができる多くの進化アルゴリズムが利用可能である
。ＣＨＣ適応性探索アルゴリズムは、参照によってここに含まれる米国特許明細
書第５３９０２８３号に詳細なような、プリント回路ボード用ピックアンドプレ
ースマシーンを構成するような、複雑な組み合わせの工業タスクに特に有効であ
ることがわかっている。他の進化アルゴリズムと比較されるように、ＣＨＣアル
ゴリズムは、”適者生存”組み換え段階を用いる発生アルゴリズムであり、この
アルゴリズムにおいて、親であろうと子であろうとよりよい能力を発揮している
個体のみをその後の組み合わせ段階に用いる。このような選択的生存がもたらす
かもしれない不利な系統的影響を緩和するために、ＣＨＣアルゴリズムは、近親
相姦、きわめて同様な属性を有する個体間の交配を回避する。当業者には明らか
なように、各々の進化アルゴリズムは、反復解もたらすのに使用される前記計画
に関して賛否両論を示し、本発明における使用に関する進化アルゴリズムの特定
の選択は任意である。明瞭かつ理解を容易にするために、他の進化アルゴリズム
の使用が本開示の文脈において当業者に明らかであるとしても、本発明の詳細を
、ＣＨＣアルゴリズムに共通する技術を使用して与える。

【００１７】図４は、本発明によるデータセットの好適な圧縮に関する探索を目的とする進
化アルゴリズムの使用に関する流れ図の例を示す。４１０において、前記データ
セットを示し、前記データセットにおいて繰り返される列を認識する。図２にお
いて示すように、ある列の潜在的価値は、前記列の長さと、前記列が前記データ
セットにおいて生じる回数と、前記列を記憶するコストと、他の要因とに依存す
る。好適実施形態において、その後のタスクの複雑さを減らすために、４１０に
おける可能なマクロ列の認識は、前記データセットを圧縮する前記列の潜在的価
値に悪影響を及ぼす要因に依存する。すなわち、例えば、指定された最小限以下
の最高の潜在的価値を有する列を、可能性があるマクロの列として認識しない。
同様に、マクロ列の長さを、処理を容易にするために制限してもよい。図５は、
図１の例としてのデータセット１００に関連する４記号までの１８のマクロ列５
１０を示す。図２に挙げたように、例データセット１００において４記号までの
２３の反復列に加え、少なくとも１個の５記号反復列‘ａｂｃａｄ’および１個
の６記号反復列‘ａｂｃａｄｅ’が存在する。反復列‘ｅｃ’、‘ａａ’、‘ａ
ｄ’、‘ｄｅ’および‘ｅｄ’を、これらはこの例においてゼロの価値を有する
ため、マクロ列として認識しない。同様に、前記マクロ列のリストを、１の価値
を有する列‘ｂｃ’、‘ｄａ’、‘ｃａａ’、‘ａａｂ’、‘ｃａｄ’、‘ａｄ
ｅ’を含めないことによってさらに減らしてもよい。

【００１８】４２０において、前記マクロ列を染色体構造に割り当てる。簡単な割り当てに
おいて、前記染色体構造をバイナリ染色体の組とし、各々のマクロ列を、この染
色体の組の各々の組に関連付ける。前記バイナリ染色体は、前記関連するマクロ
列の存在を示す一方の値と、前記関連するマクロ列の不在を示す他方の値とを有
する。この例において、前記染色体を、可能なマクロ列の数と同じビットを有す
るバイナリ数として符号化する。他の割り当てまたは表現を、さらに以下で考察
するように用いてもよい。各々のマクロ列を前記染色体構造における位置に割り
当てる。さらに以下で考察するように、処理を容易にするために、好適実施形態
において、前記染色体構造における位置の順序は、前記染色体の圧縮有効性に悪
影響を及ぼす。図５の例において、マクロ列５１０を、図２に示す価値決定の例
を使用して、左から右に価値が低下する順序において与えた。すなわち、図１−
３に関して上述した圧縮の例において、マクロ列‘ａｂｃａ’５１１は、５単位
の価値を有し、図５において最初に左から載せた。４または５の価値を有する他
のマクロ列はなく、したがって、次の４つの列見出し５１２は、３の価値を有す
るマクロ列、‘ａｂｃ’、‘ａｂ’、‘ｂｃａ’および‘ｄａｂ’である。その
後、２および１の価値を有するマクロ列を、各々、その後の列見出しとして載せ
た。

【００１９】４３０において、メンバーの初期母集団を発生する。前記母集団におけるメン
バーの数は、圧縮タスクの大きさに依存する。上記で注意したように、代表的な
データセットに関するマクロ選択の可能な組み合わせの数は、極端に多い。上述
した母集団は、可能な組み合わせの小さい標本である。好適実施形態において、
前記母集団のメンバーの数を少なくとも５０とする。図５の例において、５Ａに
おいて示す初期母集団において８メンバーｃ１−ｃ８５２０が存在する。前記
母集団の各メンバーは、マクロ置換に関する属性のユニークな組を表す染色体を
有する。好適実施形態において、前記ユニーク染色体を、ランダムプロセスによ
って発生する。上述したバイナリ染色体構造を使用すると、各メンバーｃ１−ｃ
８５２０は、各々の染色体位置に割り当てられた０および１のランダム列を有
する。特定のマクロ列の染色体位置における”１”は、対応するメンバー５２０
におけるマクロ列５１０属性の存在を示す。例えば、メンバーｃ１は、マクロ列
‘ａｂｃ’、‘ｄａｂ’、‘ｅｄａｂ’、‘ｃａｄ’および‘ｄａ’の組み合わ
せである染色体５３１を有する。すなわち、メンバーｃ１は、マクロ列‘ａｂｃ
’、‘ｄａｂ’、‘ｅｄａｂ’、‘ｃａｄ’または‘ｄａ’のデータセット１０
０へのどのような組み合わせもタイルする能力を有する。他方において、メンバ
ーｃ３は、マクロ列‘ｃａｄｅ’または‘ａｄｅ’のデータセット１００へのど
のような組み合わせもタイルする能力を有する。

【００２０】図４の例のフローによって続けて、前記母集団の各々の現在のメンバーの圧縮
有効性を４４０において評価する。上述したように、前記母集団の各メンバーは
、前記データセットにタイルし、圧縮データセットを発生することができるマク
ロ列属性の組を有する。これも上述したように、グリーディアルゴリズムのよう
な、マクロの組み合わせのタイリングを行う代わりの方法が利用可能である。例
えば、前記グリーディアルゴリズムを用い、どの利用可能なメンバーマクロ列属
性を第１、第２、第３他に用いるかを決定する。例えば、メンバーｃ１に用いる
グリーディアルゴリズムは、マクロ列‘ｅｄａｂ’の２の価値と比較してマクロ
列‘ａｂｃ’および‘ｄａｂ’は３の価値を有するため、マクロ列‘ａｂｃ’ま
たは‘ｄａｂ’のいずれかを用いる。その後、メンバーｃ１における次のマクロ
列を、これらの最低価値に応じて用いる。しかしながら、当業者には明らかなよ
うに、前記グリーディアルゴリズムは、マクロ列の各々のタイリング後に各々の
選択肢の最低価値を計算するため、重大なリソースを要求する。計算の複雑さを
減らすために、簡単な固定された順序のタイリングを好適実施形態において使用
する。前記マクロ列を前記染色体構造において潜在的価値によって左から右に配
列するため、各々の利用可能なマクロ列を左から右にタイリングすることによっ
て、単一経路のグリーディアルゴリズムのような適用を行う。すなわち、例えば
、図５のメンバーｃ１を、４４０において圧縮有効性に関して、マクロ‘ａｂｃ
’を最初にタイルし、次に‘ｄａｂ’をタイルし、次に‘ｅｄａｂ’をタイルし
、次に‘ｃａｄ’をタイルし、次に‘ｄａ’をタイルすることによって評価する
。これらのタイリングのいくつかは、圧縮プロセスにおいて効果がない。例えば
、データセット１００において‘ｄａｂ’をタイルした後、列‘ｅｄａｂ’にお
けるすべての‘ｄａｂ’の発生は‘ｄａｂ’に関するマクロ記号によって置き換
えられ、列‘ｅｄａｂ’はもはや結果として生じるデータセットにおいて生じな
いため、列‘ｅｄａｂ’の最低価値はその後ゼロになる。当業者には明らかなよ
うに、ブロック４４０において最適化技術を用い、その後の最低価値をもたない
ことがわかるまたは決定されるか、所定の最小値より低い最低価値を有する列を
タイルしようとする必要性を取り除くことができる。図５の例において、各々の
メンバー５２０の圧縮有効性ＣＥ５４０を、各々のメンバー５２０の利用可能
なマクロ列５１０をタイルした後の圧縮されたデータセットおよび辞書における
全記号数として示す。すなわち、上述したようなメンバーｃ１のマクロ列を用い
た結果、２５記号の圧縮データセットおよび辞書に関する結合記憶要求が生じる
。メンバーｃ２は、２３記号の記憶要求を達成することができ、メンバーｃ３は
、２６の記憶要求を達成することができる等である。

【００２１】４５０において、メンバー（例えば、図５におけるｃ１−ｃ８５２０）を、
交配し、子（図５におけるｃ９−ｃ１６５２１）を発生させるために対にする
。ＣＨＣアルゴリズムをこの例としての実施形態に使用するため、前記交配を非
近親相姦メンバー間に限定する。好適実施形態において、メンバーの対の染色体
間の”ハミング距離”を使用し、交配する前記母集団の最も異なるメンバーを決
定する。代わりに、図５に示すように、隣接するメンバーｃ１−ｃ２、ｃ３−ｃ
４、ｃ５−ｃ６およびｃ７−ｃ８を対にし、２つの隣接するメンバーがきわめて
同様な属性を有することがわかっている場合、ペアリングを変更するか、前記隣
接するメンバーを無効にする。前記ペアリングを図５において、染色体セット５
Ａおよび５Ｂ間のバツ印５５０によって示す。本発明の好適実施形態において、
一様交差交配方法を用いる。前記メンバーの対の交配は子の対を発生し、これら
の子は、これらの両親が同じ遺伝子を有する場合、これらの親と同じ遺伝子を有
し、これらの親の遺伝子が異なる場合、これらの親の属性のランダムな組み合わ
せを有する。例えば、図５において、メンバーｃ１およびｃ２を交配し、子ｃ９
およびｃ１０を発生する。メンバーｃ１およびｃ２は、第１（ａｂｃａ）、第４
（ｂｃａ）、第６（ｂｃａｄ）、第７（ｃａｄｅ）、第１０（ｃａａｂ）、第１
２（ｃａａ）、第１５（ａｄｅ）および第１６（ｅｄａ）染色体位置において同
じ遺伝子を有する。したがって、これらの子は、これらの位置の各々において同
じ遺伝子を有する。すなわち、例えば、親ｃ１もｃ２もマクロ列‘ａｂｃａ’属
性を持たず、したがって、これらの子ｃ９、ｃ１０のいずれもマクロ列‘ａｂｃ
ａ’属性を有することができない。親ｃ１、ｃ２は、他の染色体位置の各々にお
いて異なる。子ｃ９、ｃ１０の各々は、親ｃ１、ｃ２の各々からの遺伝子値をラ
ンダムな”交差”方法において受け継ぐ。例えば、オフスプリングｃ９は、第２
、第９、第１３および第１８位置におけるｃ１の属性と、第３、第５、第８、第
１１、第１４および第１７位置におけるｃ２の属性とを受け継ぐ。子ｃ１０は、
これらの位置における反対の親の属性を受け継ぐ。図５の５Ｂにおいて示すよう
に、このランダム交差を、親ｃ１およびｃ２の染色体を子ｃ９およびｃ１０に各
々複製し、次に、ランダムな染色体位置５６１−５６６における遺伝子値を”く
るくる変える”ことによって行う。染色体セット５Ｂの円で囲んだ遺伝子値は、
染色体セット５Ａと比べて変えられたまたは交差された遺伝子値を表す。

【００２２】結果として生じる子の各々は、これらの受け継いだ染色体に基づく圧縮有効性
を示す。これらの有効性程度を、図４の４６０において評価し、図５において、
各々の子ｃ９−ｃ１６５１２に関連する程度５４１として示す。示したように
、子ｃ９は、２５の圧縮有効性程度を有し、子ｃ１０は、２３の圧縮有効性程度
を有する、等である。すべての交配が改善された子を生じるわけではないことに
注意されたい。各々が２４の有効性程度を有するメンバーｃ５およびｃ６は、各
々が２５の有効性程度を有する子の対ｃ１３およびｃ１４を発生する。

【００２３】４７０において、もっと良い能力を発揮する子を、前記母集団のあまり能力を
発揮しないメンバーと入れ替える。図５の例において、子ｃ１０、ｃ１１および
ｃ１５は、２３の有効性程度を有し、メンバー３は２６の有効性程度を有し、メ
ンバーｃ１は２５の有効性程度を有し、メンバーｃ５、ｃ６およびｃ８は２４の
有効性程度を有する。したがって、メンバーｃ３、ｃ１と、メンバーｃ５、ｃ６
およびｃ８のうちの１つを、次の生殖−組み換えサイクル中に、よりよい能力を
発揮する子ｃ１０、ｃ１１およびｃ１５によって置き換える。

【００２４】前記生殖−組み換えプロセスを繰り返すことによって、結果として生じる前記
母集団のメンバーの特徴は、共通の解に収束するようになる。このプロセスは、
ループ４５０−４７２を、前記母集団が収束するまで、または、前記ループが、
例えば、所定の時間期限または他の停止期限に達するのに応じて停止するまで繰
り返す。

【００２５】ブロック４７６を使用し、第１収束解をむやみに使う必要がないことを保証す
る。大抵の方向付けられた試行錯誤捜索の特徴であるように、この探索は、真の
最小に関係してもしなくてもよい局所的最小に収束する。４７６において、前記
生殖−組み換えプロセス全体を、４８０において前記母集団のメンバーのいくつ
かを変異させ、反復プロセス４４０−４７２を繰り返すことによって繰り返す。
本発明の好適実施形態において、前記母集団の最高に能力を発揮するメンバーを
除くすべてのメンバーを、変異したメンバーによって置き換える。変異の方法は
変化してもよく、好適実施形態において、変異したメンバーを、限定された範囲
のランダム変化を前記最高に能力を発揮するメンバーの染色体に導入し、これに
よって、探索空間における前記最高に能力を発揮するメンバーについての標本化
を行うことによって形成する。ＣＨＣアルゴリズムは”適者生存”遺伝戦略を用
いるため、最高に能力を発揮するメンバーは各々の変異−再開サイクルを通じて
保持され、前記反復がより劣った解を再生する恐れはない。

【００２６】いくつかの停止規準を使用し、４７６において、前記進化プロセスを停止する
ときを決定することができる。例えば、同じ最高の能力を発揮するメンバーが、
各々の変異−再開サイクルにおいて繰り返し認識された場合、前記進化プロセス
を停止する。同様に、圧縮における改善の割合が各変異−再開サイクルを通じて
わずかである場合、前記進化プロセスを停止してもよい。同様に、最長タイムリ
ミットを超えた場合、前記進化プロセスを停止する。これらおよび他の反復−停
止技術は、当該技術分野において一般的である。前記プロセスを停止した場合、
４９０において、前記母集団の最高のメンバーを使用し、前記データセットをタ
イルし、この進化アルゴリズムプロセスによって見つかった最高の圧縮データを
発生する。

【００２７】完全にするために、図５は、次の生殖−組み換えサイクルの結果を示す。示し
たように、メンバーの新たな組５２２は、よりよい能力を発揮する子ｃ１０、ｃ
１１およびｃ１５と、元のよりよい能力を発揮する子ｃ２、ｃ４、ｃ６、ｃ７お
よびｃ８とを含む。染色体組５Ｃにおけるメンバー５２２の配置を、異なってい
るメンバーの交配が生じるように構成する。上述したように、メンバー間のハミ
ング距離を使用し、交配の各対における相違を最大にすることができる。図５に
において示すのは、メンバーｃ１５およびｃ２がつがい、子ｃ１７およびｃ１８
を発生することである。染色体組５Ｃの‘ａｂ’列における”１”によって示す
ように、双方のメンバーｃ１５およびｃ２は、マクロ列‘ａｂ’属性を有し、し
たがって、双方の子ｃ１７およびｃ１８は、マクロ列‘ａｂ’属性を有する。前
記交配プロセス中のランダム交差を、染色体組５Ｄにおける円で囲んだ対によっ
て示す。

【００２８】各々の子ｃ１７−ｃ２４５２３の圧縮有効性を図５のＣＥ５４３において
示す。特定の注意は子ｃ２３の圧縮有効性である。子ｃ２３のマクロ属性に対応
する‘ｄａｂ’、‘ｂｃａｄ’、‘ｃａｄｅ’、‘ｅｄａｂ’、‘ｃａａｂ’、
‘ａｄｅ’および‘ｂｃ’のこの順序におけるタイリングを図６において示す。
マクロ列‘ｄａｂ’をタイル６０１、６０１’、６０１”した後、データセット
１００において残る‘ｂｃａｄ’の発生はなく、したがって、マクロ列‘ｂｃａ
ｄ’をこの圧縮において使用しない。同様に、マクロ列‘ｅｄａｂ’、‘ａｄｅ
’および‘ｂｃ’を使用しない。使用するマクロ列‘ｄａｂ’６０１、６０１’
、６０１”、‘ｃａａｂ’６０２、６０２’および‘ｃａｄｅ’６０３，６０３
’に関してマクロ記号Ａ、ＢおよびＣを使用することによって、圧縮データセッ
ト１００は、２１記号の合計記憶要求に関して、１０記号と、１１記号を含む辞
書とを含む。このように、この例において、前記進化アルゴリズムは、上述し、
図３において示した慣例的なグリーディアルゴリズムより少なくとも１よりよい
解を発生する。このよりよく性能を発揮する子ｃ２３と、子ｃ１７、ｃ１８、ｃ
１９、ｃ２１、ｃ２２、ｃ２４のうち１つとは、その後の生殖−組み替えサイク
ルに関するより能力を発揮しないメンバーｃ６およびｃ８に置き換わる。２３の
結合された有効性程度の数が多いめに、ランダム処理を使用し、前記メンバーお
よび子の中から選択し、つがいにする次のメンバーの組を決定することができ、
代わりに、結合されたメンバーおよび子のセットの間のハミング距離を使用し、
最も大きい相違を有する新たなメンバーを選択することができる。

【００２９】上述した詳細は、データセットに関する有効な圧縮案を見つける探索を方向づ
ける進化アルゴリズムの使用の好適な方法および例を与える。この好適な方法お
よび例に基づいて、代わりの方法が、当業者には以下に考察するように明らかで
あろう。

【００３０】前記染色体構造は、マクロ列の数と、前記染色体におけるビット数との間が１
対１である必要はない。能率的な記憶または処理に関する表現を構成する方法お
よび技術は、当該技術分野において一般的である。前記染色体の構造をツリー構
造とすることができ、同様の属性を前記ツリーのブランチ内で結合する。この場
合における前記進化アルゴリズムを構成し、階層的な方法において前記ツリー構
造を処理し、特定のブランチまたは大枝が価値がないと判断された場合、処理の
短縮が可能になる。例えば、データセット１００に対応するツリーを、‘ａｂ’
、‘ａｂｃ’、‘ａｂｃｅ’、‘ｄａｂ’等のような列‘ａｂ’を含むすべての
マクロ列に対応するブランチによって構成することができる。前記メンバーが‘
ａｂ’ブランチ属性を含まない場合、サブブランチとして‘ａｂ’を含まない列
を評価または遺伝させる必要はない。同様に、前記染色体が代表的に比較的わず
かなマクロ列属性しか含まないということがない場合、当該技術分野においては
一般的な空間マトリックス技術を使用し、前記染色体の組を処理するのに必要な
メモリを最小限にすることができる。１つの染色体の遺伝子をマクロ列に限定す
る必要はない。例えば、前記染色体を構成し、前記問題の異なる表現の有効性の
評価、または、異なったアルゴリズムの有効性の評価を行うことができる。すな
わち、例えば、ある染色体の遺伝子の１つは、前記マクロ属性を特定の順序にお
いて用いるかどうかを表わすことができる。この特定の順序におけるマクロ属性
の適用が前記圧縮有効性を改善する場合、好適な子がこの遺伝子を含むことが適
切である。これらおよび他の染色体表現技術は、本開示を読む当業者には明らか
であろう。例えば、固定長のマクロ辞書を使用するプログラミング符号の圧縮に
おいて有功であることがわかった好適実施形態は、上述したビット選択案に機能
的に同等である、インデックス辞書を、バイナリ反射グレイ符号化を使用して符
号化するバイナリ表現を使用する。遺伝子を、ｋｌｏｇ２ビットを使用する染
色体において符号化し、ここでｋをマクロプールの長さ（可能なマクロ列の数）
とし、符号化された場合の各々の遺伝子は、圧縮に使用すべきマクロ列の１０進
数インデックスを表わす。１つの染色体における２重インデックスは、衝突と呼
ばれ、衝突を、前記染色体によって現在明示的に選択されていない次の最高のイ
ンデックスを選択することによって解決する。このようにして、前記染色体にお
ける遺伝子の数は、前記圧縮案において使用されるマクロの数と等しくなる。こ
のようにして、各々の遺伝子は、個々のマクロに配置される前記列におけるビッ
トの位置とは対照的に１つのマクロに直接に配置される。

【００３１】圧縮有効性の決定は、前記圧縮データを表すのに使用した方法と、辞書を形成
するのに使用した方法の関数である。前記例において、あるマクロ列のあるマク
ロ記号による置き換えは、１つの記号が前記マクロの長さにおいてのデータセッ
ト記号の数に取って代わるという結果になった。このような例において、前記マ
クロ記号のサイズを、原データセットにおいて使用した記号（以下、データセッ
ト記号）と同じサイズとする。当該技術分野において既知のように、記号のサイ
ズは、可能なユニークな記号表現の数を決定し、例えば、記号のサイズを８ビッ
トとすると、これらの８ビットによって表すことができる２５６の可能なユニー
クな記号が存在する。マクロ記号をデータセット記号から識別するために、各マ
クロ記号はユニークでなければならない。前記データセット記号が前記記号の元
のサイズ内でユニークマクロ記号の追加をできない場合、前記サイズを増大させ
なければならない。したがって、マクロを追加する”コスト”は、１記号の置換
より大きい。当該技術分野において一般的に、”エスケープ文字”のような１つ
のユニーク記号は、次の記号が、あるデータセット記号ではなく、あるマクロ記
号であることを示すことを意図している。したがって、あるマクロ記号を追加す
るコストは、前記マクロ記号それ自体のサイズに前記エスケープ文字のサイズを
加えたものである。他の例において、所定の数のマクロ記号を、前記データセッ
ト記号の元のサイズ内でユニークに識別することができるが、一度その数を超え
ると、その後のマクロは、追加のコストを招く。このように、マクロの最低コス
トは、前に選択されたマクロの数に依存する。他の例において、前記辞書を、固
定された数の可能なマクロ記号を有する固定されたサイズのアレイとして構成し
てもよく、各々のマクロ記号は、固定された幅の記憶位置において置かれるマク
ロ列を有する。例えば、８個までのマクロ記号を保持することができ、各マクロ
列が４個以下の記号を含む８×４辞書を規定してもよい。８個までのマクロの数
、または、４までの各マクロ列の長さに関係なく、前記辞書に関する同じ８×４
の固定されたサイズが可能である。したがって、満たされているか否かにかかわ
らず前記辞書が存在するため、８個までの各マクロを追加する最低コストはゼロ
である。同様に、多数のデータセットに関連付けられた”汎用”辞書を設けても
よく、各データセットは、この汎用辞書への関連する”特別目的”の追加項目を
有してもよい。前記データセットにおけるマクロ列が前記汎用辞書における項目
に対応する場合、前記汎用辞書のコストは多数のデータセット間に分配され、ま
たは、埋没コストとして無視されるため、前記汎用辞書を使用することの最低コ
ストは、特別目的のマクロの最低コストより低い。通信用途において、前記汎用
辞書が受信機に一度通信されると、圧縮データセットのその後の伝送は、前記汎
用辞書を含む必要がなく、したがって、前記汎用辞書からマクロを使用するコス
トはゼロである。これらおよび他の記号割り当ておよび辞書処理技術と、これら
の関連するコストは、当業者には明らかであろう。

【００３２】前記母集団のメンバーの初期化を、種々の形態において行うことができる。ラ
ンダム遺伝子決定を上記において与えた。代わりに、グリーディアルゴリズムを
前記原データセットに用いることができ、前記母集団のメンバーの１つを、前記
グリーディアルゴリズム解に対応する遺伝子値に初期化することができる。この
ようにして、”適者生存”進化アルゴリズムによって与えられた解を、慣例的な
グリーディアルゴリズムによって与えられるのと少なくとも同じく良好であるこ
とを保証することができる。同様に、前記染色体を、関連するマクロ列属性のグ
ループを表すように構成した場合、前記初期化プロセスを、各グループが前記初
期母集団において少なくとも１度表されたことに基づかせることができる。同様
に、前記”ランダム”初期化プロセスを、例えば、より高い潜在的価値を有する
マクロ列が、それほど生産的でない列より選択される可能性が高い重み付けプロ
セスとすることができる。予め規定されたまたは好適な属性を有する母集団のメ
ンバーの組を形成するこれらおよび他の技術は、当業者には一般的である。

【００３３】マクロ列の規定および確認も、前記母集団の各メンバーの圧縮有効性に影響す
る。例えば、格納効率に関して、入れ子マクロ列をサポートしてもよい。例えば
、マクロ記号Ａが列‘ｂｃａ’を表す場合、マクロ記号Ｂを‘ｄｂｃａ’に対応
する列‘ｄＡ’として規定することができ、マクロ記号Ｃを列‘ｄｂｃａｃｂｃ
ａ’に対応する列‘ＢｃＡ’として規定することができる。入れ子マクロ列規定
を許可することによって、より長い列の部分集合である列のタイリングは、追加
の圧縮に関する前記より長い列の使用を除去する。

【００３４】図７は、本発明による圧縮器７００の一例のブロック図を示す。圧縮器７００
は、プリプロセッサ７１０と、マクロ提案器７２０と、タイラー７３０と、進化
アルゴリズムプロセッサ７５０とを含む。前記圧縮プロセスが始まると、プリプ
ロセッサ７１０は、データセット７０１を処理し、データセット７０１内の可能
なマクロ列を認識する。前記可能なマクロ列をマクロプール７１１において記憶
する。プリプロセッサ７１０は、さらに、マクロプール７１１における列の数の
ような、マクロプール７１１に関連するパラメータ７１４を進化アルゴリズムプ
ロセッサ７５０に供給する。進化アルゴリズムプロセッサ７５０は、図４のブロ
ック４１０−４３０に関して上述したような、異なったマクロ属性を有する初期
メンバーの母集団を発生する。前記初期メンバーは、母集団７５５を形成し、こ
の母集団７５５から、進化アルゴリズムプロセッサ７５０は、子７５２を発生す
る。前記進化プロセスを初期化するために、母集団７５５の初期メンバーの各々
をマクロ提案器７２０およびタイラー７３０に与え、図４のブロック４４０に対
応する、母集団７５５の初期メンバーの各々に関連する圧縮程度７３５を与える
。その後、以下に詳述するように、進化アルゴリズムプロセッサ７５０は、子７
５２を、マクロ提案器７２０およびタイラー７３０に与え、子７５２の各々に関
する圧縮程度７３５を与える。前記初期メンバーおよび子７５２の圧縮程度７３
５を与える処理は、容易に理解されるように同一であるため、図７および以下の
節は、特に子７５２に言及する。

【００３５】マクロ提案器７２０は、各々の子７５２を処理し、各々の子７５２のマクロ属
性から提案されたマクロの組７２１を与える。マクロ提案器７２０は、種々の決
定因子を使用し、前記子のマクロ属性から得られたマクロのどれをどの順序でタ
イラー７３０に与えるべきかを決定してもよい。好適実施形態において、例えば
、プリプロセッサ７１０は、マクロプール７１１における各マクロの初期価値７
１３を決定し、これらの初期価値７１３は、マクロ提案器７２０によって考慮す
べきマクロの順序を含む決定因子を形成する。他の規準７１５は、マクロ間の依
存性、前記タイリングプロセスにおける境界等のような決定因子７１２を形成し
てもよい。

【００３６】データセット７０１に提案されたマクロ７２１の各々をタイルし、圧縮データ
セット７３２と、圧縮データセット７３２において使用される各々の提案された
マクロ７２１を含むマクロ辞書７３１とを形成する。タイラー７３０は、圧縮デ
ータセット７３２およびマクロ辞書７３１のサイズも決定し、各々の子７５２を
評価する進化アルゴリズムプロセッサ７５０によって使用される圧縮有効性の程
度７３５を与える。

【００３７】進化アルゴリズムプロセッサ７５０は、各々の子７５２の圧縮有効性７３５を
、母集団７５５の各々のメンバーの圧縮有効性７３５と比較し、子７５２の次の
発生に関する親を決定する。好適実施形態において、進化アルゴリズムプロセッ
サ７５０は、母集団７５５の子７５２およびメンバーの組み合わせにおける各々
の圧縮有効性に基づいて分類されたリストを発生し、母集団７５５の全体を、図
４のブロック４７０において詳述するように、よりよい圧縮有効性を有する子７
５２および／またはメンバーの組によって置き換える。

【００３８】母集団７５５を最高に圧縮が有効なメンバーによって更新した後、進化アルゴ
リズムプロセッサ７５０は、母集団７５５を親として使用し、その後の子７５２
を発生し、上記プロセスを繰り返す。進化アルゴリズムプロセッサ７５０は、図
４のブロック４７２および４７６の前記収束決定および停止決定も行う。再開が
要求された場合、進化アルゴリズムプロセッサ７５０は、上述したように、前記
母集団を、好適には最高に性能を発揮するメンバー以外を変異させる。前記進化
プロセスが停止した場合、進化アルゴリズムプロセッサ７５０は、進化アルゴリ
ズムプロセッサ７５０によって見つけられた最高の解に対応する最終的な圧縮デ
ータセット７３２およびマクロ辞書７３１に関するタイラー７３０に対する表現
に関する、最高に性能を発揮するメンバーをマクロ提案器７２０に与え、前記プ
ロセスを停止する。

【００３９】上記は単に本発明の原理を説明する。したがって、当業者が、ここに明示的に
説明または示していなくても、本発明の原理を具体化し、したがってその精神お
よび範囲内である種々の配置を考案することができることは明らかであろう。例
えば、タイラー７３０は、前記進化アルゴリズムの各反復において各々の提案さ
れたマクロの組に関する圧縮データセット７３２およびマクロ辞書７３１を明示
的に形成する必要はない。タイラー７３０は、圧縮程度７３５を、圧縮データセ
ット７３２が実際に発生された場合に行われる置換の回数のようなパラメトリッ
クデータに基づいて発生することができる。同様に、タイラー７３０は、徹底的
なタイリングに基づく実際の計算でなく、所定のメンバーが発生する圧縮の推定
に基づく圧縮有効性程度を与える圧縮推定器を含んでもよい。

【００４０】上述したように、どのようなの数の進化アルゴリズムのうち１つを用いてもよ
く、上述した用語およびパラメータを、どの特定の進化アルゴリズムの実行も意
味すると解釈すべきでない。例えば、上記詳細において、対という用語を、つが
う２つのメンバーまたは発生される２つの子を認識するのに使用した。当業者に
は明らかなように、ここに与えた技術を、２つより少ないまたは多いメンバーを
つがいに使用する進化アルゴリズムと、つがいごとに異なった数の子を発生する
進化アルゴリズムと、染色体を長さまたは複雑さにおいて変化することができる
進化アルゴリズムに用いることができる。

【００４１】本発明を記憶空間または通信バンド幅を節約する文脈において与えたが、辞書
記号置換は他の用途において同様に使用される。例えば、暗号化−暗号解読シス
テムにおいて、前記辞書を符号ブックとして使用することができる。前記システ
ムにおける送信装置および受信装置が同じ辞書を有する場合、本発明を使用し、
前記符号辞書に基づいて圧縮されたデータセットを与えることができる。この用
途における前記送信装置は、単に、前記圧縮データセットを前記辞書なしで送信
する。前記受信装置は、前記圧縮データセットを、前記符号辞書を前記圧縮デー
タセットに関連付けることによって、解読する。

【００４２】本発明を、ハードウェア、ソフトウェアまたは双方の組み合わせにおいて実現
することができる。例えば、タイラー７３０を、データの列を記号によって有効
に置き換えることに最適化されたハードウェアエンジンとしてもよく、進化アル
ゴリズムプロセッサ７５０を、汎用コンピュータにおいて実行するアプリケーシ
ョンプログラムとしてもよい。同様に、上述した機能的分割を、説明の目的のみ
のために与えた。例えば、タイラー７３０は、単に、圧縮データセット７３２お
よびマクロ辞書７３１をファイルとして発生することができ、進化アルゴリズム
プロセッサ７５０は、前記圧縮有効性程度を、前記ファイルのサイズを返すシス
テムルーチンにアクセスすることによって得ることができる。これらおよび他の
システムアーキテクチャのトレードオフおよび最適化は、当業者には明らかであ
り、本発明の精神および範囲内である。

【図面の簡単な説明】

【図１】図１は、データセットの圧縮の一例を示す。

【図２】図２は、データセットにおいて繰り返される列に関する価値因子の決
定の一例を示す。

【図３】図３は、慣例的なグリーディアルゴリズムを使用するデータセットの
圧縮の一例を示す。

【図４】図４は、進化アルゴリズムを使用し、本発明によるデータセットの好
適な圧縮に関する探索を管理する流れ図の一例を示す。

【図５】図５は、本発明によるデータセットの好適な圧縮に関する探索を管理
する進化アルゴリズムの適用の一例を示す。

【図６】本発明によるデータセットの圧縮の一例を示す。

【図７】本発明による符号圧縮機のブロック図の一例を示す。

───────────────────────────────────────────────────── フロントページの続き (71)出願人Ｇｒｏｅｎｅｗｏｕｄｓｅｗｅｇ１， 5621 ＢＡＥｉｎｄｈｏｖｅｎ，ＴｈｅＮｅｔｈｅｒｌａｎｄｓ (72)発明者ラリーイェーエシェルマンオランダ国 5656 アーアーアインドーフェンプロフホルストラーン６Ｆターム(参考） 5J064 AA02 BA11 BA14 BA15 BC01 BC18 BD02

Claims

【特許請求の範囲】

【請求項１】データセットを圧縮する圧縮器であって、親染色体の母集団から複数の子染色体を発生するように構成された進化アルゴ
リズムプロセッサと、前記進化アルゴリズムプロセッサに動作的に結合され、前記複数の子染色体の
各々の子染色体を受け、これらから前記各々の子染色体に対応するマクロの組を
発生するマクロ提案器と、前記各々の子染色体に対応するマクロの組の各々のマクロに対応するマクロ列
を含む複数のマクロ列を記憶するように構成されたマクロプールと、前記マクロ提案器およびマクロプールに動作的に結合され、前記マクロプール
と前記各々の子染色体に対応するマクロの組とに基づいて前記データセットの圧
縮を与えるタイラーとを具える圧縮器において、前記進化アルゴリズムプロセッサを、さらに、前記親染色体の母集団を、前記
各々の子染色体に対応する前記データセットの圧縮に関連する圧縮程度に基づい
て変更するように構成したことを特徴とする圧縮器。
【請求項２】請求項１に記載の圧縮器において、前記進化アルゴリズムプロセッサを、前記複数の子染色体を、前記親染色体の
母集団において選択された親染色体のペアリングによって発生するように構成し
たことを特徴とする圧縮器。
【請求項３】請求項１に記載の圧縮器において、前記進化アルゴリズムプロセ
ッサを、前記子染色体をＣＨＣアルゴリズムによって発生するように構成したこ
とを特徴とする圧縮器。
【請求項４】請求項１に記載の圧縮器において、前記タイラーを、少なくとも
１つの子染色体に対応する少なくとも１つのマクロ列を含むマクロ辞書を発生す
るように構成したことを特徴とする圧縮器。
【請求項５】請求項１に記載の圧縮器において、前記進化アルゴリズムプロセ
ッサを、さらに、前記親染色体の母集団の少なくとも１つの親染色体を変異させ
るように構成したことを特徴とする圧縮器。
【請求項６】請求項１に記載の圧縮器において、前記マクロ提案器が、前記マ
クロの組の各々のマクロの最低価値に基づいた前記マクロの組を与え、前記最低
価値が前記各々のマクロに関係する圧縮有効性程度に基づくことを特徴とする圧
縮器。
【請求項７】データセットを圧縮する方法であって、前記データセット内の複数のマクロ列を認識し、マクロ属性を前記複数のマク
ロ列の各々のマクロ列に関連付けるステップと、各々が対応するマクロ属性の組を有する複数の親染色体を発生するステップと
、各々の前記親染色体を評価し、各々の前記親染色体に関連する親圧縮程度を決
定するステップと、進化アルゴリズムプロセスによって前記複数の親染色体に基づいて、各々が対
応するマクロ属性の組を有する複数の子染色体を発生するステップと、前記複数の子染色体の各々の子染色体を評価し、前記各々の子染色体に関係す
る子圧縮程度を決定するステップと、前記各々の子染色体に関係する子圧縮程度に基づいて複数の好適な子染色体を
認識するステップと、前記複数の好適な子染色体に対応するマクロ属性の組に基づいて圧縮データセ
ットを発生するステップとを具えることを特徴とする方法。
【請求項８】請求項７に記載の方法において、前記圧縮データセットを発生す
るステップが、前記選択された染色体の少なくとも１つのマクロ属性に対応する前記データセ
ット内のマクロ列の少なくとも１回の発生に関してマクロ記号を置換するステッ
プを含むことを特徴とする方法。
【請求項９】請求項７に記載の方法において、前記各々の子染色体を評価する
ステップが、少なくとも１つのマクロ属性を前記子染色体から選択するステップと、前記少なくとも１つのマクロ属性を前記データセットにおいてタイリングし、
子データセットを発生するステップと、前記子圧縮程度を前記子データセットのサイズに基づいて決定するステップと
を含むことを特徴とする方法。
【請求項１０】請求項９に記載の方法において、前記少なくとも１つのマクロ
属性を前記子染色体から選択するステップが、前記少なくとも１つのマクロ属性
の最低圧縮有効性に基づくことを特徴とする方法。
【請求項１１】請求項１０に記載の方法において、前記子圧縮程度を決定する
ステップが、前記少なくとも１つのマクロ属性に対応するマクロ列のサイズにも
基づくことを特徴とする方法。