JP2002533960A - 進化アルゴリズムによる符号圧縮 - Google Patents

進化アルゴリズムによる符号圧縮

Info

Publication number
JP2002533960A
JP2002533960A JP2000590103A JP2000590103A JP2002533960A JP 2002533960 A JP2002533960 A JP 2002533960A JP 2000590103 A JP2000590103 A JP 2000590103A JP 2000590103 A JP2000590103 A JP 2000590103A JP 2002533960 A JP2002533960 A JP 2002533960A
Authority
JP
Japan
Prior art keywords
macro
child
chromosomes
compression
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000590103A
Other languages
English (en)
Inventor
デヴィッド スハッフェル イェー
エー マシアス キース
イェー エシェルマン ラリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2002533960A publication Critical patent/JP2002533960A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Generation (AREA)

Abstract

(57)【要約】 マクロ置換に基づく符号圧縮を、進化アルゴリズムプロセスによって管理する。好適実施形態において、マクロ置換の組のランダム母集団を発生し、圧縮有効性を各々の組に関して評価する。このランダム母集団を”親”の対に分割し、親の各対は”子”の対を発生する。前記子の各々によって与えられえる圧縮の有効性を評価し、”適者生存”アルゴリズムを用い、最高の圧縮有効性を有する個体を認識する。これらの好適な個体を、子の対を発生する親の対に分割し、最高圧縮有効性個体を、次の世代に関する親であると選択する。このプロセスを、その後の世代が無意味な改善を示すまで続け、最高の個体を解として選択する。

Description

【発明の詳細な説明】
【0001】 発明の背景1.発明の分野 本発明は、データ記憶の分野に関係し、特に、効率的な記憶に関するデータお
よびプログラミング符号の圧縮に関係する。
【0002】2.関連技術の説明 この「情報時代」において、記憶または通信されている情報量は増え続けてい
る。しかしながら、記憶および通信における進歩にもかかわらず、情報記憶およ
び通信の効率を、情報それ自身を圧縮することによって最適化する必要性が依然
として存在する。例えば、小型計算装置における物理的空間は、貴重なリソース
であり、実際上の制限を有する。アプリケーションプログラムおよびデータファ
イルに必要な記憶を最小にすることは、特に、小型計算装置、通信装置、電子機
器等のような、制限された記憶リソースを有する装置およびシステムのためにな
る。同様に、制限されたバンド幅の通信チャネルを、所定の量の情報を通信する
のに必要なデータ要素数を減らすことによって、より効率的に使用することがで
きる。
【0003】 データセット内の情報を圧縮する1つの方法は、辞書参照方法である。前記デ
ータセット内で繰り返される列を表す記号を、辞書において規定する。前記デー
タセットにおける前記列の各々の発生を、前記列を表す記号によって置き換える
。前記代用記号および前記辞書に関するオーバヘッドが、元の列の存在よりも少
ない記憶空間を消費する場合、記憶空間における節約が達成される。図1は、こ
のような圧縮を示す。非圧縮データセット100を、圧縮データセット110に
、ユニーク記号A、B、CおよびDに関連し、各々非圧縮列100における記号
の列‘ec’、‘aab’、‘cad’および‘dab’を表すマクロ辞書12
0を形成することによって変換する。一般的な述語と一致して、他の記号によっ
て置き換えられる記号の列をマクロと呼び、マクロ列をこれらのマクロ記号によ
って置き換えることをタイリングと呼ぶ。列‘ac’101に対応するマクロA
を、101’において繰り返されるデータセット101における第1列として認
識する。列‘aab’102に対応するマクロBを、102’において繰り返さ
れるデータセット100における次の列として認識する。列‘cad’103に
対応するマクロCを、103’において繰り返されるデータセット100におけ
る次の列として認識する。列‘dab’104に対応するマクロDを、104’
、104”において繰り返されるデータセット100における次の列として認識
する。原データセット100を、圧縮データセット110に、マクロ列‘ac’
、‘aab’、‘cad’および‘dab’の各々の発生101、101’、1
02、102’、103、103’、104、104’、104”を、これらの
対応する記号A、B、CおよびDに各々置き換えることによって変換する。原デ
ータセット100は、圧縮データセット110およびマクロ辞書120から、マ
クロ記号A、B、C、Dの各々の発生を対応するマクロ列‘ac’、‘aab’
、‘cad’および‘dab’に置き換えることによって再生可能である。
【0004】 原データセット100は28記号を含む。圧縮データセット110は12記号
を含み、辞書120は11記号を含む。データセット100、110および辞書
120に関する記憶要求が記憶されている記号の数に直接比例するとすると、図
1の圧縮は、結果として、18%の記憶要求節減を生じる((28−(12+1
1))/28)。同様に、原データセット100を、制限されたバンド幅の通信
チャネルを経て通信しようとする場合、圧縮データセット110および辞書12
0の伝送は、結果として、18%のバンド幅節減を生じる。
【0005】 当業者には明らかなように、上述した記憶および通信要求における節減は、マ
クロ記号によって置き換えられる列の選択に依存する。例えば、マクロ列‘ec
’101、101’をマクロ記号Aによる置き換えに選択しない場合、マクロ列
‘caab’を、記号cをマクロ列102、102’に含めることによって形成
することができ、結果として、辞書120および圧縮データセット110におけ
る記号数が減少する。他のマクロ列グループ化は、辞書120または圧縮データ
セット110における記号数を増加させるかもしれず、減少させるかもしれない
【0006】 どの列をマクロとして選択するかを決定する一般的な方法は、”グリーディ(
greedy:貪欲)”アルゴリズムに基づく。価値を各々の可能なマクロ列に
関連付け、前記グリーディアルゴリズムは、その名が暗示するように、最も高い
価値を有する列を選択する。その後、次に最も高い価値を有する次のマクロ列を
選択し、同様に続ける。図2は、データセット100において繰り返される列に
関する価値の決定の一例を示す。データセット100における4つの記号までの
各々の繰り返される列を、すべての他の列に関係なく、価値に関して評価する。
例えば、データセット100において101、101’で2回現れる列‘ec’
を考える。この列を辞書120におくことは、2つの記号を必要とし、マクロ列
‘ec’の発生101、101’をマクロ記号Aで置き換えることは、発生10
1、101’あたり1つの記号を節約する。したがって、列‘ec’を使用する
ことの価値は、図2のライン201において示すようにゼロである(2回の発生
×発生あたり1つの記号の節約−辞書における2つの記号)。他方において、列
‘ca’は、データセット100において4回生じ、図2のライン202に示す
ように2の価値を有する(4回の発生×発生あたり1記号の節約−辞書における
2記号)。同様に、図2のライン205に示すように、列‘abca’はデータ
セット100において2回生じ、5の価値を有する(3回の発生×発生あたり3
記号の節約−辞書における4記号)。当業者には明らかなように、前記マクロ記
号がサイズにおいて前記データセットにおける原記号より小さいまたは大きい場
合、または、前記辞書における原記号の記憶がより多くのまたはより少ない記憶
資源を要求する場合、各々の列の価値の決定は、相当して影響を受ける。
【0007】 各々の列の”価値”を、多数の方法において規定することができる。上記例に
おいて、前記価値を、単に記憶要求における節減として規定した。マクロの価値
は、例えば、特定の列の置き換えに関する困難さまたは時間ペナルティ等に基づ
いてもよい。すなわち、例えば、短い列は長い列よりも置き換えるのが簡単また
は速いかもしれず、したがって、長い列の価値を、単に記憶要求に基づく価値と
比較して減らしてもよい。しかしながら、前記価値を規定し、前記グリーディア
ルゴリズムを使用し、最高の前記規定された価値を有する列を選択することによ
って、前記圧縮処理の規定された価値を最高にしようとする。しかしながら、当
業者には既知のように、最高の価値を有する列を選択することは、最終解が最高
の価値を発生することを必ずしも保証しない。
【0008】 図3は、図2に示す規定された価値決定を使用し、前記グリーディアルゴリズ
ムをデータセット100に用いた結果を示す。列‘abca’は、上記で規定し
たように、5の記号節約を有する最高の価値を有する。‘abca’の各々の発
生301、301’、301”を圧縮データセット310においてマクロ記号A
301、301’、301”によって置き換えることは、結果として、合計記号
数(圧縮データセット310における19記号に加え、辞書(図示せず)におい
て‘abca’を記憶するための4記号)における5記号の節減を生じる。前記
グリーディアルゴリズムによれば、圧縮データセット310において繰り返され
る列は認識され、評価される。所定の列の価値は、圧縮データに用いる場合と、
原データセットに用いる場合とで異なるかもしれないことに注意されたい。最低
価値という言葉を、一般に、処理が続くにつれて変化するかもしれないパラメー
タの価値を規定するのに使用し、前記最低価値を、前記処理における所定の時点
における価値とする。前記グリーディアルゴリズムは、圧縮データセット310
に関して最も高い最低価値を有する列を選択し、次の圧縮データセットを、前記
選択された列をそのマクロブロックに置き換えることによって発生する。その後
、この次の圧縮データセットに関する最も高い最低価値を有する列を認識し、選
択し、他の圧縮データセットをこの選択されたマクロ列を使用して形成する。こ
の反復される圧縮−再評価−選択プロセスは、その後の選択の最低価値があるカ
ットオフ値を超えるまで、または、マクロ列のある最大値を超えるまで続く。図
3の例において、‘abca’をマクロとして選択するのに応じて、図2のすべ
ての3タプル(文字列の並び)および4タプルの最低価値は、図2の3タプルま
たは4タプルが圧縮データセット310において繰り返されないため、ゼロにな
る。2タプル列‘ec’、‘de’、‘ab’および‘ed’は圧縮データセッ
ト310において繰り返されるが、各々はゼロの最低価値を有する(2回の発生
×発生あたり1記号−辞書における2記号)。したがって、前記グリーディアル
ゴリズムは終了し、その解として圧縮データセット310を与え、合計記号要求
は23になる。上述し、図6に示したように、この例においてグリーディアルゴ
リズムによって与えられる解は次善である。
【0009】 最適な解を、すべての可能なマクロ列選択と、前記可能なマクロ選択のすべて
の可能な適用とを徹底的に評価することによって見つけることができる。すなわ
ち、例えば、マクロ列‘abca’がデータセット100において3回発生する
。図3は、マクロ列‘abca’の選択と、このマクロ列の各発生の置き換えと
に基づく圧縮を示す。他の可能な圧縮は、列‘abca’の選択と、このマクロ
の最初の2回の発生のみの置き換えか、最後の2回の発生の置き換えか、第1お
よび第3の発生の置き換えである。同様に、前記3回の発生の各々を単独で置き
換えてもよい。このように、この1列は、7つの可能な選択の評価を単独で要求
する。これらの7つの可能な選択を、すべての他の繰り返される列のすべてのそ
の後の可能な選択に関して評価しなければならない。前記解が2、3および4タ
プル列のみの使用に限定されるとしても、1700記号を含むデータセットは、
徹底的な探索に10131を超える評価を要求するかもしれず、1800記号を
含むデータセットは10425を超える評価を要求するかもしれないと見積もら
れる。
【0010】 最低価値を決定する特定の方法を仮定すれば、前記グリーディアルゴリズムは
、非常に少ない数の可能な選択を評価する。図3の例において、前記グリーディ
アルゴリズムは、データセット100の圧縮に関して数100の可能な選択のう
ち1つの可能な選択を評価した。前記グリーディアルゴリズムは、よい解を見つ
けるのに幾分有効であるが、よりよい結果を、評価の範囲を拡張し、可能な選択
のより大きい標本化を含むことによって得られると考えられる。
【0011】 発明の簡単な要約 本発明の目的は、圧縮を行うのに利用可能な可能な選択の多数の標本化に基づ
く符号圧縮方法および装置を提供することである。本発明の他の目的は、改善さ
れた圧縮を与える可能性がより高い標本を選択する方法を提供することである。
【0012】 これらおよび他の目的を、進化アルゴリズムプロセスによる圧縮選択の選択に
従う符号圧縮方法および装置を提供することによって達成する。好適実施形態に
おいて、圧縮選択の組のランダムな母集団を発生し、各々の圧縮有効性を評価す
る。このランダム母集団を”親”の対に分割し、親の各々の対は”子”の対を発
生する。子の発生において、前記親は、これらの圧縮選択を、自然の親子間の全
般的な特徴の伝達と同様に伝える。前記子の各々によって与えられる圧縮の有効
性を評価し、”適者生存”アルゴリズムを用いて、最も高い圧縮有効性を有する
”個体”を認識する。これらの好適な個体を、子の対を発生する親の対に分割し
、最高の圧縮有効性の個体を、次の発生に関する親であると選択する。子のプロ
セスを、その後の発生が無意味な改善を示すまで続け、最高の個体を解として選
択する。代わりの実施形態において、探索空間をさらに拡張するために、ランダ
ム変化を、その後の発生が無意味な改善を示す場合に導入し、前記プロセスを繰
り返す。
【0013】 発明の詳細な説明 反復する子発生プロセスによって動作するある種類のアルゴリズムが開発され
ている。これらの反復子発生プロセスを、一般に、進化アルゴリズムと呼び、発
生アルゴリズム、変異アルゴリズム等を含む。代表的な進化アルゴリズムにおい
て、特定の属性または遺伝子を、所定のタスクを行う能力に関連付けて仮定し、
遺伝子の異なった組み合わせは、前記タスクを行う有効性の異なったレベルを生
じる。前記進化アルゴリズムは、特に、前記属性の組み合わせと前記タスクを行
う有効性との間の関係が閉じた形式の解を持たない問題に有効である。
【0014】 前記子発生プロセスを使用し、遺伝子のどの特定の組み合わせが所定のタスク
を行うのに最も有効なのかを、統制試行錯誤探索を使用して決定する。遺伝子ま
たは属性の組み合わせを、染色体と呼ぶ。前記進化アルゴリズムの発生アルゴリ
ズムクラスにおいて、生殖−組み換えサイクルを使用し、子の世代を繁殖させる
。前記生殖−組み換えサイクルの生殖段階において、異なった染色体を有する母
集団のメンバーは、つがい、子を発生する。これらの子は、親メンバーから渡さ
れた属性を、代表的に、各親からの遺伝子のあるランダムな組み合わせとして有
する。古典的な発生アルゴリズムにおいて、所定のタスクを行うのに他よりも有
効な個体に、つがって子を発生するのにより高い機会を与える。すなわち、子が
、親が効果的に所定の仕事を行うことを可能にしたどちらの遺伝子でも相続する
であろうという希望で、好適な染色体を有する個体に子を発生するのにより高い
機会を与える。前記生殖−組み換えサイクルの組み換え段階は、所定のタスクを
行う有効性を示すこれらに関する優先権に基づいて、親の次の世代の形成を行う
。このようにして、所定のタスクを行うのに有効な属性を有する子の数は、各世
代と共に増加する傾向にある。無性生殖、変異等のような、子を発生する他の方
法の例を使用しても、所定のタスクを行う改善された能力の増加する見込みを有
する子の発生が生じる。
【0015】 本開示の文脈において、前記母集団は、マクロ置換に関する属性の異なった組
み合わせを反映する染色体を有するメンバーから成る。マクロ置換に関する属性
のいくつかの組み合わせは、データセットを圧縮するのに、他の組み合わせより
有効である。本発明によれば、圧縮に関して他よりも有効な染色体を有するメン
バーから子を発生することによって、前記データセットを圧縮する子の有効性を
有効に上昇させる。
【0016】 本発明によって用いることができる多くの進化アルゴリズムが利用可能である
。CHC適応性探索アルゴリズムは、参照によってここに含まれる米国特許明細
書第5390283号に詳細なような、プリント回路ボード用ピックアンドプレ
ースマシーンを構成するような、複雑な組み合わせの工業タスクに特に有効であ
ることがわかっている。他の進化アルゴリズムと比較されるように、CHCアル
ゴリズムは、”適者生存”組み換え段階を用いる発生アルゴリズムであり、この
アルゴリズムにおいて、親であろうと子であろうとよりよい能力を発揮している
個体のみをその後の組み合わせ段階に用いる。このような選択的生存がもたらす
かもしれない不利な系統的影響を緩和するために、CHCアルゴリズムは、近親
相姦、きわめて同様な属性を有する個体間の交配を回避する。当業者には明らか
なように、各々の進化アルゴリズムは、反復解もたらすのに使用される前記計画
に関して賛否両論を示し、本発明における使用に関する進化アルゴリズムの特定
の選択は任意である。明瞭かつ理解を容易にするために、他の進化アルゴリズム
の使用が本開示の文脈において当業者に明らかであるとしても、本発明の詳細を
、CHCアルゴリズムに共通する技術を使用して与える。
【0017】 図4は、本発明によるデータセットの好適な圧縮に関する探索を目的とする進
化アルゴリズムの使用に関する流れ図の例を示す。410において、前記データ
セットを示し、前記データセットにおいて繰り返される列を認識する。図2にお
いて示すように、ある列の潜在的価値は、前記列の長さと、前記列が前記データ
セットにおいて生じる回数と、前記列を記憶するコストと、他の要因とに依存す
る。好適実施形態において、その後のタスクの複雑さを減らすために、410に
おける可能なマクロ列の認識は、前記データセットを圧縮する前記列の潜在的価
値に悪影響を及ぼす要因に依存する。すなわち、例えば、指定された最小限以下
の最高の潜在的価値を有する列を、可能性があるマクロの列として認識しない。
同様に、マクロ列の長さを、処理を容易にするために制限してもよい。図5は、
図1の例としてのデータセット100に関連する4記号までの18のマクロ列5
10を示す。図2に挙げたように、例データセット100において4記号までの
23の反復列に加え、少なくとも1個の5記号反復列‘abcad’および1個
の6記号反復列‘abcade’が存在する。反復列‘ec’、‘aa’、‘a
d’、‘de’および‘ed’を、これらはこの例においてゼロの価値を有する
ため、マクロ列として認識しない。同様に、前記マクロ列のリストを、1の価値
を有する列‘bc’、‘da’、‘caa’、‘aab’、‘cad’、‘ad
e’を含めないことによってさらに減らしてもよい。
【0018】 420において、前記マクロ列を染色体構造に割り当てる。簡単な割り当てに
おいて、前記染色体構造をバイナリ染色体の組とし、各々のマクロ列を、この染
色体の組の各々の組に関連付ける。前記バイナリ染色体は、前記関連するマクロ
列の存在を示す一方の値と、前記関連するマクロ列の不在を示す他方の値とを有
する。この例において、前記染色体を、可能なマクロ列の数と同じビットを有す
るバイナリ数として符号化する。他の割り当てまたは表現を、さらに以下で考察
するように用いてもよい。各々のマクロ列を前記染色体構造における位置に割り
当てる。さらに以下で考察するように、処理を容易にするために、好適実施形態
において、前記染色体構造における位置の順序は、前記染色体の圧縮有効性に悪
影響を及ぼす。図5の例において、マクロ列510を、図2に示す価値決定の例
を使用して、左から右に価値が低下する順序において与えた。すなわち、図1−
3に関して上述した圧縮の例において、マクロ列‘abca’511は、5単位
の価値を有し、図5において最初に左から載せた。4または5の価値を有する他
のマクロ列はなく、したがって、次の4つの列見出し512は、3の価値を有す
るマクロ列、‘abc’、‘ab’、‘bca’および‘dab’である。その
後、2および1の価値を有するマクロ列を、各々、その後の列見出しとして載せ
た。
【0019】 430において、メンバーの初期母集団を発生する。前記母集団におけるメン
バーの数は、圧縮タスクの大きさに依存する。上記で注意したように、代表的な
データセットに関するマクロ選択の可能な組み合わせの数は、極端に多い。上述
した母集団は、可能な組み合わせの小さい標本である。好適実施形態において、
前記母集団のメンバーの数を少なくとも50とする。図5の例において、5Aに
おいて示す初期母集団において8メンバーc1−c8 520が存在する。前記
母集団の各メンバーは、マクロ置換に関する属性のユニークな組を表す染色体を
有する。好適実施形態において、前記ユニーク染色体を、ランダムプロセスによ
って発生する。上述したバイナリ染色体構造を使用すると、各メンバーc1−c
8 520は、各々の染色体位置に割り当てられた0および1のランダム列を有
する。特定のマクロ列の染色体位置における”1”は、対応するメンバー520
におけるマクロ列510属性の存在を示す。例えば、メンバーc1は、マクロ列
‘abc’、‘dab’、‘edab’、‘cad’および‘da’の組み合わ
せである染色体531を有する。すなわち、メンバーc1は、マクロ列‘abc
’、‘dab’、‘edab’、‘cad’または‘da’のデータセット10
0へのどのような組み合わせもタイルする能力を有する。他方において、メンバ
ーc3は、マクロ列‘cade’または‘ade’のデータセット100へのど
のような組み合わせもタイルする能力を有する。
【0020】 図4の例のフローによって続けて、前記母集団の各々の現在のメンバーの圧縮
有効性を440において評価する。上述したように、前記母集団の各メンバーは
、前記データセットにタイルし、圧縮データセットを発生することができるマク
ロ列属性の組を有する。これも上述したように、グリーディアルゴリズムのよう
な、マクロの組み合わせのタイリングを行う代わりの方法が利用可能である。例
えば、前記グリーディアルゴリズムを用い、どの利用可能なメンバーマクロ列属
性を第1、第2、第3他に用いるかを決定する。例えば、メンバーc1に用いる
グリーディアルゴリズムは、マクロ列‘edab’の2の価値と比較してマクロ
列‘abc’および‘dab’は3の価値を有するため、マクロ列‘abc’ま
たは‘dab’のいずれかを用いる。その後、メンバーc1における次のマクロ
列を、これらの最低価値に応じて用いる。しかしながら、当業者には明らかなよ
うに、前記グリーディアルゴリズムは、マクロ列の各々のタイリング後に各々の
選択肢の最低価値を計算するため、重大なリソースを要求する。計算の複雑さを
減らすために、簡単な固定された順序のタイリングを好適実施形態において使用
する。前記マクロ列を前記染色体構造において潜在的価値によって左から右に配
列するため、各々の利用可能なマクロ列を左から右にタイリングすることによっ
て、単一経路のグリーディアルゴリズムのような適用を行う。すなわち、例えば
、図5のメンバーc1を、440において圧縮有効性に関して、マクロ‘abc
’を最初にタイルし、次に‘dab’をタイルし、次に‘edab’をタイルし
、次に‘cad’をタイルし、次に‘da’をタイルすることによって評価する
。これらのタイリングのいくつかは、圧縮プロセスにおいて効果がない。例えば
、データセット100において‘dab’をタイルした後、列‘edab’にお
けるすべての‘dab’の発生は‘dab’に関するマクロ記号によって置き換
えられ、列‘edab’はもはや結果として生じるデータセットにおいて生じな
いため、列‘edab’の最低価値はその後ゼロになる。当業者には明らかなよ
うに、ブロック440において最適化技術を用い、その後の最低価値をもたない
ことがわかるまたは決定されるか、所定の最小値より低い最低価値を有する列を
タイルしようとする必要性を取り除くことができる。図5の例において、各々の
メンバー520の圧縮有効性CE 540を、各々のメンバー520の利用可能
なマクロ列510をタイルした後の圧縮されたデータセットおよび辞書における
全記号数として示す。すなわち、上述したようなメンバーc1のマクロ列を用い
た結果、25記号の圧縮データセットおよび辞書に関する結合記憶要求が生じる
。メンバーc2は、23記号の記憶要求を達成することができ、メンバーc3は
、26の記憶要求を達成することができる等である。
【0021】 450において、メンバー(例えば、図5におけるc1−c8 520)を、
交配し、子(図5におけるc9−c16 521)を発生させるために対にする
。CHCアルゴリズムをこの例としての実施形態に使用するため、前記交配を非
近親相姦メンバー間に限定する。好適実施形態において、メンバーの対の染色体
間の”ハミング距離”を使用し、交配する前記母集団の最も異なるメンバーを決
定する。代わりに、図5に示すように、隣接するメンバーc1−c2、c3−c
4、c5−c6およびc7−c8を対にし、2つの隣接するメンバーがきわめて
同様な属性を有することがわかっている場合、ペアリングを変更するか、前記隣
接するメンバーを無効にする。前記ペアリングを図5において、染色体セット5
Aおよび5B間のバツ印550によって示す。本発明の好適実施形態において、
一様交差交配方法を用いる。前記メンバーの対の交配は子の対を発生し、これら
の子は、これらの両親が同じ遺伝子を有する場合、これらの親と同じ遺伝子を有
し、これらの親の遺伝子が異なる場合、これらの親の属性のランダムな組み合わ
せを有する。例えば、図5において、メンバーc1およびc2を交配し、子c9
およびc10を発生する。メンバーc1およびc2は、第1(abca)、第4
(bca)、第6(bcad)、第7(cade)、第10(caab)、第1
2(caa)、第15(ade)および第16(eda)染色体位置において同
じ遺伝子を有する。したがって、これらの子は、これらの位置の各々において同
じ遺伝子を有する。すなわち、例えば、親c1もc2もマクロ列‘abca’属
性を持たず、したがって、これらの子c9、c10のいずれもマクロ列‘abc
a’属性を有することができない。親c1、c2は、他の染色体位置の各々にお
いて異なる。子c9、c10の各々は、親c1、c2の各々からの遺伝子値をラ
ンダムな”交差”方法において受け継ぐ。例えば、オフスプリングc9は、第2
、第9、第13および第18位置におけるc1の属性と、第3、第5、第8、第
11、第14および第17位置におけるc2の属性とを受け継ぐ。子c10は、
これらの位置における反対の親の属性を受け継ぐ。図5の5Bにおいて示すよう
に、このランダム交差を、親c1およびc2の染色体を子c9およびc10に各
々複製し、次に、ランダムな染色体位置561−566における遺伝子値を”く
るくる変える”ことによって行う。染色体セット5Bの円で囲んだ遺伝子値は、
染色体セット5Aと比べて変えられたまたは交差された遺伝子値を表す。
【0022】 結果として生じる子の各々は、これらの受け継いだ染色体に基づく圧縮有効性
を示す。これらの有効性程度を、図4の460において評価し、図5において、
各々の子c9−c16 512に関連する程度541として示す。示したように
、子c9は、25の圧縮有効性程度を有し、子c10は、23の圧縮有効性程度
を有する、等である。すべての交配が改善された子を生じるわけではないことに
注意されたい。各々が24の有効性程度を有するメンバーc5およびc6は、各
々が25の有効性程度を有する子の対c13およびc14を発生する。
【0023】 470において、もっと良い能力を発揮する子を、前記母集団のあまり能力を
発揮しないメンバーと入れ替える。図5の例において、子c10、c11および
c15は、23の有効性程度を有し、メンバー3は26の有効性程度を有し、メ
ンバーc1は25の有効性程度を有し、メンバーc5、c6およびc8は24の
有効性程度を有する。したがって、メンバーc3、c1と、メンバーc5、c6
およびc8のうちの1つを、次の生殖−組み換えサイクル中に、よりよい能力を
発揮する子c10、c11およびc15によって置き換える。
【0024】 前記生殖−組み換えプロセスを繰り返すことによって、結果として生じる前記
母集団のメンバーの特徴は、共通の解に収束するようになる。このプロセスは、
ループ450−472を、前記母集団が収束するまで、または、前記ループが、
例えば、所定の時間期限または他の停止期限に達するのに応じて停止するまで繰
り返す。
【0025】 ブロック476を使用し、第1収束解をむやみに使う必要がないことを保証す
る。大抵の方向付けられた試行錯誤捜索の特徴であるように、この探索は、真の
最小に関係してもしなくてもよい局所的最小に収束する。476において、前記
生殖−組み換えプロセス全体を、480において前記母集団のメンバーのいくつ
かを変異させ、反復プロセス440−472を繰り返すことによって繰り返す。
本発明の好適実施形態において、前記母集団の最高に能力を発揮するメンバーを
除くすべてのメンバーを、変異したメンバーによって置き換える。変異の方法は
変化してもよく、好適実施形態において、変異したメンバーを、限定された範囲
のランダム変化を前記最高に能力を発揮するメンバーの染色体に導入し、これに
よって、探索空間における前記最高に能力を発揮するメンバーについての標本化
を行うことによって形成する。CHCアルゴリズムは”適者生存”遺伝戦略を用
いるため、最高に能力を発揮するメンバーは各々の変異−再開サイクルを通じて
保持され、前記反復がより劣った解を再生する恐れはない。
【0026】 いくつかの停止規準を使用し、476において、前記進化プロセスを停止する
ときを決定することができる。例えば、同じ最高の能力を発揮するメンバーが、
各々の変異−再開サイクルにおいて繰り返し認識された場合、前記進化プロセス
を停止する。同様に、圧縮における改善の割合が各変異−再開サイクルを通じて
わずかである場合、前記進化プロセスを停止してもよい。同様に、最長タイムリ
ミットを超えた場合、前記進化プロセスを停止する。これらおよび他の反復−停
止技術は、当該技術分野において一般的である。前記プロセスを停止した場合、
490において、前記母集団の最高のメンバーを使用し、前記データセットをタ
イルし、この進化アルゴリズムプロセスによって見つかった最高の圧縮データを
発生する。
【0027】 完全にするために、図5は、次の生殖−組み換えサイクルの結果を示す。示し
たように、メンバーの新たな組522は、よりよい能力を発揮する子c10、c
11およびc15と、元のよりよい能力を発揮する子c2、c4、c6、c7お
よびc8とを含む。染色体組5Cにおけるメンバー522の配置を、異なってい
るメンバーの交配が生じるように構成する。上述したように、メンバー間のハミ
ング距離を使用し、交配の各対における相違を最大にすることができる。図5に
において示すのは、メンバーc15およびc2がつがい、子c17およびc18
を発生することである。染色体組5Cの‘ab’列における”1”によって示す
ように、双方のメンバーc15およびc2は、マクロ列‘ab’属性を有し、し
たがって、双方の子c17およびc18は、マクロ列‘ab’属性を有する。前
記交配プロセス中のランダム交差を、染色体組5Dにおける円で囲んだ対によっ
て示す。
【0028】 各々の子c17−c24 523の圧縮有効性を図5のCE 543において
示す。特定の注意は子c23の圧縮有効性である。子c23のマクロ属性に対応
する‘dab’、‘bcad’、‘cade’、‘edab’、‘caab’、
‘ade’および‘bc’のこの順序におけるタイリングを図6において示す。
マクロ列‘dab’をタイル601、601’、601”した後、データセット
100において残る‘bcad’の発生はなく、したがって、マクロ列‘bca
d’をこの圧縮において使用しない。同様に、マクロ列‘edab’、‘ade
’および‘bc’を使用しない。使用するマクロ列‘dab’601、601’
、601”、‘caab’602、602’および‘cade’603,603
’に関してマクロ記号A、BおよびCを使用することによって、圧縮データセッ
ト100は、21記号の合計記憶要求に関して、10記号と、11記号を含む辞
書とを含む。このように、この例において、前記進化アルゴリズムは、上述し、
図3において示した慣例的なグリーディアルゴリズムより少なくとも1よりよい
解を発生する。このよりよく性能を発揮する子c23と、子c17、c18、c
19、c21、c22、c24のうち1つとは、その後の生殖−組み替えサイク
ルに関するより能力を発揮しないメンバーc6およびc8に置き換わる。23の
結合された有効性程度の数が多いめに、ランダム処理を使用し、前記メンバーお
よび子の中から選択し、つがいにする次のメンバーの組を決定することができ、
代わりに、結合されたメンバーおよび子のセットの間のハミング距離を使用し、
最も大きい相違を有する新たなメンバーを選択することができる。
【0029】 上述した詳細は、データセットに関する有効な圧縮案を見つける探索を方向づ
ける進化アルゴリズムの使用の好適な方法および例を与える。この好適な方法お
よび例に基づいて、代わりの方法が、当業者には以下に考察するように明らかで
あろう。
【0030】 前記染色体構造は、マクロ列の数と、前記染色体におけるビット数との間が1
対1である必要はない。能率的な記憶または処理に関する表現を構成する方法お
よび技術は、当該技術分野において一般的である。前記染色体の構造をツリー構
造とすることができ、同様の属性を前記ツリーのブランチ内で結合する。この場
合における前記進化アルゴリズムを構成し、階層的な方法において前記ツリー構
造を処理し、特定のブランチまたは大枝が価値がないと判断された場合、処理の
短縮が可能になる。例えば、データセット100に対応するツリーを、‘ab’
、‘abc’、‘abce’、‘dab’等のような列‘ab’を含むすべての
マクロ列に対応するブランチによって構成することができる。前記メンバーが‘
ab’ブランチ属性を含まない場合、サブブランチとして‘ab’を含まない列
を評価または遺伝させる必要はない。同様に、前記染色体が代表的に比較的わず
かなマクロ列属性しか含まないということがない場合、当該技術分野においては
一般的な空間マトリックス技術を使用し、前記染色体の組を処理するのに必要な
メモリを最小限にすることができる。1つの染色体の遺伝子をマクロ列に限定す
る必要はない。例えば、前記染色体を構成し、前記問題の異なる表現の有効性の
評価、または、異なったアルゴリズムの有効性の評価を行うことができる。すな
わち、例えば、ある染色体の遺伝子の1つは、前記マクロ属性を特定の順序にお
いて用いるかどうかを表わすことができる。この特定の順序におけるマクロ属性
の適用が前記圧縮有効性を改善する場合、好適な子がこの遺伝子を含むことが適
切である。これらおよび他の染色体表現技術は、本開示を読む当業者には明らか
であろう。例えば、固定長のマクロ辞書を使用するプログラミング符号の圧縮に
おいて有功であることがわかった好適実施形態は、上述したビット選択案に機能
的に同等である、インデックス辞書を、バイナリ反射グレイ符号化を使用して符
号化するバイナリ表現を使用する。遺伝子を、k log2ビットを使用する染
色体において符号化し、ここでkをマクロプールの長さ(可能なマクロ列の数)
とし、符号化された場合の各々の遺伝子は、圧縮に使用すべきマクロ列の10進
数インデックスを表わす。1つの染色体における2重インデックスは、衝突と呼
ばれ、衝突を、前記染色体によって現在明示的に選択されていない次の最高のイ
ンデックスを選択することによって解決する。このようにして、前記染色体にお
ける遺伝子の数は、前記圧縮案において使用されるマクロの数と等しくなる。こ
のようにして、各々の遺伝子は、個々のマクロに配置される前記列におけるビッ
トの位置とは対照的に1つのマクロに直接に配置される。
【0031】 圧縮有効性の決定は、前記圧縮データを表すのに使用した方法と、辞書を形成
するのに使用した方法の関数である。前記例において、あるマクロ列のあるマク
ロ記号による置き換えは、1つの記号が前記マクロの長さにおいてのデータセッ
ト記号の数に取って代わるという結果になった。このような例において、前記マ
クロ記号のサイズを、原データセットにおいて使用した記号(以下、データセッ
ト記号)と同じサイズとする。当該技術分野において既知のように、記号のサイ
ズは、可能なユニークな記号表現の数を決定し、例えば、記号のサイズを8ビッ
トとすると、これらの8ビットによって表すことができる256の可能なユニー
クな記号が存在する。マクロ記号をデータセット記号から識別するために、各マ
クロ記号はユニークでなければならない。前記データセット記号が前記記号の元
のサイズ内でユニークマクロ記号の追加をできない場合、前記サイズを増大させ
なければならない。したがって、マクロを追加する”コスト”は、1記号の置換
より大きい。当該技術分野において一般的に、”エスケープ文字”のような1つ
のユニーク記号は、次の記号が、あるデータセット記号ではなく、あるマクロ記
号であることを示すことを意図している。したがって、あるマクロ記号を追加す
るコストは、前記マクロ記号それ自体のサイズに前記エスケープ文字のサイズを
加えたものである。他の例において、所定の数のマクロ記号を、前記データセッ
ト記号の元のサイズ内でユニークに識別することができるが、一度その数を超え
ると、その後のマクロは、追加のコストを招く。このように、マクロの最低コス
トは、前に選択されたマクロの数に依存する。他の例において、前記辞書を、固
定された数の可能なマクロ記号を有する固定されたサイズのアレイとして構成し
てもよく、各々のマクロ記号は、固定された幅の記憶位置において置かれるマク
ロ列を有する。例えば、8個までのマクロ記号を保持することができ、各マクロ
列が4個以下の記号を含む8×4辞書を規定してもよい。8個までのマクロの数
、または、4までの各マクロ列の長さに関係なく、前記辞書に関する同じ8×4
の固定されたサイズが可能である。したがって、満たされているか否かにかかわ
らず前記辞書が存在するため、8個までの各マクロを追加する最低コストはゼロ
である。同様に、多数のデータセットに関連付けられた”汎用”辞書を設けても
よく、各データセットは、この汎用辞書への関連する”特別目的”の追加項目を
有してもよい。前記データセットにおけるマクロ列が前記汎用辞書における項目
に対応する場合、前記汎用辞書のコストは多数のデータセット間に分配され、ま
たは、埋没コストとして無視されるため、前記汎用辞書を使用することの最低コ
ストは、特別目的のマクロの最低コストより低い。通信用途において、前記汎用
辞書が受信機に一度通信されると、圧縮データセットのその後の伝送は、前記汎
用辞書を含む必要がなく、したがって、前記汎用辞書からマクロを使用するコス
トはゼロである。これらおよび他の記号割り当ておよび辞書処理技術と、これら
の関連するコストは、当業者には明らかであろう。
【0032】 前記母集団のメンバーの初期化を、種々の形態において行うことができる。ラ
ンダム遺伝子決定を上記において与えた。代わりに、グリーディアルゴリズムを
前記原データセットに用いることができ、前記母集団のメンバーの1つを、前記
グリーディアルゴリズム解に対応する遺伝子値に初期化することができる。この
ようにして、”適者生存”進化アルゴリズムによって与えられた解を、慣例的な
グリーディアルゴリズムによって与えられるのと少なくとも同じく良好であるこ
とを保証することができる。同様に、前記染色体を、関連するマクロ列属性のグ
ループを表すように構成した場合、前記初期化プロセスを、各グループが前記初
期母集団において少なくとも1度表されたことに基づかせることができる。同様
に、前記”ランダム”初期化プロセスを、例えば、より高い潜在的価値を有する
マクロ列が、それほど生産的でない列より選択される可能性が高い重み付けプロ
セスとすることができる。予め規定されたまたは好適な属性を有する母集団のメ
ンバーの組を形成するこれらおよび他の技術は、当業者には一般的である。
【0033】 マクロ列の規定および確認も、前記母集団の各メンバーの圧縮有効性に影響す
る。例えば、格納効率に関して、入れ子マクロ列をサポートしてもよい。例えば
、マクロ記号Aが列‘bca’を表す場合、マクロ記号Bを‘dbca’に対応
する列‘dA’として規定することができ、マクロ記号Cを列‘dbcacbc
a’に対応する列‘BcA’として規定することができる。入れ子マクロ列規定
を許可することによって、より長い列の部分集合である列のタイリングは、追加
の圧縮に関する前記より長い列の使用を除去する。
【0034】 図7は、本発明による圧縮器700の一例のブロック図を示す。圧縮器700
は、プリプロセッサ710と、マクロ提案器720と、タイラー730と、進化
アルゴリズムプロセッサ750とを含む。前記圧縮プロセスが始まると、プリプ
ロセッサ710は、データセット701を処理し、データセット701内の可能
なマクロ列を認識する。前記可能なマクロ列をマクロプール711において記憶
する。プリプロセッサ710は、さらに、マクロプール711における列の数の
ような、マクロプール711に関連するパラメータ714を進化アルゴリズムプ
ロセッサ750に供給する。進化アルゴリズムプロセッサ750は、図4のブロ
ック410−430に関して上述したような、異なったマクロ属性を有する初期
メンバーの母集団を発生する。前記初期メンバーは、母集団755を形成し、こ
の母集団755から、進化アルゴリズムプロセッサ750は、子752を発生す
る。前記進化プロセスを初期化するために、母集団755の初期メンバーの各々
をマクロ提案器720およびタイラー730に与え、図4のブロック440に対
応する、母集団755の初期メンバーの各々に関連する圧縮程度735を与える
。その後、以下に詳述するように、進化アルゴリズムプロセッサ750は、子7
52を、マクロ提案器720およびタイラー730に与え、子752の各々に関
する圧縮程度735を与える。前記初期メンバーおよび子752の圧縮程度73
5を与える処理は、容易に理解されるように同一であるため、図7および以下の
節は、特に子752に言及する。
【0035】 マクロ提案器720は、各々の子752を処理し、各々の子752のマクロ属
性から提案されたマクロの組721を与える。マクロ提案器720は、種々の決
定因子を使用し、前記子のマクロ属性から得られたマクロのどれをどの順序でタ
イラー730に与えるべきかを決定してもよい。好適実施形態において、例えば
、プリプロセッサ710は、マクロプール711における各マクロの初期価値7
13を決定し、これらの初期価値713は、マクロ提案器720によって考慮す
べきマクロの順序を含む決定因子を形成する。他の規準715は、マクロ間の依
存性、前記タイリングプロセスにおける境界等のような決定因子712を形成し
てもよい。
【0036】 データセット701に提案されたマクロ721の各々をタイルし、圧縮データ
セット732と、圧縮データセット732において使用される各々の提案された
マクロ721を含むマクロ辞書731とを形成する。タイラー730は、圧縮デ
ータセット732およびマクロ辞書731のサイズも決定し、各々の子752を
評価する進化アルゴリズムプロセッサ750によって使用される圧縮有効性の程
度735を与える。
【0037】 進化アルゴリズムプロセッサ750は、各々の子752の圧縮有効性735を
、母集団755の各々のメンバーの圧縮有効性735と比較し、子752の次の
発生に関する親を決定する。好適実施形態において、進化アルゴリズムプロセッ
サ750は、母集団755の子752およびメンバーの組み合わせにおける各々
の圧縮有効性に基づいて分類されたリストを発生し、母集団755の全体を、図
4のブロック470において詳述するように、よりよい圧縮有効性を有する子7
52および/またはメンバーの組によって置き換える。
【0038】 母集団755を最高に圧縮が有効なメンバーによって更新した後、進化アルゴ
リズムプロセッサ750は、母集団755を親として使用し、その後の子752
を発生し、上記プロセスを繰り返す。進化アルゴリズムプロセッサ750は、図
4のブロック472および476の前記収束決定および停止決定も行う。再開が
要求された場合、進化アルゴリズムプロセッサ750は、上述したように、前記
母集団を、好適には最高に性能を発揮するメンバー以外を変異させる。前記進化
プロセスが停止した場合、進化アルゴリズムプロセッサ750は、進化アルゴリ
ズムプロセッサ750によって見つけられた最高の解に対応する最終的な圧縮デ
ータセット732およびマクロ辞書731に関するタイラー730に対する表現
に関する、最高に性能を発揮するメンバーをマクロ提案器720に与え、前記プ
ロセスを停止する。
【0039】 上記は単に本発明の原理を説明する。したがって、当業者が、ここに明示的に
説明または示していなくても、本発明の原理を具体化し、したがってその精神お
よび範囲内である種々の配置を考案することができることは明らかであろう。例
えば、タイラー730は、前記進化アルゴリズムの各反復において各々の提案さ
れたマクロの組に関する圧縮データセット732およびマクロ辞書731を明示
的に形成する必要はない。タイラー730は、圧縮程度735を、圧縮データセ
ット732が実際に発生された場合に行われる置換の回数のようなパラメトリッ
クデータに基づいて発生することができる。同様に、タイラー730は、徹底的
なタイリングに基づく実際の計算でなく、所定のメンバーが発生する圧縮の推定
に基づく圧縮有効性程度を与える圧縮推定器を含んでもよい。
【0040】 上述したように、どのようなの数の進化アルゴリズムのうち1つを用いてもよ
く、上述した用語およびパラメータを、どの特定の進化アルゴリズムの実行も意
味すると解釈すべきでない。例えば、上記詳細において、対という用語を、つが
う2つのメンバーまたは発生される2つの子を認識するのに使用した。当業者に
は明らかなように、ここに与えた技術を、2つより少ないまたは多いメンバーを
つがいに使用する進化アルゴリズムと、つがいごとに異なった数の子を発生する
進化アルゴリズムと、染色体を長さまたは複雑さにおいて変化することができる
進化アルゴリズムに用いることができる。
【0041】 本発明を記憶空間または通信バンド幅を節約する文脈において与えたが、辞書
記号置換は他の用途において同様に使用される。例えば、暗号化−暗号解読シス
テムにおいて、前記辞書を符号ブックとして使用することができる。前記システ
ムにおける送信装置および受信装置が同じ辞書を有する場合、本発明を使用し、
前記符号辞書に基づいて圧縮されたデータセットを与えることができる。この用
途における前記送信装置は、単に、前記圧縮データセットを前記辞書なしで送信
する。前記受信装置は、前記圧縮データセットを、前記符号辞書を前記圧縮デー
タセットに関連付けることによって、解読する。
【0042】 本発明を、ハードウェア、ソフトウェアまたは双方の組み合わせにおいて実現
することができる。例えば、タイラー730を、データの列を記号によって有効
に置き換えることに最適化されたハードウェアエンジンとしてもよく、進化アル
ゴリズムプロセッサ750を、汎用コンピュータにおいて実行するアプリケーシ
ョンプログラムとしてもよい。同様に、上述した機能的分割を、説明の目的のみ
のために与えた。例えば、タイラー730は、単に、圧縮データセット732お
よびマクロ辞書731をファイルとして発生することができ、進化アルゴリズム
プロセッサ750は、前記圧縮有効性程度を、前記ファイルのサイズを返すシス
テムルーチンにアクセスすることによって得ることができる。これらおよび他の
システムアーキテクチャのトレードオフおよび最適化は、当業者には明らかであ
り、本発明の精神および範囲内である。
【図面の簡単な説明】
【図1】 図1は、データセットの圧縮の一例を示す。
【図2】 図2は、データセットにおいて繰り返される列に関する価値因子の決
定の一例を示す。
【図3】 図3は、慣例的なグリーディアルゴリズムを使用するデータセットの
圧縮の一例を示す。
【図4】 図4は、進化アルゴリズムを使用し、本発明によるデータセットの好
適な圧縮に関する探索を管理する流れ図の一例を示す。
【図5】 図5は、本発明によるデータセットの好適な圧縮に関する探索を管理
する進化アルゴリズムの適用の一例を示す。
【図6】 本発明によるデータセットの圧縮の一例を示す。
【図7】 本発明による符号圧縮機のブロック図の一例を示す。
───────────────────────────────────────────────────── フロントページの続き (71)出願人 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands (72)発明者 ラリー イェー エシェルマン オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 Fターム(参考) 5J064 AA02 BA11 BA14 BA15 BC01 BC18 BD02

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 データセットを圧縮する圧縮器であって、 親染色体の母集団から複数の子染色体を発生するように構成された進化アルゴ
    リズムプロセッサと、 前記進化アルゴリズムプロセッサに動作的に結合され、前記複数の子染色体の
    各々の子染色体を受け、これらから前記各々の子染色体に対応するマクロの組を
    発生するマクロ提案器と、 前記各々の子染色体に対応するマクロの組の各々のマクロに対応するマクロ列
    を含む複数のマクロ列を記憶するように構成されたマクロプールと、 前記マクロ提案器およびマクロプールに動作的に結合され、前記マクロプール
    と前記各々の子染色体に対応するマクロの組とに基づいて前記データセットの圧
    縮を与えるタイラーとを具える圧縮器において、 前記進化アルゴリズムプロセッサを、さらに、前記親染色体の母集団を、前記
    各々の子染色体に対応する前記データセットの圧縮に関連する圧縮程度に基づい
    て変更するように構成したことを特徴とする圧縮器。
  2. 【請求項2】 請求項1に記載の圧縮器において、 前記進化アルゴリズムプロセッサを、前記複数の子染色体を、前記親染色体の
    母集団において選択された親染色体のペアリングによって発生するように構成し
    たことを特徴とする圧縮器。
  3. 【請求項3】 請求項1に記載の圧縮器において、前記進化アルゴリズムプロセ
    ッサを、前記子染色体をCHCアルゴリズムによって発生するように構成したこ
    とを特徴とする圧縮器。
  4. 【請求項4】 請求項1に記載の圧縮器において、前記タイラーを、少なくとも
    1つの子染色体に対応する少なくとも1つのマクロ列を含むマクロ辞書を発生す
    るように構成したことを特徴とする圧縮器。
  5. 【請求項5】 請求項1に記載の圧縮器において、前記進化アルゴリズムプロセ
    ッサを、さらに、前記親染色体の母集団の少なくとも1つの親染色体を変異させ
    るように構成したことを特徴とする圧縮器。
  6. 【請求項6】 請求項1に記載の圧縮器において、前記マクロ提案器が、前記マ
    クロの組の各々のマクロの最低価値に基づいた前記マクロの組を与え、前記最低
    価値が前記各々のマクロに関係する圧縮有効性程度に基づくことを特徴とする圧
    縮器。
  7. 【請求項7】 データセットを圧縮する方法であって、 前記データセット内の複数のマクロ列を認識し、マクロ属性を前記複数のマク
    ロ列の各々のマクロ列に関連付けるステップと、 各々が対応するマクロ属性の組を有する複数の親染色体を発生するステップと
    、 各々の前記親染色体を評価し、各々の前記親染色体に関連する親圧縮程度を決
    定するステップと、 進化アルゴリズムプロセスによって前記複数の親染色体に基づいて、各々が対
    応するマクロ属性の組を有する複数の子染色体を発生するステップと、 前記複数の子染色体の各々の子染色体を評価し、前記各々の子染色体に関係す
    る子圧縮程度を決定するステップと、 前記各々の子染色体に関係する子圧縮程度に基づいて複数の好適な子染色体を
    認識するステップと、 前記複数の好適な子染色体に対応するマクロ属性の組に基づいて圧縮データセ
    ットを発生するステップとを具えることを特徴とする方法。
  8. 【請求項8】 請求項7に記載の方法において、前記圧縮データセットを発生す
    るステップが、 前記選択された染色体の少なくとも1つのマクロ属性に対応する前記データセ
    ット内のマクロ列の少なくとも1回の発生に関してマクロ記号を置換するステッ
    プを含むことを特徴とする方法。
  9. 【請求項9】 請求項7に記載の方法において、前記各々の子染色体を評価する
    ステップが、 少なくとも1つのマクロ属性を前記子染色体から選択するステップと、 前記少なくとも1つのマクロ属性を前記データセットにおいてタイリングし、
    子データセットを発生するステップと、 前記子圧縮程度を前記子データセットのサイズに基づいて決定するステップと
    を含むことを特徴とする方法。
  10. 【請求項10】 請求項9に記載の方法において、前記少なくとも1つのマクロ
    属性を前記子染色体から選択するステップが、前記少なくとも1つのマクロ属性
    の最低圧縮有効性に基づくことを特徴とする方法。
  11. 【請求項11】 請求項10に記載の方法において、前記子圧縮程度を決定する
    ステップが、前記少なくとも1つのマクロ属性に対応するマクロ列のサイズにも
    基づくことを特徴とする方法。
JP2000590103A 1998-12-21 1999-12-13 進化アルゴリズムによる符号圧縮 Pending JP2002533960A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/217,408 US6260031B1 (en) 1998-12-21 1998-12-21 Code compaction by evolutionary algorithm
US09/217,408 1998-12-21
PCT/EP1999/009815 WO2000038112A2 (en) 1998-12-21 1999-12-13 Code compaction by evolutionary algorithm

Publications (1)

Publication Number Publication Date
JP2002533960A true JP2002533960A (ja) 2002-10-08

Family

ID=22810954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000590103A Pending JP2002533960A (ja) 1998-12-21 1999-12-13 進化アルゴリズムによる符号圧縮

Country Status (6)

Country Link
US (1) US6260031B1 (ja)
EP (1) EP1055196A2 (ja)
JP (1) JP2002533960A (ja)
CA (1) CA2322138A1 (ja)
TW (1) TW472238B (ja)
WO (1) WO2000038112A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008537209A (ja) * 2005-03-11 2008-09-11 ロックソフト リミテッド データ・クラスタを使用する冗長性の少ないデータを格納する方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249116B2 (en) * 2002-04-08 2007-07-24 Fiske Software, Llc Machine learning
US7139738B2 (en) * 2002-06-27 2006-11-21 Koninklijke Philips Electronics N.V. Face recognition using evolutionary algorithms
US8019705B2 (en) * 2003-03-24 2011-09-13 Fiske Software, LLC. Register and active element machines: commands, programs, simulators and translators
EP1716514A2 (en) * 2004-02-10 2006-11-02 Koninklijke Philips Electronics N.V. Genetic algorithms for optimization of genomics-based medical diagnostic tests
US20060293045A1 (en) * 2005-05-27 2006-12-28 Ladue Christoph K Evolutionary synthesis of a modem for band-limited non-linear channels
US7739586B2 (en) * 2005-08-19 2010-06-15 Microsoft Corporation Encoding of markup language data
US8515882B2 (en) 2010-11-18 2013-08-20 International Business Machines Corporation Efficient storage of individuals for optimization simulation
US8489526B2 (en) 2010-11-24 2013-07-16 International Business Machines Corporation Controlling quarantining and biasing in cataclysms for optimization simulations
US9152779B2 (en) 2011-01-16 2015-10-06 Michael Stephen Fiske Protecting codes, keys and user credentials with identity and patterns
US10268843B2 (en) 2011-12-06 2019-04-23 AEMEA Inc. Non-deterministic secure active element machine
US9563844B2 (en) 2011-06-30 2017-02-07 International Business Machines Corporation Speculative asynchronous sub-population evolutionary computing utilizing a termination speculation threshold
US9165247B2 (en) 2012-01-04 2015-10-20 International Business Machines Corporation Using global and local catastrophes across sub-populations in parallel evolutionary computing
US9305257B2 (en) 2013-05-20 2016-04-05 International Business Machines Corporation Adaptive cataclysms in genetic algorithms

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996002895A1 (en) * 1994-07-14 1996-02-01 Johnson Grace Company Method and apparatus for compressing images
US5651099A (en) * 1995-01-26 1997-07-22 Hewlett-Packard Company Use of a genetic algorithm to optimize memory space
US5734754A (en) * 1996-02-23 1998-03-31 University Of Rochester System for model-based compression of speckle images
US6128346A (en) * 1998-04-14 2000-10-03 Motorola, Inc. Method and apparatus for quantizing a signal in a digital system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008537209A (ja) * 2005-03-11 2008-09-11 ロックソフト リミテッド データ・クラスタを使用する冗長性の少ないデータを格納する方法
JP4768009B2 (ja) * 2005-03-11 2011-09-07 ロックソフト リミテッド データ・クラスタを使用する冗長性の少ないデータを格納する方法

Also Published As

Publication number Publication date
EP1055196A2 (en) 2000-11-29
WO2000038112A3 (en) 2000-08-03
WO2000038112A2 (en) 2000-06-29
US6260031B1 (en) 2001-07-10
CA2322138A1 (en) 2000-06-29
TW472238B (en) 2002-01-11

Similar Documents

Publication Publication Date Title
Lucasius et al. Understanding and using genetic algorithms Part 2. Representation, configuration and hybridization
US9058564B2 (en) Controlling quarantining and biasing in cataclysms for optimization simulations
US5651099A (en) Use of a genetic algorithm to optimize memory space
US7047169B2 (en) Method for optimizing a solution set
Krasnogor et al. Emergence of profitable search strategies based on a simple inheritance mechanism
US8700548B2 (en) Optimization technique using evolutionary algorithms
Babu et al. A near-optimal initial seed value selection in k-means means algorithm using a genetic algorithm
JP2002533960A (ja) 進化アルゴリズムによる符号圧縮
CN109298930B (zh) 一种基于多目标优化的云工作流调度方法及装置
Wong et al. A novel approach in parameter adaptation and diversity maintenance for genetic algorithms
CN107463702A (zh) 一种基于进化算法的数据库多连接查询优化方法
Chugh et al. Surrogate-assisted evolutionary biobjective optimization for objectives with non-uniform latencies
JP2023535131A (ja) 構成可能な機械学習ベースの算術コード化によるゲノム情報圧縮
Szwarcman et al. Quantum-inspired evolutionary algorithm applied to neural architecture search
CN115481727A (zh) 一种基于进化计算的意图识别神经网络生成与优化方法
CN115329269A (zh) 一种可微分的遗传编程符号回归方法
CN116305939A (zh) 陆地生态系统碳水通量高精度反演方法、系统及电子设备
Du et al. Genetic algorithms
CN110321208B (zh) 一种求解云任务调度的进化计算方法
Schnier et al. Learning representations for evolutionary computation
WO2017169736A1 (ja) 情報処理装置及びプログラム
Li et al. Surrogate-Assisted Evolution of Convolutional Neural Networks by Collaboratively Optimizing the Basic Blocks and Topologies
Jin et al. Evolutionary algorithms
Lopes et al. Using feedback in a regulatory network computational device
Mäntykivi Genetic Operators in Chain-Structured Neural Architecture Search