JPH1115807A

JPH1115807A - 分類子システムの学習方法

Info

Publication number: JPH1115807A
Application number: JP9162232A
Authority: JP
Inventors: Yoshiki Takatama; 圭樹高玉; Takao Terano; 隆雄寺野; Tomohiro Uchida; 智洋内田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1997-06-19
Filing date: 1997-06-19
Publication date: 1999-01-22

Abstract

(57)【要約】【課題】複数のエージェントが存在する系において、
作成困難な大域的評価関数を用意する必要がなく、系全
体の学習を最適に行なうことができる学習方法を提供す
ることを目的とする。【解決手段】複数のエージェント間の相互作用を通し
て自己の判断基準（局所的評価関数）を自己組織化しな
がら集団の特性を認識し、適応行動と協調行動をエージ
ェント内の分類子システムが学習する分類子システムの
学習方法で、各エージェントが自己の近傍の環境から得
る局所的な情報により、大域的評価関数を作成する必要
がないため、その評価関数の作成や検証にかかる時間や
労力を大幅に削減することができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、遺伝的アルゴリズ
ムを用いた分類子システムに使用する学習方法におい
て、評価関数設定を容易にする方法および良い解を得る
ことができる学習方法およびそのプログラムを記憶した
記録媒体に関する。

【０００２】

【従来の技術】従来、遺伝的アルゴリズムに使用される
分類子システムの学習方法としては、United States Pa
tent ( 4,881,178)に開示されている。または、例え
ば、「遺伝的アルゴリズム」、北野宏明編、産業図書
（１９９３年出版）に掲載されている。上記に開示され
ている遺伝的アルゴリズムを用いた分類子システムの学
習方法の概要は以下の通りである。

【０００３】まず、分類子システムについて説明する。
分類子システムは、John Hollandによって提案された一
種の適応システムの枠組であり、基本的に条件部と行動
部からなる分類子の集合と、メッセージリストからな
る。プロダクションシステムの言葉で言い換えれば、分
類子はルールで、メッセージリストはワーキングメモリ
（入力条件を一時的に記憶するためのメモリ）に相当す
る。通常、分類子システムの各分類子（ルール）には適
合度（強度ともいう）等の情報が付随している。分類子
システムは、入力条件をコード化したものを予め用意し
た分類子（ルール）の条件部のコードと比較し、一致し
た分類子（ルール）の行動部のコードに従って出力す
る。その行動の結果を評価し、評価値が基準値より向上
した場合は適合度を更新するというシステムである。ま
た、分類システムは、一般に遺伝的アルゴリズムによっ
てルールの変更を行なう。

【０００４】次に、遺伝的アルゴリズムについて説明す
る。遺伝的アルゴリズムは、生物進化の原理、例えば、
選択淘汰、交叉や突然変異などの原理に着想を得たアル
ゴリズムであり、学習の一つの手法と考えられている。
この遺伝的アルゴリズムでは、始めに解こうとする課題
を個体の遺伝子として表現する。一般に様々な個体の遺
伝子は乱数等によって生成し、集団を構成する。その
後、これらの遺伝子の表現を評価関数によって評価し、
その基準値よりも良い評価値であるなら、そこで、処理
を終了するが、基準値よりも悪い評価値であった場合
は、選択、交叉、突然変異等のプロセスによって集団の
遺伝子を変化させる。新たに生成した遺伝子を再び評価
関数によって評価する。評価値が基準値を満たすまでこ
れらの処理を繰り返す。

【０００５】この遺伝的アルゴリズムを分類子システム
に適用する方法は、個体の単位の違いからミシガン・ア
プローチとピッツ・アプローチの二つに大別されてい
る。ミシガン・アプローチでは、分類子システム内の各
ルールを個体として見た集合に対して、遺伝的アルゴリ
ズムのプロセスが行なわれる。従ってこのプロセスによ
って新たなルールが生成される。一方、ピッツ・アプロ
ーチは分類子システム自体を個体と考える学習方法であ
る。ピッツ・アプローチでは、分類子システムの集合が
一つの集団を形成すると考えている。つまり、ミシガン
・アプローチではシステム全体で一つの分類子システム
を持っていたが、ピッツ・アプローチでは、複数の分類
子システムを持っており、各々で実行、評価する。例え
ば、遺伝的アルゴリズムのプロセスの一つである交叉を
行う場合について説明する。交叉は分類子システム同士
で行われ、図５（ａ）に示すように置換される。一般に
染色体の長さが各分類子システムによって異なるので、
分類子システム毎に交叉位置を指定する。これらの交叉
指定位置を揃えて交叉させる。このピッツ・アプローチ
では、分類子システムを一つの個体とすることにより、
各ルールに対する評価をする必要が無くなり、評価は各
分類子システムに対して行なえば良い。

【０００６】各ルールの適合度の調整する強化学習法に
は、バケツリレー・アルゴリズム(bucket brigade algo
rithm) と利益共有法 (profit sharing) の二つがあ
る。バケツリレー・アルゴリズムでは、ルールが実行さ
れる毎（ステップ毎）にそのルールの適合度を修正す
る。適合度の修正アルゴリズムは、次のようになる。

【０００７】（１）活性化したルール（入力条件とルー
ルの条件部が一致したルール）について、その強さに比
例した大きさだけ適合度を減少させる。

【０００８】（２）適合度の減少分を、直前のステップ
で実行されたルールの適合度に加える。

【０００９】（３）ルールの実行結果として得られた結
果を報酬として、そのルールの適合度に加える。

【００１０】得られた報酬は、ただちに過去のルールに
伝播されずに、次の実行の際に１段階だけ伝播する。学
習は遅いが、各ステップにおける計算コストは小さい。

【００１１】また、利益共有法では、実行されたルール
の履歴を保存しておき、報酬が得られるたびに、報酬の
値に重み付けした値を減じながら過去にさかのぼってル
ールの適合度を修正する。過去に実行されたルールの適
合度も一度に修正するため学習が速い。報酬がまれにし
か得られない場合には、それほど計算コストはかからな
いが、頻繁に報酬が得られる場合には高くつく。

【００１２】上記の学習方法によって学習された分類子
システムのルールは、明示的な大域的評価関数を用いて
評価され、系全体として最適化されたかを判断する。し
たがって、複数の分類子システムが存在する系において
も、各分類子システムは同一の評価関数によって、学習
されたルールの評価が行なわれる。

【００１３】

【発明が解決しようとする課題】しかしながら、遺伝的
アルゴリズムを分類子システムに適応するミシガン・ア
プローチとピッツ・アプローチにはそれぞれ次のような
欠点がある。

【００１４】ミシガン・アプローチの欠点は、新たなル
ールを生成することができるが、全く意味のないルール
を生成する可能性があり、無駄なコンピュータ・コスト
がかかる点である。さらに分類子システムを複数のエー
ジェントに対応させた場合、全エージェントが一つの分
類子システムを参照するため、異なる役割を学習するこ
とが不可能であり、組織的な行動を行なうことができな
い。

【００１５】一方、ピッツ・アプローチの欠点は、新た
なルールを生成することはできないため、初期収束が起
こることである。つまり、各分類子システムが同じよう
なエリート・ルール（適合度の高いルール）を持ってし
まうため、ミシガン・アプローチと同様に組織的に行動
することができない。さらに、自らルールを生成するこ
とができないため、あらかじめ適切なルールを用意しな
ければならない。

【００１６】さらに、従来の分類子システムでは、大域
的評価関数を用いて、学習されたルールが評価されるこ
とが多く、複雑な問題や大規模な問題に対しては、その
評価関数が複雑になるため、その作成が困難になるとい
う問題がある。

【００１７】本発明は、大域的評価関数の作成が困難で
ある場合においても、分類子システムの学習および評価
を行なえる学習方法を提供することを目的とする。さら
に、ミシガン・アプローチとピッツ・アプローチの欠点
をそれぞれ相補的に補い、分類子システムが効果的に学
習できる学習方法を提供することを目的とする。

【００１８】

【課題を解決するための手段】上記の課題を解決するた
めに本発明は、第１に複数の分類子システムが存在する
系に対して、各分類子システムが自己の近傍の環境から
得られる局所的な情報により組織的な学習を行なうこと
を特徴とするもので、作成困難な大域的評価関数を用意
する必要がなく、系全体の学習を最適に行なうことがで
きる学習方法を提供できる。

【００１９】第２に、アプローチとピッツ・アプローチ
を組み合わせたアプローチにより、それら欠点を相補的
に補い、効率的に組織学習をすることができる。

【００２０】

【発明の実施の形態】本発明の請求項１に記載の発明
は、複数のエージェントが存在する系に対して、各エー
ジェントが自己の近傍の環境から得る局所的な情報によ
り、エージェント内の分類子システムが組織的な学習を
行なうもので、各エージェントが自己の近傍から得る局
所的な情報により、複雑な問題や大規模な問題において
作成が困難である大域的評価関数を作成することなく、
組織学習を行なうことができるという作用を有する。

【００２１】本発明の請求項２に記載の発明は、各エー
ジェントは近傍の環境の状態を認識し、これに対する行
動を繰り返しながら各自の局所的評価関数を自己組織化
するもので、一連の行動が集団全体に対して貢献するこ
とにより、複雑な問題や大規模な問題において作成が困
難である大域的評価関数を作成することなく、組織学習
を行なうことができるという作用を有する。

【００２２】本発明の請求項３に記載の発明は、自己の
判断基準（局所的評価関数）は、各エージェントの分類
子システム、各エージェント近傍の環境の状態、報酬を
得る間に実行されたルールの順番および連続したルール
に基づいた行動評価メカニズムの要素によって構成され
た評価関数を用いるもので、このような局所的評価関数
を用いることにより各エージェントの行動が組織に与え
る影響を評価しながら行動することにより、複雑な問題
や大規模な問題において作成が困難である大域的評価関
数を作成することなく、組織学習を行なうことができる
という作用を有する。

【００２３】本発明の請求項４乃至９に記載の発明は、
分類子システム内のルールは、遺伝的アルゴリズムの操
作オペレータである選択淘汰、交叉または突然変異によ
って新たに生成されるもので、妥当性を失ったルールを
削除したり新たなルールを獲得することにより学習を促
進することにより、複雑な問題や大規模な問題において
作成が困難である大域的評価関数を作成することなく、
組織学習を行なうことができるという作用を有する。

【００２４】本発明の請求項１０に記載の発明は、各エ
ージェントは、交叉オペレータにより任意時間毎、任意
置きあるいはランダムに相手を選択するもので、規則的
あるいは不規則に選択することで学習を促進することに
より、複雑な問題や大規模な問題において作成が困難で
ある大域的評価関数を作成することなく、組織学習を行
なうことができるという作用を有する。

【００２５】本発明の請求項１１に記載の発明は、複数
のエージェント間の相互作用を通して自己の判断基準
（局所的評価関数）を自己組織化しながら集団の特性を
認識し、適応行動と協調行動をエージェント内の分類子
システムが学習するもので、一連の行動が集団全体に対
して貢献や他のエージェントとの協調行動に対する評価
により、複雑な問題や大規模な問題において作成が困難
である大域的評価関数を作成することなく、組織学習を
行なうことができるという作用を有する。

【００２６】本発明の請求項１２に記載の発明は、コン
ピュータによって学習するプログラムを記録した記録媒
体であって、複数のエージェント間の相互作用を通して
自己の判断基準（局所的評価関数）を自己組織化しなが
ら集団の特性を認識し、適応行動と協調行動をエージェ
ント内の分類子システムが学習することを特徴とする分
類子システムの学習方法を記録した記録媒体であり、複
雑な問題や大規模な問題において作成が困難である大域
的評価関数を作成することなく、組織学習をコンピュー
タによって行なうことができるという作用を有する。

【００２７】以下、本発明の実施の形態について、図１
から図５を用いて説明する。（実施の形態１）図１は、本発明の実施形態１の遺伝的
アルゴリズムを用いた分類子システムの学習システムの
構成図である。図１において、１１は系全体の状況の情
報を格納する環境メモリ部、１２、１３、１４は環境メ
モリ部１１からの自己の近傍状況の情報と予め用意した
ルール（条件部）と比較し一致するルール（行動部）に
従って行動を行う分類子システム、１０１、１０２、１
０３は分類子システム１２、１３、１４からの学習要求
に応じて遺伝的アルゴリズムと強化学習により学習を行
ない、学習の結果に基づき分類子システム１２、１３、
１４のルールの書き換えとルールの適合度の書き換えを
行なう機能を持つ学習部、１０４、１０５、１０６は分
類子システム１２、１３、１４が環境メモリ部１１から
得た環境の状態が改善されたか否かの評価を行ない、改
善されたならば、分類子システム１２、１３、１４に対
して学習要求を出すよう学習部１０１、１０２、１０３
に指示する機能を持つ評価部、２０１、２０２、２０３
は分類子システムと学習部と評価部とで構成されるエー
ジェントである。

【００２８】以下に遺伝的アルゴリズムを用いた分類子
システムの学習システムの動作について説明する。

【００２９】分類子システム１２は、環境メモリ部１１
から自己の近傍の状況に関する情報を受け、評価要素を
評価部１０４に送る。

【００３０】評価部１０４では、直前に実行されたルー
ルの評価のため、環境メモリ部から得た情報に基づき、
報酬が与えられるかをチェックする。

【００３１】学習部１０１では、評価部１０４で報酬が
与えられる場合は分類子システム１２からの要求により
強化学習（ルールの適合度の書き換え）と遺伝的アルゴ
リズム（分類子システムのルールの書き換え）によって
分類子システム内のルールを書き換える。

【００３２】一方、評価部１０４で報酬が与えられなか
った場合は、図２に示す予め用意したルール（条件部）
と比較し、一致したルール（条件部）を持つルール（行
動部）に対応した行動を行い、行動した結果を環境メモ
リ部１１に返す。

【００３３】以上の処理を、系全体として適切な結果に
なるまで繰り返し行われる。次に、遺伝的アルゴリズム
を用いた分類子システムの学習方法について、プリント
基板ＣＡＤを使った自動部品配置システムを具体的な応
用例として詳細に説明する。

【００３４】本実施の形態では、１つのエージェント
（分類子システム、学習部、評価部で構成される）は１
つの部品に対応し、各部品の近傍の状況として、他の部
品につながる配線の長さの合計と当該部品と他の部品と
が重なり合っている箇所をコード化した情報を用いるも
のとする。なお、配線用のスペースを確保するために各
部品の周囲にギャップを設けて、そのギャップの重なり
をコード化した情報を用いる場合もある。

【００３５】自動部品配置システムに応用した分類子シ
ステムの学習方法の処理フローを図３に示し説明する。

【００３６】ステップ３０１は、各部品（エージェント
２０１、２０２、２０３）の位置、各部品の大きさ、各
部品の向き、配線情報（他の部品に繋がる配線の情
報）、カウンタ＝０を初期条件として環境メモリ部１１
に設定する。

【００３７】ステップ３０２は、各部品（分類子システ
ム１２、１３、１４）は環境情報部１１から当該部品の
位置、大きさおよび配線情報等をコード化した情報を得
て、カウンタを１つ増加する。

【００３８】ステップ３０３は、部品（分類子システム
１２）が評価要素である環境メモリ部１１から得た配線
情報を評価部１０４に送る。評価部１０４は、検出した
評価要素から報酬が与えるかをチェックし、結果を報酬
として部品（分類子システム１２）に返す。この例での
報酬は、当該部品の配線長の合計が最小値を更新したか
どうかを評価し、その評価結果によって決める。

【００３９】ステップ３０４は、配線長の合計が最小値
を更新した場合はステップ３０５へ、更新しない場合
は、ステップ３０８に進む。

【００４０】ステップ３０８では、各部品（分類子シス
テム１２，１３，１４）は環境メモリ部１１から当該部
品の位置、大きさおよび配線情報等をコード化した情報
と分類子システムのルール（条件部）と比較する。各部
品は、ルール（条件部）と一致するルールがあれば、そ
のルール（行動部）に従って、待機、移動、回転などの
行動をとり、その結果を環境メモリ部１１に返す。

【００４１】また、一致するルール（条件部）がなけれ
ば、各部品（分類子システム１２，１３，１４）は検出
したコードを条件部とし、ランダムに生成した行動部を
持つルールを新たに生成し、実行する。

【００４２】ステップ３０９では、ルールを実行した結
果は環境メモリ部１１に通知され、終了条件を満たして
いれば処理を終了し、終了条件を満たしていない場合
は、ステップ３０２に戻る。終了条件は、環境メモリ部
１１ですべての部品が重なりを解消し、かつ、全部品の
配線長の合計が設定値以下または全部品の配線長の合計
がｎ回（例えば３回）同じであれば処理を終了するもの
とする。

【００４３】ステップ３０５では、分類子システム１２
は評価部１０４の報酬の結果を受けて、学習部１０１に
強化学習の要求を行う。学習部１０１は、図２に示す分
類子システム１２が報酬を得るまでに実行した一連のル
ールの適合度を、従来の技術で説明したバケツリレー・
アルゴリズムまたは利益共有法の強化学習により変更
し、カウンタを１つ増やし、ステップ３０６に進む。

【００４４】ステップ３０６では、カウンタが設定値
（例えば、５）に達したかを判断し、達している場合に
は、カウンタを０に戻し、ステップ３０７にすすむ。達
していない場合は、ステップ３０２に戻る。このカウン
タの設定値は、強化学習を重視するか遺伝的アルゴリズ
ムを重視するかを決めるものである。

【００４５】ステップ３０７では、学習部１０１は分類
子システム１２の要求により遺伝的アルゴリズムにより
分類子システム１２のルールを書き換え、ステップ３０
２に戻る。

【００４６】次に、遺伝的アルゴリズムによる分類子シ
ステムのルールの書き換えについて説明する。遺伝的ア
ルゴリズムを分類子システムに適応する方法は、個体
（遺伝的アルゴリズムを適用する対象）の違いからミシ
ガン・アプローチとピッツ・アプローチの二つに大別さ
れている。

【００４７】まず、ミシガンアプローチでは、分類子シ
ステム内のルールを個体とみなし、遺伝的アルゴリズム
を適用する。遺伝的アルゴリズムによって、ルールは選
択、交叉、突然変異を起こす。一般的には、メモリの制
約上、分類子システムに記憶できるルールの数は有限で
あり、新たなルールを記憶するため、『選択』によって
適合度の低いルールを削除する。なお、メモリがいっぱ
いになっていない場合でも、『選択』を行なうことはで
きる。『交叉』によって、新たなルールを生成する場合
について、図４に示す。例えば適合度の高いルール１と
ルール２から、ルールのコードを任意の交叉位置から分
割し、ルール１上位コードとルール２下位コードを結合
し、新たにルールｎ＋１を生成するものである。この例
は単純交叉（または一点交叉）と呼ばれている。交叉位
置は一点ではなく複数点の場合もある。また、『突然変
異』は、例えば（ルール３：1011001110010101）から新
たなルールｎ＋３として（10110011ABC10101）を生成す
るものである。

【００４８】一方、ピッツ・アプローチは、図５（ａ）
に示すように、例えばランダムに選ばれた分類子システ
ム１と分類子システム（１＋ｍ）において、下位の一部
（ｎ個分）を相互に交換し、新たな分類子システムのル
ールとするものである。

【００４９】さらに、図５（ｂ）のように、ランダムに
選ばれた分類子システム１と分類子システム（１＋ｍ）
において、自己の適合度の高いルールを設定数（ｎ個
分）だけを選び、相互に相手の適合度の低いルールから
順に設定数（ｎ個分）のルールを上書きすることもあ
る。

【００５０】また、コンピュータによって実現する際
に、上記処理フロー図３または図４をプログラム化し、
プログラムを記録した記録媒体により各種コンピュータ
にインストールすることにより実現できる。

【００５１】以上、遺伝的アルゴリズムを用いた分類子
システムの学習方法の応用システムでは、明示的に大域
的評価関数を作成しなくても、すべての部品が終了条件
を満たすまで各部品（分類子システム）が組織的に学習
し、最適な部品配置となるように最適化するするもので
ある。このような部品追加の問題では、人間のエキスパ
ートで約半日を必要とするが、本手法により作成された
部品配置システムを用いれば、パーソナルコンピュータ
でも約１時間で結果がでるので、開発効率を上げること
ができる。

【００５２】また、遺伝的アルゴリズムを用いた分類子
システムの学習方法の具体的な応用例として、プリント
基板ＣＡＤを使った自動部品配置システムについて説明
したが、これに限定されるものではなく、机などのレイ
アウト変更の最適化問題、コンピュータやプリンタなど
の情報機器のレイアウト変更の最適化問題およびサッカ
ーやラグビーなどの多人数スポーツのシミュレーション
システムの最適化問題等の最適化問題に幅広く応用でき
る。

【００５３】本発明は、外部からの統制なしに、自ら適
切な適応行動を獲得・学習するするように各部品の分類
子システムのルールを改善できるため、各部品は適切な
配置位置を探すことができる。さらに、全部品の配線長
の合計が人間のエキスパートが行った結果よりも本発明
が用いた方が短くなったことと、数倍速く解を得ること
ができたことから、本発明は多くの制約を満たさなけれ
ばならない最適化問題に対して有効であった。

【００５４】

【発明の効果】以上のように本発明を適応した手法は、
複数の分類子システムが存在する系に対して、各分類子
システムが自己の近傍の環境から得られる状況により組
織的な学習を行なうことにより、大域的評価関数を作成
する必要がないため、その評価関数の作成や検証にかか
る時間や労力を大幅に削減することができる。

【００５５】また、ミシガン・アプローチとピッツ・ア
プローチを組み合わせることによりＣＡＤの再配置設計
においては、専門家による再配置結果よりも良い結果が
得られる。

【図面の簡単な説明】

【図１】本発明の実施の形態１における遺伝的アルゴリ
ズムを用いた分類子システムの学習システムの構成図

【図２】同実施の形態１の分類子システムのルールの説
明図

【図３】同実施の形態１の自動部品配置システムの処理
フローチャート

【図４】同実施の形態１のミシガン・アプローチによる
分類子システムのルールの生成の説明図

【図５】（ａ）同実施の形態１のピッツ・アプローチに
よる分類子システムのルールの生成の説明図（ｂ）同実施の形態１のミシガン・アプローチとピッツ
・アプローチを組み合わせたアプローチによる分類子シ
ステムのルールの生成の説明図

【符号の説明】

１１環境メモリ部１２、１３、１４分類子システム１０１、１０２、１０３学習部１０４、１０５、１０６評価部２０１、２０２、２０３エージェント

Claims

【特許請求の範囲】

【請求項１】複数のエージェントが存在する系に対し
て、各エージェントが自己の近傍の環境から得る局所的
な情報により、エージェント内の分類子システムが組織
的な学習を行なうことを特徴とする分類子システムの学
習方法。
【請求項２】各エージェントは近傍の環境の状態を認
識し、これに対する行動を繰り返しながら各自の局所的
評価関数を自己組織化することを特徴とする請求項１記
載の分類子システムの学習方法。
【請求項３】自己の判断基準（局所的評価関数）に
は、各エージェントの分類子システム、各エージェント
近傍の環境の状態、報酬を得る間に実行されたルールの
順番および連続したルールに基づいた行動評価メカニズ
ムの要素によって構成された評価関数を用いることを特
徴とする請求項２記載の分類子システムの学習方法。
【請求項４】分類子システム内のルールは、遺伝的ア
ルゴリズムの操作オペレータである選択淘汰、交叉また
は突然変異によって新たに生成されることを特徴とする
請求項２または３記載の分類子システムの学習方法。
【請求項５】新たな環境に遭遇したときは、分類子シ
ステム内のルールが新たに生成されることを特徴とする
請求項２または３記載の分類子システムの学習方法。
【請求項６】各エージェント内の分類子システムが保
持するルール数が最大数を越えた場合は、適合度の低い
ルールが削除され置き換わることを特徴とする請求項２
または３記載の分類子システムの学習方法。
【請求項７】分類子システム内のルールは、交叉オペ
レータにより選択された各ルールまたは各エージェント
内の分類子システム間で交換することを特徴とする請求
項４記載の分類子システムの学習方法。
【請求項８】各エージェントは、交叉オペレータを適
用する相手エージェントを選び、自己の適合度の一番高
いルールグループを相手の適合度の一番低いルールグル
ープに上書きすることを特徴とする請求項７記載の分類
子システムの学習方法。
【請求項９】各エージェントは、任意に選んだ２つの
ルールのコードの上位と下位を相互に交換することを特
徴とする請求項７記載の分類子システムの学習方法。
【請求項１０】各エージェントは、交叉オペレータに
より任意時間毎、任意置きあるいはランダムに相手を選
択することを特徴とする請求項４乃至９のいずれかに記
載の分類子システムの学習方法。
【請求項１１】複数のエージェント間の相互作用を通
して自己の判断基準（局所的評価関数）を自己組織化し
ながら集団の特性を認識し、適応行動と協調行動をエー
ジェント内の分類子システムが学習することを特徴とす
る分類子システムの学習方法。
【請求項１２】コンピュータによって学習するプログ
ラムを記録した記録媒体であって、複数のエージェント
間の相互作用を通して自己の判断基準（局所的評価関
数）を自己組織化しながら集団の特性を認識し、適応行
動と協調行動をエージェント内の分類子システムが学習
することを特徴とする分類子システムの学習方法を記録
した記録媒体。