JPH1115807A - 分類子システムの学習方法 - Google Patents

分類子システムの学習方法

Info

Publication number
JPH1115807A
JPH1115807A JP9162232A JP16223297A JPH1115807A JP H1115807 A JPH1115807 A JP H1115807A JP 9162232 A JP9162232 A JP 9162232A JP 16223297 A JP16223297 A JP 16223297A JP H1115807 A JPH1115807 A JP H1115807A
Authority
JP
Japan
Prior art keywords
classifier system
rule
learning
agent
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9162232A
Other languages
English (en)
Inventor
Yoshiki Takatama
圭樹 高玉
Takao Terano
隆雄 寺野
Tomohiro Uchida
智洋 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9162232A priority Critical patent/JPH1115807A/ja
Publication of JPH1115807A publication Critical patent/JPH1115807A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数のエージェントが存在する系において、
作成困難な大域的評価関数を用意する必要がなく、系全
体の学習を最適に行なうことができる学習方法を提供す
ることを目的とする。 【解決手段】 複数のエージェント間の相互作用を通し
て自己の判断基準(局所的評価関数)を自己組織化しな
がら集団の特性を認識し、適応行動と協調行動をエージ
ェント内の分類子システムが学習する分類子システムの
学習方法で、各エージェントが自己の近傍の環境から得
る局所的な情報により、大域的評価関数を作成する必要
がないため、その評価関数の作成や検証にかかる時間や
労力を大幅に削減することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、遺伝的アルゴリズ
ムを用いた分類子システムに使用する学習方法におい
て、評価関数設定を容易にする方法および良い解を得る
ことができる学習方法およびそのプログラムを記憶した
記録媒体に関する。
【0002】
【従来の技術】従来、遺伝的アルゴリズムに使用される
分類子システムの学習方法としては、United States Pa
tent ( 4,881,178)に開示されている。または、例え
ば、「遺伝的アルゴリズム」、北野宏明編、産業図書
(1993年出版)に掲載されている。上記に開示され
ている遺伝的アルゴリズムを用いた分類子システムの学
習方法の概要は以下の通りである。
【0003】まず、分類子システムについて説明する。
分類子システムは、John Hollandによって提案された一
種の適応システムの枠組であり、基本的に条件部と行動
部からなる分類子の集合と、メッセージリストからな
る。プロダクションシステムの言葉で言い換えれば、分
類子はルールで、メッセージリストはワーキングメモリ
(入力条件を一時的に記憶するためのメモリ)に相当す
る。通常、分類子システムの各分類子(ルール)には適
合度(強度ともいう)等の情報が付随している。分類子
システムは、入力条件をコード化したものを予め用意し
た分類子(ルール)の条件部のコードと比較し、一致し
た分類子(ルール)の行動部のコードに従って出力す
る。その行動の結果を評価し、評価値が基準値より向上
した場合は適合度を更新するというシステムである。ま
た、分類システムは、一般に遺伝的アルゴリズムによっ
てルールの変更を行なう。
【0004】次に、遺伝的アルゴリズムについて説明す
る。遺伝的アルゴリズムは、生物進化の原理、例えば、
選択淘汰、交叉や突然変異などの原理に着想を得たアル
ゴリズムであり、学習の一つの手法と考えられている。
この遺伝的アルゴリズムでは、始めに解こうとする課題
を個体の遺伝子として表現する。一般に様々な個体の遺
伝子は乱数等によって生成し、集団を構成する。その
後、これらの遺伝子の表現を評価関数によって評価し、
その基準値よりも良い評価値であるなら、そこで、処理
を終了するが、基準値よりも悪い評価値であった場合
は、選択、交叉、突然変異等のプロセスによって集団の
遺伝子を変化させる。新たに生成した遺伝子を再び評価
関数によって評価する。評価値が基準値を満たすまでこ
れらの処理を繰り返す。
【0005】この遺伝的アルゴリズムを分類子システム
に適用する方法は、個体の単位の違いからミシガン・ア
プローチとピッツ・アプローチの二つに大別されてい
る。ミシガン・アプローチでは、分類子システム内の各
ルールを個体として見た集合に対して、遺伝的アルゴリ
ズムのプロセスが行なわれる。従ってこのプロセスによ
って新たなルールが生成される。一方、ピッツ・アプロ
ーチは分類子システム自体を個体と考える学習方法であ
る。ピッツ・アプローチでは、分類子システムの集合が
一つの集団を形成すると考えている。つまり、ミシガン
・アプローチではシステム全体で一つの分類子システム
を持っていたが、ピッツ・アプローチでは、複数の分類
子システムを持っており、各々で実行、評価する。例え
ば、遺伝的アルゴリズムのプロセスの一つである交叉を
行う場合について説明する。交叉は分類子システム同士
で行われ、図5(a)に示すように置換される。一般に
染色体の長さが各分類子システムによって異なるので、
分類子システム毎に交叉位置を指定する。これらの交叉
指定位置を揃えて交叉させる。このピッツ・アプローチ
では、分類子システムを一つの個体とすることにより、
各ルールに対する評価をする必要が無くなり、評価は各
分類子システムに対して行なえば良い。
【0006】各ルールの適合度の調整する強化学習法に
は、バケツリレー・アルゴリズム(bucket brigade algo
rithm) と利益共有法 (profit sharing) の二つがあ
る。バケツリレー・アルゴリズムでは、ルールが実行さ
れる毎(ステップ毎)にそのルールの適合度を修正す
る。適合度の修正アルゴリズムは、次のようになる。
【0007】(1)活性化したルール(入力条件とルー
ルの条件部が一致したルール)について、その強さに比
例した大 きさだけ適合度を減少させる。
【0008】(2)適合度の減少分を、直前のステップ
で実行されたルールの適合度に加える。
【0009】(3)ルールの実行結果として得られた結
果を報酬として、そのルールの適合度に加える。
【0010】得られた報酬は、ただちに過去のルールに
伝播されずに、次の実行の際に1段階だけ伝播する。学
習は遅いが、各ステップにおける計算コストは小さい。
【0011】また、利益共有法では、実行されたルール
の履歴を保存しておき、報酬が得られるたびに、報酬の
値に重み付けした値を減じながら過去にさかのぼってル
ールの適合度を修正する。過去に実行されたルールの適
合度も一度に修正するため学習が速い。報酬がまれにし
か得られない場合には、それほど計算コストはかからな
いが、頻繁に報酬が得られる場合には高くつく。
【0012】上記の学習方法によって学習された分類子
システムのルールは、明示的な大域的評価関数を用いて
評価され、系全体として最適化されたかを判断する。し
たがって、複数の分類子システムが存在する系において
も、各分類子システムは同一の評価関数によって、学習
されたルールの評価が行なわれる。
【0013】
【発明が解決しようとする課題】しかしながら、遺伝的
アルゴリズムを分類子システムに適応するミシガン・ア
プローチとピッツ・アプローチにはそれぞれ次のような
欠点がある。
【0014】ミシガン・アプローチの欠点は、新たなル
ールを生成することができるが、全く意味のないルール
を生成する可能性があり、無駄なコンピュータ・コスト
がかかる点である。さらに分類子システムを複数のエー
ジェントに対応させた場合、全エージェントが一つの分
類子システムを参照するため、異なる役割を学習するこ
とが不可能であり、組織的な行動を行なうことができな
い。
【0015】一方、ピッツ・アプローチの欠点は、新た
なルールを生成することはできないため、初期収束が起
こることである。つまり、各分類子システムが同じよう
なエリート・ルール(適合度の高いルール)を持ってし
まうため、ミシガン・アプローチと同様に組織的に行動
することができない。さらに、自らルールを生成するこ
とができないため、あらかじめ適切なルールを用意しな
ければならない。
【0016】さらに、従来の分類子システムでは、大域
的評価関数を用いて、学習されたルールが評価されるこ
とが多く、複雑な問題や大規模な問題に対しては、その
評価関数が複雑になるため、その作成が困難になるとい
う問題がある。
【0017】本発明は、大域的評価関数の作成が困難で
ある場合においても、分類子システムの学習および評価
を行なえる学習方法を提供することを目的とする。さら
に、ミシガン・アプローチとピッツ・アプローチの欠点
をそれぞれ相補的に補い、分類子システムが効果的に学
習できる学習方法を提供することを目的とする。
【0018】
【課題を解決するための手段】上記の課題を解決するた
めに本発明は、第1に複数の分類子システムが存在する
系に対して、各分類子システムが自己の近傍の環境から
得られる局所的な情報により組織的な学習を行なうこと
を特徴とするもので、作成困難な大域的評価関数を用意
する必要がなく、系全体の学習を最適に行なうことがで
きる学習方法を提供できる。
【0019】第2に、アプローチとピッツ・アプローチ
を組み合わせたアプローチにより、それら欠点を相補的
に補い、効率的に組織学習をすることができる。
【0020】
【発明の実施の形態】本発明の請求項1に記載の発明
は、複数のエージェントが存在する系に対して、各エー
ジェントが自己の近傍の環境から得る局所的な情報によ
り、エージェント内の分類子システムが組織的な学習を
行なうもので、各エージェントが自己の近傍から得る局
所的な情報により、複雑な問題や大規模な問題において
作成が困難である大域的評価関数を作成することなく、
組織学習を行なうことができるという作用を有する。
【0021】本発明の請求項2に記載の発明は、各エー
ジェントは近傍の環境の状態を認識し、これに対する行
動を繰り返しながら各自の局所的評価関数を自己組織化
するもので、一連の行動が集団全体に対して貢献するこ
とにより、複雑な問題や大規模な問題において作成が困
難である大域的評価関数を作成することなく、組織学習
を行なうことができるという作用を有する。
【0022】本発明の請求項3に記載の発明は、自己の
判断基準(局所的評価関数)は、各エージェントの分類
子システム、各エージェント近傍の環境の状態、報酬を
得る間に実行されたルールの順番および連続したルール
に基づいた行動評価メカニズムの要素によって構成され
た評価関数を用いるもので、このような局所的評価関数
を用いることにより各エージェントの行動が組織に与え
る影響を評価しながら行動することにより、複雑な問題
や大規模な問題において作成が困難である大域的評価関
数を作成することなく、組織学習を行なうことができる
という作用を有する。
【0023】本発明の請求項4乃至9に記載の発明は、
分類子システム内のルールは、遺伝的アルゴリズムの操
作オペレータである選択淘汰、交叉または突然変異によ
って新たに生成されるもので、妥当性を失ったルールを
削除したり新たなルールを獲得することにより学習を促
進することにより、複雑な問題や大規模な問題において
作成が困難である大域的評価関数を作成することなく、
組織学習を行なうことができるという作用を有する。
【0024】本発明の請求項10に記載の発明は、各エ
ージェントは、交叉オペレータにより任意時間毎、任意
置きあるいはランダムに相手を選択するもので、規則的
あるいは不規則に選択することで学習を促進することに
より、複雑な問題や大規模な問題において作成が困難で
ある大域的評価関数を作成することなく、組織学習を行
なうことができるという作用を有する。
【0025】本発明の請求項11に記載の発明は、複数
のエージェント間の相互作用を通して自己の判断基準
(局所的評価関数)を自己組織化しながら集団の特性を
認識し、適応行動と協調行動をエージェント内の分類子
システムが学習するもので、一連の行動が集団全体に対
して貢献や他のエージェントとの協調行動に対する評価
により、複雑な問題や大規模な問題において作成が困難
である大域的評価関数を作成することなく、組織学習を
行なうことができるという作用を有する。
【0026】本発明の請求項12に記載の発明は、コン
ピュータによって学習するプログラムを記録した記録媒
体であって、複数のエージェント間の相互作用を通して
自己の判断基準(局所的評価関数)を自己組織化しなが
ら集団の特性を認識し、適応行動と協調行動をエージェ
ント内の分類子システムが学習することを特徴とする分
類子システムの学習方法を記録した記録媒体であり、複
雑な問題や大規模な問題において作成が困難である大域
的評価関数を作成することなく、組織学習をコンピュー
タによって行なうことができるという作用を有する。
【0027】以下、本発明の実施の形態について、図1
から図5を用いて説明する。 (実施の形態1)図1は、本発明の実施形態1の遺伝的
アルゴリズムを用いた分類子システムの学習システムの
構成図である。図1において、11は系全体の状況の情
報を格納する環境メモリ部、12、13、14は環境メ
モリ部11からの自己の近傍状況の情報と予め用意した
ルール(条件部)と比較し一致するルール(行動部)に
従って行動を行う分類子システム、101、102、1
03は分類子システム12、13、14からの学習要求
に応じて遺伝的アルゴリズムと強化学習により学習を行
ない、学習の結果に基づき分類子システム12、13、
14のルールの書き換えとルールの適合度の書き換えを
行なう機能を持つ学習部、104、105、106は分
類子システム12、13、14が環境メモリ部11から
得た環境の状態が改善されたか否かの評価を行ない、改
善されたならば、分類子システム12、13、14に対
して学習要求を出すよう学習部101、102、103
に指示する機能を持つ評価部、201、202、203
は分類子システムと学習部と評価部とで構成されるエー
ジェントである。
【0028】以下に遺伝的アルゴリズムを用いた分類子
システムの学習システムの動作について説明する。
【0029】分類子システム12は、環境メモリ部11
から自己の近傍の状況に関する情報を受け、評価要素を
評価部104に送る。
【0030】評価部104では、直前に実行されたルー
ルの評価のため、環境メモリ部から得た情報に基づき、
報酬が与えられるかをチェックする。
【0031】学習部101では、評価部104で報酬が
与えられる場合は分類子システム12からの要求により
強化学習(ルールの適合度の書き換え)と遺伝的アルゴ
リズム(分類子システムのルールの書き換え)によって
分類子システム内のルールを書き換える。
【0032】一方、評価部104で報酬が与えられなか
った場合は、図2に示す予め用意したルール(条件部)
と比較し、一致したルール(条件部)を持つルール(行
動部)に対応した行動を行い、行動した結果を環境メモ
リ部11に返す。
【0033】以上の処理を、系全体として適切な結果に
なるまで繰り返し行われる。次に、遺伝的アルゴリズム
を用いた分類子システムの学習方法について、プリント
基板CADを使った自動部品配置システムを具体的な応
用例として詳細に説明する。
【0034】本実施の形態では、1つのエージェント
(分類子システム、学習部、評価部で構成される)は1
つの部品に対応し、各部品の近傍の状況として、他の部
品につながる配線の長さの合計と当該部品と他の部品と
が重なり合っている箇所をコード化した情報を用いるも
のとする。なお、配線用のスペースを確保するために各
部品の周囲にギャップを設けて、そのギャップの重なり
をコード化した情報を用いる場合もある。
【0035】自動部品配置システムに応用した分類子シ
ステムの学習方法の処理フローを図3に示し説明する。
【0036】ステップ301は、各部品(エージェント
201、202、203)の位置、各部品の大きさ、各
部品の向き、配線情報(他の部品に繋がる配線の情
報)、カウンタ=0を初期条件として環境メモリ部11
に設定する。
【0037】ステップ302は、各部品(分類子システ
ム12、13、14)は環境情報部11から当該部品の
位置、大きさおよび配線情報等をコード化した情報を得
て、カウンタを1つ増加する。
【0038】ステップ303は、部品(分類子システム
12)が評価要素である環境メモリ部11から得た配線
情報を評価部104に送る。評価部104は、検出した
評価要素から報酬が与えるかをチェックし、結果を報酬
として部品(分類子システム12)に返す。この例での
報酬は、当該部品の配線長の合計が最小値を更新したか
どうかを評価し、その評価結果によって決める。
【0039】ステップ304は、配線長の合計が最小値
を更新した場合はステップ305へ、更新しない場合
は、ステップ308に進む。
【0040】ステップ308では、各部品(分類子シス
テム12,13,14)は環境メモリ部11から当該部
品の位置、大きさおよび配線情報等をコード化した情報
と分類子システムのルール(条件部)と比較する。各部
品は、ルール(条件部)と一致するルールがあれば、そ
のルール(行動部)に従って、待機、移動、回転などの
行動をとり、その結果を環境メモリ部11に返す。
【0041】また、一致するルール(条件部)がなけれ
ば、各部品(分類子システム12,13,14)は検出
したコードを条件部とし、ランダムに生成した行動部を
持つルールを新たに生成し、実行する。
【0042】ステップ309では、ルールを実行した結
果は環境メモリ部11に通知され、終了条件を満たして
いれば処理を終了し、終了条件を満たしていない場合
は、ステップ302に戻る。終了条件は、環境メモリ部
11ですべての部品が重なりを解消し、かつ、全部品の
配線長の合計が設定値以下または全部品の配線長の合計
がn回(例えば3回)同じであれば処理を終了するもの
とする。
【0043】ステップ305では、分類子システム12
は評価部104の報酬の結果を受けて、学習部101に
強化学習の要求を行う。学習部101は、図2に示す分
類子システム12が報酬を得るまでに実行した一連のル
ールの適合度を、従来の技術で説明したバケツリレー・
アルゴリズムまたは利益共有法の強化学習により変更
し、カウンタを1つ増やし、ステップ306に進む。
【0044】ステップ306では、カウンタが設定値
(例えば、5)に達したかを判断し、達している場合に
は、カウンタを0に戻し、ステップ307にすすむ。達
していない場合は、ステップ302に戻る。このカウン
タの設定値は、強化学習を重視するか遺伝的アルゴリズ
ムを重視するかを決めるものである。
【0045】ステップ307では、学習部101は分類
子システム12の要求により遺伝的アルゴリズムにより
分類子システム12のルールを書き換え、ステップ30
2に戻る。
【0046】次に、遺伝的アルゴリズムによる分類子シ
ステムのルールの書き換えについて説明する。遺伝的ア
ルゴリズムを分類子システムに適応する方法は、個体
(遺伝的アルゴリズムを適用する対象)の違いからミシ
ガン・アプローチとピッツ・アプローチの二つに大別さ
れている。
【0047】まず、ミシガンアプローチでは、分類子シ
ステム内のルールを個体とみなし、遺伝的アルゴリズム
を適用する。遺伝的アルゴリズムによって、ルールは選
択、交叉、突然変異を起こす。一般的には、メモリの制
約上、分類子システムに記憶できるルールの数は有限で
あり、新たなルールを記憶するため、『選択』によって
適合度の低いルールを削除する。なお、メモリがいっぱ
いになっていない場合でも、『選択』を行なうことはで
きる。『交叉』によって、新たなルールを生成する場合
について、図4に示す。例えば適合度の高いルール1と
ルール2から、ルールのコードを任意の交叉位置から分
割し、ルール1上位コードとルール2下位コードを結合
し、新たにルールn+1を生成するものである。この例
は単純交叉(または一点交叉)と呼ばれている。交叉位
置は一点ではなく複数点の場合もある。また、『突然変
異』は、例えば(ルール3:1011001110010101)から新
たなルールn+3として(10110011ABC10101)を生成す
るものである。
【0048】一方、ピッツ・アプローチは、図5(a)
に示すように、例えばランダムに選ばれた分類子システ
ム1と分類子システム(1+m)において、下位の一部
(n個分)を相互に交換し、新たな分類子システムのル
ールとするものである。
【0049】さらに、図5(b)のように、ランダムに
選ばれた分類子システム1と分類子システム(1+m)
において、自己の適合度の高いルールを設定数(n個
分)だけを選び、相互に相手の適合度の低いルールから
順に設定数(n個分)のルールを上書きすることもあ
る。
【0050】また、コンピュータによって実現する際
に、上記処理フロー図3または図4をプログラム化し、
プログラムを記録した記録媒体により各種コンピュータ
にインストールすることにより実現できる。
【0051】以上、遺伝的アルゴリズムを用いた分類子
システムの学習方法の応用システムでは、明示的に大域
的評価関数を作成しなくても、すべての部品が終了条件
を満たすまで各部品(分類子システム)が組織的に学習
し、最適な部品配置となるように最適化するするもので
ある。このような部品追加の問題では、人間のエキスパ
ートで約半日を必要とするが、本手法により作成された
部品配置システムを用いれば、パーソナルコンピュータ
でも約1時間で結果がでるので、開発効率を上げること
ができる。
【0052】また、遺伝的アルゴリズムを用いた分類子
システムの学習方法の具体的な応用例として、プリント
基板CADを使った自動部品配置システムについて説明
したが、これに限定されるものではなく、机などのレイ
アウト変更の最適化問題、コンピュータやプリンタなど
の情報機器のレイアウト変更の最適化問題およびサッカ
ーやラグビーなどの多人数スポーツのシミュレーション
システムの最適化問題等の最適化問題に幅広く応用でき
る。
【0053】本発明は、外部からの統制なしに、自ら適
切な適応行動を獲得・学習するするように各部品の分類
子システムのルールを改善できるため、各部品は適切な
配置位置を探すことができる。さらに、全部品の配線長
の合計が人間のエキスパートが行った結果よりも本発明
が用いた方が短くなったことと、数倍速く解を得ること
ができたことから、本発明は多くの制約を満たさなけれ
ばならない最適化問題に対して有効であった。
【0054】
【発明の効果】以上のように本発明を適応した手法は、
複数の分類子システムが存在する系に対して、各分類子
システムが自己の近傍の環境から得られる状況により組
織的な学習を行なうことにより、大域的評価関数を作成
する必要がないため、その評価関数の作成や検証にかか
る時間や労力を大幅に削減することができる。
【0055】また、ミシガン・アプローチとピッツ・ア
プローチを組み合わせることによりCADの再配置設計
においては、専門家による再配置結果よりも良い結果が
得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における遺伝的アルゴリ
ズムを用いた分類子システムの学習システムの構成図
【図2】同実施の形態1の分類子システムのルールの説
明図
【図3】同実施の形態1の自動部品配置システムの処理
フローチャート
【図4】同実施の形態1のミシガン・アプローチによる
分類子システムのルールの生成の説明図
【図5】(a)同実施の形態1のピッツ・アプローチに
よる分類子システムのルールの生成の説明図 (b)同実施の形態1のミシガン・アプローチとピッツ
・アプローチを組み合わせたアプローチによる分類子シ
ステムのルールの生成の説明図
【符号の説明】
11 環境メモリ部 12、13、14 分類子システム 101、102、103 学習部 104、105、106 評価部 201、202、203 エージェント

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 複数のエージェントが存在する系に対し
    て、各エージェントが自己の近傍の環境から得る局所的
    な情報により、エージェント内の分類子システムが組織
    的な学習を行なうことを特徴とする分類子システムの学
    習方法。
  2. 【請求項2】 各エージェントは近傍の環境の状態を認
    識し、これに対する行動を繰り返しながら各自の局所的
    評価関数を自己組織化することを特徴とする請求項1記
    載の分類子システムの学習方法。
  3. 【請求項3】 自己の判断基準(局所的評価関数)に
    は、各エージェントの分類子システム、各エージェント
    近傍の環境の状態、報酬を得る間に実行されたルールの
    順番および連続したルールに基づいた行動評価メカニズ
    ムの要素によって構成された評価関数を用いることを特
    徴とする請求項2記載の分類子システムの学習方法。
  4. 【請求項4】 分類子システム内のルールは、遺伝的ア
    ルゴリズムの操作オペレータである選択淘汰、交叉また
    は突然変異によって新たに生成されることを特徴とする
    請求項2または3記載の分類子システムの学習方法。
  5. 【請求項5】 新たな環境に遭遇したときは、分類子シ
    ステム内のルールが新たに生成されることを特徴とする
    請求項2または3記載の分類子システムの学習方法。
  6. 【請求項6】 各エージェント内の分類子システムが保
    持するルール数が最大数を越えた場合は、適合度の低い
    ルールが削除され置き換わることを特徴とする請求項2
    または3記載の分類子システムの学習方法。
  7. 【請求項7】 分類子システム内のルールは、交叉オペ
    レータにより選択された各ルールまたは各エージェント
    内の分類子システム間で交換することを特徴とする請求
    項4記載の分類子システムの学習方法。
  8. 【請求項8】 各エージェントは、交叉オペレータを適
    用する相手エージェントを選び、自己の適合度の一番高
    いルールグループを相手の適合度の一番低いルールグル
    ープに上書きすることを特徴とする請求項7記載の分類
    子システムの学習方法。
  9. 【請求項9】 各エージェントは、任意に選んだ2つの
    ルールのコードの上位と下位を相互に交換することを特
    徴とする請求項7記載の分類子システムの学習方法。
  10. 【請求項10】 各エージェントは、交叉オペレータに
    より任意時間毎、任意置きあるいはランダムに相手を選
    択することを特徴とする請求項4乃至9のいずれかに記
    載の分類子システムの学習方法。
  11. 【請求項11】 複数のエージェント間の相互作用を通
    して自己の判断基準(局所的評価関数)を自己組織化し
    ながら集団の特性を認識し、適応行動と協調行動をエー
    ジェント内の分類子システムが学習することを特徴とす
    る分類子システムの学習方法。
  12. 【請求項12】 コンピュータによって学習するプログ
    ラムを記録した記録媒体であって、複数のエージェント
    間の相互作用を通して自己の判断基準(局所的評価関
    数)を自己組織化しながら集団の特性を認識し、適応行
    動と協調行動をエージェント内の分類子システムが学習
    することを特徴とする分類子システムの学習方法を記録
    した記録媒体。
JP9162232A 1997-06-19 1997-06-19 分類子システムの学習方法 Pending JPH1115807A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9162232A JPH1115807A (ja) 1997-06-19 1997-06-19 分類子システムの学習方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9162232A JPH1115807A (ja) 1997-06-19 1997-06-19 分類子システムの学習方法

Publications (1)

Publication Number Publication Date
JPH1115807A true JPH1115807A (ja) 1999-01-22

Family

ID=15750490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9162232A Pending JPH1115807A (ja) 1997-06-19 1997-06-19 分類子システムの学習方法

Country Status (1)

Country Link
JP (1) JPH1115807A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020190853A (ja) * 2019-05-20 2020-11-26 ヤフー株式会社 学習装置、学習方法及び学習プログラム
WO2022029821A1 (ja) * 2020-08-03 2022-02-10 日本電気株式会社 方策作成装置、制御装置、方策作成方法、及び、プログラムが格納された非一時的なコンピュータ可読媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020190853A (ja) * 2019-05-20 2020-11-26 ヤフー株式会社 学習装置、学習方法及び学習プログラム
WO2022029821A1 (ja) * 2020-08-03 2022-02-10 日本電気株式会社 方策作成装置、制御装置、方策作成方法、及び、プログラムが格納された非一時的なコンピュータ可読媒体

Similar Documents

Publication Publication Date Title
Ali et al. An improved class of real-coded Genetic Algorithms for numerical optimization✰
Rafiq et al. Neural network design for engineering applications
Brownlee et al. Constrained, mixed-integer and multi-objective optimisation of building designs by NSGA-II with fitness approximation
Caraffa et al. Minimizing makespan in a blocking flowshop using genetic algorithms
Lanzi Learning classifier systems: then and now
Fogel et al. Inductive reasoning and bounded rationality reconsidered
EP0762294A2 (en) Computer system using genetic optimization techniques
Vergidis et al. Business process improvement using multi-objective optimisation
Mishra et al. A fuzzy goal-programming model of machine-tool selection and operation allocation problem in FMS: a quick converging simulated annealing-based approach
Yaghoobi Parameter optimization of software reliability models using improved differential evolution algorithm
Seif et al. Modelling and optimization of a bi-objective flow shop scheduling with diverse maintenance requirements
Yeh et al. Simplified swarm optimization for bi-objection active reliability redundancy allocation problems
Yih et al. A neural network design for circuit partitioning
Boone et al. Evaluating the appropriateness of market segmentation solutions using artificial neural networks and the membership clustering criterion
Bartlett et al. Estimation and approximation bounds for gradient-based reinforcement learning
Balafoutis et al. Algorithms for stochastic CSPs
Gutiérrez et al. Designing multilayer perceptrons using a guided saw-tooth evolutionary programming algorithm
JPH1115807A (ja) 分類子システムの学習方法
Santos et al. Adaptive large neighborhood search applied to the design of electronic circuits
WO2024011867A1 (zh) 多条公交线路的排班表优化方法、装置及相关设备
Bull On zcs in multi-agent environments
CN113205185A (zh) 网络模型优化方法、装置、计算机设备和存储介质
US6336107B1 (en) Method and system of automatic arrangement of composing elements
Nagatani et al. Backward varilable selection of support vector regressors by block deletion
CN111291792A (zh) 基于双进化的流量数据类型集成分类方法及装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060228