JPH1173207A

JPH1173207A - ルックアップテーブル設計方法及び記録媒体

Info

Publication number: JPH1173207A
Application number: JP9271189A
Authority: JP
Inventors: Hideyuki Aisu; 英之愛須
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1997-06-30
Filing date: 1997-10-03
Publication date: 1999-03-16
Anticipated expiration: 2017-10-03
Also published as: JP3421552B2

Abstract

(57)【要約】【課題】与えられた入力−出力変数の組み合わせに応
じて最も適切かつロバスト性に優れたルックアップテー
ブルを自動設計する方法を提供すること。【解決手段】学習過程において、所定の条件の成立を
契機として生成された、目的となるルックアップテーブ
ルに対する入出力ベクトルの対を含む抗体データに、そ
の相対的な優良性を示す濃度を対応付けて記憶する手段
から、選択された入力ベクトルに基づいて定められる所
定の近傍範囲に含まれる抗体データを求め、その個々の
抗体データについて所定の方法により評価値を求め、求
められた全ての評価値を考慮した各抗体データの評価値
の相対的な優良性を基準にして各抗体データの濃度を更
新し、学習過程の終了後に前記記憶手段に記憶されてい
る抗体データとその濃度に基づきルックアップテーブル
の内容を決定する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えば、センサ入
力に基づき使用する制御パラメータを決定するパラメー
タルックアップテーブル、観測された状況に基づき適切
な戦略を決定するデシジョンテーブルなど、種々ルック
アップテーブルを順方向計算モデルもしくは計算シミュ
レータを用いて自動設計もしくは設計支援するための汎
用的なルックアップテーブル設計方法に関し、特に、オ
ンラインで入力値から演算によりリアルタイムに出力値
を求めることが不可能なため事前に出力値を決めルック
アップテーブルに記憶させる必要がある場合に、ルック
アップテーブルに記憶させる内容（入力値の場合分けお
よびそれぞれの場合において出力する値）の設計を自動
化もしくは支援するための汎用的なルックアップテーブ
ル設計方法置に関する。

【０００２】

【従来の技術】ルックアップテーブルは、例えば入力を
量子化しアドレスに変換する手段を利用した連想メモリ
などとして、容易にハードウェアとして実装可能かつ高
速に動作可能であり、動作試験も容易であるため、交通
信号の制御パラメータ調整装置、エレベータの郡管理モ
ード決定装置、家電機器の制御パラメータ調整装置な
ど、リアルタイム性が要求されるシステムを中心に、極
めて広い分野で利用されている。

【０００３】ここで、ルックアップテーブルとは、入力
を幾つかの場合に分け、それぞれの場合に対応する出力
を記憶し、任意の入力が与えられた場合にそれに対応す
る出力を検索して出力することが可能な、ソフトウェア
モジュールもしくはハードウェアモジュールを指す。

【０００４】ルックアップテーブルの利用方法として
は、オンラインで入力値から演算によりリアルタイム／
自動的に出力値を求めることが不可能なため事前に出力
値を決めておく必要がある場合と、演算により自動的に
出力値を求めることが可能であるが演算用ハードウェア
を省くためルックアップテーブルに記憶させ利用する場
合との２種類の利用目的がある。以下では、前者の目的
で用いるルックアップテーブルを扱うものとする。

【０００５】ルックアップテーブル（例えばセンサ入力
に基づき使用する制御パラメータを決定するパラメータ
ルックアップテーブルや観測された状況に基づき適切な
戦略を決定するデシジョンテーブルなど）を作成するた
めには、入力値の場合分けおよびそれぞれの場合におい
て出力する値を設計する必要がある。従来の一般的なル
ックアップテーブル設計においては、設計者がノウハウ
に基づき入力情報を事前に場合分けし、さらにそれぞれ
の場合に対応する出力値を別の手段により決定してい
る。ここでは、交通信号の制御に用いられるルックアッ
プテーブルを例に、従来のルックアップテーブル設計手
法を説明する。

【０００６】日本の交通信号の制御としては、制御対象
となる交差点群（系統）に属する信号機群について、同
系統内の主要なポイント（例えば代表交差点）に設けた
車両感知器郡の情報を入力とし該信号機群に対する制御
パラメータを出力とするルックアップテーブルを設計
し、このルックアップテーブルから一定時間ごとに交通
状況に合せた制御パラメータを選択して制御に使用す
る、パタン選択制御と呼ばれる方式が一般的である。こ
の場合、制御パラメータとしては、青信号開始時間の間
隔を示す「サイクル」、互いに交差する各交通路に与え
る青時間の比を示す「スプリット」、系統内の各信号機
間の青開始時刻のずれを示す「オフセット」の３種類が
主に用いられる制御パラメータである。交通信号の制御
では、これら制御パラメータを交通状況に応じて調整す
ることで車両の流れをよりスムーズにすることが１つの
目標であり、ルックアップテーブルの設計にあたっては
これら制御パラメータを多様な交通状況に応じて夫々決
定することが必要になる。

【０００７】この例の場合におけるルックアップテーブ
ルの一設計法について簡単に説明すると、まず、第１の
手順として、ルックアップテーブルに対する入力ベクト
ル空間の分割を行う。すなわち、車両感知器郡により与
えられる入力である代表交差点の交通量を、例えば閑
散、上り方向優先、下り方向優先など予め決められた数
種類のパタンに場合分けする。図１６に、よく使用され
る分割の一例を示す。図１６では、上り交通指標（上り
の交通量）と下り交通指標（下りの交通量）の２次元入
力ベクトル空間を、閑散、２種類の上り優先、２種類の
平等、２種類の下り優先の計７つの区間に分割してい
る。

【０００８】この入力ベクトル空間の分割はノウハウに
基づいて行われるもので、一般的な分割手法が存在する
訳ではない。

【０００９】次に、第２の手順として、上記の分割にて
定められた各パタンに対応する出力ベクトルを定める。
すなわち、各パタンごとに、そのパタンにおける代表的
な交通状況（図１６の場合、各パタンにおける上り交通
指標の代表値および下り交通指標の代表値）を定め、例
えばスルーバンド最大化と呼ばれる設計手法や街路交通
シミュレータを用いた最適化手法等により、該代表的な
交通状況に適した「サイクル」「スプリット」「オフセ
ット」を決定し、これを対応するパタンにはめ込む。

【００１０】上記の街路交通シミュレータを用いた最適
化では、例えば、ＴＲＡＮＳＹＴと呼ばれる設計支援ツ
ールが主に用いられている。ＴＲＡＮＳＹＴは、英国運
輸道路研究所（ＴＲＲＬ）により開発されたもので、街
路交通現象解析および信号パラメータ設計支援のため、
世界的に最も広く用いられているツールである。このＴ
ＲＡＮＳＹＴは、車群単位で交通流を記述するマクロモ
デルを用い、道路網に方向別平均交通量などを設定し、
車群のサイクル期間内の動きをシミュレートする機能
と、各信号交差点で発生する遅れと停止回数に基づく評
価値をシミュレーションにより計算し、オフセット、ス
プリットを山登り法により最適化する機能を持つ。ま
た、最適化の評価基準としては、主に次に示す評価値
Ｐ．Ｉ．を用い、設定された交通状況の下で評価値Ｐ．
Ｉ．を最小にするパラメータを求める。Ｐ．Ｉ．＝Σ（遅れ時間＋α×停止回数）このような手順を経て交通信号制御用のルックアップテ
ーブルが設計される。

【００１１】なお、以上の内容については、（社）交通
工学研究会編集・発行「交通信号の手引」や越編著・
技術書院発行「交通工学通論」等にて詳しく説明されて
いる。

【００１２】以上説明した交通信号制御用のルックアッ
プテーブルの設計方法と同様に、一般にルックアップテ
ーブルの設計においては、経験やノウハウに基づく方法
あるいは試行錯誤的な方法により入力ベクトル空間の分
割（入力ベクトルの場合分け）を決定し、その後それぞ
れの分割における入力ベクトルの代表値を、例えば各分
割の中央の値を使うなどの方法で決定し、さらに各代表
値に対応する最適出力を、順方向モデルを用いて出力の
評価値を求めることによる最適化や計算シミュレータに
よる検証の試行錯誤的反復などにより決定し各分割の出
力として記憶させる方法が、最も広く用いられている。

【００１３】なお、順方向モデルおよび計算シミュレー
タとは、内部パラメータおよびシミュレータへの入力ベ
クトル（ルックアップテーブルの出力ベクトル）を決定
すると対応する出力が一意に演算により求められる演算
式もしくはソフトウェアモジュールもしくはハードウェ
アモジュールを示すものとし、同じ内部パラメータおよ
び入力ベクトルを指定しても対応する出力が一意に決ま
らない一対多写像となるものは含まれないものとする。

【００１４】しかしながら、前述したような従来のルッ
クアップテーブルの設計方法には、以下の２つの大きな
問題点がある。

【００１５】（問題点１）設計に手間を要する点過去のノウハウがない新たなタイプのルックアップテー
ブルを設計する場合には、１）入力空間の分割の決定２）各分割における出力値の決定３）ルックアップテーブル全体として問題なく機能する
かどうかについてのシミュレーションもしくは実験によ
る検証の３ステップを試行錯誤的に繰り返さなくてはならない
ため、全体の作業の繰り返し数は膨大になり、設計に手
間を要する問題点がある。特に、複数センサからの情報
を入力とし入力が多種多様に渡る場合、一般に解析的に
出力を求める手法がないため設計は試行錯誤的にならざ
るを得ず、手間を要することが多い。例えば、エレベー
タ群管理制御において、どの階の呼びを優先するかを決
定する優先重みを、全呼び情報、呼び頻度、時刻などを
入力として決定するためのルックアップテーブルなど
は、解析的に優先重みを求める手法がないため設計が困
難である。

【００１６】（問題点２）入力ベクトル空間の各分割に
おけるロバストな代表値の決定が困難である点ルックアップテーブルの入力ベクトルとしては、センサ
により得られる観測値や観測値を加工した情報を用いる
が、これらのセンサにより可観測な情報が、ルックアッ
プテーブルの出力対象（つまり制御対象）となるシステ
ムＳの状態を完全に推定するためには不足する場合が多
い。つまり、設定されたセンサにより得られる観測値を
もとにしても状態が推定できない不可観測な内部パラメ
ータ（以下、これを内部パラメータｐと呼ぶ）がシステ
ムＳに存在する場合、各分割の代表値（中央値等）か
ら、順方向モデルやシミュレータに設定すべき内部パラ
メータｐ（ｐはベクトルである）が一意に定まらず、該
代表値と該内部パラメータｐとは一対多の関係にある。
さらに詳しく言うと、一般に、ある内部パラメータｐの
下での可観測値ｒ｜ｐは一意に求まるが、逆に観測値ｒ
の観測下での内部パラメータｐ｜ｒは逆方向処理である
ため一意には決まらない。

【００１７】この場合、従来手法では、まず入力ベクト
ル空間の分割の代表的可観測値ｒを決め、ｒに対する内
部パラメータの集合Ｐ｜ｒの中から１つの内部パラメー
タｐ１（ｐ１はＰの要素）を仮定し、この内部パラメー
タｐ１をシステムＳの順方向モデルやシミュレータに設
定し、この内部パラメータｐ１の下での最適な出力を探
索手法により求め、ルックアップテーブルに記憶させる
ことになる。このため、ルックアップテーブル使用時の
システムＳの内部パラメータｐが仮定値ｐ１と大幅に異
なると、出力が有効でなくなるおそれがあり、ロバスト
性に問題がある。さらには、非線形処理を含むシミュレ
ーションにおいては、一般に逆方向処理により集合Ｐ｜
ｒを求めることすら困難である場合が多い。

【００１８】この点について交通信号制御システムを例
に取って具体的に説明する。図１７に示す例は、１〜１
５の番号を付した１５個の交差点、３１個のリンクから
なる系統の例である。なお、３１個のリンクは、交差点
１に下り方向から流入してくるリンク、１〜１５番の隣
接する交差点に挟まれた上り方向のリンクおよび下り方
向のリンク、交差点１５に上り方向から流入してくるリ
ンク、交差点８おいて脇から流入してくるリンクであ
る。

【００１９】説明を簡単にするために、この系統は、中
央の交差点８において脇から多量に流入するリンクを持
ち、交差点郡の信号制御装置は、主要交差点１に備えら
れた２つの車両感知器により夫々得られる上りの交通量
および下りの交通量を計測し、ルックアップテーブルに
より系統内全交差点の「オフセット」を決定するものと
する。ここで、オフセットは、主要交差点１にて青が開
始される時刻を基準とした各交差点の青開始時刻の持つ
ずれの量であるものとする（この例では、１４個のオフ
セットが設定される）。

【００２０】この例では、２箇所の車両感知器のみで
は、脇からの流入交通量が車両感知器により得られる上
り交通量内で占める割合を推定するのは不可能である。
このため、従来手法では、上り交通量の半分の量が流入
交通であるなどの仮定を設けて内部パラメータ（３つの
交通量）を決定し、例えば前述のＴＲＡＮＳＹＴに設定
しオフセットを探索により最適化することで、各分割の
オフセットを決定する。したがって、現実の流入交通量
が仮定した値（例えば上り交通量の半分の量）の付近に
あれば、ルックアップテーブルは有効に機能するが、現
実の流入交通量が仮定した値から大幅にずれてくると、
ルックアップテーブルが有効に機能しなくなるおそれが
あり、ロバスト性に問題がある。

【００２１】また、ルックアップテーブルを用いる際に
は、入力ベクトルの属する分割について決定された出力
ベクトルが出力される。すなわち、各分割ごとに決定さ
れた出力ベクトルは、これを決定する際に用いた入力ベ
クトルの代表値から入力ベクトル空間上の距離の遠い入
力ベクトルについても広くシステムＳに適用される。し
たがって、入力ベクトル空間の各分割が大きい（分割が
荒い）場合、代表値に対して最適化された出力ベクトル
が代表値から距離の遠い入力ベクトルに対しても有効に
機能するとは限らないという問題がある。

【００２２】

【発明が解決しようとする課題】上記したように従来の
ルックアップテーブル設計方法には、例えば過去のノウ
ハウがない新たなタイプのルックアップテーブルを設計
する場合には、入力空間の分割の決定、各分割における
出力値の決定、ルックアップテーブル全体として問題な
く機能するかどうかについてのシミュレーションもしく
は実験による検証の３ステップを試行錯誤的に繰り返さ
なくてはならないため、全体の作業の繰り返し数は膨大
になり、設計に手間を要する問題点があった。また、入
力ベクトル空間の各分割におけるロバストな代表値の決
定が困難である問題点があたった。

【００２３】本発明は、上記事情を考慮してなされたも
ので、利用可能な入力情報の多い少ないにかかわらず与
えられた入力−出力変数の組み合わせに応じて最も適切
かつロバスト性に優れたルックアップテーブルの内容を
自動設計もしくは設計支援することのできるルックアッ
プテーブル設計方法を提供することを目的とする。

【００２４】

【課題を解決するための手段】本発明は、概略的には、
計算シミュレーションモデルまたは順方向モデル上での
オフライン学習により、自動的にルックアップテーブル
の内容設計を行うものである。本発明では、免疫系の
「膨大な種類の抗原に対抗するための多種多様な抗体を
後天的に作り出す機構」を単純化して模倣している。言
い換えると、生態の免疫システムの原理の一部を模倣し
て発見的探索手段および記憶手段を一体化させ、知識の
多様性を崩さぬようにオフライン学習を行わせる。ただ
し、本発明は、免疫系の詳細な原理とは直接の対応はな
いためここでは生体免疫システム自体についての説明は
省略するが、免疫系自体の学習能力等に関しては、例え
ば、Ｊ．Ｄ．Ｆａｍｅｒ，Ｎ．Ｈ．Ｐａｃｋａｒｄ，
「Ｔｈｅｉｍｍｕｎｅｓｙｓｔｅｍ，ａｄａｐｔａ
ｉｏｎ，ａｎｄｍａｃｈｉｎｅｌｅａｒｎｉｎ
ｇ」，ＰｈｙｓｉｃａＤ２２，ｐｐ．１８７−２０
４，１９８６等の文献にて詳しく説明されている。

【００２５】本発明では、遺伝的アルゴリズム（ＧＡ）
において遺伝子に情報のコーディング単位を当て嵌めて
いることに倣い、抗体にルックアップテーブルに対する
入力ベクトルおよび出力ベクトルのコーディング単位を
当て嵌める。すなわち、抗体とは、入力ベクトルおよび
出力ベクトルのコーディング単位のことを意味する。抗
体は、数値もしくは記号ベクトルとして表現される。

【００２６】また、本発明では、抗体の濃度に有効性の
指標を当て嵌める。すなわち、抗体の濃度とは、強化学
習に基づく手法一般における強化値と同様の意義を持つ
ものであり、抗体の取捨選択の基準となるものである。
なお、強化学習とは、報酬を入力として報酬をもたらす
出力を優先すべく重みを更新することにより環境に適応
する機械学習の一種であり、明確な教師出力が与えられ
なくても学習を行うことができる特徴を持つ。

【００２７】なお、抗体の評価値は、その抗体の出力ベ
クトルに対応する部分についてある内部パラメータの条
件下で計算シミュレーションもしくは順方向モデル演算
を実行した結果から評価される、その条件下においてそ
の抗体により対象システムが上手く制御できたかどうか
を示す尺度であり、抗体単独に定まる値である。

【００２８】本発明（請求項１）に係るルックアップテ
ーブル設計方法は、所望のシステムの制御に使用するル
ックアップテーブルの入力ベクトルおよび出力ベクトル
の関係を調べる学習を行った後に、この学習の結果に基
づいて該ルックアップテーブルの内容を決定するルック
アップテーブル設計方法であって、前記学習において、
所定の条件の成立を契機として生成された、目的となる
ルックアップテーブルに対する入力ベクトルおよび出力
ベクトルの対を含む抗体データに、その相対的な優良性
を示す濃度を対応付けて複数記憶している抗体情報記憶
手段から、入力ベクトル空間上における所定の近傍範囲
内に含まれる入力ベクトルを持つ抗体データを求めるこ
とを通して、評価対象とする複数の抗体データを定め、
評価対象とされた個々の抗体データについて所定の方法
により評価値を求め、求められた全ての前記評価値を考
慮した各抗体データの評価値の相対的な優良性を基準に
して、各抗体データの濃度を更新することを特徴とす
る。

【００２９】また、本発明（発明１）に係るルックアッ
プテーブル設計装置は、ルックアップテーブルへの入力
ベクトルおよび出力ベクトルのコーディング単位である
抗体とその濃度とを対応付けて複数個記憶する抗体記憶
手段と、前記抗体記憶手段に記憶された抗体の濃度を更
新後の値に書き換えるデータ変更手段と、前記抗体記憶
手段に追加すべき新たな抗体を生成する候補抗体産生手
段と、指定された抗体の評価値を求める抗体評価値決定
手段と、ユーザにより指定される学習パラメータおよび
ルックアップテーブル設計パラメータを入力するパラメ
ータ入力手段と、入力された前記学習パラメータに基づ
いて抗体の学習過程を管理するとともに、入力された前
記ルックアップテーブル設計パラメータに基づいてルッ
クアップテーブル設計過程を管理する学習・設計管理手
段と、学習過程終了後に前記抗体記憶手段に記憶されて
いる内容に基づいてルックアップテーブルの内容を決定
するルックアップテーブル作成手段とを備え、前記学習
過程において抗体の濃度の更新を行う際に、抗体の入力
ベクトルに相当する部分が入力ベクトル空間上で近傍に
位置する抗体集団の中での、該抗体の評価値の相対的な
優良度を基準にして、該抗体の濃度を更新することを特
徴とする。

【００３０】本発明によれば、学習過程において、候補
抗体産生手段によりルックアップテーブルの内容のもと
となる多種多様な入力ベクトルおよび出力ベクトルのコ
ーディング単位（抗体）を生成し抗体記憶手段に記憶す
るとともに、あるステップの入力ベクトルを基準とする
近傍内においてまず抗体評価値決定手段により各近傍抗
体を独立に評価し次に近傍抗体間の相対的な優良度を基
準にして各近傍抗体の濃度をデータ変更手段により更新
していくので、抗体の多様性を維持しつつより優れた制
御を行う能力を持つと期待される抗体の濃度を増加させ
ていき、そして、学習過程終了後のルックアップテーブ
ル設計過程において、抗体記憶手段に記憶されている内
容に基づいてルックアップテーブルの内容を決定するの
で、過去のノウハウがなくても手間をかけず適切かつロ
バスト性に優れたルックアップテーブルを設計できるよ
うにしたものである。

【００３１】また、本発明によれば、ニューラルネット
ワークのように設計者が学習用教師データを用意しなく
ても、計算シミュレーション上での自律的な試行錯誤の
反復によりルックアップテーブルの自動設計が可能とな
る。

【００３２】本発明（発明２）は、上記発明１におい
て、ルックアップテーブルの入力ベクトルの各次元毎に
指定された大きさのメッシュに入力ベクトル空間を分割
し、検索キーとして入力された入力ベクトルの含まれる
メッシュに対し、各次元毎に指定された大きさの近傍内
にある近傍メッシュに含まれる全ての近傍抗体のコーデ
ィング内容または抗体格納アドレス情報を前記抗体記憶
手段から検索・抽出する近傍抗体検索手段をさらに備
え、この近傍抗体検索手段により抽出された全ての近傍
抗体の評価値を前記抗体評価値決定手段によりそれぞれ
求め、求められた全ての評価値を用いた所定の演算によ
り、該抽出された近傍抗体それぞれについて濃度更新を
行うことを特徴とする。

【００３３】ここで、近傍抗体検索手段による検出の一
例を示すと、入力ベクトルを２次元、メッシュ分割数を
両次元とも８分割、近傍の大きさを両次元とも１メッシ
ュとした場合、図４において、抗体記憶手段内に記憶さ
れている抗体の入力ベクトルに相当する部分が入力ベク
トル空間に占める座標が黒丸で示されたようであり、検
索キーとして入力された入力ベクトルが占める座標が×
印で示されたようであるとすると、ハッチングされた９
つのメッシュ（近傍メッシュ）に含まれる抗体（この場
合、４つの抗体）が近傍抗体検索手段により近傍抗体と
して抽出される。

【００３４】本発明では、抗体が競合する範囲を入力ベ
クトル空間の近傍メッシュ内に限定することにより、入
力ベクトル空間上での多様性が保たれ、各メッシュ（ル
ックアップテーブルの各アドレス）に対応する抗体がま
んべんなく得られることになる。すなわち、抗体評価値
決定手段が抗体の評価のために計算シミュレータもしく
は順方向モデルを用いる場合に、計算シミュレータもし
くは順方向モデルにおける内部パラメータｐの変動によ
り観測され得る観測値ｒ｜ｐのいずれかに対応する抗体
がまんべんなく得られる。

【００３５】本発明（発明３）は、上記発明２におい
て、前記近傍抗体検索手段により抽出された全ての近傍
抗体の評価値を前記抗体評価値決定手段によりそれぞれ
求め、求められた全ての評価値からその平均値を求め、
濃度更新対象となる抗体の評価値と前記平均値との大小
関係に応じて、該濃度更新対象となる抗体の濃度を更新
することを特徴とする。

【００３６】このような濃度更新方法によれば、メッシ
ュに依存して抗体の評価値の相場に大幅なばらつきがあ
る場合でも、近傍内での相場に対し相対的に評価値が優
れた抗体の濃度が増すため、評価値の絶対基準を各メッ
シュ毎に定める必要がなく、学習パラメータの設定が著
しく容易になる。例えば、前述のＴＲＡＮＳＹＴにおけ
る評価指標Ｐ．Ｉ．を評価値として用いた場合、メッシ
ュの交通量の総量平均に応じて著しく良不良の基準値が
変動するため、濃度増減の基準もメッシュにより異なる
が、本方式によれば濃度増減の基準をユーザが個別に定
める必要がなくなる。

【００３７】濃度更新方法の一例として、以下の式に基
づき濃度更新を行う方法がある。ここで、Ｆｊは抗体ｊ
の評価値である。次の式では評価値が大きいほど評価が
優れているものとする。ｎは近傍内抗体の数、Ｃｊは抗
体ｊの濃度、Δは濃度増減値である。 ΣＦｋ／ｎ≦Ｆｊ → Ｃｊ＝Ｃｊ＋Δ ΣＦｋ／ｎ＞Ｆｊ → Ｃｊ＝Ｃｊ−Δ ここで、Ｆｋの総和を取る範囲は、Ｋ＝１〜ｎである。

【００３８】あるいは、以下の式に基づき、濃度を各抗
体の勝率とみなして濃度変更を行う方法がある。ここ
で、Ｓｊは抗体がデータベースに追加されてから経過し
たステップ数であり、抗体格納手段に記憶されるものと
する。 ΣＦｋ／ｎ≦Ｆｊ → Ｃｊ＝（ＳｊＣｊ＋１）／（Ｓ
ｊ＋１） ΣＦｋ／ｎ＞Ｆｊ → Ｃｊ＝ＳｊＣｊ／（Ｓｊ＋１）ここで、Ｆｋの総和を取る範囲は、Ｋ＝１〜ｎである。

【００３９】他の濃度更新方法としては、入力ベクトル
空間における抗体と入力のユークリッド距離に応じた重
み付け平均を利用する方法、近傍抗体内での順位に応じ
た値を濃度から増減する方法など、種々の方法が考えら
れる。

【００４０】本発明（請求項２）は、請求項１に記載の
発明において、各学習の繰り返し毎に、第１の計算シミ
ュレータまたは順方向モデルの内部パラメータをランダ
ムにまたは予め指定された手順により変更し、第１の計
算シミュレーションまたは順方向モデル演算を行い、該
第１の計算シミュレーションまたは順方向モデル演算の
結果から予め指定された観測可能な情報を抽出してこれ
を変換して入力ベクトルを生成し、ルックアップテーブ
ルの入力ベクトルの各次元毎に指定された分割数に入力
ベクトル空間を分割して形成される複数のメッシュのう
ちの前記入力ベクトルが含まれるメッシュに、これを起
点として該各次元毎に指定された数だけ隣接するメッシ
ュを加えてなる、近傍メッシュに含まれる全ての抗体デ
ータを求めることを通して、評価対象とする複数の抗体
データを定め、評価対象とされた個々の抗体データにつ
いて、そのコーディング内容の出力ベクトルに相当する
部分の値を変換して第２の計算シミュレータまたは順方
向モデルに入力し、第１と同じ内部パラメータを設定し
た第２の計算シミュレーションまたは順方向モデル演算
を行い、該第２の計算シミュレーションまたは順方向モ
デル演算の結果に基づいて、各抗体データの評価値を求
めることを特徴とする。

【００４１】また、本発明（発明４）は、上記発明１に
おいて、ルックアップテーブルの入力ベクトルの各次元
毎に指定された大きさのメッシュに入力ベクトル空間を
分割し、検索キーとして入力された入力ベクトルの含ま
れるメッシュに対し、各次元毎に指定された大きさの近
傍内にある近傍メッシュに含まれる全ての近傍抗体のコ
ーディング内容または抗体格納アドレス情報を前記抗体
記憶手段から検索・抽出する近傍抗体検索手段をさらに
備え、前記抗体評価値手決定段は、計算シミュレータま
たは順方向モデル、パラメータ自動変更手段およびシミ
ュレーション結果評価手段を有し、各学習ステップ毎
に、計算シミュレータまたは順方向モデルの内部パラメ
ータをランダムにまたは予め指定された手順により変更
し、第１の計算シミュレーションまたは順方向モデル演
算を行い、前記第１の計算シミュレーションまたは順方
向モデル演算の結果から予め指定された観測可能な情報
を抽出してこれを入力ベクトルに変換し、該入力ベクト
ルを検索キーとして前記近傍抗体検索手段により前記抗
体格納手段から近傍抗体を抽出し、抽出された各近傍抗
体それぞれについて、そのコーディング内容の出力ベク
トルに相当する部分の値を変換して計算シミュレータま
たは順方向モデルに入力し、第２の計算シミュレーショ
ンまたは順方向モデル演算を行い、前記第２の計算シミ
ュレーションまたは順方向モデル演算の結果に基づい
て、前記抽出された各近傍抗体の評価値をそれぞれ求め
ることを特徴とする。

【００４２】本発明では、入力ベクトルを得るための第
１のシミュレーションで、内部パラメータｐに対応する
ルックアップテーブルの対象システムＳの可観測値ベク
トルｒを求め、抗体を評価するための第２のシミュレー
ションにより、内部パラメータｐの設定下で、入力ベク
トルｒ´｜ｐ（可観測値ベクトルｒと一対一対応）の近
傍抗体の出力ベクトルに相当する部分ｘをシミュレータ
に入力した際の評価値Ｆ｜ｐ，ｘを見積もることができ
る。そして、このＦ｜ｐ，ｘを抗体評価基準とし、ｐを
変動させながら学習を行うことにより、ある入力ベクト
ルｒ´の近傍にあるときに、ｐ｜ｒ´が何であれ常にＦ
が相対的に優れたロバストな出力ｘがコーディングされ
た抗体の濃度を増加させることはできる。これにより、
前述した従来手法の問題点２を、対象システムＳの逆方
向モデルを作成・解析する手間なしに解決することが可
能となる。

【００４３】本発明（発明５）は、上記発明４におい
て、前記候補抗体産生手段は、各学習ステップ毎に、前
記第１のシミュレーションまたは順方向モデル演算の結
果から予め指定された観測可能な情報を抽出してこれを
変換することにより作成された前記入力ベクトルと、所
定の手順で作成した出力ベクトルとの双方をコーディン
グすることにより、新たな候補抗体を生成するものであ
ることを特徴とする。

【００４４】本発明では、第１のシミュレーション後
に、指定された可観測値をもとに入力ベクトルｒ´｜ｐ
を求め、これとは別に所定の手順、例えば、ｐの設定下
での最適な出力ベクトルｘ｜ｐを山登り法などの探索手
法により求め、最後に両者を結合して抗体にコーディン
グする。山登り法の他にも、遺伝的アルゴリズムの様に
ランダム生成や近傍内の他の抗体を雛形にして突然変
異、交叉などの手段により出力ベクトルを作成する方法
など、種々の方法が考えられる。

【００４５】また、本発明によれば、内部パラメータｐ
を変動させた際に出現し得る入力ベクトルの近傍抗体以
外は始めから生成されないため、利用されない候補抗体
を作成・追加することを避け学習の効率化、メモリの節
約が図ることができる。

【００４６】本発明（発明６）は、上記発明４または５
において、前記候補抗体産生手段は、各学習ステップ毎
に、前記第１のシミュレーションまたは順方向モデル演
算の結果から予め指定された観測可能な情報を抽出しこ
れを変換することにより作成された前記入力ベクトルを
前記検索手段に検索キーとして入力して抽出された前記
近傍抗体の数が予め指定された規定個数を下回った場合
にのみ、新たな候補抗体を生成するものであることを特
徴とする。

【００４７】本発明によれば、各メッシュの近傍に存在
する抗体の数に偏りが生じるのを防ぐことができる。近
傍抗体の数が多過ぎると濃度更新の際の抗体評価に計算
時間を要し、また少な過ぎると発明３による近傍内での
相対評価ができなくなるが、本発明によれば、常に２以
上規定個数以下の適正抗体数が保たれる。

【００４８】本発明（発明１２）は、上記発明４または
５において、前記候補抗体産生手段は、各学習ステップ
毎に、前記第１の計算シミュレーションまたは順方向モ
デル演算の結果に基づいて予め指定された観測可能な情
報を抽出しこれを変換することにより作成された前記入
力ベクトルを前記検索手段に検索キーとして入力して抽
出された前記近傍抗体の数が予め指定された規定個数を
下回った場合に、新たな抗体を該規定個数に達するまで
繰り返し生成するものであることを特徴とする。

【００４９】本発明によれば、上記発明６の場合よりも
さらに各メッシュの近傍に存在する抗体の数が平均化さ
れる。

【００５０】本発明（発明７）は、上記発明１〜６，１
２において、各学習ステップ毎に、濃度の更新された前
記抗体（近傍抗体）のうち濃度が最小しきい値を下回っ
た抗体を前記抗体格納手段より削除することを特徴とす
る。

【００５１】本発明により、不適合な抗体を維持してい
くことを防ぐことができる。

【００５２】本発明（発明１３）は、上記発明１〜６，
１２において、各学習ステップ毎に、濃度更新された前
記抗体（近傍抗体）のうち濃度が最小の抗体を前記格納
手段より削除することを特徴とする。本発明により、不
適合な抗体を維持していくことを防ぐことができる。な
お、本発明は、上記発明１２と組み合わせて利用するの
が望ましい。

【００５３】本発明（発明１１）は、上記発明１〜７，
１２，１３において、前記近傍抗体検索手段において使
用する前記近傍の大きさを、学習の進行状況に応じて次
第に小さくすることを特徴とする。

【００５４】本発明によれば、ユーザが適切な近傍の大
きさを決められない場合、抗体が少ない内は近傍を大き
くとることでそれぞれのメッシュの抗体の濃度変更され
る機会を増やしロバストな抗体を得ることを優先され、
学習が進み抗体が多くなるに従い近傍を小さくすること
で、入力ベクトル空間の狭い領域に特化した抗体を得る
ことが優先されるようになり、学習の進行状況に応じた
効果的な近傍サイズを設定することができる。

【００５５】本発明（請求項３）は、請求項１または４
に記載の発明において、前記ルックアップテーブルの内
容を決定するに際しては、ルックアップテーブルの入力
ベクトルの各次元毎に指定された分割数に入力ベクトル
空間を分割して形成される複数のメッシュの各々につい
て、前記学習後における前記抗体情報記憶手段から、対
象となるメッシュとこれを起点として該各次元毎に指定
された数だけ隣接するメッシュとを加えてなる近傍メッ
シュに含まれる全ての抗体データを求め、そのうち最大
の濃度を持つ抗体データのコーディング内容の出力ベク
トルに相当する部分を、ルックアップテーブルの該対象
となるメッシュに相当するアドレスに書き込む処理を行
うことを特徴とする。

【００５６】また、本発明（発明８）は、上記発明１ま
たは４において、前記ルックアップテーブル作成手段
は、ルックアップテーブルの入力ベクトルの各次元毎に
指定された大きさに入力ベクトル空間を分割してなるメ
ッシュの中央値を前記近傍抗体検索手段に検索キーとし
て入力し、抽出された近傍抗体の中で最大の濃度を持つ
抗体のコーディング内容の出力ベクトルに相当する部分
を、ルックアップテーブルの前記メッシュに相当するア
ドレスに書き込むことを、全メッシュについて順次行う
ことにうより、前記抗体格納手段に格納されている抗体
をルックアップテーブルに変換するものであることを特
徴とする。

【００５７】本発明によれば、各メッシュ毎に最も優れ
た抗体の出力ベクトルをルックアップテーブルに記憶さ
せ、学習結果をルックアップテーブルに変換できる。ま
た、本発明により得られたルックアップテーブルは、前
述の連想メモリとして実装することができる。

【００５８】本発明（請求項４）は、請求項１または４
に記載の発明において、前記ルックアップテーブルの内
容を決定するに際しては、ルックアップテーブルの入力
ベクトルの各次元毎に指定された分割数に入力ベクトル
空間を分割して形成される複数のメッシュの各々につい
て、前記学習後における前記抗体情報記憶手段から、対
象となるメッシュとこれを起点として該各次元毎に指定
された数だけ隣接するメッシュとを加えてなる近傍メッ
シュに含まれる全ての抗体データを求め、そのうち最大
の濃度を持つ抗体データのコーディング内容をルックア
ップテーブルに書き込む処理を行うことを特徴とする。

【００５９】また、本発明（発明９）は、上記発明１ま
たは４において、前記ルックアップテーブル作成手段
は、ルックアップテーブルの入力ベクトルの各次元毎に
指定された大きさに入力ベクトル空間を分割してなるメ
ッシュの中央値を前記近傍抗体検索手段に検索キーとし
て入力し、抽出された近傍抗体の中で最大の濃度を持つ
抗体のコーディング内容を、ルックアップテーブルに書
き込むことを、全メッシュについて順次行うことにうよ
り、前記抗体格納手段に格納されている抗体をルックア
ップテーブルに変換するものであることを特徴とする。

【００６０】本発明によれば、各メッシュ毎に最も優れ
た抗体の出力ベクトルをルックアップテーブルに記憶さ
せ、学習結果をルックアップテーブルに変換できる。ま
た、本発明により得られる形式のルックアップテーブル
は、連想メモリとして実装することはできず、また近傍
抗体検索手段に相当する手段をルックアップテーブル読
出手段として必要とするが、上記発明８により得られる
形式のルックアップテーブルより一般に記憶量が少な
く、また、上記発明８の処理を行う際に同時に作成可能
である。

【００６１】本発明（発明１０）は、上記発明８または
９において、前記ルックアップテーブル作成手段は、ル
ックアップテーブル作成時に前記入力ベクトル空間のメ
ッシュの中央値を前記近傍抗体検索手段に検索キーとし
て入力した際に抽出された近傍抗体が存在しなかった場
合には、該メッシュをユーザに通知するものであること
を特徴とする。

【００６２】ユーザに通知する手段としては、入力ベク
トル空間におけるメッシュ中央値の座標をグラフィカル
・ユーザ・インタフェース上にビジュアルに表示する等
の方法が考えられる。候補抗体産生手段により新しい候
補抗体を作成する場合などは、近傍内に抗体の存在しな
いメッシュが学習後に残る。これらは内部パラメータｐ
をどう変動させても近傍に入力ベクトルが出現し得ない
メッシュであるか、あるいは学習が足りないかのいずれ
かであるが、ユーザに前者と後者を判別させるための情
報を提供することができる。

【００６３】本発明（請求項５）は、請求項１ないし２
のいずれか１項に記載の発明において、複数の前記第１
の計算シミュレータまたは順方向モデルにより、複数の
前記入力ベクトルを並行して生成するとともに、生成さ
れた前記複数の入力ベクトルの各々について行う前記評
価対象とされた個々の抗体データの評価値を求める処理
を、複数の前記第２の計算シミュレータまたは順方向モ
デルにより、並行して実行することを特徴とする。

【００６４】また、本発明（発明１４）は、上記発明１
〜１３において、前記抗体評価値決定手段を複数備え、
各々の抗体評価値決定手段における処理を並列に実行す
ることを特徴とする。

【００６５】本発明によれば、最も計算時間を要するシ
ミュレーション演算もしくは順方向モデル演算を並列処
理し、学習時間を短縮することができる。

【００６６】本発明（請求項６）は、請求項１ないし２
のいずれか１項に記載の発明において、グラフィカル・
ユーザ・インタフェースを用いて制御・調整対象である
システムの構成図を表示し、前記グラフィカル・ユーザ
・インタフェースにより入力されるセンサ構成に関する
情報および指定したセンサ構成により得られる観測値と
ルックアップテーブルへの入力ベクトルとの関係を定義
する情報を受け付け、入力された前記情報に基づいてル
ックアップテーブルを設計することを特徴とする。

【００６７】好ましくは、さらに、設計された前記ルッ
クアップテーブルの統合的なパフォーマンスを評価して
提示することを特徴とする。これによって、観測系設計
とルックアップテーブル設計を総合的に支援することが
できる。

【００６８】センサ構成に関する情報は、センサの種
類、設置箇所などであり、例えば、表示中の構成図上に
所望のセンサを示すセンサアイテムをドラッグ・アンド
・ドロップする操作により入力される。観測値とルック
アップテーブルへの入力ベクトルとの関係を定義する情
報は、例えば、あるセンサの観測値をそのまま入力ベク
トルとする指定、あるセンサの観測値を他の単位のデー
タに変換する指定、ある複数のセンサの観測値の平均を
取る指定など種々のものが考えられ、例えば、表示中の
図上に配置された所望のセンサとその処理内容とをマウ
スで選択することにより入力される。

【００６９】本発明によれば、対象システムＳの逆方向
モデルをルックアップテーブルへの入力として利用する
情報の種類に合わせて解析する必要がなく、入力ベクト
ルの種類にかかわらずほぼ同じ方式により学習できるの
で、ユーザにルックアップテーブルへの入力をその場で
選択させ即学習させることが可能となる。

【００７０】例えば、交通信号制御パラメータ決定用の
ルックアップテーブル設計に適用した場合、車両感知器
を置く道路・車線・位置や、複数車両感知器情報の平均
値を入力として使用するか否か、さらに車両速度感知器
や画像処理装置などの比較的高価な異種センサをどのよ
うに組み合わせるか、などをユーザにＧＵＩ上で自由に
選択させ、指定した入力の元で自動設計されたルックア
ップテーブルの制御調整性能を比較することで、目的に
応じた監視系の設計がサポートできる。

【００７１】また、本発明（発明１５）は、上記発明１
〜１４において、制御・調整対象であるシステムにおい
て、観測可能なセンサ情報および該センサ情報の幾つか
を統合処理することにより得られる情報の中から、ルッ
クアップテーブルへの入力として利用する情報をユーザ
が前記パラメータ入力手段のグラフィカル・ユーザ・イ
ンタフェースを利用して選択でき、さらに選択された入
力に対応したルックアップテーブルが学習により自動設
計され、同時に設計されたルックアップテーブルの総合
的なパフォーマンスをユーザに提示することで、観測系
設計とルックアップテーブル設計を総合的に支援するこ
とを特徴とする。

【００７２】本発明（請求項７）は、請求項１ないし６
のいずれか１項に記載の発明において、グラフィカル・
ユーザ・インタフェースを用いて、制御・調整対象であ
るシステムの構成図を表示し、グラフィカル・ユーザ・
インタフェースにより入力されるあいまいな確率分布の
形式で表現された前記システムの内部パラメータの情報
を受け付け、前記情報が入力された場合、あいまいな形
式で与えられた内部パラメータには与えられた確率分布
に従ってランダムに変動を加えて学習することを特徴と
する。

【００７３】これによって、あいまいさの程度に応じた
ロバスト性を持つルックアップテーブルを設計すること
ができる。

【００７４】すなわち、本発明によれば、例えば、交通
信号制御パラメータ決定用のルックアップテーブル設計
に適用した場合、交通量や平均車両速度が交通調査によ
りほぼ一定とわかっている場所については、交通シミュ
レータの内部パラメータを具体的な数値に固定し、特に
変動の大きい場所や、調査不十分なため具体的な値を特
定できない場所については、ファジィ理論におけるメン
バーシップ関数のようなあいまいな幅を持つ値として内
部パラメータを指定できる。これにより、制御調整の対
象システムＳのあいまいさや変動の程度に応じたテーブ
ル設計が容易になる。

【００７５】また、本発明（発明１６）は、上記発明１
〜１５において、制御・調整対象であるシステムにおい
て、該システムの内部パラメータをあいまいな確率分布
の形式で前記パラメータ入力手段のグラフィカル・ユー
ザ・インタフェースを利用して入力でき、あいまいな形
式で与えられた内部パラメータには確率分布に従い学習
中にランダムに変動を加えることにより、あいまいさの
程度に応じたロバストなルックアップテーブルを自動設
計することを特徴とする。

【００７６】本発明（請求項８）は、請求項１または２
に記載の発明において、グラフィカル・ユーザ・インタ
フェースを用いて制御・調整対象であるシステムの構成
図を表示し、前記グラフィカル・ユーザ・インタフェー
スにより入力されるセンサ構成に関する第１の情報、制
御・調整対象となる各機器に関する第２の情報、指定し
たセンサ構成により得られる観測値とルックアップテー
ブルの入力ベクトルとの関係を定義する第３の情報およ
びルックアップテーブルの出力ベクトルと指定した制御
・調整対象機器への出力値との関係を定義する第４の情
報を受け付け、入力された前記情報に基づいてルックア
ップテーブルを学習により設計することを特徴とする。

【００７７】センサ構成に関する情報は、センサの種
類、設置箇所、測定する情報などであり、例えば、表示
中の構成図上に所望のセンサを示すアイテムをドラッグ
・アンド・ドロップし、さらにセンサの種類と取り付け
箇所に応じて出現するプロパティ入力画面を用いて詳細
情報を指定する操作により入力される。また、制御・調
整対象となる各機器に関する情報は、制御対象とする機
器および操作対象量などであり、例えば、表示中の構成
図上の所望の機器をクリックし、さらに機器に応じたプ
ロパティ入力画面を用いて選択する操作により入力され
る。特に指定されない機器に関してはデフォルトの制御
方法を採用すればよい。

【００７８】本発明によれば、ユーザルックアップテー
ブルへの入出力をその場で選択させた後に、即学習さ
せ、さらに作成されたルックアップテーブルの性能を表
示し、ユーザがこれを参考にルックアップテーブルの入
出力やセンサ構成、制御・調整対象機器を変更するとい
う、インタラクティブなルックアップテーブルの設計が
可能となる。

【００７９】例えば、交通信号制御パラメータ決定用の
ルックアップテーブルの設計に適用した場合、車両感知
器を置く道路、位置や、感知器情報に基づき適応的にパ
ラメータを変更する信号機と固定パラメータで制御する
信号機の指定、交通量に応じて適応的に車両速度制限表
示を変更する道路の指定等、ユーザにＧＵＩ上で自由に
指定させ、指定した条件の元で自動設計されたルックア
ップテーブルの制御性能を比較することで、目的に応じ
た関し制御系の設計をサポートすることができる。

【００８０】本発明（請求項９）は、請求項８に記載の
発明において、予め用意された処理関数に相当する部品
の選択を受け付け、選択された該部品を、その種類が視
覚的に識別可能な処理関数に相当するノードとして画面
上に表示するとともに、前記システム構成図上で指定さ
れたセンサからの入力に相当するノードと、前記システ
ム構成図上で指定した各制御・調整対象機器への出力に
相当するノードと、学習対象であるルックアップテーブ
ルに相当するノードとを、画面上に表示し、グラフィカ
ル・ユーザ・インタフェースにより入力される、所望の
前記入力に相当するノードと所望の前記処理関数に相当
するノードとの間をリンクにより接続すべき指定を受け
付け、この受け付けた指定に基づいて前記第３および第
４の情報を得ることを特徴とする。

【００８１】本発明によれば、指定したセンサ構成によ
り得られる観測値とルックアップテーブルの入力ベクト
ルとの関係を定義する情報、およびルックアップテーブ
ルの出力ベクトルと指定した制御・調整対象機器への出
力値との関係を定義する情報を入力することが容易にな
る。

【００８２】本発明（請求項１０）は、請求項２に記載
の発明において、表形式の入出力が可能なグラフィカル
・ユーザ・インタフェース上において、制御・調整対象
システムの前記第１の計算シミュレーションまたは順方
向モデル演算の結果である各観測値に相当するセルと、
制御・調整対象システムの前記第２の計算シミュレーシ
ョンまたは順方向モデル演算への各出力に相当するセル
と、学習対象であるルックアップテーブルへの入力ベク
トルの各要素に相当するセルと、学習対象であるルック
アップテーブルの出力ベクトルの各要素に相当するセル
の少なくとも一部を画面上に表示し、前記グラフィカル
・ユーザ・インタフェースにより入力される、前記ルッ
クアップテーブルへの入力ベクトルの各要素に相当する
セルに前記制御・調整対象システムの各観測値に相当す
るセルの値を引数とし値を求める演算式を埋め込む指定
を受け付けるとともに、前記グラフィカル・ユーザ・イ
ンタフェースにより入力される、前記制御・調整対象シ
ステムに対する各出力に相当するセルに前記ルックアッ
プテーブルの出力ベクトルの各要素に相当するセルの値
を引数の一部とし値を求める演算式またはデフォルト出
力値を埋め込む指定を受け付け、これら受け付けた指定
により得た前記観測値と前記ルックアップテーブルの入
力ベクトルとの関係を示す演算式および前記ルックアッ
プテーブルの出力ベクトルと前記制御・調整対象機器へ
の出力値との関係を示す演算式に基づいてルックアップ
テーブルを学習により設計することを特徴とする。

【００８３】本発明によれば、センサ構成により得られ
る観測値とルックアップテーブルの入力ベクトルとの関
係を定義する情報、およびルックアップテーブルの出力
ベクトルと指定した制御・調整対象機器への出力値との
関係を定義する情報を入力・変更することが容易にな
る。

【００８４】本発明（請求項１１）は、請求項１０に記
載の発明において、表形式の入出力が可能なグラフィカ
ル・ユーザ・インタフェース上において、制御・調整対
象システムの前記第１および第２の計算シミュレーショ
ンまたは順方向モデル演算の内部パラメータに相当する
セルと、制御・調整対象システムの前記第２の計算シミ
ュレーションまたは順方向モデル演算の計算結果に相当
するいくつかのセルと、前記各抗体データの評価値に相
当するセルの少なくとも一部をも画面上に表示し、前記
グラフィカル・ユーザ・インタフェースにより入力され
る、前記各観測値に相当するセルに、前記内部パラメー
タに相当するセルの値を引数として観測値を求める前記
第１の計算シミュレーションまたは順方向モデル演算に
相当する演算式を埋め込む指定と、前記グラフィカル・
ユーザ・インタフェースにより入力される、前記内部パ
ラメータに相当するセルに、該内部パラメータを変動さ
せる範囲および制約条件式を埋め込む指定と、前記グラ
フィカル・ユーザ・インタフェースにより入力される、
前記第２の計算シミュレーションまたは順方向モデル演
算の計算結果に相当するセルに、前記内部パラメータに
相当するセルの値と前記第２の計算シミュレーションま
たは順方向モデル演算への各出力に相当するセルの値を
引数として計算結果を求める前記第２の計算シミュレー
ションまたは順方向モデル演算に相当する演算式を埋め
込む指定と、前記グラフィカル・ユーザ・インタフェー
スにより入力される、前記各抗体データの評価値に相当
するセルに前記第２の計算シミュレーションまたは順方
向モデル演算の計算結果に相当するいくつかのセルの値
を引数とし評価値を求める評価式を埋め込む指定のうち
少なくとも１つの指定を受け付け、受け付けている指定
のうちで入力されたものの内容に基づいてルックアップ
テーブルを学習により設計することを特徴とする。

【００８５】本発明によれば、計算シミュレーションも
しくは順方向モデルを作成・変更すること、評価式を入
力・変更することが容易になる。

【００８６】本発明（請求項１２）に係るコンピュータ
読取り可能な記録媒体は、グラフィカル・ユーザ・イン
タフェースを用いて制御・調整対象であるシステムの構
成図を表示させ、グラフィカル・ユーザ・インタフェー
スにより入力されるセンサ構成に関する情報および指定
したセンサ構成により得られる観測値とルックアップテ
ーブルへの入力ベクトルとの関係を定義する情報を受け
付けさせ、入力された前記情報に基づいてルックアップ
テーブルを設計させるようにコンピュータを制御するた
めのプログラムを格納したコンピュータ読取り可能な記
録媒体である。

【００８７】また、本発明に係るコンピュータ読取り可
能な記録媒体は、グラフィカル・ユーザ・インタフェー
スを用いて制御・調整対象であるシステムの構成図を表
示させ、グラフィカル・ユーザ・インタフェースにより
入力されるセンサ構成に関する情報および指定したセン
サ構成により得られる観測値とルックアップテーブルへ
の入力ベクトルとの関係を定義する情報を受け付けさ
せ、入力された前記情報に基づいてルックアップテーブ
ルを設計させ、設計された前記ルックアップテーブルの
総合的なパフォーマンスを評価して提示させるようにコ
ンピュータを制御するためのプログラムを格納したコン
ピュータ読取り可能な記録媒体である。

【００８８】本発明（請求項１３）に係るコンピュータ
読取り可能な記録媒体は、設計すべきルックアップテー
ブルの適用対象となるシステムの所定の内部パラメータ
についてロバスト性に関する学習を行わせて該ルックア
ップテーブルを設計させるためのプログラムであって、
グラフィカル・ユーザ・インタフェースを用いて、制御
・調整対象であるシステムの構成図を表示させ、グラフ
ィカル・ユーザ・インタフェースにより入力されるあい
まいな確率分布の形式で表現された前記システムの内部
パラメータの情報を受け付けさせ、前記情報が入力され
た場合、あいまいな形式で与えられた内部パラメータに
ついて与えられた確率分布に従ったランダムな変動を加
えて学習を行わせ、この学習結果に基づいてルックアッ
プテーブルの内容を決定させるようにコンピュータを制
御するためのプログラムを格納したコンピュータ読取り
可能な記録媒体である。

【００８９】上記のコンピュータ読取り可能な記録媒体
に係る各発明においては、コンピュータに実行させるル
ックアップテーブルの設計の手順あるいは機能として、
上記した各方法に係る発明や各装置に係る発明に相当す
る手順あるいは機能を用いることができる。

【００９０】なお、以上の装置に係る各発明は方法に係
る発明としても成立し、以上の方法に係る各発明は装置
に係る発明としても成立する。

【００９１】また、以上の装置や方法に係る発明は、相
当する手順あるいは手段をコンピュータに実行させるた
めのプログラムを記録した機械読取り可能な媒体として
も成立する。

【００９２】

【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。

【００９３】本実施形態に係るルックアップテーブル設
計装置は、概略的には、制御対象システムの動作を模擬
する計算シミュレーションモデルもしくは順方向モデル
上でのオフライン学習を行うことにより、自動的に制御
用ルックアップテーブルの内容設計（あるいはその支
援）を行うものであり、生体免疫系の「膨大な種類の抗
原に対抗するための多種多様な抗体を後天的に作り出す
機構」の基礎となる原理に倣って、ルックアップテーブ
ルの内容のもととなる多種多様な入力ベクトルおよび出
力ベクトルのコーディング単位（抗体）を生成する機能
（多様性の生成機能）と、多様性を維持しつつより優れ
た制御を行う能力を持つと期待されるコーディング単位
を取捨選択していく機能（多様性の維持機能）とを並行
的に実行させるとともに、学習により行われる抗体の取
捨選択においても多様性を維持するようにかつロバスト
性により優れたコーディング単位が維持されていくよう
に工夫することにより、過去のノウハウがなくても手間
をかけず適切かつロバスト性に優れたルックアップテー
ブルを設計できるようにしたものである。

【００９４】本実施形態では、遺伝的アルゴリズム（Ｇ
Ａ）において「遺伝子」に情報のコーディング単位を当
て嵌めていることに倣い、「抗体」にルックアップテー
ブルに対する入力ベクトルおよび出力ベクトルのコーデ
ィング単位を当て嵌める。すなわち、「抗体」とは、入
力ベクトルおよび出力ベクトルのコーディング単位のこ
とを意味する。「抗体」は、数値もしくは記号ベクトル
として表現される。

【００９５】また、本実施形態では、「抗体の濃度」
に、その抗体の他の抗体との優劣関係も考慮した有効性
の指標を当て嵌める。すなわち、「抗体の濃度」とは、
強化学習に基づく手法一般における強化値と同様の意義
を持つものであり、抗体の取捨選択の基準となるもので
ある。なお、強化学習とは、報酬を入力として報酬をも
たらす出力を優先すべく重みを更新することにより環境
に適応する機械学習の一種であり、明確な教師出力が与
えられなくても学習を行うことができる特徴を持つ。

【００９６】なお、後述する抗体の「評価値」は、その
抗体についてある条件下で計算シミュレーションもしく
は順方向モデル演算を実行した結果得られる、その条件
下においてその抗体により対象システムが上手く制御で
きたかどうかを示す尺度であり、抗体単独に定まる値で
ある。

【００９７】ルックアップテーブルによる制御対象とな
る対象システムとしては、交通システム・生産システム
・物流システム・化学プラント・生物プラント・エレベ
ータ群管理システム等、種々のシステムが考えられる。

【００９８】（第１の実施形態）本発明の第１の実施形
態について説明する。

【００９９】図１に、本実施形態に係るルックアップテ
ーブル設計装置の構成を示す。本ルックアップテーブル
設計装置は、ハードウェアとして実現可能であり、また
ルックアップテーブル自体も含めてプログラムおよびデ
ータとして実現可能である。

【０１００】本ルックアップテーブル設計装置は、抗体
格納部５、候補抗体産生部４、抗体評価値決定部３、パ
ラメータ入力部２、学習・設計管理部１、ルックアップ
テーブル作成部６を備えている。

【０１０１】抗体格納部５は、ルックアップテーブルの
入力ベクトル（センサの出力値またはこれを加工した
値）および出力ベクトル（対象システムに対する制御パ
ラメータまたはこれを得る元となるデータ）のコーディ
ング単位である抗体とその濃度とを対応付けて記憶する
機能と、指定された抗体の濃度を更新後の値に書き替
え、指定された抗体とその濃度のデータを削除し、およ
び生成された抗体の情報を格納する機能と、入力ベクト
ル空間のうちの所定の範囲内に含まれる抗体（近傍抗
体）を検索・抽出する機能とを有する。近傍抗体の検索
・抽出では、例えば、入力ベクトル空間をメッシュ分割
した場合に、指定された入力ベクトルの属するメッシュ
とその回りのいくつかのメッシュを、所定の範囲として
検索・抽出を行う。

【０１０２】候補抗体産生部４は、必要に応じて抗体格
納部５に追加格納すべき新たな候補抗体を生成する。例
えば、候補抗体数が規定個数以下の場合に所定個数の生
成を行う。

【０１０３】抗体評価値決定部３は、指定された抗体の
コーディング内容に基づいて、ルックアップテーブルの
適用対象となる対象システムＳをモデル化したシミュレ
ータもしくは順方向モデルによるシミュレーション演算
もしくは順方向モデル演算を実行することにより、該指
定された抗体の評価値を求める。

【０１０４】パラメータ入力部２は、ユーザ（または他
のプロセスや装置）から学習やルックアップテーブル設
計に用いるパラメータを入力する。

【０１０５】学習・設計管理部１は、入力された学習パ
ラメータに基づき学習過程を管理し、また入力されたル
ックアップテーブル設計パラメータに基づきルックアッ
プテーブル設計過程を管理する。

【０１０６】学習過程では、抗体格納部５による近傍抗
体の抽出、必要に応じて行う候補抗体産生部４による近
傍抗体の追加、抗体評価値決定部３による近傍抗体の評
価、全近傍抗体の評価値を考慮した各近傍抗体の濃度の
更新、濃度をもとにした削除する抗体の選択からなる一
連の処理を、繰り返し行う。

【０１０７】また、学習過程では、一連の処理の各サイ
クルごとに、近傍抗体を得るための基礎となるパラメー
タや上記のシミュレータもしくは順方向モデルの内部パ
ラメータを変更していく。なお、後述する実施形態で
は、この変更は抗体評価値決定部３で行い、また近傍抗
体を定めるための基礎となる入力ベクトルは、上記の内
部パラメータをもとに生成している。

【０１０８】ルックアップテーブル作成部６は、学習過
程終了後のルックアップテーブル設計過程において、そ
の時点で抗体格納部５に格納されている内容に基づいて
ルックアップテーブルの内容を決定し、ルックアップテ
ーブルに記憶させる。例えば、ルックアップテーブルの
入力ベクトル空間の各メッシュの内容として、そのメッ
シュを中心とするある範囲に含まれる全抗体（例えば近
傍抗体）のうちから濃度をもとに選択した抗体（例えば
最大濃度を持つ抗体）のコーディング内容を採用するこ
とで、ルックアップテーブルの内容を決定する。

【０１０９】本実施形態によれば、ニューラルネットワ
ークのように設計者が学習用教師データを用意しなくて
も、計算シミュレーション上での自律的な試行錯誤の反
復によりルックアップテーブルの自動設計が可能とな
る。

【０１１０】以下、いくつかのより詳しい実施形態につ
いて説明する。

【０１１１】（第２の実施形態）本発明の第２の実施形
態について説明する。本実施形態のルックアップテーブ
ル設計装置は、処理過程として、最初に行われる学習過
程と次に行われるルックアップテーブル設計過程の２つ
処理過程を持ち、この２つの処理過程を経てルックアッ
プテーブルが作成される。学習過程は１つの学習サイク
ルを単位とし、所定の終了条件が成立するまで学習サイ
クルが繰り返し行われる。１つの学習サイクルでは、ル
ックアップテーブルに対する１つの入力ベクトルが選択
され、学習サイクルの都度変更される内部パラメータの
条件下で、該入力ベクトルの近傍にある抗体について学
習（近傍抗体の検索・抽出、必要に応じて行う新たな抗
体の生成、近傍抗体の評価、近傍抗体の濃度更新、濃度
に基づく抗体の取捨選択）が行われる。

【０１１２】図２に、本実施形態のルックアップテーブ
ル設計装置の構成を示す。図３に、本実施形態の抗体学
習時の処理の流れを示す。図６に、本実施形態の学習後
のルックアップテーブル作成時の処理の流れを示す。本
ルックアップテーブル設計装置は、ハードウェアとして
実現可能であり、またルックアップテーブル自体も含め
てプログラムおよびデータとして実現可能である。

【０１１３】図２に示されるように、本ルックアップテ
ーブル設計装置は、学習・設計管理部１、パラメータ入
力部２、抗体評価値決定部３、候補抗体産生部４、抗体
格納部５、ルックアップテーブル作成部６、ルックアッ
プテーブル記憶部７を備えている。

【０１１４】抗体格納部５は、ルックアップテーブルに
対する入力ベクトルおよび出力ベクトルのコーディング
単位である抗体とその濃度とを対応付けて記憶する抗体
データベース５２、入力ベクトルを検索キーとして近傍
抗体（ある入力ベクトルに対して所定の範囲内にある入
力ベクトル抗を持つ抗体）を抗体データベース５２から
抽出する近傍抗体検索部５１、指定された抗体の濃度の
更新、および指定された抗体の削除および新たに生成さ
れた抗体とその初期濃度の格納を抗体データベース５２
に対して行うデータ変更部５３を有する。

【０１１５】候補抗体産生部４は、ある学習サイクルに
おいて、近傍抗体内の抗体数が規定個数以下の場合に、
抗体格納部５に追加格納すべき新たな候補抗体、すなわ
ち入力ベクトルのコーディング部および出力ベクトルの
コーディング部からなるデータを生成する。本実施形態
では、新たな抗体の入力ベクトル部分には、近傍抗体の
検索・抽出の基礎となった入力ベクトルを用いるので、
候補抗体産生部４は、実際には、出力ベクトルを生成
し、このを上記の入力ベクトルに結合する処理を行う。

【０１１６】パラメータ入力部２は、ユーザから学習パ
ラメータおよびルックアップテーブル設計パラメータの
入力を行う。なお、ユーザが入力するのではなく、他の
実行プロセスあるいは装置からパラメータ入力部２を介
して学習パラメータおよびルックアップテーブル設計パ
ラメータを受け取るようにしてもよい。

【０１１７】抗体評価値決定部３は、パラメータ自動変
更部３１、シミュレーション実行部３２、シミュレーシ
ョン結果評価部３３を有する。パラメータ自動変更部３
１は、学習サイクルごとに、シミュレーション実行部３
２にて用いる内部パラメータを変更していく。シミュレ
ーション実行部３２は、学習サイクルごとに、パラメー
タ自動変更部３１により与えられた内部パラメータを用
いて、入力ベクトルの元となる観測値ｒを求める第１の
シミュレーション処理を行う。また、シミュレーション
実行部３２は、学習サイクルごとに、パラメータ自動変
更部３１により与えられた内部パラメータと指定された
抗体の出力ベクトルから得られる制御パラメータとを用
いて制御対象の動作を模擬した第２のシミュレーション
処理を行う。第２のシミュレーション処理は、指定され
た各抗体それぞれについて行われる。シミュレーション
結果評価部３３は、第２のシミュレーション処理の結果
（例えば、制御対象の動作結果を示す所定のパラメー
タ）からその抗体の評価値を求める。

【０１１８】シミュレーション実行部３２が行う第１の
シミュレーション処理では、ルックアップテーブルの適
用対象となる対象システムＳをモデル化した計算シミュ
レータもしくは順方向モデルであって、対象システムＳ
に対するルックアップテーブルの出力に依存せずに、内
部パラメータから観測値をシミュレートすることを目的
としたものを用いる。

【０１１９】シミュレーション実行部３２が行う第２の
シミュレーション処理では、ルックアップテーブルの適
用対象となる対象システムＳをモデル化した計算シミュ
レータもしくは順方向モデルであって、内部パラメータ
と制御パラメータから対象システムＳについての所定の
挙動あるいは所定の特性値を求めることを目的とするも
のを用いる。例えば、交通信号の制御のためのルックア
ップテーブルを設計する場合に、計算シミュレータとし
て前述のＴＲＡＮＳＹＴを用いるような場合が考えられ
る。

【０１２０】学習・設計管理部１は、入力された学習パ
ラメータおよびルックアップテーブル設計パラメータに
基づいて学習過程およびルックアップテーブル設計過程
を管理するもので、入力変換部１１、出力変換部１２、
学習管理部１３、設計管理部１４を有する。

【０１２１】入力変換部１１は、シミュレーション実行
部３２の第１のシミュレーション処理により得られた観
測値のデータを入力ベクトルに変換する。

【０１２２】出力変換部１２は、指定された抗体の持つ
出力ベクトルをシミュレーション実行部３２の第２のシ
ミュレーション処理に適合する形式に変換する。

【０１２３】学習管理部１３は、学習過程を管理するも
ので、評価対象となった抗体のコーディング内容および
濃度、または抗体データベース５２におけるその格納位
置を示す抗体格納アドレス情報を格納する抗体バッファ
１３１、評価対象となった抗体の評価値を格納する評価
値バッファ１３２、評価対象となった全抗体の評価値を
もとに該全抗体それぞれの濃度を更新する濃度更新演算
部１３３、濃度に基づいた所定の基準に従って抗体を削
除する抗体削除部１３４を有する。

【０１２４】設計管理部１４は、ルックアップテーブル
設計過程を管理するもので、ルックアップテーブル作成
部６に対して動作開始の契機を与えるなどの制御を行
う。

【０１２５】ルックアップテーブル作成部６は、抗体格
納部５に格納された内容に基づいてルックアップテーブ
ルの内容を決定しルックアップテーブル記憶部７に記憶
させるもので、メッシュ状に分割されたルックアップテ
ーブルをメッシュ単位でスキャンする制御を行う入力ス
キャン部６１、対象メッシュに対する近傍抗体を格納す
る抗体バッファ６２、抗体バッファ６２に格納された近
傍抗体のうちから最大の濃度を持つ抗体を検出する最大
濃度抗体検出部６３、最大濃度抗体検出部６３により検
出された抗体のコーディング内容の出力ベクトルに相当
する部分または入力ベクトルと出力ベクトルの両方の部
分をルックアップテーブル７の該当部分に書き込むルッ
クアップテーブル書込部６４を有する。

【０１２６】次に、図３のフローチャートを参照しなが
ら本実施形態における学習過程すなわち抗体学習時の処
理手順について説明する。

【０１２７】（ステップＳ１１）ステップＳ１１では、
例えばＧＵＩ（ｇｒａｐｈｉｃａｌｕｓｅｒｉｎｔ
ｅｒｆａｃｅ）等を用いたパラメータ入力部２により、
ルックアップテーブルへの入力ベクトルの各次元変数の
最大値および最小値、各次元ごとのメッシュ分割数、各
次元ごとの近傍メッシュのサイズ（数）、近傍抗体の規
定個数、新たに生成された抗体に与える抗体初期濃度等
の学習パラメータおよびルックアップテーブル設計パラ
メータを指定する。

【０１２８】近傍メッシュのサイズ（数）は、あるメッ
シュからみてどの隣接範囲までを近傍とするかを示すメ
ッシュ数の規定値である。例えば、ある次元についてサ
イズ＝１の場合はその次元ではそのメッシュおよび両隣
のメッシュが近傍メッシュとなる。また、例えば、入力
ベクトルが２次元の場合に、各次元についてサイズ＝１
の場合は近傍メッシュは９つ存在する。

【０１２９】近傍抗体は、あるメッシュおよびその近傍
メッシュの範囲に含まれる抗体である。より詳しくは、
ステップＳ１３にて定められた入力ベクトルの属するメ
ッシュを中心とする近傍メッシュの範囲内に含まれる入
力ベクトルを持つ抗体である。

【０１３０】最大値、最小値、メッシュ分割数、近傍メ
ッシュのサイズは、近傍抗体検索部５１において保存さ
れ用いられる。また、最大値、最小値、メッシュ分割
数、近傍メッシュのサイズは、ルックアップテーブル設
計パラメータとしてルックアップテーブル作成部６にお
いても使用される。

【０１３１】近傍内抗体の規定個数は、ステップＳ１５
において、ステップＳ１６の新たな候補抗体を生成する
処理を起動するか否かの判断に使用される。

【０１３２】抗体初期濃度は、ステップＳ１６にて新た
な候補抗体が生成され抗体データベース５２および抗体
バッファ１３１に追加される際に記憶される初期濃度で
あり、一定の値が設定される。

【０１３３】（ステップＳ１２）ステップＳ１２では、
パラメータ自動変更部３１において、抗体評価決定部３
で用いる対象システムＳをモデル化した計算シミュレー
タもしくは順方向モデルの内部パラメータを、それらが
生じ得る（あるいは生じ得ると仮定した）範囲を夫々網
羅するように学習サイクルごとに変更する処理を行う。

【０１３４】内部パラメータには、観測値から推定可能
な対象システムＳの内部パラメータ（例えば図１７の例
における下り交通量）の他に、前述した設定された観測
値からは知ることのできない対象システムＳの内部パラ
メータｐ（ｐはベクトル）に相当するもの（例えば図１
７の例における流入交通量あるいは全交通量に占めるそ
の比率）が含まれる。本実施形態では、以下の２つの目
的を満足するため、この内部パラメータｐを、生じ得る
（あるいは生じ得ると仮定した）範囲を網羅するように
何度も変更しながら、学習を行う。（目的１）内部パラメータｐに対して一意に求まる可観
測値を変換した入力ベクトルｒ´｜ｐを間接的に変動さ
せることにより、入力ベクトル空間内でのｒ´の出現し
得るメッシュのほぼ全域について網羅的に抗体が生成さ
れ学習により改善される。（目的２）各メッシュについて、入力ベクトルｒ´｜ｐ
が含まれ得るような内部パラメータｐのいくつかのサン
プルについて抗体評価が行われるので、前述の従来手法
の問題点を解決し、ロバスト性を獲得することができ
る。

【０１３５】内部パラメータの変更方法としては、全く
ランダムに変更する方法、実際に対象システムＳで内部
パラメータが変化する確率に従い確率的に変動させる方
法、内部パラメータベクトル空間を均等分割し、中央値
を網羅的にスキャンしていく方法など、種々の方法が考
えられる。

【０１３６】なお、パラメータ入力部２から内部パラメ
ータ変更方法の選択入力を受け付け、この入力に従った
方法で内部パラメータを変更するようにして、ユーザが
内部パラメータの変更方法を指定できるようにしてもよ
い。

【０１３７】（ステップＳ１３）ステップＳ１３では、
まず、ステップＳ１２で設定された内部パラメータの条
件の下で、シミュレーション実行部３２により第１のシ
ミュレーション処理としてシミュレーション演算もしく
は順方向モデル演算を行って、内部パラメータｐから一
意に決まる可観測値ｒ｜ｐを求める。そして、求められ
た可観測値ｒ｜ｐを入力変換部１１により入力ベクトル
ｒ´｜ｐに変換する。可観測値ｒと入力ベクトルｒ´は
一対一の関係にある。

【０１３８】なお、可観測値ｒと入力ベクトルｒ´とが
同一の場合には、この変換手続きは不要である。

【０１３９】（ステップＳ１４）ステップＳ１４では、
ステップＳ１３で定められた入力ベクトルｒ´を検索キ
ーとして近傍抗体検索部５１に入力し、近傍抗体検索部
５１により、検索キーとして入力された入力ベクトルｒ
´の含まれるメッシュに対し、各次元毎に指定された近
傍内にある近傍メッシュに含まれる全ての近傍抗体のコ
ーディング内容および濃度、または抗体データベース５
２におけるその格納位置を示す抗体格納アドレス情報を
検索・抽出する。

【０１４０】例えば、図４に示すように、入力ベクトル
が２次元、メッシュ分割数が両次元とも８分割、近傍の
大きさが両次元とも１メッシュとする。図４において、
「黒丸」が抗体データベース５２内に記憶されている抗
体の入力ベクトル相当部分が入力ベクトル空間に占める
座標、「×」が検索キーとして入力された入力ベクトル
が占める座標とすると、ハッチングされた９つの近傍メ
ッシュに含まれる４つの抗体（４つの黒丸）が近傍抗体
検索部５１により近傍抗体として抽出される。

【０１４１】抽出された近傍抗体のコーディング内容お
よび濃度、または抗体格納アドレス情報は、抗体バッフ
ァ１３１に一時保存される。

【０１４２】（ステップＳ１５，Ｓ１６）ステップＳ１
５，Ｓ１６では、必要に応じて新たな候補抗体を生成す
る処理を行う。

【０１４３】すなわち、ステップＳ１４での検索・抽出
の結果、抽出された近傍抗体の数が予め指定された規定
個数を下回った場合には（ステップＳ１５）、候補抗体
産生部４により、新たな候補抗体を生成する（ステップ
Ｓ１５）。

【０１４４】新たな候補抗体の生成方法としては、例え
ば、所定の手順で出力ベクトルを作成し、そしてステッ
プＳ１３で定められた入力ベクトルとこの作成された出
力ベクトルとの双方を結合して抗体にコーディングする
ことにより生成する方法が考えられる。

【０１４５】出力ベクトルの作成方法としては、例え
ば、内部パラメータｐの設定下での最適な出力ベクトル
ｘ｜ｐを山登り法などの探索手法により求める方法が考
えられる。また、山登り法の他にも、遺伝的アルゴリズ
ムの様にランダム生成や近傍内の他の抗体を雛形にして
突然変異、交叉などの手段により出力ベクトルを作成す
る手段もあり得る。その他にも、種々の方法が考えられ
る。

【０１４６】図５に抗体生成の一例を示す。ここでは、
センサ入力ｘ１＝０．５，ｘ２＝３．０，ｘ３＝１．０
を入力ベクトルとし、出力ベクトルの雛形（１．０，
０．６）を適宜微調整したｙ１＝１．２，ｙ２＝０．５
を出力ベクトルとし、これらを結合した（０．５，３．
０，１．０，１．２，０．５）を新たな抗体としてコー
ディングしている。

【０１４７】新たに生成された候補抗体は、データ変更
部５３を通じて抗体初期濃度とともに抗体データベース
５２に追加記憶される。また、先に抽出された近傍抗体
と同様に、生成された候補抗体のコーディング内容およ
び濃度、または抗体格納アドレス情報が抗体バッファ１
３１に追加保存される（つまり、生成された候補抗体が
評価対象の近傍抗体に追加される）。

【０１４８】このように抽出された近傍抗体の数が予め
指定された規定個数を下回った場合に新たな候補抗体を
生成することにより、各メッシュの近傍に存在する抗体
の数に偏りが生じるのを防ぐことができる。近傍抗体の
数が多過ぎると濃度更新の際の抗体評価に計算時間を要
し、また少な過ぎると後述する近傍内での抗体の相対評
価ができなくなるが、本実施形態によれば近傍抗体数を
常に２以上規定個数以下の適正抗体数に保つことができ
る。

【０１４９】また、本実施形態によれば、内部パラメー
タｐを変動させた際に出現し得る入力ベクトルの近傍抗
体以外は始めから生成されないため、利用されない候補
抗体を作成・追加することを避け学習の効率化、メモリ
の節約を図ることができる。

【０１５０】（ステップＳ１７〜Ｓ１９）ステップＳ１
７〜Ｓ１９では、近傍抗体の相対評価を行う。ここで、
抗体バッファ１３１には、ステップＳ１３で定められた
入力ベクトルに関連する近傍抗体の情報、すなわちステ
ップＳ１４にて抽出された各近傍抗体に関する情報と、
ステップＳ１６にて新たに抗体が生成された場合にその
抗体に関する情報が一時保存されている。

【０１５１】まず、ステップＳ１７にて、抗体バッファ
１３１内に一時保存されている近傍抗体のうちの１つに
ついて、該抗体バッファ１３１から（抗体バッファ１３
１にコーディング内容および濃度が格納されている場
合）または抗体データベース５２から（抗体バッファ１
３１に抗体格納アドレス情報が格納されている場合）、
その抗体のコーディング内容の出力ベクトルに相当する
部分を取り出し、そして、出力変換部１２により、取り
出された該出力ベクトルに相当する部分をシミュレーシ
ョン実行部３２による第２のシミュレーション処理に適
合する形式に変換する。

【０１５２】次に、ステップＳ１８にて、シミュレーシ
ョン実行部３２において、出力変換部１２の出力データ
を制御パラメータとして入力し、これと先に定められた
内部パラメータを用いて、第２のシミュレーション処理
（第２の計算シミュレーションもしくは順方向モデル演
算）を行う。シミュレーション結果評価部３３は、この
第２のシミュレーション処理の結果として得られたデー
タに基づいて、評価対象の抗体の評価値を求める。求め
られた抗体の評価値は、評価値バッファ１３２に一時保
存される。

【０１５３】上記のステップＳ１７およびステップＳ１
８からなる処理を、抗体バッファ１３１に一時保存され
ている各近傍抗体について繰り返し行い（ステップＳ１
９）、当該学習サイクルで対象となった全近傍抗体の評
価値を求める。

【０１５４】先の第１のシミュレーション処理では、内
部パラメータｐに対応するルックアップテーブルの対象
システムＳの可観測値ベクトルｒ｜ｐを求め、これから
入力ベクトルｒ´｜ｐを求めたが、この第２のシミュレ
ーション処理では、内部パラメータｐの設定下で、入力
ベクトルｒ´｜ｐ（可観測値ベクトルｒと一対一対応）
の近傍抗体の出力ベクトル相当部分ｘをシミュレータ等
に入力した際の評価値Ｆ｜ｐ，ｘを見積もっている。本
実施形態では、このＦ｜ｐ，ｘを抗体評価基準とし、ｐ
を変動させながら学習を行うことにより、ある入力ベク
トルｒ´の近傍にあるときに、内部パラメータｐ｜ｒ´
がどのような値であっても常にＦが相対的に優れたロバ
スト性を持つような出力ｘのコーディングされた抗体の
濃度が増加する。これにより、前述した従来手法の問題
点２を、対象システムＳの逆方向モデルを作成・解析す
る手間なしに解決することが可能となる。

【０１５５】なお、出力ベクトルがそのまま第２のシミ
ュレーション処理に適合する形式である場合には、上記
の変換は不要である。

【０１５６】（ステップＳ２０）ステップＳ２０では、
濃度更新演算部１３３により近傍抗体それぞれについて
全近傍抗体の評価値を用いた所定の濃度更新演算を行
い、そして、データ変更部５３を通じて抗体データベー
ス５２に記憶されている該当する近傍抗体の濃度の更新
を行う。

【０１５７】濃度更新演算では、例えば、抗体評価値決
定部３により求められた全近傍抗体の評価値の平均値を
求め、濃度更新の対象となる抗体の評価値と該平均値の
大小関係に応じて一定量を該抗体の濃度から増減するこ
とにより、抗体の濃度更新を行う。

【０１５８】例えば、以下の式に基づき濃度更新を行う
方法がある。ここで、Ｆｊは抗体ｊの評価値である。次
の式では値が大きいほど評価が優れているものとする。
ｎは近傍内抗体の数、Ｃｊは抗体ｊの濃度、Δは濃度増
減値である。 ΣＦｋ／ｎ≦Ｆｊ → Ｃｊ＝Ｃｊ＋Δ ΣＦｋ／ｎ＞Ｆｊ → Ｃｊ＝Ｃｊ−Δ ここで、Ｆｋの総和を取る範囲は、Ｋ＝１〜ｎである。

【０１５９】あるいは、以下の式に基づき、濃度を各抗
体の勝率とみなして濃度変更を行う方法がある。ここ
で、Ｓｊは抗体が抗体データベース５２に追加されてか
ら経過したステップ数であり、抗体格納部５内に記憶さ
れるものとする。 ΣＦｋ／ｎ≦Ｆｊ → Ｃｊ＝（ＳｊＣｊ＋１）／（Ｓ
ｊ＋１） ΣＦｋ／ｎ＞Ｆｊ → Ｃｊ＝ＳｊＣｊ／（Ｓｊ＋１）ここで、Ｆｋの総和を取る範囲は、Ｋ＝１〜ｎである。

【０１６０】他の濃度更新方法としては、入力ベクトル
空間における抗体と入力のユークリッド距離に応じた重
み付け平均を利用する方法、近傍抗体内での順位に応じ
た値を濃度から増減する方法など、種々の方法が考えら
れる。

【０１６１】このような濃度更新方法によれば、メッシ
ュにより抗体評価値の相場に大幅なばらつきがある場合
でも、近傍内での相場に対し相対的に評価値が優れた抗
体の濃度が増すため、評価値の絶対基準を各メッシュ毎
に定める必要がなく、学習パラメータの設定が著しく容
易になる。例えば、前述のＴＲＡＮＳＹＴにおける評価
指標Ｐ．Ｉ．を評価値として用いた場合、メッシュの交
通量の総量平均に応じて著しく良不良の基準値が変動
し、濃度増減の基準もメッシュにより異なるが、本方式
によれば濃度増減の基準をユーザが個別に定める必要が
なくなる。

【０１６２】また、本実施形態では、上記のように抗体
が競合する範囲を入力ベクトル空間の近傍メッシュ内に
限定しているので、入力ベクトル空間上での多様性が保
たれ、各メッシュ（ルックアップテーブルの各アドレ
ス）に対応する抗体がまんべんなく得られることにな
る。つまり、計算シミュレータもしくは順方向モデルに
おける内部パラメータｐの変動により観測され得るｒ｜
ｐのいずれかに対応する抗体がまんべんなく得られる。

【０１６３】（ステップＳ２１）ステップＳ２１では、
抗体削除部１３４において、全近傍抗体から更新後の濃
度が最小しきい値を下回った抗体を抽出し、これらを抗
体データベース５２より削除するよう、データ変更部５
３に指示を出す。この指示をうけたデータ変更部５３
は、指定された抗体とその濃度の情報を抗体データベー
ス５２より削除する。これにより、抗体データベース５
内に不適合な抗体が維持されることを防ぐことができ
る。

【０１６４】抗体初期濃度や最小しきい値の設定の仕方
には、種々の形態が考えられ、一例としては、抗体初期
濃度を零に設定した場合に、最小しきい値を零に設定す
る方法が考えられる。なお、最小しきい値もパラメータ
入力部２から設定されるようにしてもよい。

【０１６５】（ステップＳ２２）ステップＳ２２では、
予め設定した学習終了条件が達成されたか否か判断し、
予め設定した学習終了条件が達成されたと判断された場
合には、その時点で学習を終了する。また、予め設定し
た学習終了条件が達成されていないと判断された場合に
は、ステップＳ１１に戻り、次の学習サイクルを行う。

【０１６６】終了判定にあたっては、反復回数、内部パ
ラメータの網羅状況、入力ベクトル空間の各メッシュに
おける抗体の最大濃度の値、などの諸条件を総合的に判
定して、学習を継続するかどうかを判定するのが好まし
い。

【０１６７】ところで、上記では近傍抗体検索部５１に
おいて使用する近傍の大きさ（すなわち近傍メッシュの
サイズ）は一定であったが、その代わりに近傍の大きさ
を学習の進行状況に応じて次第に小さくするように設定
してもよい。この場合、本ステップＳ２２において近傍
メッシュサイズの変更を行う。

【０１６８】これにより、ユーザが適切な近傍の大きさ
を決められない場合、抗体が少ない内は近傍を大きくと
ることでそれぞれのメッシュの抗体の濃度変更される機
会を増やしロバストな抗体を得ることを優先され、学習
が進み抗体が多くなるに従い近傍を小さくすることで、
入力ベクトル空間の狭い領域に特化した抗体を得ること
が優先されるようになり、学習の進行状況に応じた近傍
サイズを設定できる。

【０１６９】以上のようにして、抗体の学習が完了し、
ルックアップテーブルの作成のもととなるデータが生成
される。なお、この時点ではまだ、ルックアップテーブ
ルの入力ベクトル空間の分割はなされていない状態であ
る。

【０１７０】次に、図６のフローチャートを参照しなが
ら本実施形態におけるルックアップテーブル設計過程す
なわち学習後のルックアップテーブル作成時の処理手順
について説明する。

【０１７１】ルックアップテーブル設計過程では、学習
過程で得られた抗体をもとに、各メッシュについて、そ
の近傍メッシュのうちから当該メッシュに対する出力ベ
クトルを選択していく。この結果として、ルックアップ
テーブルの入力ベクトル空間の分割がさなれる。

【０１７２】ルックアップテーブル設計過程は、学習過
程の終了に応答して（または学習過程の終了後に外部か
ら与えられる指示に応答して）設計管理部１４が入力ス
キャン部６１に起動指示を与えることで開始される。

【０１７３】まず、ステップＳ３８において全メッシュ
のスキャンが終了したと判断されるまで、ステップＳ３
１〜Ｓ３７の一連の処理が繰り返される。この処理の１
回の繰り返しにより、ルックアップテーブルの１つのメ
ッシュの内容が決定される。

【０１７４】すなわち、まず、ステップＳ３１におい
て、入力スキャン部６１により、スキャン開始時には入
力ベクトル空間上の最初のメッシュに対象を設定し、ま
たそれ以降は次のメッシュに対象を移動する。なお、こ
のステップＳ３１では、入力ベクトル空間上の全メッシ
ュをもれなくスキャンするように、上記の一連の処理の
繰り返しごとに対象メッシュを順次移動していく。

【０１７５】次に、ステップＳ３２において、対象とさ
れたメッシュの中央値を検索キーとして近傍抗体検索部
５１に入力し、近傍抗体を抽出する。抽出された近傍抗
体のコーディング内容および濃度、または抗体格納アド
レス情報は、抗体バッファ６２に一時保存される。

【０１７６】なお、ここで用いる各次元ごとの近傍メッ
シュのサイズは、学習過程と同じ値を用いてもよいし、
ステップＳ１１にてルックアップテーブル設計過程用と
して入力された近傍メッシュのサイズの値を用いてもよ
い。

【０１７７】例えば、入力ベクトルが２次元、近傍の大
きさが両次元とも１メッシュとし、抗体データベース５
２中の内容のうち入力ベクトル空間の一部を切り出した
部分（隣接する１２個のメッシュ）が図７に示すような
状態になっていたものとす。ここで、図７中括弧内の数
字がその抗体の濃度を示すものとする。この場合、ｍ１
のメッシュが対象である場合には、ｍ１を中心とする９
つのメッシュに含まれる抗体１〜抗体１０が検索され、
ｍ２のメッシュが対象である場合には、ｍ２を中心とす
る９つのメッシュに含まれる抗体５〜抗体１４が検索さ
れる。

【０１７８】次に、ステップＳ３３において、近傍抗体
が抽出されたか否かを判断する。

【０１７９】近傍抗体が１つも抽出されなかったならば
ステップＳ３４において、後にユーザへの通知処理を行
うために該当するメッシュ位置を保存し、ステップＳ３
１に戻る。

【０１８０】一方、近傍抗体が抽出されたならば、次の
ステップＳ３５に移る。

【０１８１】ステップＳ３５では、抗体検出部６３によ
り、ステップＳ３２で抽出され抗体バッファ６２に一時
保存されている近傍抗体の中で最大の濃度を持つ抗体を
検出する。

【０１８２】例えば、上記の図７の例では、ｍ１のメッ
シュが対象である場合には、抗体１〜抗体１０のうちか
ら最も高い濃度（３０）を持つ抗体３が検出され、ｍ２
のメッシュが対象である場合には、抗体５〜抗体１４の
うちから最も高い濃度（２９）を持つ抗体９が検出され
る。

【０１８３】次に、ステップＳ３６およびステップＳ３
７において、後述する第２の形式のルックアップテーブ
ルの書き込みおよび後述する第１の形式のルックアップ
テーブルの書き込みを、ルックアップテーブル書込部６
４により行う。もちろん、ステップＳ３６とステップＳ
３７の一方のみを実行して、いずれか一方の形式のルッ
クアップテーブルのみを作成するようにしてもよい。ま
た、ユーザにどの形式のルックアップテーブルを作成す
るかを選択させ、ユーザにより指定された１つまたは複
数の形式のルックアップテーブルを作成するようにして
もよい。

【０１８４】第１の形式のルックアップテーブルの書き
込みを行う場合、入力ベクトル空間のメッシュの中央値
を近傍抗体検索部５１に検索キーとして入力して抽出さ
れた近傍抗体の中で最大の濃度を持つ抗体のコーディン
グ内容のうちの出力ベクトルに相当する部分を、ルック
アップテーブルの当該メッシュに相当するアドレスに書
き込む。なお、この書き込みを、全メッシュについて順
次行うことにより、抗体格納部５に格納されている抗体
をルックアップテーブルに変換することができる。

【０１８５】これにより、各メッシュ毎に最も優れた抗
体の出力ベクトルをルックアップテーブルに記憶させ、
学習結果をルックアップテーブルに変換できる。また、
得られた第１の形式のルックアップテーブルは、連想メ
モリとして実装できる。

【０１８６】第２の形式のルックアップテーブルの書き
込みを行う場合、入力ベクトル空間のメッシュの中央値
を近傍抗体検索部５１に検索キーとして入力して抽出さ
れた近傍抗体の中で最大の濃度を持つ抗体のコーディン
グ内容を、ルックアップテーブルに書き込む。この書き
込みを、全メッシュについて順次行うことにうより、抗
体格納部５に格納されている抗体をルックアップテーブ
ルに変換することができる。

【０１８７】得られた第２の形式のルックアップテーブ
ルは、連想メモリとして実装することはできず、また近
傍抗体検索部５１と同じ機能を持つルックアップテーブ
ル読出手段を必要とするが、第１の形式のルックアップ
テーブルより一般に記憶量が少なく、また第１の形式の
ルックアップテーブルを作成する際に同時に作成可能で
ある。

【０１８８】図８に、交通信号パラメータ決定用ルック
アップテーブル（第２の形式のルックアップテーブル）
の一例を示す。

【０１８９】このように、本実施形態に係るルックアッ
プテーブル設計装置では、学習の結果獲得された多様な
優れたコーディング単位をもとにルックアップテーブル
の内容を決定する過程を持ち、これによってルックアッ
プテーブルの領域分割のノウハウがなくても済む。

【０１９０】上記のようにしてルックアップテーブルの
設計が終了すると、ステップＳ３９にて、入力ベクトル
空間の対象メッシュの中央値を近傍抗体検索部５１に検
索キーとして入力した際に抽出された近傍抗体が存在し
なかったメッシュの位置を示す情報をユーザに通知す
る。

【０１９１】この通知の手段としては、入力ベクトル空
間におけるメッシュ中央値の座標をＧＵＩ上にビジュア
ルに表示する等の方法が考えられる。

【０１９２】なお、ユーザに抗体の存在するメッシュの
側を通知する方法もあり得る。

【０１９３】前述した手順で候補抗体産生部４により新
しい候補抗体を作成していくと、近傍内に抗体の存在し
ないメッシュが学習後に残る。これらは内部パラメータ
ｐをどう変動させても近傍に入力ベクトルが出現し得な
いメッシュであるか、あるいは学習が足りないかのいず
れかであるが、ユーザに前者と後者を判別させるための
情報を提供することができる。

【０１９４】次に、本実施形態における抗体学習時の処
理手順の他の例について説明する。

【０１９５】図９に、本実施形態の抗体学習時の他の処
理の流れを示す。

【０１９６】本手順は、基本的には図３の手順と同様で
あるが、ステップＳ１１５およびＳ１１６の処理とＳ１
２１の処理が図３の手順と相違する部分である。以下で
は、相違する部分のみについて説明する。

【０１９７】図３のステップＳ１５，Ｓ１６の処理で
は、抽出された近傍抗体の数が予め指定された規定個数
を下回った場合に新たな候補抗体を生成したが、このス
テップＳ１１５およびＳ１１６の処理では、抽出された
抗体の数が予め指定された規定個数を下回った場合に、
新たな抗体を規定個数に達するまで繰り返し生成する。

【０１９８】このようにすれば、図３のステップＳ１
５，Ｓ１６の処理よりもさらに各メッシュの近傍に存在
する抗体の数が平均化される。

【０１９９】また、図３のステップＳ２１の処理では、
更新後の濃度が最小しきい値を下回った抗体を抗体デー
タベースより削除したが、このＳ１２１の処理では、抽
出された近傍抗体の中で濃度が最小の抗体を抗体データ
ベースより削除する。

【０２００】。

【０２０１】なお、以上説明してきた本実施形態の構成
（図２）は適宜修正して実施することが可能である。例
えば、抗体評価検索部３内のパラメータ自動変更部３１
とシミュレーション結果評価部３３は、学習・設計管理
部１の内部構成とすることもできる。また、例えば、学
習・設計管理部１１内の入力変換部１１、出力変換部１
２および抗体バッファ１４を抗体評価検索部３の内部構
成とし、評価値バッファ１３２、濃度更新演算部１３３
および抗体削除部１３４を抗体評価値決定部３または抗
体格納部５の内部構成とすることもできる。特に、本実
施形態をプログラムおよびデータで実現する際に、必ず
しも図２のような形態に忠実にモジュールを階層構造化
してプログラミングしなくてもよく、図２と等価な機能
を実現する種々の構造を持つプログラムを組む自由度が
存在する。

【０２０２】以上のように本実施形態によれば、学習過
程において、必要に応じて候補抗体産部４によりルック
アップテーブルの内容のもととなる多種多様な入力ベク
トルおよび出力ベクトルのコーディング単位（抗体）を
生成し抗体データベース５２に記憶するとともに、入力
ベクトル空間について局所的にすなわちある入力ベクト
ルを基準とする近傍内においてまず抗体評価値決定部３
により各近傍抗体を独立に評価し次に濃度更新演算部１
３４により近傍抗体間の相対的な優良度を基準にして各
近傍抗体の濃度を更新しデータ変更部５３により更新す
るとともに不要な抗体を抗体削除部１３４の指示のもと
データ変更部５３により削除するので、多様性を維持し
つつより優れた制御を行う能力を持つと期待される抗体
の濃度を増加させていき、そして、学習過程終了後のル
ックアップテーブル設計過程において、抗体データベー
ス５２に記憶されている抗体の濃度に基づいて、ルック
アップテーブルの内容を、メッシュ毎に近傍メッシュ内
で最大の濃度を持つ抗体を抽出することにより決定する
ので、過去のノウハウがなくても手間をかけず適切かつ
ロバスト性に優れたルックアップテーブルを自動設計す
ることができる。

【０２０３】（第３の実施形態）次に、本発明の第３の
実施形態について説明する。

【０２０４】図１０に、本実施形態に係るルックアップ
テーブル設計装置の構成を示す。

【０２０５】本実施形態は、基本的には第２の実施形態
と同様であるが、ｎ（ｎは２以上）個の抗体評価値決定
部３₁〜３_nを備えている点が相違する。

【０２０６】以下、本実施形態が第２の実施形態と相違
する点のみについて説明する。

【０２０７】本実施形態の抗体評価値決定部３₁〜３_n
は、それぞれ、パラメータ自動変更部３１、第１のシミ
ュレーション実行部３２１、ｍ（ｍは２以上）個の第２
のシミュレーション実行部３２２₁〜３２２_m、ｍ個の
シミュレーション結果評価部３３₁〜３３_mを有する。
抗体評価値決定部３₁〜３_nの内部構成は、全て同様で
あるものとする。

【０２０８】本実施形態の抗体評価値決定部３₁〜３_n
の基本機能は、第２の実施形態の抗体評価値決定部と同
様である。また、本実施形態のパラメータ自動変更部３
１、第１のシミュレーション実行部３２１、第２のシミ
ュレーション実行部３２２₁〜３２２_m、シミュレーシ
ョン結果評価部３３₁〜３３_mは、基本的には、第１の
実施形態のパラメータ自動変更部３１、シミュレーショ
ン実行部３２のうちの第１のシミュレーション処理の機
能、シミュレーション実行部３２のうちの第２のシミュ
レーション処理の機能、シミュレーション結果評価部３
３と同様である。

【０２０９】なお、本実施形態をプログラムで実現する
場合、必ずしも予め抗体評価値決定部３₁〜３_nに相当
するｎ個の部分を実態として予め用意しておく必要はな
く、必要に応じてプロセスとして生成するようにしても
よい。この点は、各抗体評価値決定部３₁〜３_n内にお
けるｍの第２のシミュレーション実行部３２２₁〜３２
２_mやｍ個のシミュレーション結果評価部３３₁〜３３
_mについても同様である。

【０２１０】本実施形態の抗体評価値決定部３₁〜３_n
では、ｍ個の近傍抗体の評価をｍ組みの第２のシミュレ
ーション実行部３２２₁〜３２２_mおよびシミュレーシ
ョン結果評価部３３₁〜３３_mにより並列処理できるよ
うにしている。これにより、図３の手順の内側の処理ル
ープ（ステップＳ１７〜Ｓ１９）を高速化することがで
きる。

【０２１１】また、各抗体評価値決定部３₁〜３_nのパ
ラメータ自動変更部３１では相互に連携をとって、互い
に相違する内部パラメータを分担することにより、図３
の手順の外側の処理ループ（ステップＳ１２〜Ｓ２２）
をｎループ分同時実行できるようにしている。

【０２１２】すなわち、本実施形態は、図３の手順にお
ける２重ループのそれぞれを高速化するように構成した
ものである。

【０２１３】また、本実施形態では、ｎ個の抗体評価値
決定部３₁〜３_nが並列動作するので、抗体評価値決定
部３₁〜３_nからの出力も並列的になされる。したがっ
て、各抗体評価値決定部３₁〜３_nに対してデータ変更
部５３を操作する権利を排他的に与える制御や、抗体デ
ータベース５２の内容の一貫性を保つ制御等を行うのが
望ましい。また、例えばある抗体評価値決定部の結果に
応じて濃度を更新しようとした抗体が、他の抗体評価値
決定部の結果に従って既に削除されていた場合に、その
抗体の濃度更新指示を取り消すような制御を行ってもよ
い。

【０２１４】これにより、最も計算時間を要するシミュ
レーション演算もしくは順方向モデル演算を並列処理
し、学習時間を短縮することができる。

【０２１５】なお、第１の計算シミュレーションと第２
の計算シミュレーションを、同一種類のソフトウェアも
しくはハードウェアモジュールで実行することもあり得
る。この場合は、図１０の第２のシミュレーション実行
部３２２₁〜３２２_mのうちの１つを、第１の計算シミ
ュレーション演算を行う際に利用する。

【０２１６】（第４の実施形態）次に、第４の実施形態
について説明する。

【０２１７】本実施形態は、第２、第３の実施形態と同
様の構成を基本構成として有するので、以下では、相違
する部分についてのみ説明する。

【０２１８】第２、第３の実施形態では、第１のシミュ
レーション処理の前提となるセンサ仕様（センサ数、セ
ンサ種類、センサの配置形態等）および入力変換部１１
において第１のシミュレーション処理の結果得られる観
測値を入力ベクトルに変換するための変換式あるいは変
換規則は、予め固定されて設定されたものであった。

【０２１９】本実施形態では、ユーザがパラメータ入力
部２のＧＵＩを通じて、上記のセンサ仕様と変換式ある
いは変換規則とを入力可能とし、あるいは観測可能なセ
ンサ情報および該センサ情報のいくつかを統合処理する
ことにより得られる情報の中から、ルックアップテーブ
ルへの入力として利用する情報を選択入力できるように
し、本実施形態に係るルックアップテーブル設計装置
が、ユーザの入力に基づいたルックアップテーブルを作
成するようにしたものである。

【０２２０】本実施形態では、第２や第３の実施形態に
おける第１のシミュレーション処理の計算シミュレーシ
ョタもしくは順方向モデルに対して、ステップＳ１１で
設定された内部パラメータの下でユーザから指定された
各センサにおいて観測される観測値を出力する機能を付
加するとともに、入力変換部１１にはユーザから指示さ
れた変換式あるいは変換規則を用いる機能を付加する。

【０２２１】また、この変換式あるいは変換規則に依存
して、入力ベクトルの次元数が相違してくるので、ステ
ップＳ１１において、ルックアップテーブルへの入力ベ
クトルの各次元変数の最大値および最小値、各次元ごと
のメッシュ分割数、各次元ごとの近傍メッシュのサイズ
（数）については、必要な情報が揃うように入力する。
また、図２や図１０の各機能ブロック部分は、入力ベク
トルの次元数の変化に対応できる構成とする。

【０２２２】なお、第２や第３の実施形態における第２
のシミュレーション処理は、センサ仕様には依存しない
ので（第１のシミュレーション処理で得られた観測値や
入力ベクトルではなく第１のシミュレーション処理のも
ととなった内部パラメータを用いるので）、修正は不要
となる。

【０２２３】また、ユーザが内部パラメータをあいまい
な確率分布の形式でパラメータ入力部２のＧＵＩを利用
して入力できるようにし、あいまいな形式で与えられた
内部パラメータには確率分布に従い学習中にランダムに
変動を加えることにより、内部パラメータのあいまいさ
の程度に応じたロバストなルックアップテーブルを自動
設計するようにしてもよい。

【０２２４】図１１に、本実施形態を交通信号制御パラ
メータ決定用のルックアップテーブル設計に適用した場
合のＧＵＩ画面のイメージ図を示す。

【０２２５】ここでは、第１の画面（図中２００）に
て、制御対象となる信号機（図中２０４）に加え、車両
感知器（図中２０１）を置く道路・車線・位置（図中２
０２）や、必要に応じて画像処理装置などの比較的高価
な異種センサを置く箇所などをユーザはＧＵＩ上でメニ
ューとして用意したセンサアイテム（図中２０３）をド
ラッグ・アンド・ドロップなどすることにより自由に選
択・配置できる。また、複数車両感知器情報の平均値を
入力として使用するか否か、車両速度感知器と指定した
異種センサをどのように組み合わせるか、などをユーザ
はＧＵＩ上で、例えば、表示中の系統図上に配置された
所望のセンサとその処理内容（図示せず）とをマウスで
選択などすることにより入力することができる。さら
に、必要に応じて、第２の画面（図中３００）にて、交
通量や平均車両速度の変動の大きいリンクや、調査不十
分なため具体的な値を特定できないリンクについて、フ
ァジィ理論におけるメンバーシップ関数のようなあいま
いな幅を持つ値としてシミュレーションパラメータを入
力できる。

【０２２６】しかるのちに本実施形態のルックアップテ
ーブル設計装置は、指定された条件に応じたルックアッ
プテーブルを自動生成する。

【０２２７】また、好ましくは、本実施形態のルックア
ップテーブル設計装置に、自動生成したこのルックアッ
プテーブルのパフォーマンスを評価して表示する機能を
付加すると効果的である。

【０２２８】パフォーマンスの評価方法としては、学習
過程で得られた濃度を参照して行う方法、作成されたル
ックアップテーブルを用いて、計算シミュレーショタも
しくは順方向モデルを種々の条件で動作させてみて、総
合的にルックアップテーブルを評価する方法、ルックア
ップテーブルが完成できなかったことをもって評価とす
る方法など、種々の方法が考えられる。

【０２２９】このようにすることにより、ユーザは、提
示されたテーブルとしてのパフォーマンスを参考にし
て、センサ位置の変更を行ったり、より詳細な交通量調
査を行う旨指定するなどの改善策を講じることができ
る。

【０２３０】また、指定した入力の元で自動設計された
ルックアップテーブルの制御調整性能を比較すること
で、目的に応じた監視系の設計がサポートできる。

【０２３１】また、例えば、交通量や平均車両速度が交
通調査によりほぼ一定とわかっている場所については、
交通シミュレータの内部パラメータを具体的な数値に固
定し、特に変動の大きい場所や、調査不十分なため具体
的な値を特定できない場所については、ファジィ理論に
おけるメンバーシップ関数のようなあいまいな幅を持つ
値として内部パラメータを指定することにより、制御調
整の対象システムＳのあいまいさや変動の程度に応じた
テーブル設計が容易になる。

【０２３２】このように本実施形態によれば、対象シス
テムＳの逆方向モデルをルックアップテーブルへの入力
として利用する情報の種類に合わせて解析する必要がな
く、入力ベクトルの種類にかかわらずほぼ同じ方式によ
り学習できるので、ユーザにルックアップテーブルへの
入力をその場で選択させ即学習させることが可能とな
る。

【０２３３】次に、本発明を適用したルックアップテー
ブル設計装置のプロトタイプシステムをプログラムとし
て作成し、簡単なシミュレーション実験を行った結果に
ついて、従来技術による結果との比較を交えながら説明
する。

【０２３４】ここでは、図１７の１５個の交差点、３１
個のリンクからなる道路モデルを用いてシミュレーショ
ン実験を行った。この道路モデルは、中央の交差点８に
おいて上り交通流に対し脇から流入する交通流を持つ。
信号コントローラは、交差点１に備えられた車両感知器
によって上り下り各交通流量を測定し、本系統内におけ
る他の１４個の交差点におけるオフセットをパラメータ
決定テーブルを用いて決定し、全交差点に指示する。こ
こでは、「サイクル」、「スプリット」は固定した。ま
た、それぞれの観測値は２０％以内の観測誤差がランダ
ムに与えられるものとした。

【０２３５】プロトタイプシステムは、観測交通流量を
条件部（入力ベクトル）、設定すべきオフセットを結論
部（出力ベクトル）としてコーディングされた抗体を学
習により獲得する。抗体評価関数としては、前述のＰ．
Ｉ．をα＝２５として用いた。また、実用面を重視し学
習を高速化するため、新抗体の生成時にＴＲＡＮＳＹＴ
自体の持つ最適化機能を利用した。ＴＲＡＮＳＹＴの役
割は、第２の計算シミュレーション処理に相当する交通
流シミュレーションを行うことで抗体の評価値を決定す
ること、および山登り法によりある特定の内部パラメー
タ（図１７における３つの交通量）の設定下での最適な
「オフセット」を求めることである。この最適オフセッ
トから候補抗体産生部４により候補抗体を生成する。

【０２３６】図１２に２つの実験結果を示す。それぞれ
の学習を行った後、１００ケースのランダムに発生させ
た異なる交通流量を設定し、プロトタイプシステムによ
り設定したパラメータ決定用ルックアップテーブルを用
いた場合のＰ．Ｉ．の平均値、従来手法により設計した
ルックアップテーブルを用いた場合のＰ．Ｉ．の平均
値、および前者がＰ．Ｉ．において勝っていたケースの
全ケースに対する割合を求めたものである。ここで用い
た従来方式とは、図１６に示したように入力ベクトル空
間を７分割し、それぞれの分割における代表的な交通流
量を設定した最適化によりオフセット設計を行うもので
ある。

【０２３７】第１の例においては、上り下りそれぞれの
交通流量が基準値から９０％の範囲でランダムに増減
し、流入交通流量は零と考えられる場合を想定して学習
させた。また、第２の例においては、流入交通流量も基
準値から９０％の範囲でランダムに増減する場合を想定
し学習させた。

【０２３８】図１２に示されるように、いずれの例にお
いても、本発明に係るルックアップテーブル設計装置を
用いて設計したルックアップテーブルによる制御の方が
ロバスト性において勝っていることがわかる。特に、第
２の例においては、２点の観測値のみでは脇からの流入
交通量が上り交通量観測値内において占める割合を推定
するのが不可能なため、従来手法に対しより優れたパフ
ォーマンスを示している。

【０２３９】（第５の実施形態）本実施形態は、これま
で説明した各実施形態（特に第２または第３の実施形
態）と同様の構成を基本構成として有するので、以下で
は、相違する部分について説明する。

【０２４０】本実施形態も、第４の実施形態と同様にＧ
ＵＩに係るもので、ユーザがパラメータ入力部２のＧＵ
Ｉを通して、センサ種類とセンサ情報の変換式、制御・
調整対象となる各機器の指定等を容易に行えるようにし
たものである。

【０２４１】図１３、図１４に、本実施形態を交通信号
制御パラメータ決定用のルックアップテーブル設計に適
用した場合のＧＵＩ画面のイメージ図を示す。

【０２４２】図１３のウィンドウ３０１は、道路３０３
や信号機３０４などからなるシステム構成図上でルック
アップテーブルによる制御対象となる信号機（図中３０
４のアイコン）をユーザが画面上でクリックするなどす
ることにより選択指定し（ここでは選択されたものを網
かけで示す）、さらに制御するパラメータなどのプロパ
ティ指定をサブ画面（図示せず）より行うためのウィン
ドウである。残りの信号機に関してもデフォルトパラメ
ータ使用などのプロパティ指定をサブ画面（図示せず）
より行う。

【０２４３】また、メイン画面３０１において、ＧＵＩ
上でメニュー（図中３０２）として用意した、車両感知
器（図中３０５のアイコン）や行列長測定器（図中３０
６のアイコン）等の所望のセンサを示すアイテムを、表
示中の構成図上の所望の箇所にドラッグ・アンド・ドロ
ップなどすることにより自由に選択・配置し、さらにセ
ンサの種類と取り付け箇所に応じて出現するプロパティ
入力画面（図示せず）を用いて、測定する情報などの詳
細情報を指定する操作により入力される。

【０２４４】図１３に例示した内容においては、ユーザ
が信号機２〜４を選択指定し、また車両感知器Ａ１〜Ａ
８と行列長測定器Ｂ１をドラッグ・アンド・ドロップし
た様子を示している。選択指定された信号機２〜４は、
センサ出力に基づいて適応的にパラメータを変更する信
号機として扱われ、その他の信号機は固定パラメータで
制御する信号機として扱われる。

【０２４５】図１４のウィンドウ３１１は、ユーザが設
定したセンサ構成により得られる観測値とルックアップ
テーブルの入力ベクトルとの関係、およびルックアップ
テーブルの出力ベクトルとユーザが選択指定した信号機
への出力値との関係をＧＵＩ上で定義するためのウィン
ドウで、予め用意された平均値演算（図中３１３）や最
大値選択演算（図中３１４）等の処理関数に相当する部
品がソールボックス上に表示され、ユーザが指定したセ
ンサからの入力に相当するノード（図中３１２）と、同
じくユーザが指定した各信号機への出力に相当するノー
ド（図中３１６）と、学習対象であるルックアップテー
ブルに相当するノード（図中３１５）が、画面上に表示
され、ユーザが各入力のノードおよび追加した関数ノー
ドの間をリンクにより接続できることを示している。

【０２４６】図１４に例示した内容においては、図１３
で設定されたセンサＡ１〜Ａ８からの入力にに相当する
ノードおよび選択された信号機２〜４への出力に相当す
るノードと、ルックアップテーブルに相当するノード
と、ユーザがソールボックスから追加した２つの平均値
演算のノードと１つの最大値選択演算のノードが表示さ
れており、ユーザのリンク接続操作により、車両感知器
Ａ１の観測値と車両感知器Ａ２の観測値の平均値、車両
感知器Ａ３の観測値と車両感知器Ａ５の観測値の平均
値、車両感知器Ａ４の観測値と車両感知器Ａ６の観測値
と車両感知器Ａ７の観測値の最大値、行列長測定器信号
機１の観測値がルックアップテーブルの入力ベクトルと
なることが入力されたことを示している。

【０２４７】ＧＵＩによる入力が終了すると、本実施形
態のルックアップテーブル設計装置は、指定された条件
に応じたルックアップテーブルを自動生成する。

【０２４８】なお、本実施形態では、第１のシミュレー
ション処理に対してステップＳ１１で設定された内部パ
ラメータのもとでユーザから指定された各センサにおい
て観測される観測値を新たに演算し、演算不可能な場合
はユーザに知らせる機能を付加するとともに、入力変換
部１１および出力変換部１２にはユーザから指定された
変換式あるいは変換規則を用いる機能を付加する。

【０２４９】また、ルックアップテーブル入力ベクトル
および出力ベクトルの次元数がユーザにより変更される
ので、入力ベクトルの新たに発生した次元変数の最大最
小、メッシュ分割数、近傍メッシュのサイズ（数）、お
よび出力ベクトルの新たに発生した次元変数の最大最小
については、必要な情報をユーザが入力するか、あるい
は自動的にデフォルト値が設定される。図２や図１０の
各機能ブロック部分は、次元数の変化に対応できる構成
とする。

【０２５０】なお、前述したように、好ましくは、本実
施形態のルックアップテーブル設計装置に、自動生成し
たこのルックアップテーブルのパフォーマンスを評価し
て表示する機能を付加すると効果的である。

【０２５１】このように本実施形態によれば、センサ情
報に基づき適応的にパラメータを変更する信号機と固定
パラメータで制御する信号機の指定、交通量に応じて適
応的に車両速度制限表示を変更する道路の指定等、ユー
ザにＧＵＩ上で自由に指定させ、指定した条件の元で自
動設計されたルックアップテーブルの制御性能を比較す
ることで、目的に応じた関し制御系の設計がサポートで
きる。

【０２５２】また、指定したセンサ構成により得られる
観測値とルックアップテーブルの入力ベクトルとの関係
を定義する情報、およびルックアップテーブルの出力ベ
クトルと指定した制御・調整対象機器への出力値との関
係を定義する情報を入力することが容易になる。

【０２５３】さらに、ユーザルックアップテーブルへの
入出力をその場で選択させた後に、即学習させ、さらに
作成されたルックアップテーブルの性能を表示し、ユー
ザがこれを参考にルックアップテーブルの入出力やセン
サ構成、制御・調整対象機器を変更するという、インタ
ラクティブなルックアップテーブルの設計が可能とな
る。

【０２５４】（第６の実施形態）本実施形態は、これま
でに説明した各実施形態（特に第２、第３、第５の実施
形態）と同様の構成を基本構成として有するので、以下
では、相違する部分について説明する。

【０２５５】本実施形態は、第４、第５の実施形態と同
様にＧＵＩに係るもので、ユーザがパラメータ入力部２
のＧＵＩを通して、センサ種類とセンサ情報の変換式、
制御・調整対象となる各機器の指定等を容易に行えるよ
うにしたものである。

【０２５６】図１５に、本実施形態を交通信号制御パラ
メータ決定用のルックアップテーブル設計に適用した場
合のＧＵＩ画面のイメージ図を示す。

【０２５７】なお、本実施形態では、第５の実施形態に
おける図１３で例示したウィンドウを用いて説明したよ
うなＧＵＩを持ち、このようなウィンドウに表示された
システム構成図中に、車両感知器等のセンサや制御・調
整操作可能な信号機のＩＤ番号が表示されており、さら
に第５の実施形態と同様に、新たなセンサや信号を登録
できるものとする。

【０２５８】図１５に例示したウィンドウは、表計算ソ
フトと同様の表形式の入出力が可能なＧＵＩとなってお
り、システムの前記第１および第２のシミュレーション
もしくは順方向モデルの内部パラメータ（独立して指定
できる交通量など）に相当するセルと、演算された車両
感知器等の各センサの観測値に相当するセルと、学習対
象であるルックアップテーブルへの入力ベクトルの各要
素に相当するセルと、学習対象であるルックアップテー
ブルの出力ベクトルの各要素に相当するセルと、信号機
への各出力パラメータに相当するセルと、第２のシミュ
レーションもしくは順方向モデルの計算結果（各交差点
における車両の停止回数総和および遅れ時間総和など）
に相当するセルと、抗体評価値に相当するセルの、全て
かいずれか一部が用意されている。

【０２５９】このようなＧＵＩ環境において、ユーザは
各セルに演算式等を埋め込むことにより、例えばセンサ
種類とセンサ情報の変化式、制御・調整対象となる信号
機の指定、抗体評価式における重み係数の変更等、種々
の条件の設定や変更を容易に行うことができる。以下、
このようなＧＵＩにて設定・変更可能な情報の例をいく
つか示す。

【０２６０】１つの入力操作としては、ルックアップテ
ーブルへの入力ベクトルの各要素に相当するセルに各観
測値に相当するセルの値を引数とし値を求める演算式を
埋め込むとともに、信号機への各出力パラメータに相当
するセルにルックアップテーブルの出力ベクトルの各要
素に相当するセルの値を引数の一部とし値を求める演算
式、もしくはデフォルト出力値を埋め込む操作が可能
で、図１４のように観測値とルックアップテーブルの入
力ベクトルとの関係を定義する情報、およびルックアッ
プテーブルの出力ベクトルと制御・調整対象機器への出
力値との関係を定義する情報を入力することができる。

【０２６１】もう１つの操作は、各観測値に相当するセ
ルに、内部パラメータに相当するセルの値を引数として
観測値を求める第１の計算シミュレーションもしくは順
方向モデルに相当する演算式を埋め込むものである。

【０２６２】もう１つの操作は、各内部パラメータを変
動させる範囲および制約条件式を内部パラメータに相当
するセルに埋め込むものである。

【０２６３】もう１つの操作は、第２の計算シミュレー
ションもしくは順方向モデルの計算結果に相当するセル
に、内部パラメータに相当するセルの値と信号機への各
出力パラメータに相当するセルの値を引数として計算結
果を求める前記第２の計算シミュレーションもしくは順
方向モデルに相当する演算式を埋め込むものである。

【０２６４】もう１つの操作は、抗体データの評価値に
相当するセルに第２の計算シミュレーションもしくは順
方向モデルの計算結果に相当するいくつかのセルの値を
引数とし評価値を求める評価式を埋め込むものである。

【０２６５】なお、図１５では、上記した７種類のセル
すべてを用いたものを例示したが、その一部のセルをサ
ポートする、すなわち上記の５つの操作のうちの一部を
サポートするＧＵＩを用いても構わない。

【０２６６】ＧＵＩによる入力が終了すると、本実施形
態のルックアップテーブル設計装置は、指定された条件
に応じたルックアップテーブルを自動生成する。

【０２６７】なお、前述したように、好ましくは、本実
施形態のルックアップテーブル設計装置に、自動生成し
たこのルックアップテーブルのパフォーマンスを評価し
て表示する機能を付加すると効果的である。

【０２６８】本実施形態によれば、センサ構成により得
られる観測値とルックアップテーブルの入力ベクトルと
の関係を定義する情報、およびルックアップテーブルの
出力ベクトルと指定した制御・調整対象機器への出力値
との関係を定義する情報を入力・変更することが容易に
なる。

【０２６９】また、本実施形態によれば、計算シミュレ
ーションもしくは順方向モデル演算を作成・変更するこ
と、評価式を入力・変更することが容易になる。

【０２７０】なお、図１５におけるＧＵＩは、例えばＭ
ｉｃｒｏｓｏｆｔ社のＭｉｃｒｏｓｏｆｔＥｘｃｅｌ
等の市販の表計算ソフト上のアドインシステムとして実
現することもできる。

【０２７１】以上の各実施形態にて説明した各機能は、
ハードウェアとしてもソフトウェアとしても実現可能で
ある。また、ソフトウェアとしても実現する場合、上記
した各手順あるいは手段をコンピュータに実行させるた
めのプログラムを記録した機械読取り可能な媒体として
実施することもできる。

【０２７２】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。

【０２７３】

【発明の効果】本発明によれば、設計者の代わりに自動
的に計算シミュレーション実験を反復し、利用可能な入
力情報が多い少ないにかかわらず、与えられた入力−出
力変数の組み合わせに応じて最も適切かつロバスト性に
優れたルックアップテーブルの内容を自動設計もしくは
設計支援することが可能となる。

【０２７４】また、本発明に係るグラフィカル・ユーザ
・インタフェースを用いれば、ルックアップテーブル設
計の際の種々の情報の入力操作が容易になる。

【図面の簡単な説明】

【図１】本発明の第１の実施形態に係るルックアップテ
ーブル設計装置の構成を示す概略機能ブロック図

【図２】本発明の第２の実施形態に係るルックアップテ
ーブル設計装置の構成を示す機能ブロック図

【図３】同実施形態の抗体学習時の処理の流れを示すフ
ローチャート

【図４】近傍メッシュから近傍抗体を抽出する処理につ
いて説明するための図

【図５】抗体生成処理の一例について説明するための図

【図６】同実施形態の学習後のルックアップテーブル作
成時の処理の流れを示すフローチャート

【図７】各メッシュの内容を決定する処理の一例を説明
するための図

【図８】交通信号パラメータ決定用ルックアップテーブ
ルの一例を示す図

【図９】同実施形態の抗体学習時の他の処理の流れを示
すフローチャート

【図１０】本発明の第３の実施形態に係るルックアップ
テーブル設計装置の構成を示す機能ブロック図

【図１１】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のＧＵＩ画面イメージの
一例を示す図

【図１２】本発明を適用したルックアップテーブル設計
装置と従来のルックアップテーブル設計装置とについて
シミュレーション実験結果を比較するための図

【図１３】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のＧＵＩ画面イメージの
一例を示す図

【図１４】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のＧＵＩ画面イメージの
一例を示す図

【図１５】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のＧＵＩ画面イメージの
一例を示す図

【図１６】従来のパタン選択制御用ルックアップテーブ
ルの分割の一例を示す図

【図１７】交通信号制御システムの一例を示す図

【符号の説明】

１…学習・設計管理部２…パラメータ入力部３，３₁〜３_n…抗体評価値決定部４…候補抗体産生部５…抗体格納部６…ルックアップテーブル作成部７…ルックアップテーブル１１…入力変換部１２…出力変換部１３…学習管理部１４…設計管理部３１…パラメータ自動変更部３２…シミュレーション実行部３３，３３₁〜３３_m…シミュレーション結果評価部３２１…第１のシミュレーション実行部３２２₁〜３２２_m…第２のシミュレーション実行部５１…近傍抗体検索部５２…抗体データベース５３…データ変更部６１…入力スキャン部６２…抗体バッファ６３…最大濃度抗体検出部６４…ルックアップテーブル書込部１３１…抗体バッファ１３２…評価値バッファ１３３…濃度更新演算部１３４…抗体削除部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号ＦＩＧ０８Ｇ 1/00 Ｇ０６Ｆ 15/60 ６３０

Claims

【特許請求の範囲】

【請求項１】所望のシステムの制御に使用するルックア
ップテーブルの入力ベクトルおよび出力ベクトルの関係
を調べる学習を計算シミュレータまたは順方向モデルを
利用して行った後に、この学習の結果に基づいて該ルッ
クアップテーブルの内容を決定するルックアップテーブ
ル設計方法であって、前記学習において、所定の条件の成立を契機として生成
された、目的となるルックアップテーブルに対する入力
ベクトルおよび出力ベクトルの対を含む抗体データに、
その相対的な優良性を示す濃度を対応付けて複数記憶し
ている抗体情報記憶手段から、入力ベクトル空間上にお
ける所定の近傍範囲内に含まれる入力ベクトルを持つ抗
体データを求めることを通して、評価対象とする複数の
抗体データを定め、評価対象とされた個々の抗体データについて所定の方法
により評価値を求め、求められた全ての前記評価値を考慮した各抗体データの
評価値の相対的な優良性を基準にして、各抗体データの
濃度を更新し、濃度を基に抗体データの取捨選択を行う
ことを特徴とするルックアップテーブル設計方法。
【請求項２】前記学習は、評価対象とされた抗体データ
の濃度の更新を、評価対象を変えながら繰り返し行われ
るものであり、各学習の繰り返し毎に、第１の計算シミュレータまたは順方向モデルの内部パラ
メータをランダムにまたは予め指定された手順により変
更し、第１の計算シミュレーションまたは順方向モデル
演算を行い、該第１の計算シミュレーションまたは順方
向モデル演算の結果から予め指定された観測可能な情報
を抽出してこれを変換して入力ベクトルを生成し、ルックアップテーブルの入力ベクトルの各次元毎に指定
された分割数に入力ベクトル空間を分割して形成される
複数のメッシュのうちの前記入力ベクトルが含まれるメ
ッシュに、これを起点として該各次元毎に指定された数
だけ隣接するメッシュを加えてなる、近傍メッシュに含
まれる全ての抗体データを求めることを通して、評価対
象とする複数の抗体データを定め、評価対象とされた個々の抗体データについて、そのコー
ディング内容の出力ベクトルに相当する部分の値を変換
して第１と同じ内部パラメータを想定した第２の計算シ
ミュレータまたは順方向モデルに入力し、第２の計算シ
ミュレーションまたは順方向モデル演算を行い、該第２
の計算シミュレーションまたは順方向モデル演算の結果
に基づいて、各抗体データの評価値を求めることを特徴
とする請求項１に記載のルックアップテーブル設計方
法。
【請求項３】前記ルックアップテーブルの内容を決定す
るに際しては、ルックアップテーブルの入力ベクトルの各次元毎に指定
された分割数に入力ベクトル空間を分割して形成される
複数のメッシュの各々について、前記学習後における前記抗体情報記憶手段から、対象と
なるメッシュとこれを起点として該各次元毎に指定され
た数だけ隣接するメッシュとを加えてなる近傍メッシュ
に含まれる全ての抗体データを求め、そのうち最大の濃
度を持つ抗体データのコーディング内容の出力ベクトル
に相当する部分を、ルックアップテーブルの該対象とな
るメッシュに相当するアドレスに書き込む処理を行うこ
とを特徴とする請求項１または２に記載のルックアップ
テーブル設計方法。
【請求項４】前記ルックアップテーブルの内容を決定す
るに際しては、ルックアップテーブルの入力ベクトルの各次元毎に指定
された分割数に入力ベクトル空間を分割して形成される
複数のメッシュの各々について、前記学習後における前記抗体情報記憶手段から、対象と
なるメッシュとこれを起点として該各次元毎に指定され
た数だけ隣接するメッシュとを加えてなる近傍メッシュ
に含まれる全ての抗体データを求め、そのうち最大の濃
度を持つ抗体データのコーディング内容をルックアップ
テーブルに書き込む処理を行うことを特徴とする請求項
１または２に記載のルックアップテーブル設計方法。
【請求項５】複数の前記第１の計算シミュレータまたは
順方向モデルにより、複数の前記入力ベクトルを並行し
て生成するとともに、生成された前記複数の入力ベクトルの各々について前記
評価対象とされた個々の抗体データの評価値を求める処
理を、複数の前記第２の計算シミュレータまたは順方向
モデルにより、並行して実行することを特徴とする請求
項１または２に記載のルックアップテーブル設計方法。
【請求項６】グラフィカル・ユーザ・インタフェースを
用いて制御・調整対象であるシステムの構成図を表示
し、前記グラフィカル・ユーザ・インタフェースにより入力
されるセンサ構成に関する情報および指定したセンサ構
成により得られる観測値とルックアップテーブルへの入
力ベクトルとの関係を定義する情報を受け付け、入力された前記情報に基づいてルックアップテーブルを
設計することを特徴とする請求項１または２に記載のル
ックアップテーブル設計方法。
【請求項７】グラフィカル・ユーザ・インタフェースを
用いて、制御・調整対象であるシステムの構成図を表示
し、グラフィカル・ユーザ・インタフェースにより入力され
るあいまいな確率分布の形式で表現された前記システム
の内部パラメータの情報を受け付け、前記情報が入力された場合、あいまいな形式で与えられ
た内部パラメータには与えられた確率分布に従ってラン
ダムに変動を加えて学習することを特徴とする請求項１
または２に記載のルックアップテーブル設計方法。
【請求項８】グラフィカル・ユーザ・インタフェースを
用いて制御・調整対象であるシステムの構成図を表示
し、前記グラフィカル・ユーザ・インタフェースにより入力
されるセンサ構成に関する第１の情報、制御・調整対象
となる各機器に関する第２の情報、指定したセンサ構成
により得られる観測値とルックアップテーブルの入力ベ
クトルとの関係を定義する第３の情報およびルックアッ
プテーブルの出力ベクトルと指定した制御・調整対象機
器への出力値との関係を定義する第４の情報を受け付
け、入力された前記情報に基づいてルックアップテーブルを
学習により設計することを特徴とする請求項１または２
に記載のルックアップテーブル設計方法。
【請求項９】予め用意された処理関数に相当する部品の
選択を受け付け、選択された該部品を、その種類が視覚
的に識別可能な処理関数に相当するノードとして画面上
に表示するとともに、前記システム構成図上で指定されたセンサからの入力に
相当するノードと、前記システム構成図上で指定した各
制御・調整対象機器への出力に相当するノードと、学習
対象であるルックアップテーブルに相当するノードと
を、画面上に表示し、グラフィカル・ユーザ・インタフェースにより入力され
る、所望の前記入力に相当するノードと所望の前記処理
関数に相当するノードとの間をリンクにより接続すべき
指定を受け付け、この受け付けた指定に基づいて前記第３および第４の情
報を得ることを特徴とする請求項８に記載のルックアッ
プテーブル設計方法。
【請求項１０】表形式の入出力が可能なグラフィカル・
ユーザ・インタフェース上において、制御・調整対象シ
ステムの前記第１の計算シミュレーションまたは順方向
モデル演算の結果である各観測値に相当するセルと、制
御・調整対象システムの前記第２の計算シミュレーショ
ンまたは順方向モデル演算への各出力に相当するセル
と、学習対象であるルックアップテーブルへの入力ベク
トルの各要素に相当するセルと、学習対象であるルック
アップテーブルの出力ベクトルの各要素に相当するセル
の少なくとも一部を画面上に表示し、前記グラフィカル・ユーザ・インタフェースにより入力
される、前記ルックアップテーブルへの入力ベクトルの
各要素に相当するセルに前記制御・調整対象システムの
各観測値に相当するセルの値を引数とし値を求める演算
式を埋め込む指定を受け付けるとともに、前記グラフィカル・ユーザ・インタフェースにより入力
される、前記制御・調整対象システムに対する各出力に
相当するセルに前記ルックアップテーブルの出力ベクト
ルの各要素に相当するセルの値を引数の一部とし値を求
める演算式またはデフォルト出力値を埋め込む指定を受
け付け、これら受け付けた指定により得た前記観測値と前記ルッ
クアップテーブルの入力ベクトルとの関係を示す演算式
および前記ルックアップテーブルの出力ベクトルと前記
制御・調整対象機器への出力値との関係を示す演算式に
基づいてルックアップテーブルを学習により設計するこ
とを特徴とする請求項２に記載のルックアップテーブル
設計方法。
【請求項１１】表形式の入出力が可能なグラフィカル・
ユーザ・インタフェース上において、制御・調整対象シ
ステムの前記第１および第２の計算シミュレーションま
たは順方向モデル演算の内部パラメータに相当するセル
と、制御・調整対象システムの前記第２の計算シミュレ
ーションまたは順方向モデル演算の計算結果に相当する
いくつかのセルと、前記各抗体データの評価値に相当す
るセルの少なくとも一部をも画面上に表示し、前記グラフィカル・ユーザ・インタフェースにより入力
される、前記各観測値に相当するセルに、前記内部パラ
メータに相当するセルの値を引数として観測値を求める
前記第１の計算シミュレーションまたは順方向モデル演
算に相当する演算式を埋め込む指定と、前記グラフィカル・ユーザ・インタフェースにより入力
される、前記内部パラメータに相当するセルに、該内部
パラメータを変動させる範囲および制約条件式を埋め込
む指定と、前記グラフィカル・ユーザ・インタフェースにより入力
される、前記第２の計算シミュレーションまたは順方向
モデル演算の計算結果に相当するセルに、前記内部パラ
メータに相当するセルの値と前記第２の計算シミュレー
ションまたは順方向モデル演算への各出力に相当するセ
ルの値を引数として計算結果を求める前記第２の計算シ
ミュレーションまたは順方向モデル演算に相当する演算
式を埋め込む指定と、前記グラフィカル・ユーザ・インタフェースにより入力
される、前記各抗体データの評価値に相当するセルに前
記第２の計算シミュレーションまたは順方向モデル演算
の計算結果に相当するいくつかのセルの値を引数とし評
価値を求める評価式を埋め込む指定のうち少なくとも１
つの指定を受け付け、受け付けている指定のうちで入力されたものの内容に基
づいてルックアップテーブルを学習により設計すること
を特徴とする請求項１０に記載のルックアップテーブル
設計方法。
【請求項１２】グラフィカル・ユーザ・インタフェース
を用いて制御・調整対象であるシステムの構成図を表示
させ、グラフィカル・ユーザ・インタフェースにより入
力されるセンサ構成に関する情報および指定したセンサ
構成により得られる観測値とルックアップテーブルへの
入力ベクトルとの関係を定義する情報を受け付けさせ、
入力された前記情報に基づいてルックアップテーブルを
設計させるようにコンピュータを制御するためのプログ
ラムを格納したコンピュータ読取り可能な記録媒体。
【請求項１３】設計すべきルックアップテーブルの適用
対象となるシステムの所定の内部パラメータに対するロ
バスト性に関する学習を行わせて該ルックアップテーブ
ルを設計させるためのプログラムであって、グラフィカ
ル・ユーザ・インタフェースを用いて、制御・調整対象
であるシステムの構成図を表示させ、グラフィカル・ユ
ーザ・インタフェースにより入力されるあいまいな確率
分布の形式で表現された前記システムの内部パラメータ
の情報を受け付けさせ、前記情報が入力された場合、あ
いまいな形式で与えられた内部パラメータについて与え
られた確率分布に従ったランダムな変動を加えて学習を
行わせ、この学習結果に基づいてルックアップテーブル
の内容を決定させるようにコンピュータを制御するため
のプログラムを格納したコンピュータ読取り可能な記録
媒体。