JPH1173207A - ルックアップテーブル設計方法及び記録媒体 - Google Patents

ルックアップテーブル設計方法及び記録媒体

Info

Publication number
JPH1173207A
JPH1173207A JP9271189A JP27118997A JPH1173207A JP H1173207 A JPH1173207 A JP H1173207A JP 9271189 A JP9271189 A JP 9271189A JP 27118997 A JP27118997 A JP 27118997A JP H1173207 A JPH1173207 A JP H1173207A
Authority
JP
Japan
Prior art keywords
antibody
input
look
learning
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9271189A
Other languages
English (en)
Other versions
JP3421552B2 (ja
Inventor
Hideyuki Aisu
英之 愛須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP27118997A priority Critical patent/JP3421552B2/ja
Publication of JPH1173207A publication Critical patent/JPH1173207A/ja
Application granted granted Critical
Publication of JP3421552B2 publication Critical patent/JP3421552B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 与えられた入力−出力変数の組み合わせに応
じて最も適切かつロバスト性に優れたルックアップテー
ブルを自動設計する方法を提供すること。 【解決手段】 学習過程において、所定の条件の成立を
契機として生成された、目的となるルックアップテーブ
ルに対する入出力ベクトルの対を含む抗体データに、そ
の相対的な優良性を示す濃度を対応付けて記憶する手段
から、選択された入力ベクトルに基づいて定められる所
定の近傍範囲に含まれる抗体データを求め、その個々の
抗体データについて所定の方法により評価値を求め、求
められた全ての評価値を考慮した各抗体データの評価値
の相対的な優良性を基準にして各抗体データの濃度を更
新し、学習過程の終了後に前記記憶手段に記憶されてい
る抗体データとその濃度に基づきルックアップテーブル
の内容を決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、センサ入
力に基づき使用する制御パラメータを決定するパラメー
タルックアップテーブル、観測された状況に基づき適切
な戦略を決定するデシジョンテーブルなど、種々ルック
アップテーブルを順方向計算モデルもしくは計算シミュ
レータを用いて自動設計もしくは設計支援するための汎
用的なルックアップテーブル設計方法に関し、特に、オ
ンラインで入力値から演算によりリアルタイムに出力値
を求めることが不可能なため事前に出力値を決めルック
アップテーブルに記憶させる必要がある場合に、ルック
アップテーブルに記憶させる内容(入力値の場合分けお
よびそれぞれの場合において出力する値)の設計を自動
化もしくは支援するための汎用的なルックアップテーブ
ル設計方法置に関する。
【0002】
【従来の技術】ルックアップテーブルは、例えば入力を
量子化しアドレスに変換する手段を利用した連想メモリ
などとして、容易にハードウェアとして実装可能かつ高
速に動作可能であり、動作試験も容易であるため、交通
信号の制御パラメータ調整装置、エレベータの郡管理モ
ード決定装置、家電機器の制御パラメータ調整装置な
ど、リアルタイム性が要求されるシステムを中心に、極
めて広い分野で利用されている。
【0003】ここで、ルックアップテーブルとは、入力
を幾つかの場合に分け、それぞれの場合に対応する出力
を記憶し、任意の入力が与えられた場合にそれに対応す
る出力を検索して出力することが可能な、ソフトウェア
モジュールもしくはハードウェアモジュールを指す。
【0004】ルックアップテーブルの利用方法として
は、オンラインで入力値から演算によりリアルタイム/
自動的に出力値を求めることが不可能なため事前に出力
値を決めておく必要がある場合と、演算により自動的に
出力値を求めることが可能であるが演算用ハードウェア
を省くためルックアップテーブルに記憶させ利用する場
合との2種類の利用目的がある。以下では、前者の目的
で用いるルックアップテーブルを扱うものとする。
【0005】ルックアップテーブル(例えばセンサ入力
に基づき使用する制御パラメータを決定するパラメータ
ルックアップテーブルや観測された状況に基づき適切な
戦略を決定するデシジョンテーブルなど)を作成するた
めには、入力値の場合分けおよびそれぞれの場合におい
て出力する値を設計する必要がある。従来の一般的なル
ックアップテーブル設計においては、設計者がノウハウ
に基づき入力情報を事前に場合分けし、さらにそれぞれ
の場合に対応する出力値を別の手段により決定してい
る。ここでは、交通信号の制御に用いられるルックアッ
プテーブルを例に、従来のルックアップテーブル設計手
法を説明する。
【0006】日本の交通信号の制御としては、制御対象
となる交差点群(系統)に属する信号機群について、同
系統内の主要なポイント(例えば代表交差点)に設けた
車両感知器郡の情報を入力とし該信号機群に対する制御
パラメータを出力とするルックアップテーブルを設計
し、このルックアップテーブルから一定時間ごとに交通
状況に合せた制御パラメータを選択して制御に使用す
る、パタン選択制御と呼ばれる方式が一般的である。こ
の場合、制御パラメータとしては、青信号開始時間の間
隔を示す「サイクル」、互いに交差する各交通路に与え
る青時間の比を示す「スプリット」、系統内の各信号機
間の青開始時刻のずれを示す「オフセット」の3種類が
主に用いられる制御パラメータである。交通信号の制御
では、これら制御パラメータを交通状況に応じて調整す
ることで車両の流れをよりスムーズにすることが1つの
目標であり、ルックアップテーブルの設計にあたっては
これら制御パラメータを多様な交通状況に応じて夫々決
定することが必要になる。
【0007】この例の場合におけるルックアップテーブ
ルの一設計法について簡単に説明すると、まず、第1の
手順として、ルックアップテーブルに対する入力ベクト
ル空間の分割を行う。すなわち、車両感知器郡により与
えられる入力である代表交差点の交通量を、例えば閑
散、上り方向優先、下り方向優先など予め決められた数
種類のパタンに場合分けする。図16に、よく使用され
る分割の一例を示す。図16では、上り交通指標(上り
の交通量)と下り交通指標(下りの交通量)の2次元入
力ベクトル空間を、閑散、2種類の上り優先、2種類の
平等、2種類の下り優先の計7つの区間に分割してい
る。
【0008】この入力ベクトル空間の分割はノウハウに
基づいて行われるもので、一般的な分割手法が存在する
訳ではない。
【0009】次に、第2の手順として、上記の分割にて
定められた各パタンに対応する出力ベクトルを定める。
すなわち、各パタンごとに、そのパタンにおける代表的
な交通状況(図16の場合、各パタンにおける上り交通
指標の代表値および下り交通指標の代表値)を定め、例
えばスルーバンド最大化と呼ばれる設計手法や街路交通
シミュレータを用いた最適化手法等により、該代表的な
交通状況に適した「サイクル」「スプリット」「オフセ
ット」を決定し、これを対応するパタンにはめ込む。
【0010】上記の街路交通シミュレータを用いた最適
化では、例えば、TRANSYTと呼ばれる設計支援ツ
ールが主に用いられている。TRANSYTは、英国運
輸道路研究所(TRRL)により開発されたもので、街
路交通現象解析および信号パラメータ設計支援のため、
世界的に最も広く用いられているツールである。このT
RANSYTは、車群単位で交通流を記述するマクロモ
デルを用い、道路網に方向別平均交通量などを設定し、
車群のサイクル期間内の動きをシミュレートする機能
と、各信号交差点で発生する遅れと停止回数に基づく評
価値をシミュレーションにより計算し、オフセット、ス
プリットを山登り法により最適化する機能を持つ。ま
た、最適化の評価基準としては、主に次に示す評価値
P.I.を用い、設定された交通状況の下で評価値P.
I.を最小にするパラメータを求める。 P.I.=Σ(遅れ時間+α×停止回数) このような手順を経て交通信号制御用のルックアップテ
ーブルが設計される。
【0011】なお、以上の内容については、(社)交通
工学研究会編集・発行「交通信号の手引」や越 編著・
技術書院発行「交通工学通論」等にて詳しく説明されて
いる。
【0012】以上説明した交通信号制御用のルックアッ
プテーブルの設計方法と同様に、一般にルックアップテ
ーブルの設計においては、経験やノウハウに基づく方法
あるいは試行錯誤的な方法により入力ベクトル空間の分
割(入力ベクトルの場合分け)を決定し、その後それぞ
れの分割における入力ベクトルの代表値を、例えば各分
割の中央の値を使うなどの方法で決定し、さらに各代表
値に対応する最適出力を、順方向モデルを用いて出力の
評価値を求めることによる最適化や計算シミュレータに
よる検証の試行錯誤的反復などにより決定し各分割の出
力として記憶させる方法が、最も広く用いられている。
【0013】なお、順方向モデルおよび計算シミュレー
タとは、内部パラメータおよびシミュレータへの入力ベ
クトル(ルックアップテーブルの出力ベクトル)を決定
すると対応する出力が一意に演算により求められる演算
式もしくはソフトウェアモジュールもしくはハードウェ
アモジュールを示すものとし、同じ内部パラメータおよ
び入力ベクトルを指定しても対応する出力が一意に決ま
らない一対多写像となるものは含まれないものとする。
【0014】しかしながら、前述したような従来のルッ
クアップテーブルの設計方法には、以下の2つの大きな
問題点がある。
【0015】(問題点1)設計に手間を要する点 過去のノウハウがない新たなタイプのルックアップテー
ブルを設計する場合には、 1)入力空間の分割の決定 2)各分割における出力値の決定 3)ルックアップテーブル全体として問題なく機能する
かどうかについてのシミュレーションもしくは実験によ
る検証 の3ステップを試行錯誤的に繰り返さなくてはならない
ため、全体の作業の繰り返し数は膨大になり、設計に手
間を要する問題点がある。特に、複数センサからの情報
を入力とし入力が多種多様に渡る場合、一般に解析的に
出力を求める手法がないため設計は試行錯誤的にならざ
るを得ず、手間を要することが多い。例えば、エレベー
タ群管理制御において、どの階の呼びを優先するかを決
定する優先重みを、全呼び情報、呼び頻度、時刻などを
入力として決定するためのルックアップテーブルなど
は、解析的に優先重みを求める手法がないため設計が困
難である。
【0016】(問題点2)入力ベクトル空間の各分割に
おけるロバストな代表値の決定が困難である点 ルックアップテーブルの入力ベクトルとしては、センサ
により得られる観測値や観測値を加工した情報を用いる
が、これらのセンサにより可観測な情報が、ルックアッ
プテーブルの出力対象(つまり制御対象)となるシステ
ムSの状態を完全に推定するためには不足する場合が多
い。つまり、設定されたセンサにより得られる観測値を
もとにしても状態が推定できない不可観測な内部パラメ
ータ(以下、これを内部パラメータpと呼ぶ)がシステ
ムSに存在する場合、各分割の代表値(中央値等)か
ら、順方向モデルやシミュレータに設定すべき内部パラ
メータp(pはベクトルである)が一意に定まらず、該
代表値と該内部パラメータpとは一対多の関係にある。
さらに詳しく言うと、一般に、ある内部パラメータpの
下での可観測値r|pは一意に求まるが、逆に観測値r
の観測下での内部パラメータp|rは逆方向処理である
ため一意には決まらない。
【0017】この場合、従来手法では、まず入力ベクト
ル空間の分割の代表的可観測値rを決め、rに対する内
部パラメータの集合P|rの中から1つの内部パラメー
タp1(p1はPの要素)を仮定し、この内部パラメー
タp1をシステムSの順方向モデルやシミュレータに設
定し、この内部パラメータp1の下での最適な出力を探
索手法により求め、ルックアップテーブルに記憶させる
ことになる。このため、ルックアップテーブル使用時の
システムSの内部パラメータpが仮定値p1と大幅に異
なると、出力が有効でなくなるおそれがあり、ロバスト
性に問題がある。さらには、非線形処理を含むシミュレ
ーションにおいては、一般に逆方向処理により集合P|
rを求めることすら困難である場合が多い。
【0018】この点について交通信号制御システムを例
に取って具体的に説明する。図17に示す例は、1〜1
5の番号を付した15個の交差点、31個のリンクから
なる系統の例である。なお、31個のリンクは、交差点
1に下り方向から流入してくるリンク、1〜15番の隣
接する交差点に挟まれた上り方向のリンクおよび下り方
向のリンク、交差点15に上り方向から流入してくるリ
ンク、交差点8おいて脇から流入してくるリンクであ
る。
【0019】説明を簡単にするために、この系統は、中
央の交差点8において脇から多量に流入するリンクを持
ち、交差点郡の信号制御装置は、主要交差点1に備えら
れた2つの車両感知器により夫々得られる上りの交通量
および下りの交通量を計測し、ルックアップテーブルに
より系統内全交差点の「オフセット」を決定するものと
する。ここで、オフセットは、主要交差点1にて青が開
始される時刻を基準とした各交差点の青開始時刻の持つ
ずれの量であるものとする(この例では、14個のオフ
セットが設定される)。
【0020】この例では、2箇所の車両感知器のみで
は、脇からの流入交通量が車両感知器により得られる上
り交通量内で占める割合を推定するのは不可能である。
このため、従来手法では、上り交通量の半分の量が流入
交通であるなどの仮定を設けて内部パラメータ(3つの
交通量)を決定し、例えば前述のTRANSYTに設定
しオフセットを探索により最適化することで、各分割の
オフセットを決定する。したがって、現実の流入交通量
が仮定した値(例えば上り交通量の半分の量)の付近に
あれば、ルックアップテーブルは有効に機能するが、現
実の流入交通量が仮定した値から大幅にずれてくると、
ルックアップテーブルが有効に機能しなくなるおそれが
あり、ロバスト性に問題がある。
【0021】また、ルックアップテーブルを用いる際に
は、入力ベクトルの属する分割について決定された出力
ベクトルが出力される。すなわち、各分割ごとに決定さ
れた出力ベクトルは、これを決定する際に用いた入力ベ
クトルの代表値から入力ベクトル空間上の距離の遠い入
力ベクトルについても広くシステムSに適用される。し
たがって、入力ベクトル空間の各分割が大きい(分割が
荒い)場合、代表値に対して最適化された出力ベクトル
が代表値から距離の遠い入力ベクトルに対しても有効に
機能するとは限らないという問題がある。
【0022】
【発明が解決しようとする課題】上記したように従来の
ルックアップテーブル設計方法には、例えば過去のノウ
ハウがない新たなタイプのルックアップテーブルを設計
する場合には、入力空間の分割の決定、各分割における
出力値の決定、ルックアップテーブル全体として問題な
く機能するかどうかについてのシミュレーションもしく
は実験による検証の3ステップを試行錯誤的に繰り返さ
なくてはならないため、全体の作業の繰り返し数は膨大
になり、設計に手間を要する問題点があった。また、入
力ベクトル空間の各分割におけるロバストな代表値の決
定が困難である問題点があたった。
【0023】本発明は、上記事情を考慮してなされたも
ので、利用可能な入力情報の多い少ないにかかわらず与
えられた入力−出力変数の組み合わせに応じて最も適切
かつロバスト性に優れたルックアップテーブルの内容を
自動設計もしくは設計支援することのできるルックアッ
プテーブル設計方法を提供することを目的とする。
【0024】
【課題を解決するための手段】本発明は、概略的には、
計算シミュレーションモデルまたは順方向モデル上での
オフライン学習により、自動的にルックアップテーブル
の内容設計を行うものである。本発明では、免疫系の
「膨大な種類の抗原に対抗するための多種多様な抗体を
後天的に作り出す機構」を単純化して模倣している。言
い換えると、生態の免疫システムの原理の一部を模倣し
て発見的探索手段および記憶手段を一体化させ、知識の
多様性を崩さぬようにオフライン学習を行わせる。ただ
し、本発明は、免疫系の詳細な原理とは直接の対応はな
いためここでは生体免疫システム自体についての説明は
省略するが、免疫系自体の学習能力等に関しては、例え
ば、J.D.Famer,N.H.Packard,
「The immune system,adapta
ion,and machine learnin
g」,Physica D22,pp.187−20
4,1986等の文献にて詳しく説明されている。
【0025】本発明では、遺伝的アルゴリズム(GA)
において遺伝子に情報のコーディング単位を当て嵌めて
いることに倣い、抗体にルックアップテーブルに対する
入力ベクトルおよび出力ベクトルのコーディング単位を
当て嵌める。すなわち、抗体とは、入力ベクトルおよび
出力ベクトルのコーディング単位のことを意味する。抗
体は、数値もしくは記号ベクトルとして表現される。
【0026】また、本発明では、抗体の濃度に有効性の
指標を当て嵌める。すなわち、抗体の濃度とは、強化学
習に基づく手法一般における強化値と同様の意義を持つ
ものであり、抗体の取捨選択の基準となるものである。
なお、強化学習とは、報酬を入力として報酬をもたらす
出力を優先すべく重みを更新することにより環境に適応
する機械学習の一種であり、明確な教師出力が与えられ
なくても学習を行うことができる特徴を持つ。
【0027】なお、抗体の評価値は、その抗体の出力ベ
クトルに対応する部分についてある内部パラメータの条
件下で計算シミュレーションもしくは順方向モデル演算
を実行した結果から評価される、その条件下においてそ
の抗体により対象システムが上手く制御できたかどうか
を示す尺度であり、抗体単独に定まる値である。
【0028】本発明(請求項1)に係るルックアップテ
ーブル設計方法は、所望のシステムの制御に使用するル
ックアップテーブルの入力ベクトルおよび出力ベクトル
の関係を調べる学習を行った後に、この学習の結果に基
づいて該ルックアップテーブルの内容を決定するルック
アップテーブル設計方法であって、前記学習において、
所定の条件の成立を契機として生成された、目的となる
ルックアップテーブルに対する入力ベクトルおよび出力
ベクトルの対を含む抗体データに、その相対的な優良性
を示す濃度を対応付けて複数記憶している抗体情報記憶
手段から、入力ベクトル空間上における所定の近傍範囲
内に含まれる入力ベクトルを持つ抗体データを求めるこ
とを通して、評価対象とする複数の抗体データを定め、
評価対象とされた個々の抗体データについて所定の方法
により評価値を求め、求められた全ての前記評価値を考
慮した各抗体データの評価値の相対的な優良性を基準に
して、各抗体データの濃度を更新することを特徴とす
る。
【0029】また、本発明(発明1)に係るルックアッ
プテーブル設計装置は、ルックアップテーブルへの入力
ベクトルおよび出力ベクトルのコーディング単位である
抗体とその濃度とを対応付けて複数個記憶する抗体記憶
手段と、前記抗体記憶手段に記憶された抗体の濃度を更
新後の値に書き換えるデータ変更手段と、前記抗体記憶
手段に追加すべき新たな抗体を生成する候補抗体産生手
段と、指定された抗体の評価値を求める抗体評価値決定
手段と、ユーザにより指定される学習パラメータおよび
ルックアップテーブル設計パラメータを入力するパラメ
ータ入力手段と、入力された前記学習パラメータに基づ
いて抗体の学習過程を管理するとともに、入力された前
記ルックアップテーブル設計パラメータに基づいてルッ
クアップテーブル設計過程を管理する学習・設計管理手
段と、学習過程終了後に前記抗体記憶手段に記憶されて
いる内容に基づいてルックアップテーブルの内容を決定
するルックアップテーブル作成手段とを備え、前記学習
過程において抗体の濃度の更新を行う際に、抗体の入力
ベクトルに相当する部分が入力ベクトル空間上で近傍に
位置する抗体集団の中での、該抗体の評価値の相対的な
優良度を基準にして、該抗体の濃度を更新することを特
徴とする。
【0030】本発明によれば、学習過程において、候補
抗体産生手段によりルックアップテーブルの内容のもと
となる多種多様な入力ベクトルおよび出力ベクトルのコ
ーディング単位(抗体)を生成し抗体記憶手段に記憶す
るとともに、あるステップの入力ベクトルを基準とする
近傍内においてまず抗体評価値決定手段により各近傍抗
体を独立に評価し次に近傍抗体間の相対的な優良度を基
準にして各近傍抗体の濃度をデータ変更手段により更新
していくので、抗体の多様性を維持しつつより優れた制
御を行う能力を持つと期待される抗体の濃度を増加させ
ていき、そして、学習過程終了後のルックアップテーブ
ル設計過程において、抗体記憶手段に記憶されている内
容に基づいてルックアップテーブルの内容を決定するの
で、過去のノウハウがなくても手間をかけず適切かつロ
バスト性に優れたルックアップテーブルを設計できるよ
うにしたものである。
【0031】また、本発明によれば、ニューラルネット
ワークのように設計者が学習用教師データを用意しなく
ても、計算シミュレーション上での自律的な試行錯誤の
反復によりルックアップテーブルの自動設計が可能とな
る。
【0032】本発明(発明2)は、上記発明1におい
て、ルックアップテーブルの入力ベクトルの各次元毎に
指定された大きさのメッシュに入力ベクトル空間を分割
し、検索キーとして入力された入力ベクトルの含まれる
メッシュに対し、各次元毎に指定された大きさの近傍内
にある近傍メッシュに含まれる全ての近傍抗体のコーデ
ィング内容または抗体格納アドレス情報を前記抗体記憶
手段から検索・抽出する近傍抗体検索手段をさらに備
え、この近傍抗体検索手段により抽出された全ての近傍
抗体の評価値を前記抗体評価値決定手段によりそれぞれ
求め、求められた全ての評価値を用いた所定の演算によ
り、該抽出された近傍抗体それぞれについて濃度更新を
行うことを特徴とする。
【0033】ここで、近傍抗体検索手段による検出の一
例を示すと、入力ベクトルを2次元、メッシュ分割数を
両次元とも8分割、近傍の大きさを両次元とも1メッシ
ュとした場合、図4において、抗体記憶手段内に記憶さ
れている抗体の入力ベクトルに相当する部分が入力ベク
トル空間に占める座標が黒丸で示されたようであり、検
索キーとして入力された入力ベクトルが占める座標が×
印で示されたようであるとすると、ハッチングされた9
つのメッシュ(近傍メッシュ)に含まれる抗体(この場
合、4つの抗体)が近傍抗体検索手段により近傍抗体と
して抽出される。
【0034】本発明では、抗体が競合する範囲を入力ベ
クトル空間の近傍メッシュ内に限定することにより、入
力ベクトル空間上での多様性が保たれ、各メッシュ(ル
ックアップテーブルの各アドレス)に対応する抗体がま
んべんなく得られることになる。すなわち、抗体評価値
決定手段が抗体の評価のために計算シミュレータもしく
は順方向モデルを用いる場合に、計算シミュレータもし
くは順方向モデルにおける内部パラメータpの変動によ
り観測され得る観測値r|pのいずれかに対応する抗体
がまんべんなく得られる。
【0035】本発明(発明3)は、上記発明2におい
て、前記近傍抗体検索手段により抽出された全ての近傍
抗体の評価値を前記抗体評価値決定手段によりそれぞれ
求め、求められた全ての評価値からその平均値を求め、
濃度更新対象となる抗体の評価値と前記平均値との大小
関係に応じて、該濃度更新対象となる抗体の濃度を更新
することを特徴とする。
【0036】このような濃度更新方法によれば、メッシ
ュに依存して抗体の評価値の相場に大幅なばらつきがあ
る場合でも、近傍内での相場に対し相対的に評価値が優
れた抗体の濃度が増すため、評価値の絶対基準を各メッ
シュ毎に定める必要がなく、学習パラメータの設定が著
しく容易になる。例えば、前述のTRANSYTにおけ
る評価指標P.I.を評価値として用いた場合、メッシ
ュの交通量の総量平均に応じて著しく良不良の基準値が
変動するため、濃度増減の基準もメッシュにより異なる
が、本方式によれば濃度増減の基準をユーザが個別に定
める必要がなくなる。
【0037】濃度更新方法の一例として、以下の式に基
づき濃度更新を行う方法がある。ここで、Fjは抗体j
の評価値である。次の式では評価値が大きいほど評価が
優れているものとする。nは近傍内抗体の数、Cjは抗
体jの濃度、Δは濃度増減値である。 ΣFk/n≦Fj → Cj=Cj+Δ ΣFk/n>Fj → Cj=Cj−Δ ここで、Fkの総和を取る範囲は、K=1〜nである。
【0038】あるいは、以下の式に基づき、濃度を各抗
体の勝率とみなして濃度変更を行う方法がある。ここ
で、Sjは抗体がデータベースに追加されてから経過し
たステップ数であり、抗体格納手段に記憶されるものと
する。 ΣFk/n≦Fj → Cj=(SjCj+1)/(S
j+1) ΣFk/n>Fj → Cj=SjCj/(Sj+1) ここで、Fkの総和を取る範囲は、K=1〜nである。
【0039】他の濃度更新方法としては、入力ベクトル
空間における抗体と入力のユークリッド距離に応じた重
み付け平均を利用する方法、近傍抗体内での順位に応じ
た値を濃度から増減する方法など、種々の方法が考えら
れる。
【0040】本発明(請求項2)は、請求項1に記載の
発明において、各学習の繰り返し毎に、第1の計算シミ
ュレータまたは順方向モデルの内部パラメータをランダ
ムにまたは予め指定された手順により変更し、第1の計
算シミュレーションまたは順方向モデル演算を行い、該
第1の計算シミュレーションまたは順方向モデル演算の
結果から予め指定された観測可能な情報を抽出してこれ
を変換して入力ベクトルを生成し、ルックアップテーブ
ルの入力ベクトルの各次元毎に指定された分割数に入力
ベクトル空間を分割して形成される複数のメッシュのう
ちの前記入力ベクトルが含まれるメッシュに、これを起
点として該各次元毎に指定された数だけ隣接するメッシ
ュを加えてなる、近傍メッシュに含まれる全ての抗体デ
ータを求めることを通して、評価対象とする複数の抗体
データを定め、評価対象とされた個々の抗体データにつ
いて、そのコーディング内容の出力ベクトルに相当する
部分の値を変換して第2の計算シミュレータまたは順方
向モデルに入力し、第1と同じ内部パラメータを設定し
た第2の計算シミュレーションまたは順方向モデル演算
を行い、該第2の計算シミュレーションまたは順方向モ
デル演算の結果に基づいて、各抗体データの評価値を求
めることを特徴とする。
【0041】また、本発明(発明4)は、上記発明1に
おいて、ルックアップテーブルの入力ベクトルの各次元
毎に指定された大きさのメッシュに入力ベクトル空間を
分割し、検索キーとして入力された入力ベクトルの含ま
れるメッシュに対し、各次元毎に指定された大きさの近
傍内にある近傍メッシュに含まれる全ての近傍抗体のコ
ーディング内容または抗体格納アドレス情報を前記抗体
記憶手段から検索・抽出する近傍抗体検索手段をさらに
備え、前記抗体評価値手決定段は、計算シミュレータま
たは順方向モデル、パラメータ自動変更手段およびシミ
ュレーション結果評価手段を有し、各学習ステップ毎
に、計算シミュレータまたは順方向モデルの内部パラメ
ータをランダムにまたは予め指定された手順により変更
し、第1の計算シミュレーションまたは順方向モデル演
算を行い、前記第1の計算シミュレーションまたは順方
向モデル演算の結果から予め指定された観測可能な情報
を抽出してこれを入力ベクトルに変換し、該入力ベクト
ルを検索キーとして前記近傍抗体検索手段により前記抗
体格納手段から近傍抗体を抽出し、抽出された各近傍抗
体それぞれについて、そのコーディング内容の出力ベク
トルに相当する部分の値を変換して計算シミュレータま
たは順方向モデルに入力し、第2の計算シミュレーショ
ンまたは順方向モデル演算を行い、前記第2の計算シミ
ュレーションまたは順方向モデル演算の結果に基づい
て、前記抽出された各近傍抗体の評価値をそれぞれ求め
ることを特徴とする。
【0042】本発明では、入力ベクトルを得るための第
1のシミュレーションで、内部パラメータpに対応する
ルックアップテーブルの対象システムSの可観測値ベク
トルrを求め、抗体を評価するための第2のシミュレー
ションにより、内部パラメータpの設定下で、入力ベク
トルr´|p(可観測値ベクトルrと一対一対応)の近
傍抗体の出力ベクトルに相当する部分xをシミュレータ
に入力した際の評価値F|p,xを見積もることができ
る。そして、このF|p,xを抗体評価基準とし、pを
変動させながら学習を行うことにより、ある入力ベクト
ルr´の近傍にあるときに、p|r´が何であれ常にF
が相対的に優れたロバストな出力xがコーディングされ
た抗体の濃度を増加させることはできる。これにより、
前述した従来手法の問題点2を、対象システムSの逆方
向モデルを作成・解析する手間なしに解決することが可
能となる。
【0043】本発明(発明5)は、上記発明4におい
て、前記候補抗体産生手段は、各学習ステップ毎に、前
記第1のシミュレーションまたは順方向モデル演算の結
果から予め指定された観測可能な情報を抽出してこれを
変換することにより作成された前記入力ベクトルと、所
定の手順で作成した出力ベクトルとの双方をコーディン
グすることにより、新たな候補抗体を生成するものであ
ることを特徴とする。
【0044】本発明では、第1のシミュレーション後
に、指定された可観測値をもとに入力ベクトルr´|p
を求め、これとは別に所定の手順、例えば、pの設定下
での最適な出力ベクトルx|pを山登り法などの探索手
法により求め、最後に両者を結合して抗体にコーディン
グする。山登り法の他にも、遺伝的アルゴリズムの様に
ランダム生成や近傍内の他の抗体を雛形にして突然変
異、交叉などの手段により出力ベクトルを作成する方法
など、種々の方法が考えられる。
【0045】また、本発明によれば、内部パラメータp
を変動させた際に出現し得る入力ベクトルの近傍抗体以
外は始めから生成されないため、利用されない候補抗体
を作成・追加することを避け学習の効率化、メモリの節
約が図ることができる。
【0046】本発明(発明6)は、上記発明4または5
において、前記候補抗体産生手段は、各学習ステップ毎
に、前記第1のシミュレーションまたは順方向モデル演
算の結果から予め指定された観測可能な情報を抽出しこ
れを変換することにより作成された前記入力ベクトルを
前記検索手段に検索キーとして入力して抽出された前記
近傍抗体の数が予め指定された規定個数を下回った場合
にのみ、新たな候補抗体を生成するものであることを特
徴とする。
【0047】本発明によれば、各メッシュの近傍に存在
する抗体の数に偏りが生じるのを防ぐことができる。近
傍抗体の数が多過ぎると濃度更新の際の抗体評価に計算
時間を要し、また少な過ぎると発明3による近傍内での
相対評価ができなくなるが、本発明によれば、常に2以
上規定個数以下の適正抗体数が保たれる。
【0048】本発明(発明12)は、上記発明4または
5において、前記候補抗体産生手段は、各学習ステップ
毎に、前記第1の計算シミュレーションまたは順方向モ
デル演算の結果に基づいて予め指定された観測可能な情
報を抽出しこれを変換することにより作成された前記入
力ベクトルを前記検索手段に検索キーとして入力して抽
出された前記近傍抗体の数が予め指定された規定個数を
下回った場合に、新たな抗体を該規定個数に達するまで
繰り返し生成するものであることを特徴とする。
【0049】本発明によれば、上記発明6の場合よりも
さらに各メッシュの近傍に存在する抗体の数が平均化さ
れる。
【0050】本発明(発明7)は、上記発明1〜6,1
2において、各学習ステップ毎に、濃度の更新された前
記抗体(近傍抗体)のうち濃度が最小しきい値を下回っ
た抗体を前記抗体格納手段より削除することを特徴とす
る。
【0051】本発明により、不適合な抗体を維持してい
くことを防ぐことができる。
【0052】本発明(発明13)は、上記発明1〜6,
12において、各学習ステップ毎に、濃度更新された前
記抗体(近傍抗体)のうち濃度が最小の抗体を前記格納
手段より削除することを特徴とする。本発明により、不
適合な抗体を維持していくことを防ぐことができる。な
お、本発明は、上記発明12と組み合わせて利用するの
が望ましい。
【0053】本発明(発明11)は、上記発明1〜7,
12,13において、前記近傍抗体検索手段において使
用する前記近傍の大きさを、学習の進行状況に応じて次
第に小さくすることを特徴とする。
【0054】本発明によれば、ユーザが適切な近傍の大
きさを決められない場合、抗体が少ない内は近傍を大き
くとることでそれぞれのメッシュの抗体の濃度変更され
る機会を増やしロバストな抗体を得ることを優先され、
学習が進み抗体が多くなるに従い近傍を小さくすること
で、入力ベクトル空間の狭い領域に特化した抗体を得る
ことが優先されるようになり、学習の進行状況に応じた
効果的な近傍サイズを設定することができる。
【0055】本発明(請求項3)は、請求項1または4
に記載の発明において、前記ルックアップテーブルの内
容を決定するに際しては、ルックアップテーブルの入力
ベクトルの各次元毎に指定された分割数に入力ベクトル
空間を分割して形成される複数のメッシュの各々につい
て、前記学習後における前記抗体情報記憶手段から、対
象となるメッシュとこれを起点として該各次元毎に指定
された数だけ隣接するメッシュとを加えてなる近傍メッ
シュに含まれる全ての抗体データを求め、そのうち最大
の濃度を持つ抗体データのコーディング内容の出力ベク
トルに相当する部分を、ルックアップテーブルの該対象
となるメッシュに相当するアドレスに書き込む処理を行
うことを特徴とする。
【0056】また、本発明(発明8)は、上記発明1ま
たは4において、前記ルックアップテーブル作成手段
は、ルックアップテーブルの入力ベクトルの各次元毎に
指定された大きさに入力ベクトル空間を分割してなるメ
ッシュの中央値を前記近傍抗体検索手段に検索キーとし
て入力し、抽出された近傍抗体の中で最大の濃度を持つ
抗体のコーディング内容の出力ベクトルに相当する部分
を、ルックアップテーブルの前記メッシュに相当するア
ドレスに書き込むことを、全メッシュについて順次行う
ことにうより、前記抗体格納手段に格納されている抗体
をルックアップテーブルに変換するものであることを特
徴とする。
【0057】本発明によれば、各メッシュ毎に最も優れ
た抗体の出力ベクトルをルックアップテーブルに記憶さ
せ、学習結果をルックアップテーブルに変換できる。ま
た、本発明により得られたルックアップテーブルは、前
述の連想メモリとして実装することができる。
【0058】本発明(請求項4)は、請求項1または4
に記載の発明において、前記ルックアップテーブルの内
容を決定するに際しては、ルックアップテーブルの入力
ベクトルの各次元毎に指定された分割数に入力ベクトル
空間を分割して形成される複数のメッシュの各々につい
て、前記学習後における前記抗体情報記憶手段から、対
象となるメッシュとこれを起点として該各次元毎に指定
された数だけ隣接するメッシュとを加えてなる近傍メッ
シュに含まれる全ての抗体データを求め、そのうち最大
の濃度を持つ抗体データのコーディング内容をルックア
ップテーブルに書き込む処理を行うことを特徴とする。
【0059】また、本発明(発明9)は、上記発明1ま
たは4において、前記ルックアップテーブル作成手段
は、ルックアップテーブルの入力ベクトルの各次元毎に
指定された大きさに入力ベクトル空間を分割してなるメ
ッシュの中央値を前記近傍抗体検索手段に検索キーとし
て入力し、抽出された近傍抗体の中で最大の濃度を持つ
抗体のコーディング内容を、ルックアップテーブルに書
き込むことを、全メッシュについて順次行うことにうよ
り、前記抗体格納手段に格納されている抗体をルックア
ップテーブルに変換するものであることを特徴とする。
【0060】本発明によれば、各メッシュ毎に最も優れ
た抗体の出力ベクトルをルックアップテーブルに記憶さ
せ、学習結果をルックアップテーブルに変換できる。ま
た、本発明により得られる形式のルックアップテーブル
は、連想メモリとして実装することはできず、また近傍
抗体検索手段に相当する手段をルックアップテーブル読
出手段として必要とするが、上記発明8により得られる
形式のルックアップテーブルより一般に記憶量が少な
く、また、上記発明8の処理を行う際に同時に作成可能
である。
【0061】本発明(発明10)は、上記発明8または
9において、前記ルックアップテーブル作成手段は、ル
ックアップテーブル作成時に前記入力ベクトル空間のメ
ッシュの中央値を前記近傍抗体検索手段に検索キーとし
て入力した際に抽出された近傍抗体が存在しなかった場
合には、該メッシュをユーザに通知するものであること
を特徴とする。
【0062】ユーザに通知する手段としては、入力ベク
トル空間におけるメッシュ中央値の座標をグラフィカル
・ユーザ・インタフェース上にビジュアルに表示する等
の方法が考えられる。候補抗体産生手段により新しい候
補抗体を作成する場合などは、近傍内に抗体の存在しな
いメッシュが学習後に残る。これらは内部パラメータp
をどう変動させても近傍に入力ベクトルが出現し得ない
メッシュであるか、あるいは学習が足りないかのいずれ
かであるが、ユーザに前者と後者を判別させるための情
報を提供することができる。
【0063】本発明(請求項5)は、請求項1ないし2
のいずれか1項に記載の発明において、複数の前記第1
の計算シミュレータまたは順方向モデルにより、複数の
前記入力ベクトルを並行して生成するとともに、生成さ
れた前記複数の入力ベクトルの各々について行う前記評
価対象とされた個々の抗体データの評価値を求める処理
を、複数の前記第2の計算シミュレータまたは順方向モ
デルにより、並行して実行することを特徴とする。
【0064】また、本発明(発明14)は、上記発明1
〜13において、前記抗体評価値決定手段を複数備え、
各々の抗体評価値決定手段における処理を並列に実行す
ることを特徴とする。
【0065】本発明によれば、最も計算時間を要するシ
ミュレーション演算もしくは順方向モデル演算を並列処
理し、学習時間を短縮することができる。
【0066】本発明(請求項6)は、請求項1ないし2
のいずれか1項に記載の発明において、グラフィカル・
ユーザ・インタフェースを用いて制御・調整対象である
システムの構成図を表示し、前記グラフィカル・ユーザ
・インタフェースにより入力されるセンサ構成に関する
情報および指定したセンサ構成により得られる観測値と
ルックアップテーブルへの入力ベクトルとの関係を定義
する情報を受け付け、入力された前記情報に基づいてル
ックアップテーブルを設計することを特徴とする。
【0067】好ましくは、さらに、設計された前記ルッ
クアップテーブルの統合的なパフォーマンスを評価して
提示することを特徴とする。これによって、観測系設計
とルックアップテーブル設計を総合的に支援することが
できる。
【0068】センサ構成に関する情報は、センサの種
類、設置箇所などであり、例えば、表示中の構成図上に
所望のセンサを示すセンサアイテムをドラッグ・アンド
・ドロップする操作により入力される。観測値とルック
アップテーブルへの入力ベクトルとの関係を定義する情
報は、例えば、あるセンサの観測値をそのまま入力ベク
トルとする指定、あるセンサの観測値を他の単位のデー
タに変換する指定、ある複数のセンサの観測値の平均を
取る指定など種々のものが考えられ、例えば、表示中の
図上に配置された所望のセンサとその処理内容とをマウ
スで選択することにより入力される。
【0069】本発明によれば、対象システムSの逆方向
モデルをルックアップテーブルへの入力として利用する
情報の種類に合わせて解析する必要がなく、入力ベクト
ルの種類にかかわらずほぼ同じ方式により学習できるの
で、ユーザにルックアップテーブルへの入力をその場で
選択させ即学習させることが可能となる。
【0070】例えば、交通信号制御パラメータ決定用の
ルックアップテーブル設計に適用した場合、車両感知器
を置く道路・車線・位置や、複数車両感知器情報の平均
値を入力として使用するか否か、さらに車両速度感知器
や画像処理装置などの比較的高価な異種センサをどのよ
うに組み合わせるか、などをユーザにGUI上で自由に
選択させ、指定した入力の元で自動設計されたルックア
ップテーブルの制御調整性能を比較することで、目的に
応じた監視系の設計がサポートできる。
【0071】また、本発明(発明15)は、上記発明1
〜14において、制御・調整対象であるシステムにおい
て、観測可能なセンサ情報および該センサ情報の幾つか
を統合処理することにより得られる情報の中から、ルッ
クアップテーブルへの入力として利用する情報をユーザ
が前記パラメータ入力手段のグラフィカル・ユーザ・イ
ンタフェースを利用して選択でき、さらに選択された入
力に対応したルックアップテーブルが学習により自動設
計され、同時に設計されたルックアップテーブルの総合
的なパフォーマンスをユーザに提示することで、観測系
設計とルックアップテーブル設計を総合的に支援するこ
とを特徴とする。
【0072】本発明(請求項7)は、請求項1ないし6
のいずれか1項に記載の発明において、グラフィカル・
ユーザ・インタフェースを用いて、制御・調整対象であ
るシステムの構成図を表示し、グラフィカル・ユーザ・
インタフェースにより入力されるあいまいな確率分布の
形式で表現された前記システムの内部パラメータの情報
を受け付け、前記情報が入力された場合、あいまいな形
式で与えられた内部パラメータには与えられた確率分布
に従ってランダムに変動を加えて学習することを特徴と
する。
【0073】これによって、あいまいさの程度に応じた
ロバスト性を持つルックアップテーブルを設計すること
ができる。
【0074】すなわち、本発明によれば、例えば、交通
信号制御パラメータ決定用のルックアップテーブル設計
に適用した場合、交通量や平均車両速度が交通調査によ
りほぼ一定とわかっている場所については、交通シミュ
レータの内部パラメータを具体的な数値に固定し、特に
変動の大きい場所や、調査不十分なため具体的な値を特
定できない場所については、ファジィ理論におけるメン
バーシップ関数のようなあいまいな幅を持つ値として内
部パラメータを指定できる。これにより、制御調整の対
象システムSのあいまいさや変動の程度に応じたテーブ
ル設計が容易になる。
【0075】また、本発明(発明16)は、上記発明1
〜15において、制御・調整対象であるシステムにおい
て、該システムの内部パラメータをあいまいな確率分布
の形式で前記パラメータ入力手段のグラフィカル・ユー
ザ・インタフェースを利用して入力でき、あいまいな形
式で与えられた内部パラメータには確率分布に従い学習
中にランダムに変動を加えることにより、あいまいさの
程度に応じたロバストなルックアップテーブルを自動設
計することを特徴とする。
【0076】本発明(請求項8)は、請求項1または2
に記載の発明において、グラフィカル・ユーザ・インタ
フェースを用いて制御・調整対象であるシステムの構成
図を表示し、前記グラフィカル・ユーザ・インタフェー
スにより入力されるセンサ構成に関する第1の情報、制
御・調整対象となる各機器に関する第2の情報、指定し
たセンサ構成により得られる観測値とルックアップテー
ブルの入力ベクトルとの関係を定義する第3の情報およ
びルックアップテーブルの出力ベクトルと指定した制御
・調整対象機器への出力値との関係を定義する第4の情
報を受け付け、入力された前記情報に基づいてルックア
ップテーブルを学習により設計することを特徴とする。
【0077】センサ構成に関する情報は、センサの種
類、設置箇所、測定する情報などであり、例えば、表示
中の構成図上に所望のセンサを示すアイテムをドラッグ
・アンド・ドロップし、さらにセンサの種類と取り付け
箇所に応じて出現するプロパティ入力画面を用いて詳細
情報を指定する操作により入力される。また、制御・調
整対象となる各機器に関する情報は、制御対象とする機
器および操作対象量などであり、例えば、表示中の構成
図上の所望の機器をクリックし、さらに機器に応じたプ
ロパティ入力画面を用いて選択する操作により入力され
る。特に指定されない機器に関してはデフォルトの制御
方法を採用すればよい。
【0078】本発明によれば、ユーザルックアップテー
ブルへの入出力をその場で選択させた後に、即学習さ
せ、さらに作成されたルックアップテーブルの性能を表
示し、ユーザがこれを参考にルックアップテーブルの入
出力やセンサ構成、制御・調整対象機器を変更するとい
う、インタラクティブなルックアップテーブルの設計が
可能となる。
【0079】例えば、交通信号制御パラメータ決定用の
ルックアップテーブルの設計に適用した場合、車両感知
器を置く道路、位置や、感知器情報に基づき適応的にパ
ラメータを変更する信号機と固定パラメータで制御する
信号機の指定、交通量に応じて適応的に車両速度制限表
示を変更する道路の指定等、ユーザにGUI上で自由に
指定させ、指定した条件の元で自動設計されたルックア
ップテーブルの制御性能を比較することで、目的に応じ
た関し制御系の設計をサポートすることができる。
【0080】本発明(請求項9)は、請求項8に記載の
発明において、予め用意された処理関数に相当する部品
の選択を受け付け、選択された該部品を、その種類が視
覚的に識別可能な処理関数に相当するノードとして画面
上に表示するとともに、前記システム構成図上で指定さ
れたセンサからの入力に相当するノードと、前記システ
ム構成図上で指定した各制御・調整対象機器への出力に
相当するノードと、学習対象であるルックアップテーブ
ルに相当するノードとを、画面上に表示し、グラフィカ
ル・ユーザ・インタフェースにより入力される、所望の
前記入力に相当するノードと所望の前記処理関数に相当
するノードとの間をリンクにより接続すべき指定を受け
付け、この受け付けた指定に基づいて前記第3および第
4の情報を得ることを特徴とする。
【0081】本発明によれば、指定したセンサ構成によ
り得られる観測値とルックアップテーブルの入力ベクト
ルとの関係を定義する情報、およびルックアップテーブ
ルの出力ベクトルと指定した制御・調整対象機器への出
力値との関係を定義する情報を入力することが容易にな
る。
【0082】本発明(請求項10)は、請求項2に記載
の発明において、表形式の入出力が可能なグラフィカル
・ユーザ・インタフェース上において、制御・調整対象
システムの前記第1の計算シミュレーションまたは順方
向モデル演算の結果である各観測値に相当するセルと、
制御・調整対象システムの前記第2の計算シミュレーシ
ョンまたは順方向モデル演算への各出力に相当するセル
と、学習対象であるルックアップテーブルへの入力ベク
トルの各要素に相当するセルと、学習対象であるルック
アップテーブルの出力ベクトルの各要素に相当するセル
の少なくとも一部を画面上に表示し、前記グラフィカル
・ユーザ・インタフェースにより入力される、前記ルッ
クアップテーブルへの入力ベクトルの各要素に相当する
セルに前記制御・調整対象システムの各観測値に相当す
るセルの値を引数とし値を求める演算式を埋め込む指定
を受け付けるとともに、前記グラフィカル・ユーザ・イ
ンタフェースにより入力される、前記制御・調整対象シ
ステムに対する各出力に相当するセルに前記ルックアッ
プテーブルの出力ベクトルの各要素に相当するセルの値
を引数の一部とし値を求める演算式またはデフォルト出
力値を埋め込む指定を受け付け、これら受け付けた指定
により得た前記観測値と前記ルックアップテーブルの入
力ベクトルとの関係を示す演算式および前記ルックアッ
プテーブルの出力ベクトルと前記制御・調整対象機器へ
の出力値との関係を示す演算式に基づいてルックアップ
テーブルを学習により設計することを特徴とする。
【0083】本発明によれば、センサ構成により得られ
る観測値とルックアップテーブルの入力ベクトルとの関
係を定義する情報、およびルックアップテーブルの出力
ベクトルと指定した制御・調整対象機器への出力値との
関係を定義する情報を入力・変更することが容易にな
る。
【0084】本発明(請求項11)は、請求項10に記
載の発明において、表形式の入出力が可能なグラフィカ
ル・ユーザ・インタフェース上において、制御・調整対
象システムの前記第1および第2の計算シミュレーショ
ンまたは順方向モデル演算の内部パラメータに相当する
セルと、制御・調整対象システムの前記第2の計算シミ
ュレーションまたは順方向モデル演算の計算結果に相当
するいくつかのセルと、前記各抗体データの評価値に相
当するセルの少なくとも一部をも画面上に表示し、前記
グラフィカル・ユーザ・インタフェースにより入力され
る、前記各観測値に相当するセルに、前記内部パラメー
タに相当するセルの値を引数として観測値を求める前記
第1の計算シミュレーションまたは順方向モデル演算に
相当する演算式を埋め込む指定と、前記グラフィカル・
ユーザ・インタフェースにより入力される、前記内部パ
ラメータに相当するセルに、該内部パラメータを変動さ
せる範囲および制約条件式を埋め込む指定と、前記グラ
フィカル・ユーザ・インタフェースにより入力される、
前記第2の計算シミュレーションまたは順方向モデル演
算の計算結果に相当するセルに、前記内部パラメータに
相当するセルの値と前記第2の計算シミュレーションま
たは順方向モデル演算への各出力に相当するセルの値を
引数として計算結果を求める前記第2の計算シミュレー
ションまたは順方向モデル演算に相当する演算式を埋め
込む指定と、前記グラフィカル・ユーザ・インタフェー
スにより入力される、前記各抗体データの評価値に相当
するセルに前記第2の計算シミュレーションまたは順方
向モデル演算の計算結果に相当するいくつかのセルの値
を引数とし評価値を求める評価式を埋め込む指定のうち
少なくとも1つの指定を受け付け、受け付けている指定
のうちで入力されたものの内容に基づいてルックアップ
テーブルを学習により設計することを特徴とする。
【0085】本発明によれば、計算シミュレーションも
しくは順方向モデルを作成・変更すること、評価式を入
力・変更することが容易になる。
【0086】本発明(請求項12)に係るコンピュータ
読取り可能な記録媒体は、グラフィカル・ユーザ・イン
タフェースを用いて制御・調整対象であるシステムの構
成図を表示させ、グラフィカル・ユーザ・インタフェー
スにより入力されるセンサ構成に関する情報および指定
したセンサ構成により得られる観測値とルックアップテ
ーブルへの入力ベクトルとの関係を定義する情報を受け
付けさせ、入力された前記情報に基づいてルックアップ
テーブルを設計させるようにコンピュータを制御するた
めのプログラムを格納したコンピュータ読取り可能な記
録媒体である。
【0087】また、本発明に係るコンピュータ読取り可
能な記録媒体は、グラフィカル・ユーザ・インタフェー
スを用いて制御・調整対象であるシステムの構成図を表
示させ、グラフィカル・ユーザ・インタフェースにより
入力されるセンサ構成に関する情報および指定したセン
サ構成により得られる観測値とルックアップテーブルへ
の入力ベクトルとの関係を定義する情報を受け付けさ
せ、入力された前記情報に基づいてルックアップテーブ
ルを設計させ、設計された前記ルックアップテーブルの
総合的なパフォーマンスを評価して提示させるようにコ
ンピュータを制御するためのプログラムを格納したコン
ピュータ読取り可能な記録媒体である。
【0088】本発明(請求項13)に係るコンピュータ
読取り可能な記録媒体は、設計すべきルックアップテー
ブルの適用対象となるシステムの所定の内部パラメータ
についてロバスト性に関する学習を行わせて該ルックア
ップテーブルを設計させるためのプログラムであって、
グラフィカル・ユーザ・インタフェースを用いて、制御
・調整対象であるシステムの構成図を表示させ、グラフ
ィカル・ユーザ・インタフェースにより入力されるあい
まいな確率分布の形式で表現された前記システムの内部
パラメータの情報を受け付けさせ、前記情報が入力され
た場合、あいまいな形式で与えられた内部パラメータに
ついて与えられた確率分布に従ったランダムな変動を加
えて学習を行わせ、この学習結果に基づいてルックアッ
プテーブルの内容を決定させるようにコンピュータを制
御するためのプログラムを格納したコンピュータ読取り
可能な記録媒体である。
【0089】上記のコンピュータ読取り可能な記録媒体
に係る各発明においては、コンピュータに実行させるル
ックアップテーブルの設計の手順あるいは機能として、
上記した各方法に係る発明や各装置に係る発明に相当す
る手順あるいは機能を用いることができる。
【0090】なお、以上の装置に係る各発明は方法に係
る発明としても成立し、以上の方法に係る各発明は装置
に係る発明としても成立する。
【0091】また、以上の装置や方法に係る発明は、相
当する手順あるいは手段をコンピュータに実行させるた
めのプログラムを記録した機械読取り可能な媒体として
も成立する。
【0092】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
【0093】本実施形態に係るルックアップテーブル設
計装置は、概略的には、制御対象システムの動作を模擬
する計算シミュレーションモデルもしくは順方向モデル
上でのオフライン学習を行うことにより、自動的に制御
用ルックアップテーブルの内容設計(あるいはその支
援)を行うものであり、生体免疫系の「膨大な種類の抗
原に対抗するための多種多様な抗体を後天的に作り出す
機構」の基礎となる原理に倣って、ルックアップテーブ
ルの内容のもととなる多種多様な入力ベクトルおよび出
力ベクトルのコーディング単位(抗体)を生成する機能
(多様性の生成機能)と、多様性を維持しつつより優れ
た制御を行う能力を持つと期待されるコーディング単位
を取捨選択していく機能(多様性の維持機能)とを並行
的に実行させるとともに、学習により行われる抗体の取
捨選択においても多様性を維持するようにかつロバスト
性により優れたコーディング単位が維持されていくよう
に工夫することにより、過去のノウハウがなくても手間
をかけず適切かつロバスト性に優れたルックアップテー
ブルを設計できるようにしたものである。
【0094】本実施形態では、遺伝的アルゴリズム(G
A)において「遺伝子」に情報のコーディング単位を当
て嵌めていることに倣い、「抗体」にルックアップテー
ブルに対する入力ベクトルおよび出力ベクトルのコーデ
ィング単位を当て嵌める。すなわち、「抗体」とは、入
力ベクトルおよび出力ベクトルのコーディング単位のこ
とを意味する。「抗体」は、数値もしくは記号ベクトル
として表現される。
【0095】また、本実施形態では、「抗体の濃度」
に、その抗体の他の抗体との優劣関係も考慮した有効性
の指標を当て嵌める。すなわち、「抗体の濃度」とは、
強化学習に基づく手法一般における強化値と同様の意義
を持つものであり、抗体の取捨選択の基準となるもので
ある。なお、強化学習とは、報酬を入力として報酬をも
たらす出力を優先すべく重みを更新することにより環境
に適応する機械学習の一種であり、明確な教師出力が与
えられなくても学習を行うことができる特徴を持つ。
【0096】なお、後述する抗体の「評価値」は、その
抗体についてある条件下で計算シミュレーションもしく
は順方向モデル演算を実行した結果得られる、その条件
下においてその抗体により対象システムが上手く制御で
きたかどうかを示す尺度であり、抗体単独に定まる値で
ある。
【0097】ルックアップテーブルによる制御対象とな
る対象システムとしては、交通システム・生産システム
・物流システム・化学プラント・生物プラント・エレベ
ータ群管理システム等、種々のシステムが考えられる。
【0098】(第1の実施形態)本発明の第1の実施形
態について説明する。
【0099】図1に、本実施形態に係るルックアップテ
ーブル設計装置の構成を示す。本ルックアップテーブル
設計装置は、ハードウェアとして実現可能であり、また
ルックアップテーブル自体も含めてプログラムおよびデ
ータとして実現可能である。
【0100】本ルックアップテーブル設計装置は、抗体
格納部5、候補抗体産生部4、抗体評価値決定部3、パ
ラメータ入力部2、学習・設計管理部1、ルックアップ
テーブル作成部6を備えている。
【0101】抗体格納部5は、ルックアップテーブルの
入力ベクトル(センサの出力値またはこれを加工した
値)および出力ベクトル(対象システムに対する制御パ
ラメータまたはこれを得る元となるデータ)のコーディ
ング単位である抗体とその濃度とを対応付けて記憶する
機能と、指定された抗体の濃度を更新後の値に書き替
え、指定された抗体とその濃度のデータを削除し、およ
び生成された抗体の情報を格納する機能と、入力ベクト
ル空間のうちの所定の範囲内に含まれる抗体(近傍抗
体)を検索・抽出する機能とを有する。近傍抗体の検索
・抽出では、例えば、入力ベクトル空間をメッシュ分割
した場合に、指定された入力ベクトルの属するメッシュ
とその回りのいくつかのメッシュを、所定の範囲として
検索・抽出を行う。
【0102】候補抗体産生部4は、必要に応じて抗体格
納部5に追加格納すべき新たな候補抗体を生成する。例
えば、候補抗体数が規定個数以下の場合に所定個数の生
成を行う。
【0103】抗体評価値決定部3は、指定された抗体の
コーディング内容に基づいて、ルックアップテーブルの
適用対象となる対象システムSをモデル化したシミュレ
ータもしくは順方向モデルによるシミュレーション演算
もしくは順方向モデル演算を実行することにより、該指
定された抗体の評価値を求める。
【0104】パラメータ入力部2は、ユーザ(または他
のプロセスや装置)から学習やルックアップテーブル設
計に用いるパラメータを入力する。
【0105】学習・設計管理部1は、入力された学習パ
ラメータに基づき学習過程を管理し、また入力されたル
ックアップテーブル設計パラメータに基づきルックアッ
プテーブル設計過程を管理する。
【0106】学習過程では、抗体格納部5による近傍抗
体の抽出、必要に応じて行う候補抗体産生部4による近
傍抗体の追加、抗体評価値決定部3による近傍抗体の評
価、全近傍抗体の評価値を考慮した各近傍抗体の濃度の
更新、濃度をもとにした削除する抗体の選択からなる一
連の処理を、繰り返し行う。
【0107】また、学習過程では、一連の処理の各サイ
クルごとに、近傍抗体を得るための基礎となるパラメー
タや上記のシミュレータもしくは順方向モデルの内部パ
ラメータを変更していく。なお、後述する実施形態で
は、この変更は抗体評価値決定部3で行い、また近傍抗
体を定めるための基礎となる入力ベクトルは、上記の内
部パラメータをもとに生成している。
【0108】ルックアップテーブル作成部6は、学習過
程終了後のルックアップテーブル設計過程において、そ
の時点で抗体格納部5に格納されている内容に基づいて
ルックアップテーブルの内容を決定し、ルックアップテ
ーブルに記憶させる。例えば、ルックアップテーブルの
入力ベクトル空間の各メッシュの内容として、そのメッ
シュを中心とするある範囲に含まれる全抗体(例えば近
傍抗体)のうちから濃度をもとに選択した抗体(例えば
最大濃度を持つ抗体)のコーディング内容を採用するこ
とで、ルックアップテーブルの内容を決定する。
【0109】本実施形態によれば、ニューラルネットワ
ークのように設計者が学習用教師データを用意しなくて
も、計算シミュレーション上での自律的な試行錯誤の反
復によりルックアップテーブルの自動設計が可能とな
る。
【0110】以下、いくつかのより詳しい実施形態につ
いて説明する。
【0111】(第2の実施形態)本発明の第2の実施形
態について説明する。本実施形態のルックアップテーブ
ル設計装置は、処理過程として、最初に行われる学習過
程と次に行われるルックアップテーブル設計過程の2つ
処理過程を持ち、この2つの処理過程を経てルックアッ
プテーブルが作成される。学習過程は1つの学習サイク
ルを単位とし、所定の終了条件が成立するまで学習サイ
クルが繰り返し行われる。1つの学習サイクルでは、ル
ックアップテーブルに対する1つの入力ベクトルが選択
され、学習サイクルの都度変更される内部パラメータの
条件下で、該入力ベクトルの近傍にある抗体について学
習(近傍抗体の検索・抽出、必要に応じて行う新たな抗
体の生成、近傍抗体の評価、近傍抗体の濃度更新、濃度
に基づく抗体の取捨選択)が行われる。
【0112】図2に、本実施形態のルックアップテーブ
ル設計装置の構成を示す。図3に、本実施形態の抗体学
習時の処理の流れを示す。図6に、本実施形態の学習後
のルックアップテーブル作成時の処理の流れを示す。本
ルックアップテーブル設計装置は、ハードウェアとして
実現可能であり、またルックアップテーブル自体も含め
てプログラムおよびデータとして実現可能である。
【0113】図2に示されるように、本ルックアップテ
ーブル設計装置は、学習・設計管理部1、パラメータ入
力部2、抗体評価値決定部3、候補抗体産生部4、抗体
格納部5、ルックアップテーブル作成部6、ルックアッ
プテーブル記憶部7を備えている。
【0114】抗体格納部5は、ルックアップテーブルに
対する入力ベクトルおよび出力ベクトルのコーディング
単位である抗体とその濃度とを対応付けて記憶する抗体
データベース52、入力ベクトルを検索キーとして近傍
抗体(ある入力ベクトルに対して所定の範囲内にある入
力ベクトル抗を持つ抗体)を抗体データベース52から
抽出する近傍抗体検索部51、指定された抗体の濃度の
更新、および指定された抗体の削除および新たに生成さ
れた抗体とその初期濃度の格納を抗体データベース52
に対して行うデータ変更部53を有する。
【0115】候補抗体産生部4は、ある学習サイクルに
おいて、近傍抗体内の抗体数が規定個数以下の場合に、
抗体格納部5に追加格納すべき新たな候補抗体、すなわ
ち入力ベクトルのコーディング部および出力ベクトルの
コーディング部からなるデータを生成する。本実施形態
では、新たな抗体の入力ベクトル部分には、近傍抗体の
検索・抽出の基礎となった入力ベクトルを用いるので、
候補抗体産生部4は、実際には、出力ベクトルを生成
し、このを上記の入力ベクトルに結合する処理を行う。
【0116】パラメータ入力部2は、ユーザから学習パ
ラメータおよびルックアップテーブル設計パラメータの
入力を行う。なお、ユーザが入力するのではなく、他の
実行プロセスあるいは装置からパラメータ入力部2を介
して学習パラメータおよびルックアップテーブル設計パ
ラメータを受け取るようにしてもよい。
【0117】抗体評価値決定部3は、パラメータ自動変
更部31、シミュレーション実行部32、シミュレーシ
ョン結果評価部33を有する。パラメータ自動変更部3
1は、学習サイクルごとに、シミュレーション実行部3
2にて用いる内部パラメータを変更していく。シミュレ
ーション実行部32は、学習サイクルごとに、パラメー
タ自動変更部31により与えられた内部パラメータを用
いて、入力ベクトルの元となる観測値rを求める第1の
シミュレーション処理を行う。また、シミュレーション
実行部32は、学習サイクルごとに、パラメータ自動変
更部31により与えられた内部パラメータと指定された
抗体の出力ベクトルから得られる制御パラメータとを用
いて制御対象の動作を模擬した第2のシミュレーション
処理を行う。第2のシミュレーション処理は、指定され
た各抗体それぞれについて行われる。シミュレーション
結果評価部33は、第2のシミュレーション処理の結果
(例えば、制御対象の動作結果を示す所定のパラメー
タ)からその抗体の評価値を求める。
【0118】シミュレーション実行部32が行う第1の
シミュレーション処理では、ルックアップテーブルの適
用対象となる対象システムSをモデル化した計算シミュ
レータもしくは順方向モデルであって、対象システムS
に対するルックアップテーブルの出力に依存せずに、内
部パラメータから観測値をシミュレートすることを目的
としたものを用いる。
【0119】シミュレーション実行部32が行う第2の
シミュレーション処理では、ルックアップテーブルの適
用対象となる対象システムSをモデル化した計算シミュ
レータもしくは順方向モデルであって、内部パラメータ
と制御パラメータから対象システムSについての所定の
挙動あるいは所定の特性値を求めることを目的とするも
のを用いる。例えば、交通信号の制御のためのルックア
ップテーブルを設計する場合に、計算シミュレータとし
て前述のTRANSYTを用いるような場合が考えられ
る。
【0120】学習・設計管理部1は、入力された学習パ
ラメータおよびルックアップテーブル設計パラメータに
基づいて学習過程およびルックアップテーブル設計過程
を管理するもので、入力変換部11、出力変換部12、
学習管理部13、設計管理部14を有する。
【0121】入力変換部11は、シミュレーション実行
部32の第1のシミュレーション処理により得られた観
測値のデータを入力ベクトルに変換する。
【0122】出力変換部12は、指定された抗体の持つ
出力ベクトルをシミュレーション実行部32の第2のシ
ミュレーション処理に適合する形式に変換する。
【0123】学習管理部13は、学習過程を管理するも
ので、評価対象となった抗体のコーディング内容および
濃度、または抗体データベース52におけるその格納位
置を示す抗体格納アドレス情報を格納する抗体バッファ
131、評価対象となった抗体の評価値を格納する評価
値バッファ132、評価対象となった全抗体の評価値を
もとに該全抗体それぞれの濃度を更新する濃度更新演算
部133、濃度に基づいた所定の基準に従って抗体を削
除する抗体削除部134を有する。
【0124】設計管理部14は、ルックアップテーブル
設計過程を管理するもので、ルックアップテーブル作成
部6に対して動作開始の契機を与えるなどの制御を行
う。
【0125】ルックアップテーブル作成部6は、抗体格
納部5に格納された内容に基づいてルックアップテーブ
ルの内容を決定しルックアップテーブル記憶部7に記憶
させるもので、メッシュ状に分割されたルックアップテ
ーブルをメッシュ単位でスキャンする制御を行う入力ス
キャン部61、対象メッシュに対する近傍抗体を格納す
る抗体バッファ62、抗体バッファ62に格納された近
傍抗体のうちから最大の濃度を持つ抗体を検出する最大
濃度抗体検出部63、最大濃度抗体検出部63により検
出された抗体のコーディング内容の出力ベクトルに相当
する部分または入力ベクトルと出力ベクトルの両方の部
分をルックアップテーブル7の該当部分に書き込むルッ
クアップテーブル書込部64を有する。
【0126】次に、図3のフローチャートを参照しなが
ら本実施形態における学習過程すなわち抗体学習時の処
理手順について説明する。
【0127】(ステップS11)ステップS11では、
例えばGUI(graphical user int
erface)等を用いたパラメータ入力部2により、
ルックアップテーブルへの入力ベクトルの各次元変数の
最大値および最小値、各次元ごとのメッシュ分割数、各
次元ごとの近傍メッシュのサイズ(数)、近傍抗体の規
定個数、新たに生成された抗体に与える抗体初期濃度等
の学習パラメータおよびルックアップテーブル設計パラ
メータを指定する。
【0128】近傍メッシュのサイズ(数)は、あるメッ
シュからみてどの隣接範囲までを近傍とするかを示すメ
ッシュ数の規定値である。例えば、ある次元についてサ
イズ=1の場合はその次元ではそのメッシュおよび両隣
のメッシュが近傍メッシュとなる。また、例えば、入力
ベクトルが2次元の場合に、各次元についてサイズ=1
の場合は近傍メッシュは9つ存在する。
【0129】近傍抗体は、あるメッシュおよびその近傍
メッシュの範囲に含まれる抗体である。より詳しくは、
ステップS13にて定められた入力ベクトルの属するメ
ッシュを中心とする近傍メッシュの範囲内に含まれる入
力ベクトルを持つ抗体である。
【0130】最大値、最小値、メッシュ分割数、近傍メ
ッシュのサイズは、近傍抗体検索部51において保存さ
れ用いられる。また、最大値、最小値、メッシュ分割
数、近傍メッシュのサイズは、ルックアップテーブル設
計パラメータとしてルックアップテーブル作成部6にお
いても使用される。
【0131】近傍内抗体の規定個数は、ステップS15
において、ステップS16の新たな候補抗体を生成する
処理を起動するか否かの判断に使用される。
【0132】抗体初期濃度は、ステップS16にて新た
な候補抗体が生成され抗体データベース52および抗体
バッファ131に追加される際に記憶される初期濃度で
あり、一定の値が設定される。
【0133】(ステップS12)ステップS12では、
パラメータ自動変更部31において、抗体評価決定部3
で用いる対象システムSをモデル化した計算シミュレー
タもしくは順方向モデルの内部パラメータを、それらが
生じ得る(あるいは生じ得ると仮定した)範囲を夫々網
羅するように学習サイクルごとに変更する処理を行う。
【0134】内部パラメータには、観測値から推定可能
な対象システムSの内部パラメータ(例えば図17の例
における下り交通量)の他に、前述した設定された観測
値からは知ることのできない対象システムSの内部パラ
メータp(pはベクトル)に相当するもの(例えば図1
7の例における流入交通量あるいは全交通量に占めるそ
の比率)が含まれる。本実施形態では、以下の2つの目
的を満足するため、この内部パラメータpを、生じ得る
(あるいは生じ得ると仮定した)範囲を網羅するように
何度も変更しながら、学習を行う。 (目的1)内部パラメータpに対して一意に求まる可観
測値を変換した入力ベクトルr´|pを間接的に変動さ
せることにより、入力ベクトル空間内でのr´の出現し
得るメッシュのほぼ全域について網羅的に抗体が生成さ
れ学習により改善される。 (目的2)各メッシュについて、入力ベクトルr´|p
が含まれ得るような内部パラメータpのいくつかのサン
プルについて抗体評価が行われるので、前述の従来手法
の問題点を解決し、ロバスト性を獲得することができ
る。
【0135】内部パラメータの変更方法としては、全く
ランダムに変更する方法、実際に対象システムSで内部
パラメータが変化する確率に従い確率的に変動させる方
法、内部パラメータベクトル空間を均等分割し、中央値
を網羅的にスキャンしていく方法など、種々の方法が考
えられる。
【0136】なお、パラメータ入力部2から内部パラメ
ータ変更方法の選択入力を受け付け、この入力に従った
方法で内部パラメータを変更するようにして、ユーザが
内部パラメータの変更方法を指定できるようにしてもよ
い。
【0137】(ステップS13)ステップS13では、
まず、ステップS12で設定された内部パラメータの条
件の下で、シミュレーション実行部32により第1のシ
ミュレーション処理としてシミュレーション演算もしく
は順方向モデル演算を行って、内部パラメータpから一
意に決まる可観測値r|pを求める。そして、求められ
た可観測値r|pを入力変換部11により入力ベクトル
r´|pに変換する。可観測値rと入力ベクトルr´は
一対一の関係にある。
【0138】なお、可観測値rと入力ベクトルr´とが
同一の場合には、この変換手続きは不要である。
【0139】(ステップS14)ステップS14では、
ステップS13で定められた入力ベクトルr´を検索キ
ーとして近傍抗体検索部51に入力し、近傍抗体検索部
51により、検索キーとして入力された入力ベクトルr
´の含まれるメッシュに対し、各次元毎に指定された近
傍内にある近傍メッシュに含まれる全ての近傍抗体のコ
ーディング内容および濃度、または抗体データベース5
2におけるその格納位置を示す抗体格納アドレス情報を
検索・抽出する。
【0140】例えば、図4に示すように、入力ベクトル
が2次元、メッシュ分割数が両次元とも8分割、近傍の
大きさが両次元とも1メッシュとする。図4において、
「黒丸」が抗体データベース52内に記憶されている抗
体の入力ベクトル相当部分が入力ベクトル空間に占める
座標、「×」が検索キーとして入力された入力ベクトル
が占める座標とすると、ハッチングされた9つの近傍メ
ッシュに含まれる4つの抗体(4つの黒丸)が近傍抗体
検索部51により近傍抗体として抽出される。
【0141】抽出された近傍抗体のコーディング内容お
よび濃度、または抗体格納アドレス情報は、抗体バッフ
ァ131に一時保存される。
【0142】(ステップS15,S16)ステップS1
5,S16では、必要に応じて新たな候補抗体を生成す
る処理を行う。
【0143】すなわち、ステップS14での検索・抽出
の結果、抽出された近傍抗体の数が予め指定された規定
個数を下回った場合には(ステップS15)、候補抗体
産生部4により、新たな候補抗体を生成する(ステップ
S15)。
【0144】新たな候補抗体の生成方法としては、例え
ば、所定の手順で出力ベクトルを作成し、そしてステッ
プS13で定められた入力ベクトルとこの作成された出
力ベクトルとの双方を結合して抗体にコーディングする
ことにより生成する方法が考えられる。
【0145】出力ベクトルの作成方法としては、例え
ば、内部パラメータpの設定下での最適な出力ベクトル
x|pを山登り法などの探索手法により求める方法が考
えられる。また、山登り法の他にも、遺伝的アルゴリズ
ムの様にランダム生成や近傍内の他の抗体を雛形にして
突然変異、交叉などの手段により出力ベクトルを作成す
る手段もあり得る。その他にも、種々の方法が考えられ
る。
【0146】図5に抗体生成の一例を示す。ここでは、
センサ入力x1=0.5,x2=3.0,x3=1.0
を入力ベクトルとし、出力ベクトルの雛形(1.0,
0.6)を適宜微調整したy1=1.2,y2=0.5
を出力ベクトルとし、これらを結合した(0.5,3.
0,1.0,1.2,0.5)を新たな抗体としてコー
ディングしている。
【0147】新たに生成された候補抗体は、データ変更
部53を通じて抗体初期濃度とともに抗体データベース
52に追加記憶される。また、先に抽出された近傍抗体
と同様に、生成された候補抗体のコーディング内容およ
び濃度、または抗体格納アドレス情報が抗体バッファ1
31に追加保存される(つまり、生成された候補抗体が
評価対象の近傍抗体に追加される)。
【0148】このように抽出された近傍抗体の数が予め
指定された規定個数を下回った場合に新たな候補抗体を
生成することにより、各メッシュの近傍に存在する抗体
の数に偏りが生じるのを防ぐことができる。近傍抗体の
数が多過ぎると濃度更新の際の抗体評価に計算時間を要
し、また少な過ぎると後述する近傍内での抗体の相対評
価ができなくなるが、本実施形態によれば近傍抗体数を
常に2以上規定個数以下の適正抗体数に保つことができ
る。
【0149】また、本実施形態によれば、内部パラメー
タpを変動させた際に出現し得る入力ベクトルの近傍抗
体以外は始めから生成されないため、利用されない候補
抗体を作成・追加することを避け学習の効率化、メモリ
の節約を図ることができる。
【0150】(ステップS17〜S19)ステップS1
7〜S19では、近傍抗体の相対評価を行う。ここで、
抗体バッファ131には、ステップS13で定められた
入力ベクトルに関連する近傍抗体の情報、すなわちステ
ップS14にて抽出された各近傍抗体に関する情報と、
ステップS16にて新たに抗体が生成された場合にその
抗体に関する情報が一時保存されている。
【0151】まず、ステップS17にて、抗体バッファ
131内に一時保存されている近傍抗体のうちの1つに
ついて、該抗体バッファ131から(抗体バッファ13
1にコーディング内容および濃度が格納されている場
合)または抗体データベース52から(抗体バッファ1
31に抗体格納アドレス情報が格納されている場合)、
その抗体のコーディング内容の出力ベクトルに相当する
部分を取り出し、そして、出力変換部12により、取り
出された該出力ベクトルに相当する部分をシミュレーシ
ョン実行部32による第2のシミュレーション処理に適
合する形式に変換する。
【0152】次に、ステップS18にて、シミュレーシ
ョン実行部32において、出力変換部12の出力データ
を制御パラメータとして入力し、これと先に定められた
内部パラメータを用いて、第2のシミュレーション処理
(第2の計算シミュレーションもしくは順方向モデル演
算)を行う。シミュレーション結果評価部33は、この
第2のシミュレーション処理の結果として得られたデー
タに基づいて、評価対象の抗体の評価値を求める。求め
られた抗体の評価値は、評価値バッファ132に一時保
存される。
【0153】上記のステップS17およびステップS1
8からなる処理を、抗体バッファ131に一時保存され
ている各近傍抗体について繰り返し行い(ステップS1
9)、当該学習サイクルで対象となった全近傍抗体の評
価値を求める。
【0154】先の第1のシミュレーション処理では、内
部パラメータpに対応するルックアップテーブルの対象
システムSの可観測値ベクトルr|pを求め、これから
入力ベクトルr´|pを求めたが、この第2のシミュレ
ーション処理では、内部パラメータpの設定下で、入力
ベクトルr´|p(可観測値ベクトルrと一対一対応)
の近傍抗体の出力ベクトル相当部分xをシミュレータ等
に入力した際の評価値F|p,xを見積もっている。本
実施形態では、このF|p,xを抗体評価基準とし、p
を変動させながら学習を行うことにより、ある入力ベク
トルr´の近傍にあるときに、内部パラメータp|r´
がどのような値であっても常にFが相対的に優れたロバ
スト性を持つような出力xのコーディングされた抗体の
濃度が増加する。これにより、前述した従来手法の問題
点2を、対象システムSの逆方向モデルを作成・解析す
る手間なしに解決することが可能となる。
【0155】なお、出力ベクトルがそのまま第2のシミ
ュレーション処理に適合する形式である場合には、上記
の変換は不要である。
【0156】(ステップS20)ステップS20では、
濃度更新演算部133により近傍抗体それぞれについて
全近傍抗体の評価値を用いた所定の濃度更新演算を行
い、そして、データ変更部53を通じて抗体データベー
ス52に記憶されている該当する近傍抗体の濃度の更新
を行う。
【0157】濃度更新演算では、例えば、抗体評価値決
定部3により求められた全近傍抗体の評価値の平均値を
求め、濃度更新の対象となる抗体の評価値と該平均値の
大小関係に応じて一定量を該抗体の濃度から増減するこ
とにより、抗体の濃度更新を行う。
【0158】例えば、以下の式に基づき濃度更新を行う
方法がある。ここで、Fjは抗体jの評価値である。次
の式では値が大きいほど評価が優れているものとする。
nは近傍内抗体の数、Cjは抗体jの濃度、Δは濃度増
減値である。 ΣFk/n≦Fj → Cj=Cj+Δ ΣFk/n>Fj → Cj=Cj−Δ ここで、Fkの総和を取る範囲は、K=1〜nである。
【0159】あるいは、以下の式に基づき、濃度を各抗
体の勝率とみなして濃度変更を行う方法がある。ここ
で、Sjは抗体が抗体データベース52に追加されてか
ら経過したステップ数であり、抗体格納部5内に記憶さ
れるものとする。 ΣFk/n≦Fj → Cj=(SjCj+1)/(S
j+1) ΣFk/n>Fj → Cj=SjCj/(Sj+1) ここで、Fkの総和を取る範囲は、K=1〜nである。
【0160】他の濃度更新方法としては、入力ベクトル
空間における抗体と入力のユークリッド距離に応じた重
み付け平均を利用する方法、近傍抗体内での順位に応じ
た値を濃度から増減する方法など、種々の方法が考えら
れる。
【0161】このような濃度更新方法によれば、メッシ
ュにより抗体評価値の相場に大幅なばらつきがある場合
でも、近傍内での相場に対し相対的に評価値が優れた抗
体の濃度が増すため、評価値の絶対基準を各メッシュ毎
に定める必要がなく、学習パラメータの設定が著しく容
易になる。例えば、前述のTRANSYTにおける評価
指標P.I.を評価値として用いた場合、メッシュの交
通量の総量平均に応じて著しく良不良の基準値が変動
し、濃度増減の基準もメッシュにより異なるが、本方式
によれば濃度増減の基準をユーザが個別に定める必要が
なくなる。
【0162】また、本実施形態では、上記のように抗体
が競合する範囲を入力ベクトル空間の近傍メッシュ内に
限定しているので、入力ベクトル空間上での多様性が保
たれ、各メッシュ(ルックアップテーブルの各アドレ
ス)に対応する抗体がまんべんなく得られることにな
る。つまり、計算シミュレータもしくは順方向モデルに
おける内部パラメータpの変動により観測され得るr|
pのいずれかに対応する抗体がまんべんなく得られる。
【0163】(ステップS21)ステップS21では、
抗体削除部134において、全近傍抗体から更新後の濃
度が最小しきい値を下回った抗体を抽出し、これらを抗
体データベース52より削除するよう、データ変更部5
3に指示を出す。この指示をうけたデータ変更部53
は、指定された抗体とその濃度の情報を抗体データベー
ス52より削除する。これにより、抗体データベース5
内に不適合な抗体が維持されることを防ぐことができ
る。
【0164】抗体初期濃度や最小しきい値の設定の仕方
には、種々の形態が考えられ、一例としては、抗体初期
濃度を零に設定した場合に、最小しきい値を零に設定す
る方法が考えられる。なお、最小しきい値もパラメータ
入力部2から設定されるようにしてもよい。
【0165】(ステップS22)ステップS22では、
予め設定した学習終了条件が達成されたか否か判断し、
予め設定した学習終了条件が達成されたと判断された場
合には、その時点で学習を終了する。また、予め設定し
た学習終了条件が達成されていないと判断された場合に
は、ステップS11に戻り、次の学習サイクルを行う。
【0166】終了判定にあたっては、反復回数、内部パ
ラメータの網羅状況、入力ベクトル空間の各メッシュに
おける抗体の最大濃度の値、などの諸条件を総合的に判
定して、学習を継続するかどうかを判定するのが好まし
い。
【0167】ところで、上記では近傍抗体検索部51に
おいて使用する近傍の大きさ(すなわち近傍メッシュの
サイズ)は一定であったが、その代わりに近傍の大きさ
を学習の進行状況に応じて次第に小さくするように設定
してもよい。この場合、本ステップS22において近傍
メッシュサイズの変更を行う。
【0168】これにより、ユーザが適切な近傍の大きさ
を決められない場合、抗体が少ない内は近傍を大きくと
ることでそれぞれのメッシュの抗体の濃度変更される機
会を増やしロバストな抗体を得ることを優先され、学習
が進み抗体が多くなるに従い近傍を小さくすることで、
入力ベクトル空間の狭い領域に特化した抗体を得ること
が優先されるようになり、学習の進行状況に応じた近傍
サイズを設定できる。
【0169】以上のようにして、抗体の学習が完了し、
ルックアップテーブルの作成のもととなるデータが生成
される。なお、この時点ではまだ、ルックアップテーブ
ルの入力ベクトル空間の分割はなされていない状態であ
る。
【0170】次に、図6のフローチャートを参照しなが
ら本実施形態におけるルックアップテーブル設計過程す
なわち学習後のルックアップテーブル作成時の処理手順
について説明する。
【0171】ルックアップテーブル設計過程では、学習
過程で得られた抗体をもとに、各メッシュについて、そ
の近傍メッシュのうちから当該メッシュに対する出力ベ
クトルを選択していく。この結果として、ルックアップ
テーブルの入力ベクトル空間の分割がさなれる。
【0172】ルックアップテーブル設計過程は、学習過
程の終了に応答して(または学習過程の終了後に外部か
ら与えられる指示に応答して)設計管理部14が入力ス
キャン部61に起動指示を与えることで開始される。
【0173】まず、ステップS38において全メッシュ
のスキャンが終了したと判断されるまで、ステップS3
1〜S37の一連の処理が繰り返される。この処理の1
回の繰り返しにより、ルックアップテーブルの1つのメ
ッシュの内容が決定される。
【0174】すなわち、まず、ステップS31におい
て、入力スキャン部61により、スキャン開始時には入
力ベクトル空間上の最初のメッシュに対象を設定し、ま
たそれ以降は次のメッシュに対象を移動する。なお、こ
のステップS31では、入力ベクトル空間上の全メッシ
ュをもれなくスキャンするように、上記の一連の処理の
繰り返しごとに対象メッシュを順次移動していく。
【0175】次に、ステップS32において、対象とさ
れたメッシュの中央値を検索キーとして近傍抗体検索部
51に入力し、近傍抗体を抽出する。抽出された近傍抗
体のコーディング内容および濃度、または抗体格納アド
レス情報は、抗体バッファ62に一時保存される。
【0176】なお、ここで用いる各次元ごとの近傍メッ
シュのサイズは、学習過程と同じ値を用いてもよいし、
ステップS11にてルックアップテーブル設計過程用と
して入力された近傍メッシュのサイズの値を用いてもよ
い。
【0177】例えば、入力ベクトルが2次元、近傍の大
きさが両次元とも1メッシュとし、抗体データベース5
2中の内容のうち入力ベクトル空間の一部を切り出した
部分(隣接する12個のメッシュ)が図7に示すような
状態になっていたものとす。ここで、図7中括弧内の数
字がその抗体の濃度を示すものとする。この場合、m1
のメッシュが対象である場合には、m1を中心とする9
つのメッシュに含まれる抗体1〜抗体10が検索され、
m2のメッシュが対象である場合には、m2を中心とす
る9つのメッシュに含まれる抗体5〜抗体14が検索さ
れる。
【0178】次に、ステップS33において、近傍抗体
が抽出されたか否かを判断する。
【0179】近傍抗体が1つも抽出されなかったならば
ステップS34において、後にユーザへの通知処理を行
うために該当するメッシュ位置を保存し、ステップS3
1に戻る。
【0180】一方、近傍抗体が抽出されたならば、次の
ステップS35に移る。
【0181】ステップS35では、抗体検出部63によ
り、ステップS32で抽出され抗体バッファ62に一時
保存されている近傍抗体の中で最大の濃度を持つ抗体を
検出する。
【0182】例えば、上記の図7の例では、m1のメッ
シュが対象である場合には、抗体1〜抗体10のうちか
ら最も高い濃度(30)を持つ抗体3が検出され、m2
のメッシュが対象である場合には、抗体5〜抗体14の
うちから最も高い濃度(29)を持つ抗体9が検出され
る。
【0183】次に、ステップS36およびステップS3
7において、後述する第2の形式のルックアップテーブ
ルの書き込みおよび後述する第1の形式のルックアップ
テーブルの書き込みを、ルックアップテーブル書込部6
4により行う。もちろん、ステップS36とステップS
37の一方のみを実行して、いずれか一方の形式のルッ
クアップテーブルのみを作成するようにしてもよい。ま
た、ユーザにどの形式のルックアップテーブルを作成す
るかを選択させ、ユーザにより指定された1つまたは複
数の形式のルックアップテーブルを作成するようにして
もよい。
【0184】第1の形式のルックアップテーブルの書き
込みを行う場合、入力ベクトル空間のメッシュの中央値
を近傍抗体検索部51に検索キーとして入力して抽出さ
れた近傍抗体の中で最大の濃度を持つ抗体のコーディン
グ内容のうちの出力ベクトルに相当する部分を、ルック
アップテーブルの当該メッシュに相当するアドレスに書
き込む。なお、この書き込みを、全メッシュについて順
次行うことにより、抗体格納部5に格納されている抗体
をルックアップテーブルに変換することができる。
【0185】これにより、各メッシュ毎に最も優れた抗
体の出力ベクトルをルックアップテーブルに記憶させ、
学習結果をルックアップテーブルに変換できる。また、
得られた第1の形式のルックアップテーブルは、連想メ
モリとして実装できる。
【0186】第2の形式のルックアップテーブルの書き
込みを行う場合、入力ベクトル空間のメッシュの中央値
を近傍抗体検索部51に検索キーとして入力して抽出さ
れた近傍抗体の中で最大の濃度を持つ抗体のコーディン
グ内容を、ルックアップテーブルに書き込む。この書き
込みを、全メッシュについて順次行うことにうより、抗
体格納部5に格納されている抗体をルックアップテーブ
ルに変換することができる。
【0187】得られた第2の形式のルックアップテーブ
ルは、連想メモリとして実装することはできず、また近
傍抗体検索部51と同じ機能を持つルックアップテーブ
ル読出手段を必要とするが、第1の形式のルックアップ
テーブルより一般に記憶量が少なく、また第1の形式の
ルックアップテーブルを作成する際に同時に作成可能で
ある。
【0188】図8に、交通信号パラメータ決定用ルック
アップテーブル(第2の形式のルックアップテーブル)
の一例を示す。
【0189】このように、本実施形態に係るルックアッ
プテーブル設計装置では、学習の結果獲得された多様な
優れたコーディング単位をもとにルックアップテーブル
の内容を決定する過程を持ち、これによってルックアッ
プテーブルの領域分割のノウハウがなくても済む。
【0190】上記のようにしてルックアップテーブルの
設計が終了すると、ステップS39にて、入力ベクトル
空間の対象メッシュの中央値を近傍抗体検索部51に検
索キーとして入力した際に抽出された近傍抗体が存在し
なかったメッシュの位置を示す情報をユーザに通知す
る。
【0191】この通知の手段としては、入力ベクトル空
間におけるメッシュ中央値の座標をGUI上にビジュア
ルに表示する等の方法が考えられる。
【0192】なお、ユーザに抗体の存在するメッシュの
側を通知する方法もあり得る。
【0193】前述した手順で候補抗体産生部4により新
しい候補抗体を作成していくと、近傍内に抗体の存在し
ないメッシュが学習後に残る。これらは内部パラメータ
pをどう変動させても近傍に入力ベクトルが出現し得な
いメッシュであるか、あるいは学習が足りないかのいず
れかであるが、ユーザに前者と後者を判別させるための
情報を提供することができる。
【0194】次に、本実施形態における抗体学習時の処
理手順の他の例について説明する。
【0195】図9に、本実施形態の抗体学習時の他の処
理の流れを示す。
【0196】本手順は、基本的には図3の手順と同様で
あるが、ステップS115およびS116の処理とS1
21の処理が図3の手順と相違する部分である。以下で
は、相違する部分のみについて説明する。
【0197】図3のステップS15,S16の処理で
は、抽出された近傍抗体の数が予め指定された規定個数
を下回った場合に新たな候補抗体を生成したが、このス
テップS115およびS116の処理では、抽出された
抗体の数が予め指定された規定個数を下回った場合に、
新たな抗体を規定個数に達するまで繰り返し生成する。
【0198】このようにすれば、図3のステップS1
5,S16の処理よりもさらに各メッシュの近傍に存在
する抗体の数が平均化される。
【0199】また、図3のステップS21の処理では、
更新後の濃度が最小しきい値を下回った抗体を抗体デー
タベースより削除したが、このS121の処理では、抽
出された近傍抗体の中で濃度が最小の抗体を抗体データ
ベースより削除する。
【0200】。
【0201】なお、以上説明してきた本実施形態の構成
(図2)は適宜修正して実施することが可能である。例
えば、抗体評価検索部3内のパラメータ自動変更部31
とシミュレーション結果評価部33は、学習・設計管理
部1の内部構成とすることもできる。また、例えば、学
習・設計管理部11内の入力変換部11、出力変換部1
2および抗体バッファ14を抗体評価検索部3の内部構
成とし、評価値バッファ132、濃度更新演算部133
および抗体削除部134を抗体評価値決定部3または抗
体格納部5の内部構成とすることもできる。特に、本実
施形態をプログラムおよびデータで実現する際に、必ず
しも図2のような形態に忠実にモジュールを階層構造化
してプログラミングしなくてもよく、図2と等価な機能
を実現する種々の構造を持つプログラムを組む自由度が
存在する。
【0202】以上のように本実施形態によれば、学習過
程において、必要に応じて候補抗体産部4によりルック
アップテーブルの内容のもととなる多種多様な入力ベク
トルおよび出力ベクトルのコーディング単位(抗体)を
生成し抗体データベース52に記憶するとともに、入力
ベクトル空間について局所的にすなわちある入力ベクト
ルを基準とする近傍内においてまず抗体評価値決定部3
により各近傍抗体を独立に評価し次に濃度更新演算部1
34により近傍抗体間の相対的な優良度を基準にして各
近傍抗体の濃度を更新しデータ変更部53により更新す
るとともに不要な抗体を抗体削除部134の指示のもと
データ変更部53により削除するので、多様性を維持し
つつより優れた制御を行う能力を持つと期待される抗体
の濃度を増加させていき、そして、学習過程終了後のル
ックアップテーブル設計過程において、抗体データベー
ス52に記憶されている抗体の濃度に基づいて、ルック
アップテーブルの内容を、メッシュ毎に近傍メッシュ内
で最大の濃度を持つ抗体を抽出することにより決定する
ので、過去のノウハウがなくても手間をかけず適切かつ
ロバスト性に優れたルックアップテーブルを自動設計す
ることができる。
【0203】(第3の実施形態)次に、本発明の第3の
実施形態について説明する。
【0204】図10に、本実施形態に係るルックアップ
テーブル設計装置の構成を示す。
【0205】本実施形態は、基本的には第2の実施形態
と同様であるが、n(nは2以上)個の抗体評価値決定
部31 〜3n を備えている点が相違する。
【0206】以下、本実施形態が第2の実施形態と相違
する点のみについて説明する。
【0207】本実施形態の抗体評価値決定部31 〜3n
は、それぞれ、パラメータ自動変更部31、第1のシミ
ュレーション実行部321、m(mは2以上)個の第2
のシミュレーション実行部3221 〜322m 、m個の
シミュレーション結果評価部331 〜33m を有する。
抗体評価値決定部31 〜3n の内部構成は、全て同様で
あるものとする。
【0208】本実施形態の抗体評価値決定部31 〜3n
の基本機能は、第2の実施形態の抗体評価値決定部と同
様である。また、本実施形態のパラメータ自動変更部3
1、第1のシミュレーション実行部321、第2のシミ
ュレーション実行部3221〜322m 、シミュレーシ
ョン結果評価部331 〜33m は、基本的には、第1の
実施形態のパラメータ自動変更部31、シミュレーショ
ン実行部32のうちの第1のシミュレーション処理の機
能、シミュレーション実行部32のうちの第2のシミュ
レーション処理の機能、シミュレーション結果評価部3
3と同様である。
【0209】なお、本実施形態をプログラムで実現する
場合、必ずしも予め抗体評価値決定部31 〜3n に相当
するn個の部分を実態として予め用意しておく必要はな
く、必要に応じてプロセスとして生成するようにしても
よい。この点は、各抗体評価値決定部31 〜3n 内にお
けるmの第2のシミュレーション実行部3221 〜32
m やm個のシミュレーション結果評価部331 〜33
m についても同様である。
【0210】本実施形態の抗体評価値決定部31 〜3n
では、m個の近傍抗体の評価をm組みの第2のシミュレ
ーション実行部3221 〜322m およびシミュレーシ
ョン結果評価部331 〜33m により並列処理できるよ
うにしている。これにより、図3の手順の内側の処理ル
ープ(ステップS17〜S19)を高速化することがで
きる。
【0211】また、各抗体評価値決定部31 〜3n のパ
ラメータ自動変更部31では相互に連携をとって、互い
に相違する内部パラメータを分担することにより、図3
の手順の外側の処理ループ(ステップS12〜S22)
をnループ分同時実行できるようにしている。
【0212】すなわち、本実施形態は、図3の手順にお
ける2重ループのそれぞれを高速化するように構成した
ものである。
【0213】また、本実施形態では、n個の抗体評価値
決定部31 〜3n が並列動作するので、抗体評価値決定
部31 〜3n からの出力も並列的になされる。したがっ
て、各抗体評価値決定部31 〜3n に対してデータ変更
部53を操作する権利を排他的に与える制御や、抗体デ
ータベース52の内容の一貫性を保つ制御等を行うのが
望ましい。また、例えばある抗体評価値決定部の結果に
応じて濃度を更新しようとした抗体が、他の抗体評価値
決定部の結果に従って既に削除されていた場合に、その
抗体の濃度更新指示を取り消すような制御を行ってもよ
い。
【0214】これにより、最も計算時間を要するシミュ
レーション演算もしくは順方向モデル演算を並列処理
し、学習時間を短縮することができる。
【0215】なお、第1の計算シミュレーションと第2
の計算シミュレーションを、同一種類のソフトウェアも
しくはハードウェアモジュールで実行することもあり得
る。この場合は、図10の第2のシミュレーション実行
部3221 〜322m のうちの1つを、第1の計算シミ
ュレーション演算を行う際に利用する。
【0216】(第4の実施形態)次に、第4の実施形態
について説明する。
【0217】本実施形態は、第2、第3の実施形態と同
様の構成を基本構成として有するので、以下では、相違
する部分についてのみ説明する。
【0218】第2、第3の実施形態では、第1のシミュ
レーション処理の前提となるセンサ仕様(センサ数、セ
ンサ種類、センサの配置形態等)および入力変換部11
において第1のシミュレーション処理の結果得られる観
測値を入力ベクトルに変換するための変換式あるいは変
換規則は、予め固定されて設定されたものであった。
【0219】本実施形態では、ユーザがパラメータ入力
部2のGUIを通じて、上記のセンサ仕様と変換式ある
いは変換規則とを入力可能とし、あるいは観測可能なセ
ンサ情報および該センサ情報のいくつかを統合処理する
ことにより得られる情報の中から、ルックアップテーブ
ルへの入力として利用する情報を選択入力できるように
し、本実施形態に係るルックアップテーブル設計装置
が、ユーザの入力に基づいたルックアップテーブルを作
成するようにしたものである。
【0220】本実施形態では、第2や第3の実施形態に
おける第1のシミュレーション処理の計算シミュレーシ
ョタもしくは順方向モデルに対して、ステップS11で
設定された内部パラメータの下でユーザから指定された
各センサにおいて観測される観測値を出力する機能を付
加するとともに、入力変換部11にはユーザから指示さ
れた変換式あるいは変換規則を用いる機能を付加する。
【0221】また、この変換式あるいは変換規則に依存
して、入力ベクトルの次元数が相違してくるので、ステ
ップS11において、ルックアップテーブルへの入力ベ
クトルの各次元変数の最大値および最小値、各次元ごと
のメッシュ分割数、各次元ごとの近傍メッシュのサイズ
(数)については、必要な情報が揃うように入力する。
また、図2や図10の各機能ブロック部分は、入力ベク
トルの次元数の変化に対応できる構成とする。
【0222】なお、第2や第3の実施形態における第2
のシミュレーション処理は、センサ仕様には依存しない
ので(第1のシミュレーション処理で得られた観測値や
入力ベクトルではなく第1のシミュレーション処理のも
ととなった内部パラメータを用いるので)、修正は不要
となる。
【0223】また、ユーザが内部パラメータをあいまい
な確率分布の形式でパラメータ入力部2のGUIを利用
して入力できるようにし、あいまいな形式で与えられた
内部パラメータには確率分布に従い学習中にランダムに
変動を加えることにより、内部パラメータのあいまいさ
の程度に応じたロバストなルックアップテーブルを自動
設計するようにしてもよい。
【0224】図11に、本実施形態を交通信号制御パラ
メータ決定用のルックアップテーブル設計に適用した場
合のGUI画面のイメージ図を示す。
【0225】ここでは、第1の画面(図中200)に
て、制御対象となる信号機(図中204)に加え、車両
感知器(図中201)を置く道路・車線・位置(図中2
02)や、必要に応じて画像処理装置などの比較的高価
な異種センサを置く箇所などをユーザはGUI上でメニ
ューとして用意したセンサアイテム(図中203)をド
ラッグ・アンド・ドロップなどすることにより自由に選
択・配置できる。また、複数車両感知器情報の平均値を
入力として使用するか否か、車両速度感知器と指定した
異種センサをどのように組み合わせるか、などをユーザ
はGUI上で、例えば、表示中の系統図上に配置された
所望のセンサとその処理内容(図示せず)とをマウスで
選択などすることにより入力することができる。さら
に、必要に応じて、第2の画面(図中300)にて、交
通量や平均車両速度の変動の大きいリンクや、調査不十
分なため具体的な値を特定できないリンクについて、フ
ァジィ理論におけるメンバーシップ関数のようなあいま
いな幅を持つ値としてシミュレーションパラメータを入
力できる。
【0226】しかるのちに本実施形態のルックアップテ
ーブル設計装置は、指定された条件に応じたルックアッ
プテーブルを自動生成する。
【0227】また、好ましくは、本実施形態のルックア
ップテーブル設計装置に、自動生成したこのルックアッ
プテーブルのパフォーマンスを評価して表示する機能を
付加すると効果的である。
【0228】パフォーマンスの評価方法としては、学習
過程で得られた濃度を参照して行う方法、作成されたル
ックアップテーブルを用いて、計算シミュレーショタも
しくは順方向モデルを種々の条件で動作させてみて、総
合的にルックアップテーブルを評価する方法、ルックア
ップテーブルが完成できなかったことをもって評価とす
る方法など、種々の方法が考えられる。
【0229】このようにすることにより、ユーザは、提
示されたテーブルとしてのパフォーマンスを参考にし
て、センサ位置の変更を行ったり、より詳細な交通量調
査を行う旨指定するなどの改善策を講じることができ
る。
【0230】また、指定した入力の元で自動設計された
ルックアップテーブルの制御調整性能を比較すること
で、目的に応じた監視系の設計がサポートできる。
【0231】また、例えば、交通量や平均車両速度が交
通調査によりほぼ一定とわかっている場所については、
交通シミュレータの内部パラメータを具体的な数値に固
定し、特に変動の大きい場所や、調査不十分なため具体
的な値を特定できない場所については、ファジィ理論に
おけるメンバーシップ関数のようなあいまいな幅を持つ
値として内部パラメータを指定することにより、制御調
整の対象システムSのあいまいさや変動の程度に応じた
テーブル設計が容易になる。
【0232】このように本実施形態によれば、対象シス
テムSの逆方向モデルをルックアップテーブルへの入力
として利用する情報の種類に合わせて解析する必要がな
く、入力ベクトルの種類にかかわらずほぼ同じ方式によ
り学習できるので、ユーザにルックアップテーブルへの
入力をその場で選択させ即学習させることが可能とな
る。
【0233】次に、本発明を適用したルックアップテー
ブル設計装置のプロトタイプシステムをプログラムとし
て作成し、簡単なシミュレーション実験を行った結果に
ついて、従来技術による結果との比較を交えながら説明
する。
【0234】ここでは、図17の15個の交差点、31
個のリンクからなる道路モデルを用いてシミュレーショ
ン実験を行った。この道路モデルは、中央の交差点8に
おいて上り交通流に対し脇から流入する交通流を持つ。
信号コントローラは、交差点1に備えられた車両感知器
によって上り下り各交通流量を測定し、本系統内におけ
る他の14個の交差点におけるオフセットをパラメータ
決定テーブルを用いて決定し、全交差点に指示する。こ
こでは、「サイクル」、「スプリット」は固定した。ま
た、それぞれの観測値は20%以内の観測誤差がランダ
ムに与えられるものとした。
【0235】プロトタイプシステムは、観測交通流量を
条件部(入力ベクトル)、設定すべきオフセットを結論
部(出力ベクトル)としてコーディングされた抗体を学
習により獲得する。抗体評価関数としては、前述のP.
I.をα=25として用いた。また、実用面を重視し学
習を高速化するため、新抗体の生成時にTRANSYT
自体の持つ最適化機能を利用した。TRANSYTの役
割は、第2の計算シミュレーション処理に相当する交通
流シミュレーションを行うことで抗体の評価値を決定す
ること、および山登り法によりある特定の内部パラメー
タ(図17における3つの交通量)の設定下での最適な
「オフセット」を求めることである。この最適オフセッ
トから候補抗体産生部4により候補抗体を生成する。
【0236】図12に2つの実験結果を示す。それぞれ
の学習を行った後、100ケースのランダムに発生させ
た異なる交通流量を設定し、プロトタイプシステムによ
り設定したパラメータ決定用ルックアップテーブルを用
いた場合のP.I.の平均値、従来手法により設計した
ルックアップテーブルを用いた場合のP.I.の平均
値、および前者がP.I.において勝っていたケースの
全ケースに対する割合を求めたものである。ここで用い
た従来方式とは、図16に示したように入力ベクトル空
間を7分割し、それぞれの分割における代表的な交通流
量を設定した最適化によりオフセット設計を行うもので
ある。
【0237】第1の例においては、上り下りそれぞれの
交通流量が基準値から90%の範囲でランダムに増減
し、流入交通流量は零と考えられる場合を想定して学習
させた。また、第2の例においては、流入交通流量も基
準値から90%の範囲でランダムに増減する場合を想定
し学習させた。
【0238】図12に示されるように、いずれの例にお
いても、本発明に係るルックアップテーブル設計装置を
用いて設計したルックアップテーブルによる制御の方が
ロバスト性において勝っていることがわかる。特に、第
2の例においては、2点の観測値のみでは脇からの流入
交通量が上り交通量観測値内において占める割合を推定
するのが不可能なため、従来手法に対しより優れたパフ
ォーマンスを示している。
【0239】(第5の実施形態)本実施形態は、これま
で説明した各実施形態(特に第2または第3の実施形
態)と同様の構成を基本構成として有するので、以下で
は、相違する部分について説明する。
【0240】本実施形態も、第4の実施形態と同様にG
UIに係るもので、ユーザがパラメータ入力部2のGU
Iを通して、センサ種類とセンサ情報の変換式、制御・
調整対象となる各機器の指定等を容易に行えるようにし
たものである。
【0241】図13、図14に、本実施形態を交通信号
制御パラメータ決定用のルックアップテーブル設計に適
用した場合のGUI画面のイメージ図を示す。
【0242】図13のウィンドウ301は、道路303
や信号機304などからなるシステム構成図上でルック
アップテーブルによる制御対象となる信号機(図中30
4のアイコン)をユーザが画面上でクリックするなどす
ることにより選択指定し(ここでは選択されたものを網
かけで示す)、さらに制御するパラメータなどのプロパ
ティ指定をサブ画面(図示せず)より行うためのウィン
ドウである。残りの信号機に関してもデフォルトパラメ
ータ使用などのプロパティ指定をサブ画面(図示せず)
より行う。
【0243】また、メイン画面301において、GUI
上でメニュー(図中302)として用意した、車両感知
器(図中305のアイコン)や行列長測定器(図中30
6のアイコン)等の所望のセンサを示すアイテムを、表
示中の構成図上の所望の箇所にドラッグ・アンド・ドロ
ップなどすることにより自由に選択・配置し、さらにセ
ンサの種類と取り付け箇所に応じて出現するプロパティ
入力画面(図示せず)を用いて、測定する情報などの詳
細情報を指定する操作により入力される。
【0244】図13に例示した内容においては、ユーザ
が信号機2〜4を選択指定し、また車両感知器A1〜A
8と行列長測定器B1をドラッグ・アンド・ドロップし
た様子を示している。選択指定された信号機2〜4は、
センサ出力に基づいて適応的にパラメータを変更する信
号機として扱われ、その他の信号機は固定パラメータで
制御する信号機として扱われる。
【0245】図14のウィンドウ311は、ユーザが設
定したセンサ構成により得られる観測値とルックアップ
テーブルの入力ベクトルとの関係、およびルックアップ
テーブルの出力ベクトルとユーザが選択指定した信号機
への出力値との関係をGUI上で定義するためのウィン
ドウで、予め用意された平均値演算(図中313)や最
大値選択演算(図中314)等の処理関数に相当する部
品がソールボックス上に表示され、ユーザが指定したセ
ンサからの入力に相当するノード(図中312)と、同
じくユーザが指定した各信号機への出力に相当するノー
ド(図中316)と、学習対象であるルックアップテー
ブルに相当するノード(図中315)が、画面上に表示
され、ユーザが各入力のノードおよび追加した関数ノー
ドの間をリンクにより接続できることを示している。
【0246】図14に例示した内容においては、図13
で設定されたセンサA1〜A8からの入力にに相当する
ノードおよび選択された信号機2〜4への出力に相当す
るノードと、ルックアップテーブルに相当するノード
と、ユーザがソールボックスから追加した2つの平均値
演算のノードと1つの最大値選択演算のノードが表示さ
れており、ユーザのリンク接続操作により、車両感知器
A1の観測値と車両感知器A2の観測値の平均値、車両
感知器A3の観測値と車両感知器A5の観測値の平均
値、車両感知器A4の観測値と車両感知器A6の観測値
と車両感知器A7の観測値の最大値、行列長測定器信号
機1の観測値がルックアップテーブルの入力ベクトルと
なることが入力されたことを示している。
【0247】GUIによる入力が終了すると、本実施形
態のルックアップテーブル設計装置は、指定された条件
に応じたルックアップテーブルを自動生成する。
【0248】なお、本実施形態では、第1のシミュレー
ション処理に対してステップS11で設定された内部パ
ラメータのもとでユーザから指定された各センサにおい
て観測される観測値を新たに演算し、演算不可能な場合
はユーザに知らせる機能を付加するとともに、入力変換
部11および出力変換部12にはユーザから指定された
変換式あるいは変換規則を用いる機能を付加する。
【0249】また、ルックアップテーブル入力ベクトル
および出力ベクトルの次元数がユーザにより変更される
ので、入力ベクトルの新たに発生した次元変数の最大最
小、メッシュ分割数、近傍メッシュのサイズ(数)、お
よび出力ベクトルの新たに発生した次元変数の最大最小
については、必要な情報をユーザが入力するか、あるい
は自動的にデフォルト値が設定される。図2や図10の
各機能ブロック部分は、次元数の変化に対応できる構成
とする。
【0250】なお、前述したように、好ましくは、本実
施形態のルックアップテーブル設計装置に、自動生成し
たこのルックアップテーブルのパフォーマンスを評価し
て表示する機能を付加すると効果的である。
【0251】このように本実施形態によれば、センサ情
報に基づき適応的にパラメータを変更する信号機と固定
パラメータで制御する信号機の指定、交通量に応じて適
応的に車両速度制限表示を変更する道路の指定等、ユー
ザにGUI上で自由に指定させ、指定した条件の元で自
動設計されたルックアップテーブルの制御性能を比較す
ることで、目的に応じた関し制御系の設計がサポートで
きる。
【0252】また、指定したセンサ構成により得られる
観測値とルックアップテーブルの入力ベクトルとの関係
を定義する情報、およびルックアップテーブルの出力ベ
クトルと指定した制御・調整対象機器への出力値との関
係を定義する情報を入力することが容易になる。
【0253】さらに、ユーザルックアップテーブルへの
入出力をその場で選択させた後に、即学習させ、さらに
作成されたルックアップテーブルの性能を表示し、ユー
ザがこれを参考にルックアップテーブルの入出力やセン
サ構成、制御・調整対象機器を変更するという、インタ
ラクティブなルックアップテーブルの設計が可能とな
る。
【0254】(第6の実施形態)本実施形態は、これま
でに説明した各実施形態(特に第2、第3、第5の実施
形態)と同様の構成を基本構成として有するので、以下
では、相違する部分について説明する。
【0255】本実施形態は、第4、第5の実施形態と同
様にGUIに係るもので、ユーザがパラメータ入力部2
のGUIを通して、センサ種類とセンサ情報の変換式、
制御・調整対象となる各機器の指定等を容易に行えるよ
うにしたものである。
【0256】図15に、本実施形態を交通信号制御パラ
メータ決定用のルックアップテーブル設計に適用した場
合のGUI画面のイメージ図を示す。
【0257】なお、本実施形態では、第5の実施形態に
おける図13で例示したウィンドウを用いて説明したよ
うなGUIを持ち、このようなウィンドウに表示された
システム構成図中に、車両感知器等のセンサや制御・調
整操作可能な信号機のID番号が表示されており、さら
に第5の実施形態と同様に、新たなセンサや信号を登録
できるものとする。
【0258】図15に例示したウィンドウは、表計算ソ
フトと同様の表形式の入出力が可能なGUIとなってお
り、システムの前記第1および第2のシミュレーション
もしくは順方向モデルの内部パラメータ(独立して指定
できる交通量など)に相当するセルと、演算された車両
感知器等の各センサの観測値に相当するセルと、学習対
象であるルックアップテーブルへの入力ベクトルの各要
素に相当するセルと、学習対象であるルックアップテー
ブルの出力ベクトルの各要素に相当するセルと、信号機
への各出力パラメータに相当するセルと、第2のシミュ
レーションもしくは順方向モデルの計算結果(各交差点
における車両の停止回数総和および遅れ時間総和など)
に相当するセルと、抗体評価値に相当するセルの、全て
かいずれか一部が用意されている。
【0259】このようなGUI環境において、ユーザは
各セルに演算式等を埋め込むことにより、例えばセンサ
種類とセンサ情報の変化式、制御・調整対象となる信号
機の指定、抗体評価式における重み係数の変更等、種々
の条件の設定や変更を容易に行うことができる。以下、
このようなGUIにて設定・変更可能な情報の例をいく
つか示す。
【0260】1つの入力操作としては、ルックアップテ
ーブルへの入力ベクトルの各要素に相当するセルに各観
測値に相当するセルの値を引数とし値を求める演算式を
埋め込むとともに、信号機への各出力パラメータに相当
するセルにルックアップテーブルの出力ベクトルの各要
素に相当するセルの値を引数の一部とし値を求める演算
式、もしくはデフォルト出力値を埋め込む操作が可能
で、図14のように観測値とルックアップテーブルの入
力ベクトルとの関係を定義する情報、およびルックアッ
プテーブルの出力ベクトルと制御・調整対象機器への出
力値との関係を定義する情報を入力することができる。
【0261】もう1つの操作は、各観測値に相当するセ
ルに、内部パラメータに相当するセルの値を引数として
観測値を求める第1の計算シミュレーションもしくは順
方向モデルに相当する演算式を埋め込むものである。
【0262】もう1つの操作は、各内部パラメータを変
動させる範囲および制約条件式を内部パラメータに相当
するセルに埋め込むものである。
【0263】もう1つの操作は、第2の計算シミュレー
ションもしくは順方向モデルの計算結果に相当するセル
に、内部パラメータに相当するセルの値と信号機への各
出力パラメータに相当するセルの値を引数として計算結
果を求める前記第2の計算シミュレーションもしくは順
方向モデルに相当する演算式を埋め込むものである。
【0264】もう1つの操作は、抗体データの評価値に
相当するセルに第2の計算シミュレーションもしくは順
方向モデルの計算結果に相当するいくつかのセルの値を
引数とし評価値を求める評価式を埋め込むものである。
【0265】なお、図15では、上記した7種類のセル
すべてを用いたものを例示したが、その一部のセルをサ
ポートする、すなわち上記の5つの操作のうちの一部を
サポートするGUIを用いても構わない。
【0266】GUIによる入力が終了すると、本実施形
態のルックアップテーブル設計装置は、指定された条件
に応じたルックアップテーブルを自動生成する。
【0267】なお、前述したように、好ましくは、本実
施形態のルックアップテーブル設計装置に、自動生成し
たこのルックアップテーブルのパフォーマンスを評価し
て表示する機能を付加すると効果的である。
【0268】本実施形態によれば、センサ構成により得
られる観測値とルックアップテーブルの入力ベクトルと
の関係を定義する情報、およびルックアップテーブルの
出力ベクトルと指定した制御・調整対象機器への出力値
との関係を定義する情報を入力・変更することが容易に
なる。
【0269】また、本実施形態によれば、計算シミュレ
ーションもしくは順方向モデル演算を作成・変更するこ
と、評価式を入力・変更することが容易になる。
【0270】なお、図15におけるGUIは、例えばM
icrosoft社のMicrosoft Excel
等の市販の表計算ソフト上のアドインシステムとして実
現することもできる。
【0271】以上の各実施形態にて説明した各機能は、
ハードウェアとしてもソフトウェアとしても実現可能で
ある。また、ソフトウェアとしても実現する場合、上記
した各手順あるいは手段をコンピュータに実行させるた
めのプログラムを記録した機械読取り可能な媒体として
実施することもできる。
【0272】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0273】
【発明の効果】本発明によれば、設計者の代わりに自動
的に計算シミュレーション実験を反復し、利用可能な入
力情報が多い少ないにかかわらず、与えられた入力−出
力変数の組み合わせに応じて最も適切かつロバスト性に
優れたルックアップテーブルの内容を自動設計もしくは
設計支援することが可能となる。
【0274】また、本発明に係るグラフィカル・ユーザ
・インタフェースを用いれば、ルックアップテーブル設
計の際の種々の情報の入力操作が容易になる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係るルックアップテ
ーブル設計装置の構成を示す概略機能ブロック図
【図2】本発明の第2の実施形態に係るルックアップテ
ーブル設計装置の構成を示す機能ブロック図
【図3】同実施形態の抗体学習時の処理の流れを示すフ
ローチャート
【図4】近傍メッシュから近傍抗体を抽出する処理につ
いて説明するための図
【図5】抗体生成処理の一例について説明するための図
【図6】同実施形態の学習後のルックアップテーブル作
成時の処理の流れを示すフローチャート
【図7】各メッシュの内容を決定する処理の一例を説明
するための図
【図8】交通信号パラメータ決定用ルックアップテーブ
ルの一例を示す図
【図9】同実施形態の抗体学習時の他の処理の流れを示
すフローチャート
【図10】本発明の第3の実施形態に係るルックアップ
テーブル設計装置の構成を示す機能ブロック図
【図11】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のGUI画面イメージの
一例を示す図
【図12】本発明を適用したルックアップテーブル設計
装置と従来のルックアップテーブル設計装置とについて
シミュレーション実験結果を比較するための図
【図13】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のGUI画面イメージの
一例を示す図
【図14】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のGUI画面イメージの
一例を示す図
【図15】交通信号制御パラメータ決定用のルックアッ
プテーブル設計に適用した場合のGUI画面イメージの
一例を示す図
【図16】従来のパタン選択制御用ルックアップテーブ
ルの分割の一例を示す図
【図17】交通信号制御システムの一例を示す図
【符号の説明】
1…学習・設計管理部 2…パラメータ入力部 3,31 〜3n …抗体評価値決定部 4…候補抗体産生部 5…抗体格納部 6…ルックアップテーブル作成部 7…ルックアップテーブル 11…入力変換部 12…出力変換部 13…学習管理部 14…設計管理部 31…パラメータ自動変更部 32…シミュレーション実行部 33,331 〜33m …シミュレーション結果評価部 321…第1のシミュレーション実行部 3221 〜322m …第2のシミュレーション実行部 51…近傍抗体検索部 52…抗体データベース 53…データ変更部 61…入力スキャン部 62…抗体バッファ 63…最大濃度抗体検出部 64…ルックアップテーブル書込部 131…抗体バッファ 132…評価値バッファ 133…濃度更新演算部 134…抗体削除部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G08G 1/00 G06F 15/60 630

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】所望のシステムの制御に使用するルックア
    ップテーブルの入力ベクトルおよび出力ベクトルの関係
    を調べる学習を計算シミュレータまたは順方向モデルを
    利用して行った後に、この学習の結果に基づいて該ルッ
    クアップテーブルの内容を決定するルックアップテーブ
    ル設計方法であって、 前記学習において、所定の条件の成立を契機として生成
    された、目的となるルックアップテーブルに対する入力
    ベクトルおよび出力ベクトルの対を含む抗体データに、
    その相対的な優良性を示す濃度を対応付けて複数記憶し
    ている抗体情報記憶手段から、入力ベクトル空間上にお
    ける所定の近傍範囲内に含まれる入力ベクトルを持つ抗
    体データを求めることを通して、評価対象とする複数の
    抗体データを定め、 評価対象とされた個々の抗体データについて所定の方法
    により評価値を求め、 求められた全ての前記評価値を考慮した各抗体データの
    評価値の相対的な優良性を基準にして、各抗体データの
    濃度を更新し、濃度を基に抗体データの取捨選択を行う
    ことを特徴とするルックアップテーブル設計方法。
  2. 【請求項2】前記学習は、評価対象とされた抗体データ
    の濃度の更新を、評価対象を変えながら繰り返し行われ
    るものであり、 各学習の繰り返し毎に、 第1の計算シミュレータまたは順方向モデルの内部パラ
    メータをランダムにまたは予め指定された手順により変
    更し、第1の計算シミュレーションまたは順方向モデル
    演算を行い、該第1の計算シミュレーションまたは順方
    向モデル演算の結果から予め指定された観測可能な情報
    を抽出してこれを変換して入力ベクトルを生成し、 ルックアップテーブルの入力ベクトルの各次元毎に指定
    された分割数に入力ベクトル空間を分割して形成される
    複数のメッシュのうちの前記入力ベクトルが含まれるメ
    ッシュに、これを起点として該各次元毎に指定された数
    だけ隣接するメッシュを加えてなる、近傍メッシュに含
    まれる全ての抗体データを求めることを通して、評価対
    象とする複数の抗体データを定め、 評価対象とされた個々の抗体データについて、そのコー
    ディング内容の出力ベクトルに相当する部分の値を変換
    して第1と同じ内部パラメータを想定した第2の計算シ
    ミュレータまたは順方向モデルに入力し、第2の計算シ
    ミュレーションまたは順方向モデル演算を行い、該第2
    の計算シミュレーションまたは順方向モデル演算の結果
    に基づいて、各抗体データの評価値を求めることを特徴
    とする請求項1に記載のルックアップテーブル設計方
    法。
  3. 【請求項3】前記ルックアップテーブルの内容を決定す
    るに際しては、 ルックアップテーブルの入力ベクトルの各次元毎に指定
    された分割数に入力ベクトル空間を分割して形成される
    複数のメッシュの各々について、 前記学習後における前記抗体情報記憶手段から、対象と
    なるメッシュとこれを起点として該各次元毎に指定され
    た数だけ隣接するメッシュとを加えてなる近傍メッシュ
    に含まれる全ての抗体データを求め、そのうち最大の濃
    度を持つ抗体データのコーディング内容の出力ベクトル
    に相当する部分を、ルックアップテーブルの該対象とな
    るメッシュに相当するアドレスに書き込む処理を行うこ
    とを特徴とする請求項1または2に記載のルックアップ
    テーブル設計方法。
  4. 【請求項4】前記ルックアップテーブルの内容を決定す
    るに際しては、 ルックアップテーブルの入力ベクトルの各次元毎に指定
    された分割数に入力ベクトル空間を分割して形成される
    複数のメッシュの各々について、 前記学習後における前記抗体情報記憶手段から、対象と
    なるメッシュとこれを起点として該各次元毎に指定され
    た数だけ隣接するメッシュとを加えてなる近傍メッシュ
    に含まれる全ての抗体データを求め、そのうち最大の濃
    度を持つ抗体データのコーディング内容をルックアップ
    テーブルに書き込む処理を行うことを特徴とする請求項
    1または2に記載のルックアップテーブル設計方法。
  5. 【請求項5】複数の前記第1の計算シミュレータまたは
    順方向モデルにより、複数の前記入力ベクトルを並行し
    て生成するとともに、 生成された前記複数の入力ベクトルの各々について前記
    評価対象とされた個々の抗体データの評価値を求める処
    理を、複数の前記第2の計算シミュレータまたは順方向
    モデルにより、並行して実行することを特徴とする請求
    項1または2に記載のルックアップテーブル設計方法。
  6. 【請求項6】グラフィカル・ユーザ・インタフェースを
    用いて制御・調整対象であるシステムの構成図を表示
    し、 前記グラフィカル・ユーザ・インタフェースにより入力
    されるセンサ構成に関する情報および指定したセンサ構
    成により得られる観測値とルックアップテーブルへの入
    力ベクトルとの関係を定義する情報を受け付け、 入力された前記情報に基づいてルックアップテーブルを
    設計することを特徴とする請求項1または2に記載のル
    ックアップテーブル設計方法。
  7. 【請求項7】グラフィカル・ユーザ・インタフェースを
    用いて、制御・調整対象であるシステムの構成図を表示
    し、 グラフィカル・ユーザ・インタフェースにより入力され
    るあいまいな確率分布の形式で表現された前記システム
    の内部パラメータの情報を受け付け、 前記情報が入力された場合、あいまいな形式で与えられ
    た内部パラメータには与えられた確率分布に従ってラン
    ダムに変動を加えて学習することを特徴とする請求項1
    または2に記載のルックアップテーブル設計方法。
  8. 【請求項8】グラフィカル・ユーザ・インタフェースを
    用いて制御・調整対象であるシステムの構成図を表示
    し、 前記グラフィカル・ユーザ・インタフェースにより入力
    されるセンサ構成に関する第1の情報、制御・調整対象
    となる各機器に関する第2の情報、指定したセンサ構成
    により得られる観測値とルックアップテーブルの入力ベ
    クトルとの関係を定義する第3の情報およびルックアッ
    プテーブルの出力ベクトルと指定した制御・調整対象機
    器への出力値との関係を定義する第4の情報を受け付
    け、 入力された前記情報に基づいてルックアップテーブルを
    学習により設計することを特徴とする請求項1または2
    に記載のルックアップテーブル設計方法。
  9. 【請求項9】予め用意された処理関数に相当する部品の
    選択を受け付け、選択された該部品を、その種類が視覚
    的に識別可能な処理関数に相当するノードとして画面上
    に表示するとともに、 前記システム構成図上で指定されたセンサからの入力に
    相当するノードと、前記システム構成図上で指定した各
    制御・調整対象機器への出力に相当するノードと、学習
    対象であるルックアップテーブルに相当するノードと
    を、画面上に表示し、 グラフィカル・ユーザ・インタフェースにより入力され
    る、所望の前記入力に相当するノードと所望の前記処理
    関数に相当するノードとの間をリンクにより接続すべき
    指定を受け付け、 この受け付けた指定に基づいて前記第3および第4の情
    報を得ることを特徴とする請求項8に記載のルックアッ
    プテーブル設計方法。
  10. 【請求項10】表形式の入出力が可能なグラフィカル・
    ユーザ・インタフェース上において、制御・調整対象シ
    ステムの前記第1の計算シミュレーションまたは順方向
    モデル演算の結果である各観測値に相当するセルと、制
    御・調整対象システムの前記第2の計算シミュレーショ
    ンまたは順方向モデル演算への各出力に相当するセル
    と、学習対象であるルックアップテーブルへの入力ベク
    トルの各要素に相当するセルと、学習対象であるルック
    アップテーブルの出力ベクトルの各要素に相当するセル
    の少なくとも一部を画面上に表示し、 前記グラフィカル・ユーザ・インタフェースにより入力
    される、前記ルックアップテーブルへの入力ベクトルの
    各要素に相当するセルに前記制御・調整対象システムの
    各観測値に相当するセルの値を引数とし値を求める演算
    式を埋め込む指定を受け付けるとともに、 前記グラフィカル・ユーザ・インタフェースにより入力
    される、前記制御・調整対象システムに対する各出力に
    相当するセルに前記ルックアップテーブルの出力ベクト
    ルの各要素に相当するセルの値を引数の一部とし値を求
    める演算式またはデフォルト出力値を埋め込む指定を受
    け付け、 これら受け付けた指定により得た前記観測値と前記ルッ
    クアップテーブルの入力ベクトルとの関係を示す演算式
    および前記ルックアップテーブルの出力ベクトルと前記
    制御・調整対象機器への出力値との関係を示す演算式に
    基づいてルックアップテーブルを学習により設計するこ
    とを特徴とする請求項2に記載のルックアップテーブル
    設計方法。
  11. 【請求項11】表形式の入出力が可能なグラフィカル・
    ユーザ・インタフェース上において、制御・調整対象シ
    ステムの前記第1および第2の計算シミュレーションま
    たは順方向モデル演算の内部パラメータに相当するセル
    と、制御・調整対象システムの前記第2の計算シミュレ
    ーションまたは順方向モデル演算の計算結果に相当する
    いくつかのセルと、前記各抗体データの評価値に相当す
    るセルの少なくとも一部をも画面上に表示し、 前記グラフィカル・ユーザ・インタフェースにより入力
    される、前記各観測値に相当するセルに、前記内部パラ
    メータに相当するセルの値を引数として観測値を求める
    前記第1の計算シミュレーションまたは順方向モデル演
    算に相当する演算式を埋め込む指定と、 前記グラフィカル・ユーザ・インタフェースにより入力
    される、前記内部パラメータに相当するセルに、該内部
    パラメータを変動させる範囲および制約条件式を埋め込
    む指定と、 前記グラフィカル・ユーザ・インタフェースにより入力
    される、前記第2の計算シミュレーションまたは順方向
    モデル演算の計算結果に相当するセルに、前記内部パラ
    メータに相当するセルの値と前記第2の計算シミュレー
    ションまたは順方向モデル演算への各出力に相当するセ
    ルの値を引数として計算結果を求める前記第2の計算シ
    ミュレーションまたは順方向モデル演算に相当する演算
    式を埋め込む指定と、 前記グラフィカル・ユーザ・インタフェースにより入力
    される、前記各抗体データの評価値に相当するセルに前
    記第2の計算シミュレーションまたは順方向モデル演算
    の計算結果に相当するいくつかのセルの値を引数とし評
    価値を求める評価式を埋め込む指定のうち少なくとも1
    つの指定を受け付け、 受け付けている指定のうちで入力されたものの内容に基
    づいてルックアップテーブルを学習により設計すること
    を特徴とする請求項10に記載のルックアップテーブル
    設計方法。
  12. 【請求項12】グラフィカル・ユーザ・インタフェース
    を用いて制御・調整対象であるシステムの構成図を表示
    させ、グラフィカル・ユーザ・インタフェースにより入
    力されるセンサ構成に関する情報および指定したセンサ
    構成により得られる観測値とルックアップテーブルへの
    入力ベクトルとの関係を定義する情報を受け付けさせ、
    入力された前記情報に基づいてルックアップテーブルを
    設計させるようにコンピュータを制御するためのプログ
    ラムを格納したコンピュータ読取り可能な記録媒体。
  13. 【請求項13】設計すべきルックアップテーブルの適用
    対象となるシステムの所定の内部パラメータに対するロ
    バスト性に関する学習を行わせて該ルックアップテーブ
    ルを設計させるためのプログラムであって、グラフィカ
    ル・ユーザ・インタフェースを用いて、制御・調整対象
    であるシステムの構成図を表示させ、グラフィカル・ユ
    ーザ・インタフェースにより入力されるあいまいな確率
    分布の形式で表現された前記システムの内部パラメータ
    の情報を受け付けさせ、前記情報が入力された場合、あ
    いまいな形式で与えられた内部パラメータについて与え
    られた確率分布に従ったランダムな変動を加えて学習を
    行わせ、この学習結果に基づいてルックアップテーブル
    の内容を決定させるようにコンピュータを制御するため
    のプログラムを格納したコンピュータ読取り可能な記録
    媒体。
JP27118997A 1997-06-30 1997-10-03 ルックアップテーブル設計方法及び記録媒体 Expired - Fee Related JP3421552B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27118997A JP3421552B2 (ja) 1997-06-30 1997-10-03 ルックアップテーブル設計方法及び記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP17455397 1997-06-30
JP9-174553 1997-06-30
JP27118997A JP3421552B2 (ja) 1997-06-30 1997-10-03 ルックアップテーブル設計方法及び記録媒体

Publications (2)

Publication Number Publication Date
JPH1173207A true JPH1173207A (ja) 1999-03-16
JP3421552B2 JP3421552B2 (ja) 2003-06-30

Family

ID=26496131

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27118997A Expired - Fee Related JP3421552B2 (ja) 1997-06-30 1997-10-03 ルックアップテーブル設計方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP3421552B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016582A (ja) * 2001-07-03 2003-01-17 Matsushita Electric Ind Co Ltd 信号制御装置および方法
WO2007102269A1 (ja) * 2006-03-08 2007-09-13 Hitachi, Ltd. プラントの制御装置と制御方法及び火力発電プラントとその制御方法
US7558403B2 (en) 2005-04-01 2009-07-07 Canon Kabushiki Kaisha Information processing apparatus and information processing method
JP2020009299A (ja) * 2018-07-11 2020-01-16 パナソニックIpマネジメント株式会社 交通信号制御システム、交通管理装置および交通信号制御方法
WO2022224364A1 (ja) * 2021-04-20 2022-10-27 日本電気株式会社 設定装置、設定方法および記録媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016582A (ja) * 2001-07-03 2003-01-17 Matsushita Electric Ind Co Ltd 信号制御装置および方法
US7558403B2 (en) 2005-04-01 2009-07-07 Canon Kabushiki Kaisha Information processing apparatus and information processing method
WO2007102269A1 (ja) * 2006-03-08 2007-09-13 Hitachi, Ltd. プラントの制御装置と制御方法及び火力発電プラントとその制御方法
US8185216B2 (en) 2006-03-08 2012-05-22 Hitachi, Ltd. Plant controlling device and method, thermal power plant, and its control method
JP2020009299A (ja) * 2018-07-11 2020-01-16 パナソニックIpマネジメント株式会社 交通信号制御システム、交通管理装置および交通信号制御方法
WO2022224364A1 (ja) * 2021-04-20 2022-10-27 日本電気株式会社 設定装置、設定方法および記録媒体

Also Published As

Publication number Publication date
JP3421552B2 (ja) 2003-06-30

Similar Documents

Publication Publication Date Title
Del Ser et al. Bio-inspired computation: Where we stand and what's next
Roodposhti et al. Towards automatic calibration of neighbourhood influence in cellular automata land-use models
Zhang et al. Solution to the time-cost-quality trade-off problem in construction projects based on immune genetic particle swarm optimization
Asl et al. BIM-based parametric building energy performance multi-objective optimization
KR102157613B1 (ko) 기계학습을 이용한 자동화 철골구조물 설계 시스템 및 방법
CN104408518B (zh) 基于粒子群优化算法的神经网络学习优化方法
CN117610435B (zh) 土木建筑施工混合材料自动配比方法及系统
CN102007485A (zh) 储层开发计划的基于markov决策过程的决策支持工具
CN101203871A (zh) 管道优化器系统
Ashour Optimizing creatively in multi-objective optimization
Poole et al. Swarm intelligence algorithms for macroscopic traffic flow model validation with automatic assignment of fundamental diagrams
Pérez-Martínez et al. A methodology for urban planning generation: A novel approach based on generative design
CN117993572A (zh) 一种应用于土地利用规划编制的土地资源空间优化配置方法
JP3421552B2 (ja) ルックアップテーブル設計方法及び記録媒体
Tam et al. Well-conditioned AI-assisted sub-matrix selection for numerically stable constrained form-finding of reticulated shells using geometric deep Q-learning
Villaggi et al. Harnessing Game-Inspired Content Creation for Intuitive Generative Design and Optimization
CN116739232A (zh) 判别农村污水处理模式的方法、装置、设备和存储介质
Kajornrit A comparative study of optimization methods for improving artificial neural network performance
JP6831030B1 (ja) 予測モデルの学習方法、予測モデルの学習装置、及び、プラント制御システム
Yazici A parametric landscape urbanism method: The search for an optimal solution
Elshaarawy et al. Determining seepage loss predictions in lined canals through optimizing advanced gradient boosting techniques
JP2005107747A (ja) モデル作成装置、情報分析装置、モデル作成方法、情報分析方法、およびプログラム
Verstraete Artificial Intelligent Methods for Handling Spatial Data: Fuzzy Rulebase Systems and Gridded Data Problems
Mosavi et al. Engineering Design and Decision-Making Models
Verstraete et al. Rulebase construction using variables with data-dependent domains

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees