JP4997429B2

JP4997429B2 - 最適手法探索方法及び最適手法探索システム

Info

Publication number: JP4997429B2
Application number: JP2010550980A
Authority: JP
Inventors: 真之吉信
Original assignee: 真之吉信
Priority date: 2009-11-10
Filing date: 2009-11-10
Publication date: 2012-08-08
Anticipated expiration: 2029-11-10
Also published as: US20120271783A1; EP2500847A1; EP2500847B1; WO2011058621A1; US8838514B2; CN102713944B; EP2500847A4; JPWO2011058621A1; CN102713944A

Description

本発明は、ニューラルネットワークに細胞分化アルゴリズムを適応させることにより、課題を解決するための最適な手法を効率的に導き出す最適手法探索方法及び最適手法探索システムに関するものである。

ニューラルネットワークをシステムに組み込む上での利点は、ニューラルネットワークにおいてネットワークを形成したノードが学習を繰り返すことにより、課題を解決するための最適な手法を導き出すことである。

ニューラルネットワークの学習には、技術内容に限定がないため、今後も様々な分野への利用が期待できる。

特に、ニューラルネットワークに遺伝的アルゴリズムを採用したシステムは、特許文献１や特許文献２のように、画像処理からロボット制御に至るまで、最適手法を選択するにあたって精度の高い結果を導き出す技術として多岐の方向にわたって利用されている。
特開平９−００６８８１号公報特開２００３−３１７０７３号公報

しかしながら、一般的に、ニューラルネットワークに遺伝的アルゴリズムを採用する手法は、表現型及び遺伝子型を区別することなく探索を行うため、探索効率が悪い上に、ノード数が増加する仕組みは更なる探索時間を費やすことにつながる。

長時間かつ相当数の探索は、システムの規模をも大きくすることとなり、遺伝的アルゴリズムを採用する場合には、コスト、設置場所の面で大規模な企業や研究所などしか携わることができないものである。

よって、比較的小規模な工場や開発現場などのシステムにおいてニューラルネットワークを実現することは困難であった。

ここにおいて、本発明の解決すべき主要な目的は、次のとおりである。

即ち、本発明の第１の目的は、細胞分化の仕組みをアルゴリズムとし、事前に一定程度の学習を済ませておくことにより、探索効率を向上し最適手法を導き出す、最適手法探索方法及び最適手法探索システムを提供することにある。

また、本発明の第２の目的は、探索処理を簡略化することにより、遺伝的アルゴリズムを適応したニューラルネットワークをソフトウェアとして組込み可能とする、最適手法探索方法及び最適手法探索システムを提供することにある。

本発明方法は、上記課題の解決に当たり、任意の環境下において、環境状態をデータとして認識し、予め設定・生成されたニューラルネットワーク内に当該データを適応させることによって前記環境状態に応じた動作を行うとともに、当該動作を複数回実行処理することにより、当該複数回の処理の中から最も効率的に動作を行う設定を最適手法として導き出す、という特徴的手法を講じる。

また、本発明システムは、上記課題の解決に当たり、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に前記動作を複数回実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出すという特徴的構成手段を講じる。

さらに、具体的詳細に述べると、当該課題の解決では、本発明が次に列挙する上位概念から下位概念に亙る新規な特徴的構成手段を採用することにより、前記目的を達成するよう為される。

即ち、本発明方法の第１の特徴は、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出す最適手法探索方法であって、前記評価部は、仮想の細胞（ノード）及び細胞分裂に必要とする分子（数式群）の組み合わせから初期設定を作成し、前記実行部に当該初期設定を送信する個体定義手順と、当該実行部は前記初期設定に基づいて内部に仮想の細胞分裂空間を作成した後、当該初期設定に含まれる前記ノードを配置し、前記数式群に基づいて計算処理を実行することによりノードを分裂させてニューラルネットワークを生成するとともに、当該ニューラルネットワークが生成された後、当該実行部が具備するセンサーが検知した入力データを、当該ニューラルネットワークに入力することにより出力データを導き出し、当該出力データに基づいて当該実行部が具備する動作部を動作させ、当該動作結果を前記評価部に送信する実行部動作手順と、前記評価部は、受信した前記動作結果を元に、前記実行部の個体評価を作成すると個体評価手順と、を複数回順次実行することにより、前記個体評価の中から最も効率的な動作を導き出してなる最適手法探索方法の構成採用にある。

本発明方法の第２の特徴は、本発明方法の第１の特徴における前記評価部が、ニューラルネットワーク作成のための座標データ及び、前記実行部の評価基準及び、前記ノード及び、前記数式群の値をパラメータとしてデータベースに保持し、前記実行部を動作させる際、前記データベースから前記パラメータを選択したものを初期設定として作成し、当該実行部に送信するとともに、前記初期設定に基づいて動作を行った前記実行部の動作結果を受信し、当該ロボットの個体評価として評価を作成し、前記データベースに蓄積することにより、前記データベースに蓄積された情報の中から最も効率的な動作を行う初期設定の組み合わせを探索してなる最適手法探索方法の構成採用にある。

本発明方法の第３の特徴は、本発明方法の第１又は第２の特徴における前記前記実行部が、内部に前記実行部の動作状態を検知する評価ユニットにより、検知結果を前記評価部に送信してなる最適手法探索方法の構成採用にある。

本発明方法の第４の特徴は、本発明方法の第１又は第２の特徴における前記前記実行部が、前記評価部から受け取った前記初期設定に基づいて前記ニューラルネットワークを構成する一方で、前記実行部が具備するセンサー部にて前記環境の状態を入力データとして検知し、前記ニューラルネットワークが構成されると、前記入力データを当該ニューラルネットワークに入力することにより出力データを導き出し、前記実行部が具備する動作部に対し、前記出力データを送信することにより動作を行ってなる最適手法探索方法の構成採用にある。

本発明方法の第５の特徴は、本発明方法の第１、２又は第３の特徴における前記ノードが、当該ノードの特性を区別するパラメータとして、当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持するとともに、前記数式群は、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる最適手法探索方法の構成採用にある。

本発明システムの第１の特徴は、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記実行部に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を探索する最適手法探索システムであって、前記実行部は、内部に仮想の細胞分裂区間を具備し、前記評価部が設定した仮想の細胞となるノード及び細胞分裂に必要な仮想の分子にあたる数式に基づいて、当該細胞分裂区間においてノード数の調整を行うとともに、当該実行部が具備するセンサーが検知した結果を、入力データとして当該ノードに伝播させて前記動作に必要な信号を導き出し、当該実行部にて動作出力するニューラルネットワークを構成してなる最適手法検索システムの構成採用にある。

本発明システムの第２の特徴は、本発明方法の第１の特徴における前記実行部が、前記環境の状態を検知するセンサー部と、前記ニューラルネットワークを構成する探索部と、前記探索部により出力されたデータを元に前記動作を実行する動作部と、前記実行部の動作が成功又は失敗であるかを検知し動作評価として検出する評価ユニットと、前記評価部と、前記評価ユニットにおける前記動作評価及び前記初期設定を相互通信する通信ユニットと、を具備してなる最適手法探索システムの構成採用にある。

本発明システムの第３の特徴は、本発明方法の第１又は第２の特徴における前記評価部が、前記実行部に対し送信する前記ノード及び関数のパラメータ及び前記実行部の評価を蓄積するデータベースと、前記データベースから前記ノード及び関数のパラメータの値を抽出し、前記実行部に送信する前記ノード及び関数の初期設定を作成する個体定義モジュールと、前記実行部より受信した前記動作評価と当該実行部に対し送信した初期設定とから当該実行部の個体評価を作成し、データベースに書込み保存する個体評価モジュールと、前記個体定義モジュール及び前記個体評価モジュール並びに前記実行部に対して、各動作の実行を指示する実行管理モジュールと、前記実行部との通信を行う通信ユニットと、を具備してなる最適手法探索システムの構成採用にある。

本発明システムの第４の特徴は、本発明方法の第１、２又は第３の特徴における前記ノードが、当該ノードの特性を区別するパラメータとして、当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持してなる最適手法探索システムの構成採用にある。

本発明システムの第５の特徴は、本発明方法の第１、２又は第３の特徴における前記数式群が、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、ことを特徴とする請求項６、７又は８に記載の最適手法システム。

本発明によれば、細胞分化の仕組みを細胞分化アルゴリズムとしてニューラルネットワークに適応することにより、従来の遺伝的アルゴリズムを利用する場合に区別していない表現型及び遺伝子型を区別化することができ、課題解決のための最適手法の検出に無駄であると判断される処理を省略することで、効率的な最適手法が探索可能になる。

また、無駄な処理を大幅に省略することにより、小規模なシステムへニューラルネットワークを組込むことができるようになり、リアルタイムでの最適手法の検索が可能になる。

本発明のシステム例に係るシステム構成図である。本発明のシステム例に係る検出部１２の機能構成図である。本発明の遺伝的アルゴリズム例におけるパラメータの概要図である。本発明の遺伝的アルゴリズム例を示すフローチャートである。（ａ）は、ノードの増加状態を示す図であり、（ｂ）はニューラルネットワークにおける要部構成を示した図である。本発明の実施形態例を示すシステム構成図である。

α、α１…最適手法探索システム
１…実行部
１１、１４ａ…センサー部
１１ａ…ＣＣＤカメラ
１２…検出部
１２ａ…入力データ受信部
１２ｂ…入力データ信号変換部
１２ｃ…信号算出部
１２ｄ…出力データ信号変換部
１２ｅ…出力データ送信部
１３、１４ｂ…動作部
１４…評価ユニット
１５、２１…通信ユニット
２…評価部
２２…データベース
２３…個体定義モジュール
２４…個体評価モジュール
２５…実行管理モジュール
ｉｎ…入力データ
ｉｎｓ…入力データ信号
ｏｕｔ…出力データ
ｏｕｔｓ…出力データ信号
ｅ…評価情報
ｅｓ…初期設定
ｓ…スコア評価
ＲＰ…実行部パラメータ
Ｒ−０１…座標データ
Ｒ−０２…スコア
Ｒ−０３…コード
ＮＰ…ノードパラメータ
Ｎ−０１…座標
Ｎ−０２…シナプス結合強度
Ｎ−０３…シナプス結合先
Ｎ−０４…ノード電位
Ｎ−０５…オブジェクト実行頻度
ＯＰ…オブジェクトパラメータ
Ｏ−０１…演算発生確率
Ｏ−０２…機能発生確率
Ｎ１…ｋ…ノード

以下、本発明のシステム構成例及び本システム構成におけるアルゴリズム並びに、実施形態例を、添付図面を参照し説明する。

（システム構成例）
図１は、本発明に係るシステム構成図である。同図に示すように、最適手法探索システムαは、センサーにより動作環境を感知し、ニューラルネットワークによって最適な動作を実施する実行部１と、実行部１に対する基本設定を行うとともに、実行部１の動作結果を評価する評価部２にて構成される。

実行部１は、動作環境及び実行部１の動作状況を検知し、当該状況を入力データｉｎとしてデータ化するセンサー部１１及び、センサー部１１にて認識した入力データｉｎに基づいて動作に必要な出力データｏｕｔを導き出す検出部１２及び、検出部１２から受信した出力データｏｕｔをもとに動作を実行する動作部１３及び、実行部１について動作を評価する評価ユニット１４及び、評価ユニット１４の評価データやセンサー部１１による動作部１３の動作状況を評価部２に送信する通信ユニット１５にて構成される。

センサー部１１は、自然現象や機械により発生する、電気、磁気、熱、音、光等の変化となる環境状態を感知するセンサーを有するものとし、そのセンサーの種類は、実行部１の動作内容によって適宜変更可能である。例えば、一定空間の状態変化を視覚的に検知したい場合にはＣＣＤカメラや、ハイパースペクトルセンサー等の画像センサーを利用してもよい。

実行部１の検出部１２については図２にその詳細な構成内容を示す。
検出部１２は、上述のようにセンサー部１１が認識した環境状態から、与えられた目的のために動作部１３が動作すべき動作データを導き出す処理部であり、センサー部１１から入力された入力データｉｎを受信する入力データ受信部１２ａ及び、入力データ受信部１２ａから入力データｉｎを入力データ信号ｉｎｓに変換する入力データ信号変換部１２ｂ及び、ニューラルネットワークが組み込まれ、入力データ信号変換部１２ｂから受け取った入力データ信号ｉｎｓに基づいて動作部１３の動作に必要な出力データ信号ｏｕｔｓを算出する信号算出部１２ｃ及び、出力データ信号ｏｕｔｓを信号算出部１２ｃから受取り動作部１３用に適用可能な出力データｏｕｔに変換する出力データ信号変換部１２ｄ及び、出力データｏｕｔを動作部１３に送信する出力データ送信部１２ｄにて構成される。

なお、入力データ信号ｉｎｓに基づいて信号算出部１２ｃが出力データ信号ｏｕｔｓを導き出すために、ニューラルネットワークを信号算出部１２ｃ内で採用しているが、このニューラルネットワークのアルゴリズムについては、別途詳細に説明することとする。

動作部１３は、センサー部１１と同様に、実行部１の動作内容に応じて適宜必要な動作装置、機器を設備可能としその種類に限定はない。例えば、実行部１の移動を目的とするのであれば駆動用モーターを利用し、実行部１に設置されたアームが稼動する場合や実行部１本体の上昇下降を目的とする場合には、各動作に応じたアクチュエーターを利用するとよい。

評価ユニット１４は、実行部１の評価に利用する実行部１の可動状況を検知するためのセンサー部１４ａを具備するとともに、評価ユニット単体での動作部１４ｂをも備え、動作部１４ｂの結果を実行部１の評価に使用する。なお、以下の例に示すように、動作部１４ｂは必ずしも具備させる必要はない。

一つの例として、実行部１がある特定の物質を回収、選択することを動作目的とする場合には、動作部１３にて、実行部１が目標とする物質まで移動したことにより、評価ユニット１４が目的とする物質の回収を試み、回収が成功（又は失敗）すれば実行部１の目的とした動作が成功（又は失敗）したという評価結果を評価情報ｅとする信号にして通信ユニット１５を介して評価部２に送信する。

別の例としては、実行部１が、散水や可視光、放射線等の照射や送風などを行うことを目的とした場合、センサー部１４ａが予め湿度や温度など環境状態を調べておき、動作部１３が所定の位置まで移動した後、センサー部１４ａにて状態の変化を検知し、実行した動作の結果（成功／失敗）を評価情報ｅとして評価部２に送信する。

上記の例において、実行部１の実行結果を、環境状態の検知により判断できる場合には、評価部１４の構成内容はセンサー部１４ａのみでもよいが、評価ユニット１４が状態検知のみに限らず、回収作業を行う場合やセンサー部１４ａを移動させて状態検知する必要がある場合には、動作部１４ｂをさらに構成させるものとする。

実行部１の通信ユニット１５及び評価部２にある通信ユニット２１は、相互に通信を行うためのユニットであり、実行部１における作業の評価情報ｅは通信ユニット１５を通して通信ユニット２１に送信され、通信ユニット２１は個体評価モジュール２２に対して評価情報ｅを送ることによって、評価部２にて実行部１個体の評価が行われる。

次に、評価部２について説明する。評価部２は、実行部１の動作前に、実行部１に対してニューラルネットワークの初期設定を行うとともに、実行部１の任意の動作時間を一区切りとして、動作後の実行部１の動作内容について評価ユニット１４が評価した評価情報ｅを実行部１の１個体評価として保持し、複数回の動作又は複数台の実行部１のそれぞれの評価情報ｅを管理することにより、最も有効な動作を実行する初期設定を、最適手法として導き出す処理部である。

評価部２は、実行部１に対して、初期設定ｅｓを送信するとともに、評価ユニット１４による実行部１の動作評価を受信する通信ユニット２１と、ノードＮのパラメータの組み合わせ群及び実行部１の評価情報ｅ及び個体情報ｅｏを保持するデータベース２２と、実行部１に対してデータベース２２から初期設定ｅｓを送信する個体定義モジュール２３と、実行部１から送信された実行部１の評価情報ｅに基づいて実行部１の評価をし、評価結果をスコア化したスコア評価ｓをデータベース２２に書き込み保存する個体評価モジュール２４及び、個体定義モジュール２３や個体評価モジュール２４及び実行部１に対して動作の実行命令を送信する実行管理モジュール２５にて構成される。

以上、本発明システムにおける各処理部について説明したが、本発明システムにおいては、実行部１内部に評価部２を付属させるなど、全てを同一装置内に構成してもよいが、評価部２をパーソナルコンピュータ内部に構成し、当該パーソナルコンピュータと実行部１とを有線又は無線にて接続してデータのやり取りを行ってもよい。

さらに、評価部２に対し実行部１を複数台接続し、一度に複数台の実行部１からの評価情報ｅが得られれば、最適手法の探索をより効率的に導き出すことができる。

（細胞分化アルゴリズム）
次に、最適手法を探索するために、信号算出部１２内で実施されるニューラルネットワークにおいて採用される細胞分化アルゴリズムについて説明する。

なお、本発明は、非特許文献１に記載される細胞分化の仕組みに記載されるように、細胞分裂の過程において、細胞分化が進むにつれ、細胞や分子の状態が変化していく現象をシステム化することを目的としている。

細胞分化についての具体的な用語や分化の状態については、非特許文献１に基づくものであるため、これらの文献に示される細胞分化の仕組みについての詳細説明は割愛することとする。
生命とは何か―複雑系生命論序説、東京大学出版会、金子邦男、２００３年

はじめに、上記文献に記載される細胞分化の仕組みをシステム化する上で、細胞分化に必要な各要素をどのようにシステムに適応させるかについて説明する。

細胞分化アルゴリズムにおいて、本発明では、細胞分裂空間（培地）ＲＰ及びノード（細胞）ＮＰ並びに分子ＯＰの３つの要素を利用して細胞分化を信号算出部２にて仮想的に実施する。各要素は、それぞれの特徴を示すパラメータとして数値や数式からなるデータ群を保持し、各要素中の各データが相互に計算を行うことにより分裂を実施する。

非特許文献１にあるように、細胞分化の過程において、細胞の数が分裂によって増加していくと、細胞内の分子の状態に変化が見られるようになる。本発明では、この細胞内の分子の状態が変化する特性を利用し、入力側と出力側を設けた仮想細胞分裂空間にて細胞分裂を実施後、初期値寄りのノードＮを入力側に、細胞分化後パラメータが変動したノードＮを出力側に接続し、信号を分裂した入力側からノード群に伝播させることにより、出力側が受け取った信号が、入力信号に対して最適な結果を導き出すものである技術を採用している。

以下、図３のパラメータの概念及び、図４のフローチャートに基づき、信号算出部１２ｃにて実施される細胞分化アルゴリズムを適応したニューラルネットワークの処理手順を説明する。

図３は、個体定義モジュール２３内に保持される実行部１に振り当てる実行部パラメータＲＰ及び、ノードＮの初期値として設定されるノードパラメータＮＰ及び、ノードＮの分裂に利用される数式群からなるオブジェクトパラメータＯＰの内容を示している。

まず、実行部パラメータＲＰは、仮想の細胞分裂空間を作成するためのパラメータであって、細胞分化アルゴリズムの実施毎に、実行部１に初期値として設定される。

実行部パラメータＲＰの構成要素としては、細胞分裂空間に必要となる座標情報を数値で示す座標データＲ−０１及び、細胞分化した実行部１の評価スコアＲ−０２、実行部１毎に割り振られるノードＮについて細胞の遺伝コードに値するものであるコードＲ−０３からなる。なお、スコアＲ−０２は実行部１が実施しようとする作業において、作業の効率度を評価として数値化するための値であり、評価ユニット１４から受信する。

一方、ノードパラメータＮＰは、座標データＲ−０１中に配置される最初のノードとなるノードＮの座標を示すノード座標Ｎ−０１、ノードＮのシナプスの結合度を示すシナプス結合強度Ｎ−０２、シナプスの接続先であるノードＮを示すシナプス接続先Ｎ−０３、接続先ノードＮの保有する電位を示すノード電位Ｎ−０４、ノードＮにおけるオブジェクトの数量を示すオブジェクト実行頻度Ｎ−０５からなる。なお、これらのパラメータは数値で表現される。

また、ノード電位Ｎ−０４は、細胞分裂時には利用されず、ノードＮが他のノードに信号を伝達する契機となる閾値を示すものである。ここで、ノード電位Ｎ−０４は、他のノードから伝達された値を総和していくこととする。

さらに、オブジェクト実行頻度Ｎ−０５は、ノードＮ内に存在するオブジェクトＯ（分子）の数量を示し、分裂の度にノードＮ内のオブジェクトの数量が半減するよう設定する。

次に、オブジェクトパラメータＯＰについて説明する。オブジェクトＯは細胞分裂における分子にあたり、分子の量は生物学上においても相当数の種類が存在するため、実際の細胞分裂状態により近づけるために、初期設定段階で様々な種類のオブジェクトＯ１…ｋ（ｋは自然数）と、それぞれに対するオブジェクトパラメータＯＰ１…ｋとを定義しておく必要がある。

オブジェクトパラメータＯＰの構成要素は、オブジェクト同士の反応係数を示す演算発生確率Ｏ−０１と、ノードパラメータＮＰの各項目の値を変動させる機能発生確率Ｏ−０２からなり、それぞれ数式で表現される。

演算発生確率Ｏ−０１は、オブジェクトＯ１においては、他に設定した総てのオブジェクトＯ２〜オブジェクトＯｋ（ｋは自然数）のそれぞれの反応係数とその反応によって生成される新たなオブジェクトＯｋ＋１を設定することとし、これを総てのオブジェクトＯにおいて設定する。

機能発生確率Ｏ−０２は、オブジェクトＯにどのような機能を持たせるかによって、設定する値を適宜変更可能とする。例えば、シナプスの結合強度Ｎ−０２やノード電位Ｎ−０４の設定値を変化させる数式を設定したり等、機能発生確率Ｏ−０２に初期値を設定する時点で必要な数式を設定する。

以上の値を個体定義モジュール２３が信号算出部１２ｃに初期値として設定すると、信号算出部１２ｃ内部で仮想の細胞分裂が実行される。

次に、図４のフローチャートを利用して、信号算出部１２ｃにて細胞分化アルゴリズムが実施される手順を示す。

まず、個体定義モジュールは、実行部パラメータＲＰ及びノードパラメータＮＰ及びオブジェクトパラメータＯＰの初期値を設定し、信号算出部１２ｃにこれらのパラメータを送信する（ＳＴ１）。

このとき設定される各パラメータは、データベース２２内に保持されて、個体定義モジュールによりランダムまたは任意の規則性をもって設定されてもよく、または、必要に応じて書き換えることもできるものとする。

なお、ノードパラメータＮＰは実行部１毎に設定するが、実行部１の動作を同一条件下で比較評価するため、オブジェクトパラメータＯＰについては評価に利用する複数の実行部１に同一のパラメータを設定する。

信号算出部１２ｃは、個体定義モジュール２３より受け取った初期設定ｅｓに基づいて、仮想の細胞分裂空間を生成し、細胞分化アルゴリズムを適応したニューラルネットワークを構成する（ＳＴ２）。

次に、信号算出部１２ｃは、ノードパラメータＮＰからニューラルネットワーク内にノードＮを配置し、個体の定義を行った後（ＳＴ３）、オブジェクトＯをランダムに存在させ、オブジェクトＯの配置数が一定数に達したならば分裂を開始することとする（ＳＴ４）。

ノードＮ１は、実行頻度Ｎ−０５に基づいて、オブジェクトパラメータＯＰ内の数式群から演算発生確率Ｏ−０１又は機能発生確率Ｏ−０２を選択し、ノードパラメータＮの値を当てはめることにより、仮想的な細胞分裂が実施され、ノードＮ１はノードＮ２、Ｎ３に分裂を続けていく。

このとき、ノードＮ２、Ｎ３のノードパラメータＮＰはノードＮ１とほぼ同一であるが、実行頻度Ｎ−０５のみは、その数値を半減することとする。

さらに、ノードＮ２、Ｎ３は、ノードＮ１における分裂時と同様に、ランダムに提示される数式群から演算発生確率Ｏ−０１又は機能発生確率Ｏ−０２を選択し、当てはめながらノードＮ４、Ｎ５、Ｎ６、Ｎ７に分裂し、この工程を繰り返すことによりノードＮの総数は増加していく。

図５（ａ）は、ノードＮ１の配置後、徐々にノード数が増加する様子と、分裂を繰り返すことによりノードＮ内に存在するオブジェクトパラメータＯＰの特性が変化している例を可視的に表現した図である。同図に示すように、ノードＮ１…ｋ（ｋは自然数）が増加する過程において、ノード数増加の初期段階では分裂が頻繁に行われるためノードＮの数は爆発的に増えていくが、細胞分裂空間に配給されるオブジェクトパラメータＯＰの数式群の個数は一定数に設定しているため、ノードＮ１…Ｎｋ間それぞれでオブジェクトＯの取り合いが始まり、分裂の度に実行頻度Ｎ−０５が半減するとともに、分裂回数も減少していき、ある一定の分裂を終えるとノードＮ１…Ｎｋの個数は安定傾向になり、分裂の過程で、ノードＮの存在位置に応じてノードＮが含むオブジェクトの特性の異なるという特徴が現れはじめ、特質の異なったノードＮがそれぞれ入力側と出力側に存在することとなる。

図５（ｂ）は、図５（ａ）の図を元に、安定したノードＮ１…ｋが実際にシナプスによって入力側／出力側にそれぞれ接続され、ニューラルネットワークを形成していることを表現した図である。信号算出部１２ｃは、形成されだしたニューラルネットワークにおいて、図５（ｂ）のように、入力側と出力側にそれぞれノードＮがシナプスによって接続されたことを契機に、入力側からノードＮ１…ｋに対して入力信号ｉｎｓを送る。すると、ノードＮ１…ｋ間を信号が伝播し、出力側のノードＮ１…ｋから出力された信号が、動作部１３の動作のための出力信号ｏｕｔｓとして出力される。このときの出力信号ｏｕｔｓの適応度を計算し（ＳＴ５）、計算結果が期待した結果であるか否かを判断する（ＳＴ６）。なお、判断材料となる適応度のデータについては、初期設定ｅｓに含めてもよく、又は予め信号算出部１２ｃに保持させておいてもよい。

期待する結果が得られない場合には、ノードＮ１…ｋの中から優位なものを選択し（ＳＴ７）、必要に応じて仮想的な突然変異を起こすために選択したノードＮｋの設定を書き換え（ＳＴ８）、再度交叉させる（ＳＴ９）ことで新たな分裂を行い、期待する特性が得られるまでＳＴ３以降のプロセスを繰り返す。突然変異に利用されるデータについても適応度の判断データと同様、初期設定ｅｓ又は信号算出部１２ｃに含めておく。

ＳＴ６にて、期待する特性が得られれば、得られた信号を出力し（ＳＴ１０）、プロセスを終了させ、ニューラルネットワークが完成される。以上が、細胞分化の仕組みを採用した本発明のアルゴリズムの概要である。

（実施形態例）
次に、実施形態例について図６の構成図を利用して説明する。なお、本実施形態例においては、具体例として本発明システムを利用したゴミ収集ロボットを例示するが、本発明システムの利用例はこれに限定されるものではない。

本実施形態例では、ゴミ回収実行部１が、広場のような場所で、紙くずや空き缶などのゴミを回収するロボットであるとして想定し、センサー部として具備したＣＣＤカメラ１１ａが動作環境下における映像を撮影し、ＣＣＤカメラ１１ａの映像データに基づいて、異物が落ちているところまで動作部１３が移動し、評価ユニットとなるゴミ回収ユニット１４が、センサーにより異物を認識すると、ゴミとして回収することを目的としたシステムとする。

まず、評価部２は、個体定義モジュール２３内において実行部１に対して実行部パラメータＲＰ、ノードパラメータＮＰ、オブジェクトパラメータＯＰからなる初期設定eｓを通信ユニット２１を通じて実行部１の通信ユニット１５に送信し、通信ユニット１５は、初期設定ｅｓを信号算出部１２ｃに受け渡すと同時に、開始命令をセンサー部１１に送信する。

センサー部１１は、ゴミ回収のため、動作環境をＣＣＤカメラにて撮影し、異物（ゴミ）の存在を検知すると、入力データｉｎとして入力データ受信部１２ａへ送信し、入力データ受信部１２ａは、受信した入力データｉｎを入力データ信号変換部１２ｂへ送信する。

入力データ信号変換部１２ｂは、受信した入力データｉｎをニューラルネットワーク用の入力データ信号ｉｎｓに変換し、信号算出部１２ｃへ送信する。

一方、信号算出部１２ｃは、通信ユニット１５から受け取った初期設定ｅｓに基づいて、ノードＮの配置後、ノード数の調整を開始し、ニューラルネットワークを作成する。

信号算出部１２ｃは、ニューラルネットワークが完成すると、完成したニューラルネットワークに対し、入力データ信号ｉｎｓを入力する。なお、信号算出部１２ｃにおいて、ニューラルネットワークが作成される前にデータ信号変換部から入力データ信号ｉｎｓが送信されれば、信号算出部１２ｃは入力データ信号ｉｎｓをそのまま保持しておき、ニューラルネットワークが完成した後に入力データ信号ｉｎｓのニューラルネットワークへの入力を開始する。

ニューラルネットワークにおけるノードＮ１…ｋの信号の伝播により、出力データ信号ｏｕｔｓが出力されると、信号算出部１２ｃは、出力データ信号ｏｕｔｓを出力データ信号変換部１２ｄに受け渡す。

出力データ信号変換部１２ｄで、出力データ信号ｏｕｔｓが動作用の出力データｏｕｔに変換されると、出力データｏｕｔは出力データ送信部１２ｅを通じて動作部１３に送信され、動作部１３は出力データｏｕｔに基づいて、指定の位置まで移動する。

ゴミ回収ユニット１４は、動作部１３が動作を終了すると、センサー部１４ａで異物を検知し、異物があれば動作部１４ｂにてゴミを回収し、ゴミの回収が成功である評価情報ｅを通信ユニット１５を通じて評価部２へ送信する。センサー部１４ａが異物を検知できない場合には、ゴミの回収が失敗である評価情報ｅを評価部２へ送信する。

個体評価モジュール２４は、受け取った評価情報ｅを、ゴミ回収実行部１の固有データ及びロボット回収結果からなるスコア評価ｓを作成し、実行管理モジュール２５にスコア評価ｓの作成結果を送信すると、実行管理モジュール２５がデータベースへの書込み命令を開始し、スコア評価ｓをデータベースに書込む。

実行部１は、設定された任意の時間中、ゴミの探索、回収を繰り返し、その都度結果が評価部２へ送信され、評価部２において実行部１の評価データを蓄積する。

評価部２においては、任意の期間が終了すると、実行部１におけるごみ回収状況のスコア評価ｓを総括し実行部１におけるノードＮ１の評価としてデータベース２２へ保管する。

評価部２は、再度、評価を行う必要があれば、初期設定ｅｓを実行部１に送信することにより、改めてゴミ回収及びその評価を繰り返す。

評価部２は任意の回数又は台数の実行部１のスコアデータを比較し、最も成果の高い実行部１におけるノードＮ１のパラメータを最適パラメータとして導き出す。

以上、本発明の実施の形態につき、最適手法検索システムの実施例を説明したが、本発明は、必ずしも上述した手段にのみ限定されるものではなく、特許請求の範囲に記載の範囲内において、適宜、変更実施することが可能なものである。

本発明による最適手法探索方法及び最適手法探索システムは、ニューラルネットワークをより効率的にリアルタイムで出力データを導き出すことができるため、ソフトウェア上においてもニューラルネットワークを実現することが可能となった。

Claims

任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出す最適手法探索方法であって、
前記評価部は、仮想の細胞（ノード）及び細胞分裂に必要とする分子（数式群）の組み合わせから初期設定を作成し、前記実行部に当該初期設定を送信する個体定義手順と、
当該実行部は前記初期設定に基づいて内部に仮想の細胞分裂空間を作成した後、当該初期設定に含まれる前記ノードを配置し、前記数式群に基づいて計算処理を実行することによりノードを分裂させてニューラルネットワークを生成するとともに、当該ニューラルネットワークが生成された後、当該実行部が具備するセンサーが検知した入力データを、当該ニューラルネットワークに入力することにより出力データを導き出し、当該出力データに基づいて当該実行部が具備する動作部を動作させ、当該動作結果を前記評価部に送信する実行部動作手順と、
前記評価部は、受信した前記動作結果を元に、前記実行部の個体評価を作成すると個体評価手順と、
を複数回順次実行することにより、前記個体評価の中から最も効率的な動作を導き出す、
ことを特徴とする最適手法探索方法。
前記評価部は、
ニューラルネットワーク作成のための座標データ及び、前記実行部の評価基準及び、前記ノード及び、前記数式群の値をパラメータとしてデータベースに保持し、
前記実行部を動作させる際、前記データベースから前記パラメータを選択したものを初期設定として作成し、当該実行部に送信するとともに、
前記初期設定に基づいて動作を行った前記実行部の動作結果を受信し、当該ロボットの個体評価として評価を作成し、前記データベースに蓄積することにより、前記データベースに蓄積された情報の中から最も効率的な動作を行う初期設定の組み合わせを探索する、
ことを特徴とする請求項１に記載の最適手法探索方法。
前記実行部は、
内部に前記実行部の動作状態を検知する評価ユニットにより、
検知結果を前記評価部に送信する、
ことを特徴とする請求項１又は２に記載の最適手法探索方法。
前記実行部は、
前記評価部から受け取った前記初期設定に基づいて前記ニューラルネットワークを構成する一方で、
前記実行部が具備するセンサー部にて前記環境の状態を入力データとして検知し、
前記ニューラルネットワークが構成されると、前記入力データを当該ニューラルネットワークに入力することにより出力データを導き出し、
前記実行部が具備する動作部に対し、前記出力データを送信することにより動作を行う、
ことを特徴とする請求項１又は２に記載の最適手法探索方法。
前記ノードは、
当該ノードの特性を区別するパラメータとして、
当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持するとともに、
前記数式群は、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、
ことを特徴とする請求項１、２又は３のいずれか１項に記載の最適手法検索方法。
任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記実行部に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を探索する最適手法探索システムであって、
前記実行部は、内部に仮想の細胞分裂区間を具備し、前記評価部が設定した仮想の細胞となるノード及び細胞分裂に必要な仮想の分子にあたる数式に基づいて、当該細胞分裂区間においてノード数の調整を行うとともに、当該実行部が具備するセンサーが検知した結果を、入力データとして当該ノードに伝播させて前記動作に必要な信号を導き出し、当該実行部にて動作出力するニューラルネットワークを構成する、
ことを特徴とする最適手法検索システム。
前記実行部は、
前記環境の状態を検知するセンサー部と、
前記ニューラルネットワークを構成する探索部と、
前記探索部により出力されたデータを元に前記動作を実行する動作部と、
前記実行部の動作が成功又は失敗であるかを検知し動作評価として検出する評価ユニットと、
前記評価部と、前記評価ユニットにおける前記動作評価及び前記初期設定を相互通信する通信ユニットと、を具備する、
ことを特徴とする請求項６に記載の最適手法検索システム。
前記評価部は、
前記実行部に対し送信する前記ノード及び関数のパラメータ及び前記実行部の評価を蓄積するデータベースと、
前記データベースから前記ノード及び関数のパラメータの値を抽出し、前記実行部に送信する前記ノード及び関数の初期設定を作成する個体定義モジュールと、
前記実行部より受信した前記動作評価と当該実行部に対し送信した初期設定とから当該実行部の個体評価を作成し、データベースに書込み保存する個体評価モジュールと、
前記個体定義モジュール及び前記個体評価モジュール並びに前記実行部に対して、各動作の実行を指示する実行管理モジュールと、
前記実行部との通信を行う通信ユニットと、を具備する、
ことを特徴とする請求項６又は７に記載の最適手法検索システム。
前記ノードは、
当該ノードの特性を区別するパラメータとして、
当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持する、
ことを特徴とする請求項６、７又は８のいずれか１項に記載の最適手法検索システム
前記数式群は、
パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、
ことを特徴とする請求項６、７又は８のいずれか１項に記載の最適手法システム。