JP4997429B2 - 最適手法探索方法及び最適手法探索システム - Google Patents

最適手法探索方法及び最適手法探索システム Download PDF

Info

Publication number
JP4997429B2
JP4997429B2 JP2010550980A JP2010550980A JP4997429B2 JP 4997429 B2 JP4997429 B2 JP 4997429B2 JP 2010550980 A JP2010550980 A JP 2010550980A JP 2010550980 A JP2010550980 A JP 2010550980A JP 4997429 B2 JP4997429 B2 JP 4997429B2
Authority
JP
Japan
Prior art keywords
unit
execution unit
evaluation
node
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010550980A
Other languages
English (en)
Other versions
JPWO2011058621A1 (ja
Inventor
真之 吉信
Original Assignee
真之 吉信
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 真之 吉信 filed Critical 真之 吉信
Application granted granted Critical
Publication of JP4997429B2 publication Critical patent/JP4997429B2/ja
Publication of JPWO2011058621A1 publication Critical patent/JPWO2011058621A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physiology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ニューラルネットワークに細胞分化アルゴリズムを適応させることにより、課題を解決するための最適な手法を効率的に導き出す最適手法探索方法及び最適手法探索システムに関するものである。
ニューラルネットワークをシステムに組み込む上での利点は、ニューラルネットワークにおいてネットワークを形成したノードが学習を繰り返すことにより、課題を解決するための最適な手法を導き出すことである。
ニューラルネットワークの学習には、技術内容に限定がないため、今後も様々な分野への利用が期待できる。
特に、ニューラルネットワークに遺伝的アルゴリズムを採用したシステムは、特許文献1や特許文献2のように、画像処理からロボット制御に至るまで、最適手法を選択するにあたって精度の高い結果を導き出す技術として多岐の方向にわたって利用されている。
特開平9−006881号公報 特開2003−317073号公報
しかしながら、一般的に、ニューラルネットワークに遺伝的アルゴリズムを採用する手法は、表現型及び遺伝子型を区別することなく探索を行うため、探索効率が悪い上に、ノード数が増加する仕組みは更なる探索時間を費やすことにつながる。
長時間かつ相当数の探索は、システムの規模をも大きくすることとなり、遺伝的アルゴリズムを採用する場合には、コスト、設置場所の面で大規模な企業や研究所などしか携わることができないものである。
よって、比較的小規模な工場や開発現場などのシステムにおいてニューラルネットワークを実現することは困難であった。
ここにおいて、本発明の解決すべき主要な目的は、次のとおりである。
即ち、本発明の第1の目的は、細胞分化の仕組みをアルゴリズムとし、事前に一定程度の学習を済ませておくことにより、探索効率を向上し最適手法を導き出す、最適手法探索方法及び最適手法探索システムを提供することにある。
また、本発明の第2の目的は、探索処理を簡略化することにより、遺伝的アルゴリズムを適応したニューラルネットワークをソフトウェアとして組込み可能とする、最適手法探索方法及び最適手法探索システムを提供することにある。
本発明方法は、上記課題の解決に当たり、任意の環境下において、環境状態をデータとして認識し、予め設定・生成されたニューラルネットワーク内に当該データを適応させることによって前記環境状態に応じた動作を行うとともに、当該動作を複数回実行処理することにより、当該複数回の処理の中から最も効率的に動作を行う設定を最適手法として導き出す、という特徴的手法を講じる。
また、本発明システムは、上記課題の解決に当たり、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に前記動作を複数回実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出すという特徴的構成手段を講じる。
さらに、具体的詳細に述べると、当該課題の解決では、本発明が次に列挙する上位概念から下位概念に亙る新規な特徴的構成手段を採用することにより、前記目的を達成するよう為される。
即ち、本発明方法の第1の特徴は、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出す最適手法探索方法であって、前記評価部は、仮想の細胞(ノード)及び細胞分裂に必要とする分子(数式群)の組み合わせから初期設定を作成し、前記実行部に当該初期設定を送信する個体定義手順と、当該実行部は前記初期設定に基づいて内部に仮想の細胞分裂空間を作成した後、当該初期設定に含まれる前記ノードを配置し、前記数式群に基づいて計算処理を実行することによりノードを分裂させてニューラルネットワークを生成するとともに、当該ニューラルネットワークが生成された後、当該実行部が具備するセンサーが検知した入力データを、当該ニューラルネットワークに入力することにより出力データを導き出し、当該出力データに基づいて当該実行部が具備する動作部を動作させ、当該動作結果を前記評価部に送信する実行部動作手順と、前記評価部は、受信した前記動作結果を元に、前記実行部の個体評価を作成すると個体評価手順と、を複数回順次実行することにより、前記個体評価の中から最も効率的な動作を導き出してなる最適手法探索方法の構成採用にある。
本発明方法の第2の特徴は、本発明方法の第1の特徴における前記評価部が、ニューラルネットワーク作成のための座標データ及び、前記実行部の評価基準及び、前記ノード及び、前記数式群の値をパラメータとしてデータベースに保持し、前記実行部を動作させる際、前記データベースから前記パラメータを選択したものを初期設定として作成し、当該実行部に送信するとともに、前記初期設定に基づいて動作を行った前記実行部の動作結果を受信し、当該ロボットの個体評価として評価を作成し、前記データベースに蓄積することにより、前記データベースに蓄積された情報の中から最も効率的な動作を行う初期設定の組み合わせを探索してなる最適手法探索方法の構成採用にある。
本発明方法の第3の特徴は、本発明方法の第1又は第2の特徴における前記前記実行部が、内部に前記実行部の動作状態を検知する評価ユニットにより、検知結果を前記評価部に送信してなる最適手法探索方法の構成採用にある。
本発明方法の第4の特徴は、本発明方法の第1又は第2の特徴における前記前記実行部が、前記評価部から受け取った前記初期設定に基づいて前記ニューラルネットワークを構成する一方で、前記実行部が具備するセンサー部にて前記環境の状態を入力データとして検知し、前記ニューラルネットワークが構成されると、前記入力データを当該ニューラルネットワークに入力することにより出力データを導き出し、前記実行部が具備する動作部に対し、前記出力データを送信することにより動作を行ってなる最適手法探索方法の構成採用にある。
本発明方法の第5の特徴は、本発明方法の第1、2又は第3の特徴における前記ノードが、当該ノードの特性を区別するパラメータとして、当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持するとともに、前記数式群は、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる最適手法探索方法の構成採用にある。
本発明システムの第1の特徴は、任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記実行部に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を探索する最適手法探索システムであって、前記実行部は、内部に仮想の細胞分裂区間を具備し、前記評価部が設定した仮想の細胞となるノード及び細胞分裂に必要な仮想の分子にあたる数式に基づいて、当該細胞分裂区間においてノード数の調整を行うとともに、当該実行部が具備するセンサーが検知した結果を、入力データとして当該ノードに伝播させて前記動作に必要な信号を導き出し、当該実行部にて動作出力するニューラルネットワークを構成してなる最適手法検索システムの構成採用にある。
本発明システムの第2の特徴は、本発明方法の第1の特徴における前記実行部が、前記環境の状態を検知するセンサー部と、前記ニューラルネットワークを構成する探索部と、前記探索部により出力されたデータを元に前記動作を実行する動作部と、前記実行部の動作が成功又は失敗であるかを検知し動作評価として検出する評価ユニットと、前記評価部と、前記評価ユニットにおける前記動作評価及び前記初期設定を相互通信する通信ユニットと、を具備してなる最適手法探索システムの構成採用にある。
本発明システムの第3の特徴は、本発明方法の第1又は第2の特徴における前記評価部が、前記実行部に対し送信する前記ノード及び関数のパラメータ及び前記実行部の評価を蓄積するデータベースと、前記データベースから前記ノード及び関数のパラメータの値を抽出し、前記実行部に送信する前記ノード及び関数の初期設定を作成する個体定義モジュールと、前記実行部より受信した前記動作評価と当該実行部に対し送信した初期設定とから当該実行部の個体評価を作成し、データベースに書込み保存する個体評価モジュールと、前記個体定義モジュール及び前記個体評価モジュール並びに前記実行部に対して、各動作の実行を指示する実行管理モジュールと、前記実行部との通信を行う通信ユニットと、を具備してなる最適手法探索システムの構成採用にある。
本発明システムの第4の特徴は、本発明方法の第1、2又は第3の特徴における前記ノードが、当該ノードの特性を区別するパラメータとして、当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持してなる最適手法探索システムの構成採用にある。
本発明システムの第5の特徴は、本発明方法の第1、2又は第3の特徴における前記数式群が、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、ことを特徴とする請求項6、7又は8に記載の最適手法システム。
本発明によれば、細胞分化の仕組みを細胞分化アルゴリズムとしてニューラルネットワークに適応することにより、従来の遺伝的アルゴリズムを利用する場合に区別していない表現型及び遺伝子型を区別化することができ、課題解決のための最適手法の検出に無駄であると判断される処理を省略することで、効率的な最適手法が探索可能になる。
また、無駄な処理を大幅に省略することにより、小規模なシステムへニューラルネットワークを組込むことができるようになり、リアルタイムでの最適手法の検索が可能になる。
本発明のシステム例に係るシステム構成図である。 本発明のシステム例に係る検出部12の機能構成図である。 本発明の遺伝的アルゴリズム例におけるパラメータの概要図である。 本発明の遺伝的アルゴリズム例を示すフローチャートである。 (a)は、ノードの増加状態を示す図であり、(b)はニューラルネットワークにおける要部構成を示した図である。 本発明の実施形態例を示すシステム構成図である。
α、α1…最適手法探索システム
1…実行部
11、14a…センサー部
11a…CCDカメラ
12…検出部
12a…入力データ受信部
12b…入力データ信号変換部
12c…信号算出部
12d…出力データ信号変換部
12e…出力データ送信部
13、14b…動作部
14…評価ユニット
15、21…通信ユニット
2…評価部
22…データベース
23…個体定義モジュール
24…個体評価モジュール
25…実行管理モジュール
in…入力データ
ins…入力データ信号
out…出力データ
outs…出力データ信号
e…評価情報
es…初期設定
s…スコア評価
RP…実行部パラメータ
R−01…座標データ
R−02…スコア
R−03…コード
NP…ノードパラメータ
N−01…座標
N−02…シナプス結合強度
N−03…シナプス結合先
N−04…ノード電位
N−05…オブジェクト実行頻度
OP…オブジェクトパラメータ
O−01…演算発生確率
O−02…機能発生確率
N1…k…ノード
以下、本発明のシステム構成例及び本システム構成におけるアルゴリズム並びに、実施形態例を、添付図面を参照し説明する。
(システム構成例)
図1は、本発明に係るシステム構成図である。同図に示すように、最適手法探索システムαは、センサーにより動作環境を感知し、ニューラルネットワークによって最適な動作を実施する実行部1と、実行部1に対する基本設定を行うとともに、実行部1の動作結果を評価する評価部2にて構成される。
実行部1は、動作環境及び実行部1の動作状況を検知し、当該状況を入力データinとしてデータ化するセンサー部11及び、センサー部11にて認識した入力データinに基づいて動作に必要な出力データoutを導き出す検出部12及び、検出部12から受信した出力データoutをもとに動作を実行する動作部13及び、実行部1について動作を評価する評価ユニット14及び、評価ユニット14の評価データやセンサー部11による動作部13の動作状況を評価部2に送信する通信ユニット15にて構成される。
センサー部11は、自然現象や機械により発生する、電気、磁気、熱、音、光等の変化となる環境状態を感知するセンサーを有するものとし、そのセンサーの種類は、実行部1の動作内容によって適宜変更可能である。例えば、一定空間の状態変化を視覚的に検知したい場合にはCCDカメラや、ハイパースペクトルセンサー等の画像センサーを利用してもよい。
実行部1の検出部12については図2にその詳細な構成内容を示す。
検出部12は、上述のようにセンサー部11が認識した環境状態から、与えられた目的のために動作部13が動作すべき動作データを導き出す処理部であり、センサー部11から入力された入力データinを受信する入力データ受信部12a及び、入力データ受信部12aから入力データinを入力データ信号insに変換する入力データ信号変換部12b及び、ニューラルネットワークが組み込まれ、入力データ信号変換部12bから受け取った入力データ信号insに基づいて動作部13の動作に必要な出力データ信号outsを算出する信号算出部12c及び、出力データ信号outsを信号算出部12cから受取り動作部13用に適用可能な出力データoutに変換する出力データ信号変換部12d及び、出力データoutを動作部13に送信する出力データ送信部12dにて構成される。
なお、入力データ信号insに基づいて信号算出部12cが出力データ信号outsを導き出すために、ニューラルネットワークを信号算出部12c内で採用しているが、このニューラルネットワークのアルゴリズムについては、別途詳細に説明することとする。
動作部13は、センサー部11と同様に、実行部1の動作内容に応じて適宜必要な動作装置、機器を設備可能としその種類に限定はない。例えば、実行部1の移動を目的とするのであれば駆動用モーターを利用し、実行部1に設置されたアームが稼動する場合や実行部1本体の上昇下降を目的とする場合には、各動作に応じたアクチュエーターを利用するとよい。
評価ユニット14は、実行部1の評価に利用する実行部1の可動状況を検知するためのセンサー部14aを具備するとともに、評価ユニット単体での動作部14bをも備え、動作部14bの結果を実行部1の評価に使用する。なお、以下の例に示すように、動作部14bは必ずしも具備させる必要はない。
一つの例として、実行部1がある特定の物質を回収、選択することを動作目的とする場合には、動作部13にて、実行部1が目標とする物質まで移動したことにより、評価ユニット14が目的とする物質の回収を試み、回収が成功(又は失敗)すれば実行部1の目的とした動作が成功(又は失敗)したという評価結果を評価情報eとする信号にして通信ユニット15を介して評価部2に送信する。
別の例としては、実行部1が、散水や可視光、放射線等の照射や送風などを行うことを目的とした場合、センサー部14aが予め湿度や温度など環境状態を調べておき、動作部13が所定の位置まで移動した後、センサー部14aにて状態の変化を検知し、実行した動作の結果(成功/失敗)を評価情報eとして評価部2に送信する。
上記の例において、実行部1の実行結果を、環境状態の検知により判断できる場合には、評価部14の構成内容はセンサー部14aのみでもよいが、評価ユニット14が状態検知のみに限らず、回収作業を行う場合やセンサー部14aを移動させて状態検知する必要がある場合には、動作部14bをさらに構成させるものとする。
実行部1の通信ユニット15及び評価部2にある通信ユニット21は、相互に通信を行うためのユニットであり、実行部1における作業の評価情報eは通信ユニット15を通して通信ユニット21に送信され、通信ユニット21は個体評価モジュール22に対して評価情報eを送ることによって、評価部2にて実行部1個体の評価が行われる。
次に、評価部2について説明する。評価部2は、実行部1の動作前に、実行部1に対してニューラルネットワークの初期設定を行うとともに、実行部1の任意の動作時間を一区切りとして、動作後の実行部1の動作内容について評価ユニット14が評価した評価情報eを実行部1の1個体評価として保持し、複数回の動作又は複数台の実行部1のそれぞれの評価情報eを管理することにより、最も有効な動作を実行する初期設定を、最適手法として導き出す処理部である。
評価部2は、実行部1に対して、初期設定esを送信するとともに、評価ユニット14による実行部1の動作評価を受信する通信ユニット21と、ノードNのパラメータの組み合わせ群及び実行部1の評価情報e及び個体情報eoを保持するデータベース22と、実行部1に対してデータベース22から初期設定esを送信する個体定義モジュール23と、実行部1から送信された実行部1の評価情報eに基づいて実行部1の評価をし、評価結果をスコア化したスコア評価sをデータベース22に書き込み保存する個体評価モジュール24及び、個体定義モジュール23や個体評価モジュール24及び実行部1に対して動作の実行命令を送信する実行管理モジュール25にて構成される。
以上、本発明システムにおける各処理部について説明したが、本発明システムにおいては、実行部1内部に評価部2を付属させるなど、全てを同一装置内に構成してもよいが、評価部2をパーソナルコンピュータ内部に構成し、当該パーソナルコンピュータと実行部1とを有線又は無線にて接続してデータのやり取りを行ってもよい。
さらに、評価部2に対し実行部1を複数台接続し、一度に複数台の実行部1からの評価情報eが得られれば、最適手法の探索をより効率的に導き出すことができる。
(細胞分化アルゴリズム)
次に、最適手法を探索するために、信号算出部12内で実施されるニューラルネットワークにおいて採用される細胞分化アルゴリズムについて説明する。
なお、本発明は、非特許文献1に記載される細胞分化の仕組みに記載されるように、細胞分裂の過程において、細胞分化が進むにつれ、細胞や分子の状態が変化していく現象をシステム化することを目的としている。
細胞分化についての具体的な用語や分化の状態については、非特許文献1に基づくものであるため、これらの文献に示される細胞分化の仕組みについての詳細説明は割愛することとする。
生命とは何か―複雑系生命論序説、東京大学出版会、金子邦男、2003年
はじめに、上記文献に記載される細胞分化の仕組みをシステム化する上で、細胞分化に必要な各要素をどのようにシステムに適応させるかについて説明する。
細胞分化アルゴリズムにおいて、本発明では、細胞分裂空間(培地)RP及びノード(細胞)NP並びに分子OPの3つの要素を利用して細胞分化を信号算出部2にて仮想的に実施する。各要素は、それぞれの特徴を示すパラメータとして数値や数式からなるデータ群を保持し、各要素中の各データが相互に計算を行うことにより分裂を実施する。
非特許文献1にあるように、細胞分化の過程において、細胞の数が分裂によって増加していくと、細胞内の分子の状態に変化が見られるようになる。本発明では、この細胞内の分子の状態が変化する特性を利用し、入力側と出力側を設けた仮想細胞分裂空間にて細胞分裂を実施後、初期値寄りのノードNを入力側に、細胞分化後パラメータが変動したノードNを出力側に接続し、信号を分裂した入力側からノード群に伝播させることにより、出力側が受け取った信号が、入力信号に対して最適な結果を導き出すものである技術を採用している。
以下、図3のパラメータの概念及び、図4のフローチャートに基づき、信号算出部12cにて実施される細胞分化アルゴリズムを適応したニューラルネットワークの処理手順を説明する。
図3は、個体定義モジュール23内に保持される実行部1に振り当てる実行部パラメータRP及び、ノードNの初期値として設定されるノードパラメータNP及び、ノードNの分裂に利用される数式群からなるオブジェクトパラメータOPの内容を示している。
まず、実行部パラメータRPは、仮想の細胞分裂空間を作成するためのパラメータであって、細胞分化アルゴリズムの実施毎に、実行部1に初期値として設定される。
実行部パラメータRPの構成要素としては、細胞分裂空間に必要となる座標情報を数値で示す座標データR−01及び、細胞分化した実行部1の評価スコアR−02、実行部1毎に割り振られるノードNについて細胞の遺伝コードに値するものであるコードR−03からなる。なお、スコアR−02は実行部1が実施しようとする作業において、作業の効率度を評価として数値化するための値であり、評価ユニット14から受信する。
一方、ノードパラメータNPは、座標データR−01中に配置される最初のノードとなるノードNの座標を示すノード座標N−01、ノードNのシナプスの結合度を示すシナプス結合強度N−02、シナプスの接続先であるノードNを示すシナプス接続先N−03、接続先ノードNの保有する電位を示すノード電位N−04、ノードNにおけるオブジェクトの数量を示すオブジェクト実行頻度N−05からなる。なお、これらのパラメータは数値で表現される。
また、ノード電位N−04は、細胞分裂時には利用されず、ノードNが他のノードに信号を伝達する契機となる閾値を示すものである。ここで、ノード電位N−04は、他のノードから伝達された値を総和していくこととする。
さらに、オブジェクト実行頻度N−05は、ノードN内に存在するオブジェクトO(分子)の数量を示し、分裂の度にノードN内のオブジェクトの数量が半減するよう設定する。
次に、オブジェクトパラメータOPについて説明する。オブジェクトOは細胞分裂における分子にあたり、分子の量は生物学上においても相当数の種類が存在するため、実際の細胞分裂状態により近づけるために、初期設定段階で様々な種類のオブジェクトO1…k(kは自然数)と、それぞれに対するオブジェクトパラメータOP1…kとを定義しておく必要がある。
オブジェクトパラメータOPの構成要素は、オブジェクト同士の反応係数を示す演算発生確率O−01と、ノードパラメータNPの各項目の値を変動させる機能発生確率O−02からなり、それぞれ数式で表現される。
演算発生確率O−01は、オブジェクトO1においては、他に設定した総てのオブジェクトO2〜オブジェクトOk(kは自然数)のそれぞれの反応係数とその反応によって生成される新たなオブジェクトOk+1を設定することとし、これを総てのオブジェクトOにおいて設定する。
機能発生確率O−02は、オブジェクトOにどのような機能を持たせるかによって、設定する値を適宜変更可能とする。例えば、シナプスの結合強度N−02やノード電位N−04の設定値を変化させる数式を設定したり等、機能発生確率O−02に初期値を設定する時点で必要な数式を設定する。
以上の値を個体定義モジュール23が信号算出部12cに初期値として設定すると、信号算出部12c内部で仮想の細胞分裂が実行される。
次に、図4のフローチャートを利用して、信号算出部12cにて細胞分化アルゴリズムが実施される手順を示す。
まず、個体定義モジュールは、実行部パラメータRP及びノードパラメータNP及びオブジェクトパラメータOPの初期値を設定し、信号算出部12cにこれらのパラメータを送信する(ST1)。
このとき設定される各パラメータは、データベース22内に保持されて、個体定義モジュールによりランダムまたは任意の規則性をもって設定されてもよく、または、必要に応じて書き換えることもできるものとする。
なお、ノードパラメータNPは実行部1毎に設定するが、実行部1の動作を同一条件下で比較評価するため、オブジェクトパラメータOPについては評価に利用する複数の実行部1に同一のパラメータを設定する。
信号算出部12cは、個体定義モジュール23より受け取った初期設定esに基づいて、仮想の細胞分裂空間を生成し、細胞分化アルゴリズムを適応したニューラルネットワークを構成する(ST2)。
次に、信号算出部12cは、ノードパラメータNPからニューラルネットワーク内にノードNを配置し、個体の定義を行った後(ST3)、オブジェクトOをランダムに存在させ、オブジェクトOの配置数が一定数に達したならば分裂を開始することとする(ST4)。
ノードN1は、実行頻度N−05に基づいて、オブジェクトパラメータOP内の数式群から演算発生確率O−01又は機能発生確率O−02を選択し、ノードパラメータNの値を当てはめることにより、仮想的な細胞分裂が実施され、ノードN1はノードN2、N3に分裂を続けていく。
このとき、ノードN2、N3のノードパラメータNPはノードN1とほぼ同一であるが、実行頻度N−05のみは、その数値を半減することとする。
さらに、ノードN2、N3は、ノードN1における分裂時と同様に、ランダムに提示される数式群から演算発生確率O−01又は機能発生確率O−02を選択し、当てはめながらノードN4、N5、N6、N7に分裂し、この工程を繰り返すことによりノードNの総数は増加していく。
図5(a)は、ノードN1の配置後、徐々にノード数が増加する様子と、分裂を繰り返すことによりノードN内に存在するオブジェクトパラメータOPの特性が変化している例を可視的に表現した図である。同図に示すように、ノードN1…k(kは自然数)が増加する過程において、ノード数増加の初期段階では分裂が頻繁に行われるためノードNの数は爆発的に増えていくが、細胞分裂空間に配給されるオブジェクトパラメータOPの数式群の個数は一定数に設定しているため、ノードN1…Nk間それぞれでオブジェクトOの取り合いが始まり、分裂の度に実行頻度N−05が半減するとともに、分裂回数も減少していき、ある一定の分裂を終えるとノードN1…Nkの個数は安定傾向になり、分裂の過程で、ノードNの存在位置に応じてノードNが含むオブジェクトの特性の異なるという特徴が現れはじめ、特質の異なったノードNがそれぞれ入力側と出力側に存在することとなる。
図5(b)は、図5(a)の図を元に、安定したノードN1…kが実際にシナプスによって入力側/出力側にそれぞれ接続され、ニューラルネットワークを形成していることを表現した図である。信号算出部12cは、形成されだしたニューラルネットワークにおいて、図5(b)のように、入力側と出力側にそれぞれノードNがシナプスによって接続されたことを契機に、入力側からノードN1…kに対して入力信号insを送る。すると、ノードN1…k間を信号が伝播し、出力側のノードN1…kから出力された信号が、動作部13の動作のための出力信号outsとして出力される。このときの出力信号outsの適応度を計算し(ST5)、計算結果が期待した結果であるか否かを判断する(ST6)。なお、判断材料となる適応度のデータについては、初期設定esに含めてもよく、又は予め信号算出部12cに保持させておいてもよい。
期待する結果が得られない場合には、ノードN1…kの中から優位なものを選択し(ST7)、必要に応じて仮想的な突然変異を起こすために選択したノードNkの設定を書き換え(ST8)、再度交叉させる(ST9)ことで新たな分裂を行い、期待する特性が得られるまでST3以降のプロセスを繰り返す。突然変異に利用されるデータについても適応度の判断データと同様、初期設定es又は信号算出部12cに含めておく。
ST6にて、期待する特性が得られれば、得られた信号を出力し(ST10)、プロセスを終了させ、ニューラルネットワークが完成される。以上が、細胞分化の仕組みを採用した本発明のアルゴリズムの概要である。
(実施形態例)
次に、実施形態例について図6の構成図を利用して説明する。なお、本実施形態例においては、具体例として本発明システムを利用したゴミ収集ロボットを例示するが、本発明システムの利用例はこれに限定されるものではない。
本実施形態例では、ゴミ回収実行部1が、広場のような場所で、紙くずや空き缶などのゴミを回収するロボットであるとして想定し、センサー部として具備したCCDカメラ11aが動作環境下における映像を撮影し、CCDカメラ11aの映像データに基づいて、異物が落ちているところまで動作部13が移動し、評価ユニットとなるゴミ回収ユニット14が、センサーにより異物を認識すると、ゴミとして回収することを目的としたシステムとする。
まず、評価部2は、個体定義モジュール23内において実行部1に対して実行部パラメータRP、ノードパラメータNP、オブジェクトパラメータOPからなる初期設定esを通信ユニット21を通じて実行部1の通信ユニット15に送信し、通信ユニット15は、初期設定esを信号算出部12cに受け渡すと同時に、開始命令をセンサー部11に送信する。
センサー部11は、ゴミ回収のため、動作環境をCCDカメラにて撮影し、異物(ゴミ)の存在を検知すると、入力データinとして入力データ受信部12aへ送信し、入力データ受信部12aは、受信した入力データinを入力データ信号変換部12bへ送信する。
入力データ信号変換部12bは、受信した入力データinをニューラルネットワーク用の入力データ信号insに変換し、信号算出部12cへ送信する。
一方、信号算出部12cは、通信ユニット15から受け取った初期設定esに基づいて、ノードNの配置後、ノード数の調整を開始し、ニューラルネットワークを作成する。
信号算出部12cは、ニューラルネットワークが完成すると、完成したニューラルネットワークに対し、入力データ信号insを入力する。なお、信号算出部12cにおいて、ニューラルネットワークが作成される前にデータ信号変換部から入力データ信号insが送信されれば、信号算出部12cは入力データ信号insをそのまま保持しておき、ニューラルネットワークが完成した後に入力データ信号insのニューラルネットワークへの入力を開始する。
ニューラルネットワークにおけるノードN1…kの信号の伝播により、出力データ信号outsが出力されると、信号算出部12cは、出力データ信号outsを出力データ信号変換部12dに受け渡す。
出力データ信号変換部12dで、出力データ信号outsが動作用の出力データoutに変換されると、出力データoutは出力データ送信部12eを通じて動作部13に送信され、動作部13は出力データoutに基づいて、指定の位置まで移動する。
ゴミ回収ユニット14は、動作部13が動作を終了すると、センサー部14aで異物を検知し、異物があれば動作部14bにてゴミを回収し、ゴミの回収が成功である評価情報eを通信ユニット15を通じて評価部2へ送信する。センサー部14aが異物を検知できない場合には、ゴミの回収が失敗である評価情報eを評価部2へ送信する。
個体評価モジュール24は、受け取った評価情報eを、ゴミ回収実行部1の固有データ及びロボット回収結果からなるスコア評価sを作成し、実行管理モジュール25にスコア評価sの作成結果を送信すると、実行管理モジュール25がデータベースへの書込み命令を開始し、スコア評価sをデータベースに書込む。
実行部1は、設定された任意の時間中、ゴミの探索、回収を繰り返し、その都度結果が評価部2へ送信され、評価部2において実行部1の評価データを蓄積する。
評価部2においては、任意の期間が終了すると、実行部1におけるごみ回収状況のスコア評価sを総括し実行部1におけるノードN1の評価としてデータベース22へ保管する。
評価部2は、再度、評価を行う必要があれば、初期設定esを実行部1に送信することにより、改めてゴミ回収及びその評価を繰り返す。
評価部2は任意の回数又は台数の実行部1のスコアデータを比較し、最も成果の高い実行部1におけるノードN1のパラメータを最適パラメータとして導き出す。
以上、本発明の実施の形態につき、最適手法検索システムの実施例を説明したが、本発明は、必ずしも上述した手段にのみ限定されるものではなく、特許請求の範囲に記載の範囲内において、適宜、変更実施することが可能なものである。
本発明による最適手法探索方法及び最適手法探索システムは、ニューラルネットワークをより効率的にリアルタイムで出力データを導き出すことができるため、ソフトウェア上においてもニューラルネットワークを実現することが可能となった。

Claims (10)

  1. 任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記動作主体に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を最適手法として導き出す最適手法探索方法であって、
    前記評価部は、仮想の細胞(ノード)及び細胞分裂に必要とする分子(数式群)の組み合わせから初期設定を作成し、前記実行部に当該初期設定を送信する個体定義手順と、
    当該実行部は前記初期設定に基づいて内部に仮想の細胞分裂空間を作成した後、当該初期設定に含まれる前記ノードを配置し、前記数式群に基づいて計算処理を実行することによりノードを分裂させてニューラルネットワークを生成するとともに、当該ニューラルネットワークが生成された後、当該実行部が具備するセンサーが検知した入力データを、当該ニューラルネットワークに入力することにより出力データを導き出し、当該出力データに基づいて当該実行部が具備する動作部を動作させ、当該動作結果を前記評価部に送信する実行部動作手順と、
    前記評価部は、受信した前記動作結果を元に、前記実行部の個体評価を作成すると個体評価手順と、
    を複数回順次実行することにより、前記個体評価の中から最も効率的な動作を導き出す、
    ことを特徴とする最適手法探索方法。
  2. 前記評価部は、
    ニューラルネットワーク作成のための座標データ及び、前記実行部の評価基準及び、前記ノード及び、前記数式群の値をパラメータとしてデータベースに保持し、
    前記実行部を動作させる際、前記データベースから前記パラメータを選択したものを初期設定として作成し、当該実行部に送信するとともに、
    前記初期設定に基づいて動作を行った前記実行部の動作結果を受信し、当該ロボットの個体評価として評価を作成し、前記データベースに蓄積することにより、前記データベースに蓄積された情報の中から最も効率的な動作を行う初期設定の組み合わせを探索する、
    ことを特徴とする請求項1に記載の最適手法探索方法。
  3. 前記実行部は、
    内部に前記実行部の動作状態を検知する評価ユニットにより、
    検知結果を前記評価部に送信する、
    ことを特徴とする請求項1又は2に記載の最適手法探索方法。
  4. 前記実行部は、
    前記評価部から受け取った前記初期設定に基づいて前記ニューラルネットワークを構成する一方で、
    前記実行部が具備するセンサー部にて前記環境の状態を入力データとして検知し、
    前記ニューラルネットワークが構成されると、前記入力データを当該ニューラルネットワークに入力することにより出力データを導き出し、
    前記実行部が具備する動作部に対し、前記出力データを送信することにより動作を行う、
    ことを特徴とする請求項1又は2に記載の最適手法探索方法。
  5. 前記ノードは、
    当該ノードの特性を区別するパラメータとして、
    当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持するとともに、
    前記数式群は、パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、
    ことを特徴とする請求項1、2又は3のいずれか1項に記載の最適手法検索方法。
  6. 任意の環境下において、ニューラルネットワークを適応し前記環境に応じた動作を導き出し実行するよう初期設定した実行部と、当該実行部に対し前記初期設定を与えるとともに前記動作終了後に当該実行部の動作内容を評価する評価部と、を備え、当該評価部が、前記実行部に複数回前記動作を実行させ、当該複数の導き出された動作結果の中から、最も効率的な動作を行う実行部の初期設定を探索する最適手法探索システムであって、
    前記実行部は、内部に仮想の細胞分裂区間を具備し、前記評価部が設定した仮想の細胞となるノード及び細胞分裂に必要な仮想の分子にあたる数式に基づいて、当該細胞分裂区間においてノード数の調整を行うとともに、当該実行部が具備するセンサーが検知した結果を、入力データとして当該ノードに伝播させて前記動作に必要な信号を導き出し、当該実行部にて動作出力するニューラルネットワークを構成する、
    ことを特徴とする最適手法検索システム。
  7. 前記実行部は、
    前記環境の状態を検知するセンサー部と、
    前記ニューラルネットワークを構成する探索部と、
    前記探索部により出力されたデータを元に前記動作を実行する動作部と、
    前記実行部の動作が成功又は失敗であるかを検知し動作評価として検出する評価ユニットと、
    前記評価部と、前記評価ユニットにおける前記動作評価及び前記初期設定を相互通信する通信ユニットと、を具備する、
    ことを特徴とする請求項6に記載の最適手法検索システム。
  8. 前記評価部は、
    前記実行部に対し送信する前記ノード及び関数のパラメータ及び前記実行部の評価を蓄積するデータベースと、
    前記データベースから前記ノード及び関数のパラメータの値を抽出し、前記実行部に送信する前記ノード及び関数の初期設定を作成する個体定義モジュールと、
    前記実行部より受信した前記動作評価と当該実行部に対し送信した初期設定とから当該実行部の個体評価を作成し、データベースに書込み保存する個体評価モジュールと、
    前記個体定義モジュール及び前記個体評価モジュール並びに前記実行部に対して、各動作の実行を指示する実行管理モジュールと、
    前記実行部との通信を行う通信ユニットと、を具備する、
    ことを特徴とする請求項6又は7に記載の最適手法検索システム。
  9. 前記ノードは、
    当該ノードの特性を区別するパラメータとして、
    当該ノードが配置される座標及び、複数の当該ノードを接続する接続線の接続強度及び当該ノードの接続先及び当該ノードの電位及び当該ノードにおける前記数式群の利用率を保持する、
    ことを特徴とする請求項6、7又は8のいずれか1項に記載の最適手法検索システム
  10. 前記数式群は、
    パラメータとして当該数式群中のそれぞれの数式同士の計算規則を示す数式と、前記ノードにおけるパラメータの変更度を示す数式からなる、
    ことを特徴とする請求項6、7又は8のいずれか1項に記載の最適手法システム。
JP2010550980A 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム Active JP4997429B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/069139 WO2011058621A1 (ja) 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム

Publications (2)

Publication Number Publication Date
JP4997429B2 true JP4997429B2 (ja) 2012-08-08
JPWO2011058621A1 JPWO2011058621A1 (ja) 2013-03-28

Family

ID=43991300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010550980A Active JP4997429B2 (ja) 2009-11-10 2009-11-10 最適手法探索方法及び最適手法探索システム

Country Status (5)

Country Link
US (1) US8838514B2 (ja)
EP (1) EP2500847B1 (ja)
JP (1) JP4997429B2 (ja)
CN (1) CN102713944B (ja)
WO (1) WO2011058621A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8768873B2 (en) * 2011-05-03 2014-07-01 Space-Time Insight Space-time-node engine signal structure
JP2017162273A (ja) * 2016-03-10 2017-09-14 オムロン株式会社 センサネットワークにおける機器間連携装置、機器間連携方法、機器間連携プログラムおよびこれを格納した記録媒体
CN107958455B (zh) 2017-12-06 2019-09-20 百度在线网络技术(北京)有限公司 图像清晰度评估方法、装置、计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139606A (ja) * 1993-10-29 2004-05-13 Ricoh Co Ltd 自律システム及び自律型ロボット
JP2006323657A (ja) * 2005-05-19 2006-11-30 Mie Univ 概念型情報処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2040903C (en) * 1991-04-22 2003-10-07 John G. Sutherland Neural networks
JPH096881A (ja) 1995-06-15 1997-01-10 Toyo Electric Mfg Co Ltd ニューラルネットワーク
CN1311880B (zh) * 1998-07-31 2010-04-14 特许科技有限公司 采用人造神经网络和遗传算法的高速公路事件自动检测系统
JP2003317073A (ja) 2002-04-24 2003-11-07 Fuji Xerox Co Ltd ニューラルネットワーク処理装置
US20040044633A1 (en) * 2002-08-29 2004-03-04 Chen Thomas W. System and method for solving an optimization problem using a neural-network-based genetic algorithm technique

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139606A (ja) * 1993-10-29 2004-05-13 Ricoh Co Ltd 自律システム及び自律型ロボット
JP2006323657A (ja) * 2005-05-19 2006-11-30 Mie Univ 概念型情報処理装置

Also Published As

Publication number Publication date
US20120271783A1 (en) 2012-10-25
EP2500847A1 (en) 2012-09-19
EP2500847B1 (en) 2018-04-18
WO2011058621A1 (ja) 2011-05-19
US8838514B2 (en) 2014-09-16
CN102713944B (zh) 2015-01-14
EP2500847A4 (en) 2013-07-31
JPWO2011058621A1 (ja) 2013-03-28
CN102713944A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
Fei et al. CPS data streams analytics based on machine learning for Cloud and Fog Computing: A survey
CN114637262B (zh) 基于5g驱动的智能工厂数字孪生信息的决策控制方法及系统
CN109814556B (zh) 一种多机器人协作探索未知环境与地图构建的装置与方法
CN111432015B (zh) 一种面向动态噪声环境的全覆盖任务分配方法
JP7060080B2 (ja) 組み合わせ制御システム、組み合わせ制御方法、および、組み合わせ制御プログラム
CN110413775A (zh) 一种数据打标签分类方法、装置、终端及存储介质
Huang et al. Robust multi-robot coordination in pick-and-place tasks based on part-dispatching rules
JP4997429B2 (ja) 最適手法探索方法及び最適手法探索システム
CN114595773B (zh) 基于工厂生产过程的多源异构孪生数据融合方法及系统
KR20180059335A (ko) 지식 증강을 위한 선순환 자가 학습 방법 및 그 장치
KR20230115970A (ko) 빅데이터 및 인공지능 기반의 제조 실행 시스템 및이의 운영방법
Caiazzo et al. An IoT-based and cloud-assisted AI-driven monitoring platform for smart manufacturing: design architecture and experimental validation
CN111291984A (zh) 多无人机分布式任务选择和轨迹设计方法及装置
Al-Salt A Comparsion between Genetic Algorithms and Sequential Quadratic Programming in Solving Constrained Optimization Problems
Guo et al. Exploring self-organization and self-adaption for smart manufacturing complex networks
Zeng et al. A deep reinforcement learning approach to flexible job shop scheduling
Sharif et al. Context Aware-Resource Optimality in Electric Vehicle Smart2Charge Application. A Deep Reinforcement Learning Base Approach
Ammeri et al. A comprehensive literature classification of simulation–optimization methods
JP2001503900A (ja) マルチ―カーネル・ニューラルネットワーク同時学習、モニタリング及び予想システム
Woo et al. Developing a big data analytics platform for increasing sustainability performance in machining operations
US20220172002A1 (en) Dynamic and continuous composition of features extraction and learning operation tool for episodic industrial process
KR102191160B1 (ko) 로봇 데이터의 인공 지능형 데이터 모델링 시스템 및 그 모델링 방법
Tang et al. Actively learning Gaussian process dynamical systems through global and local explorations
Kishore et al. A real-time machine learning based cloud computing architecture for smart manufacturing
Li et al. A new multi-objective genetic algorithm for assembly line balancing

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120410

R150 Certificate of patent or registration of utility model

Ref document number: 4997429

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250