JP2013020644A - ハイブリッド制御デバイス - Google Patents

ハイブリッド制御デバイス Download PDF

Info

Publication number
JP2013020644A
JP2013020644A JP2012222508A JP2012222508A JP2013020644A JP 2013020644 A JP2013020644 A JP 2013020644A JP 2012222508 A JP2012222508 A JP 2012222508A JP 2012222508 A JP2012222508 A JP 2012222508A JP 2013020644 A JP2013020644 A JP 2013020644A
Authority
JP
Japan
Prior art keywords
neuron
controller portion
synaptic
processors
actuators
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2012222508A
Other languages
English (en)
Inventor
Jason G Fleischer
ジェイソン ジー フライシャー
Szatmary Botond
ボトンド サットマリー
Donald B Hatson
ドナルド ビー ハットソン
Douglas A Moore
ダグラス エイ ムーア
A Snook James
ジェイムズ エイ スヌック
M Edelman Gerald
ジェラルド エム エデルマン
Krichmar Jeffrey
ジェフリー クリッチマー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neurosciences Research Foundation Inc
Original Assignee
Neurosciences Research Foundation Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neurosciences Research Foundation Inc filed Critical Neurosciences Research Foundation Inc
Publication of JP2013020644A publication Critical patent/JP2013020644A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39292Neural brain based controller based on simplified model of vertebrate nervous system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39385Hybrid control system with neural brain based controller and classical ctrler

Abstract

【課題】ロボット、特に周囲の状況について学習するように適合されたロボットを提供する。
【解決手段】ロボット用ハイブリッド制御システムは、ニューロン制御部分と非ニューロン制御部分とを含むことができる。
【選択図】図1

Description

(優先権の主張)
2005年9月13日に出願(代理人整理番号第NSRF−01008US0)されたJason G.Fleischer他による名称「ハイブリッド制御デバイス」の米国仮特許出願第60/716,821号。
2006年9月11日に出願(代理人整理番号第NSRF−01008US1)されたJason G.Fleischer及び他による名称が「ハイブリッド制御デバイス」の米国仮特許出願第11/530,685号。
本発明は、ロボット、特に周囲の状況について学習するように適合されたロボットに関する。
ロボットはますます一般的になっている。特に関心を持たれているロボットの1つの部類は、人工知能を使用してその周囲状況と相互作用をするよう学習するロボットである。
本発明の実施形態は、ニューロン制御要素及び非ニューロン制御要素の両方からなることができるハイブリッド制御システムに関する。
ハイブリッド制御デバイスの図である。 ハイブリッド制御デバイスの第1の実施例を示す図である。 ハイブリッド制御デバイスの第1の実施例を示す図である。 ハイブリッド制御デバイスの第2の実施例を示す図である。 ハイブリッド制御デバイスの第2の実施例を示す図である。 ハイブリッド制御デバイスの第2の実施例を示す図である。 個別のロボットプラットホーム上にあるハイブリッド制御デバイスを示す図である。 ハイブリッド制御デバイスに関する画像処理の実施例を示す図である。 ハイブリッド制御デバイスの操作の実施例を示す図である。 ハイブリッドデバイスの1つの実施例に関する高レベルのプレイ行動を示す有限状態オートマトンの図である。
本発明の態様は、同じ参照番号が同じ要素を示す添付図面の各図において限定ではなく例証として示される。本開示において、「ある」、「1つの」及び「様々な」実施形態に対する言及は、必ずしも同じ実施形態に対するものではなく、このような言及は少なくとも1つであることを意味する点に留意されたい。以下の説明において、本発明を完全に説明するために多数の具体的な詳細事項が記載されている。しかしながら、本発明は、これらの具体的な詳細がなくとも実施可能であることは、当業者であれば明らかであろう。場合によっては、本発明を曖昧にしないために周知の特徴部は詳細には説明していない。
ハイブリッド制御システムは、ニューロン制御要素及び非ニューロン制御要素の両方からなることができる。1つの実施形態において、デバイスは、擬似神経系のようなニューロン制御部分と、計算アルゴリズム、人工知能又は制御システム方法のような非ニューロン制御部分とから構成されるハイブリッド制御システムによって誘導される。ニューロン制御部分は、脊椎動物神経系の簡易モデルに基づくことができる。この理由のため、ニューロン制御部分の制御下にあるデバイスは、ロボットではなく脳ベースデバイスと呼ぶことができる。
図1は、センサ104、106及び108、並びにセンサ104、106及び108からの入力を受け取るコントローラ110を含むデバイスを示している。コントローラ110は、ニューロンコントローラ部分112及び非ニューロンコントローラ部分114を含むことができる。アクチュエータ116、118及び120は、コントローラ110からの制御コマンドを受け取ることができる。
センサ104、106及び108は、レーザセンサ、IRセンサ、ホイールセンサのような走行距離計測センサ、触覚センサ、カメラ、及び同様のものを含むあらゆる種類のセンサとすることができる。アクチュエータは、ホイールモータ及びステアリングモータのような移動アクチュエータと、把持手段、カメラ配向モータ、及び同様のものなどの他の物体と相互作用するアクチュエータとを含む、あらゆる種類のアクチュエータとすることができる。
1つの実施形態において、アクチュエータ116の少なくとも1つは、ニューロンコントローラ部分112によって制御される。別のアクチュエータ120の少なくとも1つは、非ニューロンコントローラ部分114によって制御することができる。
1つの実施形態において、アクチュエータ118は、ニューロンコントローラ部分112及び非ニューロンコントローラ部分114の両方によって制御することができる。
デバイス102はロボットとすることができる。ニューロンコントローラ部分112及び非ニューロンコントローラ部分114の両方は、ロボットのようなデバイスに装着して配置することができる。或いは、コントローラの一部分は、デバイスから遠隔にあり、無線リンクのようなリンクでデバイスと結合することができる。
ニューロンコントローラ部分112は、幾つかのニューロンユニットを有することができる。ニューロンユニットは、ニューロン又はニューロン群を模倣することができる。
1つの実施形態において、ニューロンユニットは、平均発火率モデルによって、シミュレートすることができる。各ニューロンユニットの平均発火率変数は、約30msの時間期間の間の約100個の実ニューロンからなる群の平均活性に対応することができる。
1つの実施形態において、モデルの中に電圧独立(VI)及び電圧依存(VD)の2つの種類の結合がある。VI結合は、既に活性を有するニューロンユニット内に電流を注入するだけである。VD結合は、後シナプス活性に関係なく電流を注入する。
ニューロンユニットiの活性に対するVI結合によるシナプス前入力は、次式で与えることができる。
ここで、Mは、解剖学的に定義された様々な結合タイプの数であり、Nl iは、ニューロンユニットiに投射している解剖学的種類l当たりの結合数である。よって、このシナプス前入力は、VI結合による後シナプス活性を発生させることができる。
ここで、ωは、前の時間ステップからの活性の持続を調整する項である。ここで、ユニットiの入力に対するVDの寄与を次式で定義することができる。
次に、VD結合からの後シナプス活性は次式となる。
従って、ユニットiに対する合計のシナプス後作用は、
POSTi=POSTi VI+POSTi VDである。
次に、この入力作用は、ニューロンユニットiの発火率に影響する。平均発火率(si)は、次式のように0(休止)から1(最大発火)までの範囲とすることができる。
ここでgは倍率である。
脳ベースデバイスにおいて、幾つかの結合は、デバイスの経験に応じて結合の強度を修正することができる。これらの塑性結合は、評価信号に依存するものと、評価信号に依存しないものの2種類の形式とすることができる。評価依存結合は、次式に従って学習することができる。
ここで、ηは一定の学習率、si(t)及びsj(t)はそれぞれシナプス後ユニット及びシナプス前ユニットの活性、V(t)は評価ニューロン領域内の現在の平均活性であり、現在の環境に関する何かが学習タスクに対して顕著であることを示す信号を発生させる。これは時間差違学習の形式である。非線形伝達関数BCM()は、Bienenstock、Cooper及びMunroeの公式に基づくことができる。関数BCMは、区分線形関数として実装することができ、スライディング閾値θ、2つの勾配(k1,k2)及び飽和パラメータρ(全体を通してρ=6)によって定義される、入力としての後シナプス活性を得る。
評価独立結合は、次式に従って修正することができる。
次に、評価独立結合は、経時的な制限の無い増強を防ぐために正規化することができる。
ここで、Kはユニットiに対する結合の総数である。
以下に説明するハイブリッド制御を伴うデバイスの実施例は、Segway Soccer Brain Based Device(SS−BBD)及びDarwin++を含む。本明細書に含まれる説明は、ニューロン要素と非ニューロン要素との間にどのようにして情報が流れるかを示している。
図2Aは、ハイブリッドデバイス200の実施例を示す。この実施例において、非ニューロンコントローラ部分202は、位置特定を行うための人工知能を含む。1つの実施形態において、位置特定ユニット204は、ニューロンコントローラ部分206からのデータを使用し、データをニューロンコントローラ部分206に提供する。
位置特定ユニット204は、確率的位置特定ユニットとすることができる。確率的位置特定ユニット204は、デバイスの位置の推定値を生成することができる。確率的位置特定ユニット204は、センサデータとアクチュエータによって生じる位置及び方向の予測変化とによって推定値を再計算することができる。確率的位置特定ユニット204は、ベイズ推定ロジックを使用して推定値を提供することができる。
1つの実施形態において、確率的位置特定ユニットは、粒子フィルタ位置特定を用いることができる。粒子フィルタ位置特定は、センサデータと位置情報の予測変化とによって各々更新することができる幾つかの可能性のある位置(又は「粒子」)を保持することができる。センサデータに基づいて、確率は各位置と関連付けることができる。粒子は、最終位置推定値を生成するのに用いることができる。1つの実施形態において、粒子の加重平均を用いて、最終位置推定値を生成することができる。
1つの実施形態では、ニューロンコントローラ部分206は、ニューロン海馬シミュレーション208とニューロンアクチュエータ制御部210を含む。位置特定ユニット204により、ニューロンコントローラ部分206がより良好な位置決定情報を提供することを可能にすることができる。海馬シミュレーション208は、位置特定ユニット204に対して位置推定値及び確率推定値を更新するのを助ける情報を提供することができる。図2Aの実施例において、ニューロン海馬シミュレーション208の位置決定情報は、アクチュエータ212を制御することができるニューロンアクチュエータ制御部210に送信することができる。レーザセンサ214及び走行距離計測センサ216は、ニューロンコントローラ部分206及び非ニューロンコントローラ部分202の両方が使用することができる。
位置特定ユニット204は、位置特定及び地図構築の同時実行(SLAM)ユニットとすることができる。SLAMは、ロボットの位置を特定しながら地図生成を同時に行うことができる。
本発明の1つの実施形態は、センサ214及び216と、該センサからの入力を受け取るコントローラ220とを含むデバイス200である。コントローラ220は、ニューロンコントローラ部分206及び非ニューロンコントローラ部分202を含むことができる。非ニューロンコントローラ部分202は、位置特定モジュールを含むことができる。位置特定モジュール204は、データをニューロンコントローラ部分に提供することができる。アクチュエータ212は、コントローラ220からの制御コマンドを受け取ることができる。
ニューロンコントローラ部分206は、データを位置特定ユニット204に提供することができる。アクチュエータ212の少なくとも1つは、ニューロンコントローラ部分206が制御することができる。デバイス200は、ロボットとすることができる。
Darwin++は、位置に関する情報をエンコードするために確率的位置特定アルゴリズムを海馬と呼ばれる脳領域の能力と組み合わせるハイブリッドモデルである。Darwin++は、Darwin X(付属書参照)の海馬モデルに基づいているが、環境を地図構築して当該地図上のロボットの位置を決定する非ニューロン要素が追加されている。情報は、位置特定モジュールから神経シミュレーションに流れ、次いで、該シミュレーションから戻って位置特定モジュールの位置の仮説を変更する。デバイスの位置は、多くの位置特定仮説(粒子)を保持する粒子フィルタにより決定することができる。全ての時間ステップにおいて、あらゆる粒子は、感覚データ及び運動コマンドに従って更新され、デバイスに対し最も可能性の高い新しい位置を提供することができる。
特定の粒子が、データをもたらす正しい位置である可能性が極めて低くなると、この粒子はフィルタから消失する可能性がある。正規の粒子フィルタでは、仮説は、残存する粒子のうちの1つの無作為にサンプリングされたコピーと置き換えられる。1つの実施形態において、仮説は、CA1内の場所細胞活性から引き出された仮説に置き換えることができる。このシステムは、それ以外では、海馬モデル、行動選択及び評価依存学習の性質に関する更なる情報をもたらすことになるはずの付属書内のものと実質的に類似している。
1つの実施形態において、海馬位置特定部BBDは、自然環境においては位置特定、経路計画、及び目標指向行動を示すナビゲーションシステムである。本システムは、その位置を位置特定するための視覚、レーザ、及び自己動作情報と、経路を計画するための行動選択システムとを組み合わせることができる。1つの実施形態において、本システムは連想記憶に依存するので、センサ故障に対してロバストとすることができ、センサの1つ又はそれ以上が損なわれたときでも効率的にナビゲートすることができる。
図2Bは、Darwin++の神経構築の詳細を示す。感覚入力は、海馬複合体に到達する前に皮質領域を通る。レーザ情報は、海馬への2つの経路をとることができ、すなわち第1に、範囲データが感覚情報として海馬に直接供給され、第2に、非神経位置特定アルゴリズムが、海馬に供給する神経領域内で組織分布的にエンコードされる空間の地図上の位置の推定値を生成することができる。次いで、海馬ループは、海馬領域CA1からの出力が運動領域に進み、次いでホイールを駆動する状態で、情報を処理することができる。またCA1からの出力を用いて、位置特定モジュールの新しい位置仮説を生成することができる。1つの実施形態において、神経シミュレーションは、90000の細胞及び150万のシナプスを有することができる。
表1は、Darwin++システムの1つの実施形態におけるニューロンユニットの特性を定義するパラメータの値を示している。領域V1、HD、LOCIN、R+及びR−は入力領域であり、これらの活性は、それぞれ、カメラ画像、走行距離計、確率的位置特定アルゴリズム及びIRセンサに基づいている。領域V1及びV2/V4は、色(赤色、緑色、青色及び黄色)に関して調整された4つのサブ領域と、可変の幅垂直バー用に調整された4つのサブ領域とを有する。その名称(例えば、ECINi)に小文字iを伴う領域は、抑制ニューロンユニットを含む。この表は、各領域又は各サブ領域(サイズ)におけるニューロンユニットの数を示している。各領域におけるニューロンユニットは、固有の発火閾値(σ−fire)、これを上回ると電圧依存結合が作用することができる閾値(σ−vdep)、持続パラメータ(ω)、及び倍率(g)を有する。
表2は、Darwin++システムの実施形態における解剖学的投射及び結合タイプの特性を示している。シナプス前ニューロンユニットは、所与の確率(p)及び所与の投射形状(軸)を有してシナプス後ニューロンユニットを結合する。この樹状形状は、高さ及び幅(h x w)を有する矩形「[]」、又は内側半径及び外側半径(r1,r2)によって制限されたリングサイズを有するドーナツ形もしくはリングの側方結合「Θ」、或いは、シナプス前又はシナプス後ニューロンユニットの何らかのペアが所与の結合確率を有する非組織分布的な「non−topo」とすることができる。初期結合強度cij(0)は、最小値及び最大値(min,max)により与えられた範囲内で均一に分布して無作為に設定される。cij(0)の負の値は抑制結合を示す。「intra」でマークされた結合は、視覚的なサブ領域内の結合を示し、「inter」でマークされた結合は、視覚的なサブ領域間の結合を示す。#でマークされた投射は、正の評価依存であり、これら投射は、TD学習にS+領域を使用する。*でマークされた投射は負の評価依存であり、TD学習にS−領域を使用する。結合タイプは、電圧独立(VI)又は電圧依存(VD)とすることができる。φは結合の持続性を示す。η、k1及びk2の非ゼロ値は塑性結合を示す。
図3Aは、ハイブリッドデバイス300の別の実施例を示す。この実施例において、IRセンサ302、カメラ304及びレーザセンサ306などのセンサからの情報は、非ニューロンセンサ処理部308に送ることができる。非ニューロンコントローラ310は、物体マニピュレータアクチュエータ312のような少なくとも1つのアクチュエータを制御することができる。ニューロンコントローラ部分314は、カメラ配向アクチュエータ316のような少なくとも1つのアクチュエータを制御することができる。1つの実施形態において、ニューロンコントローラ部分314及び非ニューロンコントローラ部分310は、動作アクチュエータ318のようなアクチュエータの制御を分担することができる。例えば、ニューロンコントローラ部分314は、非ニューロンコントローラ部分310によるオーバライドにより動作アクチュエータ318を制御することができる。
ニューロン及び非ニューロンコントローラ部分314及び316は各々、センサ処理部分320及び308とアクチュエータ制御部分322及び324とを有することができる。信号は、必要に応じてこれらの部分間に送ることができる。
1つの実施形態において、レーザ及びIRデータは、非ニューロンコントローラ側に完全に留まることができ、該データを用いて運動コマンドを発生させて非ニューロンコントローラによりボールキャッチャを作動させることができる。経路は、感覚処理要素からアクチュエータ制御要素に位置付けることができる。
1つの実施形態において、デバイス300は、センサ302、304及び306と、該センサ302、304及び306からの入力を受け取り、且つニューロンコントローラ部分314及び非ニューロンコントローラ部分310を含むコントローラ301と、該コントローラ301からの制御コマンドを受け取るアクチュエータ316、318及び312とを含む。アクチュエータ312の少なくとも1つは、ニューロンコントローラ部分によって制御することができる。アクチュエータの別の少なくとも1つは、非ニューロンコントローラ部分310によって制御することができる。
1つの実施形態において、アクチュエータ318は、ニューロンコントローラ部分314及び非ニューロンコントローラ部分310の両方によって制御される。
デバイス300は、移動ロボットのようなロボットとすることができる。ニューロンコントローラ部分314及び非ニューロンコントローラ部分は、ロボット上に存在することができる。
Segway Soccer Brain−Based Device(SS−BBD)は、擬似神経系ニューロンコントローラ部分及びより従来的なロボット制御アルゴリズムの両方から構成される例示的なハイブリッド制御システムである。擬似神経系は、脊椎動物神経系の簡易モデルに基づくことができる。神経シミュレーションは、主として感覚運動制御を担うことができ、非ニューロンコントローラは、より高レベルの行動選択を提供することができる。図3Bは、例示的なハイブリッド制御システムのアーキテクチャを示しており、以下のように説明することができる。IRセンサ、カメラ、及びレーザ距離計は、システムに対し感覚入力を提供する。行動選択は、中央モジュールとすることができ、近隣物体に関するIRセンサからの非神経入力を受け取ることができ、又、神経視覚系によって視覚データを解釈させる。行動選択は、頭部及び胴体動作ニューロン領域を通して直接コマンドを幾つかのアクチュエータに送り、間接コマンドをSS−BBDのホイールに送ることができる。デバイスの動作はまた、障害物検出及び回避機構(経路計画システム)の影響を受ける可能性がある。
視覚の初期段階は、非神経性のものとすることができる。RGBカメラ画像は、数学的アルゴリズムによってYUV色空間画像に変換することができる。Yコンポーネント(光強度情報)は、数学的アルゴリズムによってエッジ検出することができる。画像のUVコンポーネント(色情報)は、前に生成された顕著な色の参照テーブルと比較することができる。参照テーブルは、画像内の固有の色が顕著な色の1つに一致する確率を表すことができる。
神経処理は、次の段階で始めることができ、エッジフィルタ処理された画像は、エッジ情報を示すニューロン群における活性値に変わり、顕著な色の確率的表現は、これらの色を示すニューロン群における活性に変わることができる。これらの群は、第1及び第2の視覚野内の領域にほぼ等しくなることができる。
これらの色及びエッジ群は、その活性がサッカーボールのような視野内のある顕著な物体の存在を示すニューロン群に結合することができる。これらの群は、下部側頭葉及び頭頂葉皮質の機能に類似する機能を有することができる。
運動ニューロン領域は、SS−BBDの頭部(パン−チルトカメラ)及び胴体(ホイール速度)を制御することができる。これらの群内の活性は、オーバライド運動が存在しなければ、現在追跡されているあらゆる標的物体に接近するようにデバイスを駆動することができる。
ボールハンドリングアクチュエータは、非神経行動選択コントローラによって直接駆動することができる。
非神経アルゴリズムは、あらゆる所与の時間においてどの物体が顕著であるか、及びその物体が所定位置に留まっている間に接近すべきか又は単に追跡すべきかどうかを決定する役割を担うことができる。例えば、SS−BBDは、相手を追跡することができるが、ボールが近くに転がると、ボールは捕捉されるべきである。行動選択機構は、標的を変える決定を行う役割を担うことができる。行動選択は、標的物体を示す神経視覚領域からの情報を使用してこれらの決定を行うことができる。行動選択はまた、IRセンサからの非神経的に処理された情報を使用することができる。行動選択は、追跡することを決定したあらゆる物体ニューロン群(例えば、ボール)とヘッドニューロン群との間の時間的結合を形成し、従って、その物体を自動的に追跡する神経制御ループを生成することができる。
非神経アルゴリズムは、レーザ距離計及びIRセンサからの情報を使用して、避ける必要のある障害物が近隣に存在するか否かを判断することができる。この場合、アルゴリズムは、現在の標的物体(行動選択機構によって選択された)に接近する必要性と、障害物に衝突しないようにする必要性とのバランスをとろうとする。障害物位置に関する情報は、レーザデータから得ることができ、障害物位置に関する情報は、標的物体ニューロン領域における活性から抽出することができる。障害物が存在するときには、障害物回避モジュールからの運動出力は、本体ニューロン群からの出力をオーバライドすることができる。
図4はSS−BBDデバイスを示している。これらのデバイスは、(A)能動捕捉デバイス、(B)レーザ距離計、(C)パン−チルトユニット及びカメラ、(D)キック組立体、(E)受動捕捉リング、及び(G)衝突バーを含むことができる。
SS−BBDは、Segway Human Transporterの市販のロボットのバージョンであるSegway Robotic Mobility Platformに基づくことができる。6つの小型Pentium(登録商標) IV PC群及びこれを45分間駆動するのに十分なバッテリ容量を含む市販用ベースの上にアルミニウムシャーシが置かれる。緩衝取付衝突アームが、衝突又はバランスコントローラ故障の際にデバイスを保護する。SS−BBDは、カラーカメラ、レーザ距離計、及びデジタルコンパスを含む種々の感覚システムを有する。短距離IR近接センサのバンクは、近隣のサッカーボールを検出するためにデバイスの周囲の下部に装着することができる。IRセンサの1つのバンクは、前面に装着されたカメラ及びレーザ距離計の感知している円弧の外側にある近隣の非ボール障害物を検出するために、ボール高さよりも上の後部に装着することができる。
SS−BBDは、サッカーボールを扱うことが可能になるソレノイド作動デバイスを有することができる。可撓性の顎状プラスチックキャッチャのペアが、デバイスの前に接して堅固にボールを挟むことができ、ボールと共にデバイスを所定位置で回転させることができるようになる。ボールをキックするために、キャッチャが引き上げられ、ソレノイドの第2のセットが4つのバー連結を作動させ、ボールに推進力を与えることができる。受動デバイスは、側面及び後部上に入ってきたボールを捕捉するのを助け、ストラップ上に装着された可撓性プラスチックのリングが、入ってきたボールの衝撃を吸収し、ボールがリングの下に滑り、ボールをデバイスにトラップすることができる。次に、下部に装着されたIRセンサは、ボールがデバイスのいずれの側に位置しているかに関して検出することができ、単純な定位置旋回運動は、ソレノイド駆動キャッチャを用いてデバイスがボールを捕捉する前面にボールが位置するまで、デバイスが回転することができるようにする。
図3Bは、1つの実施形態の制御システムの全体アーキテクチャを記載しており、以下のように説明することができる。IRセンサ、ファイヤワイヤカメラ及びレーザ距離計は、システムに感覚入力を提供することができる。行動選択は中央モジュールを有することができ、中央モジュールは、近隣の物体に関するIRセンサからの入力を受け取り、更に、神経視覚系によって解釈された視覚データを得ることができる。行動選択は、頭部及び胴体動作ニューロン領域を通して幾つかのアクチュエータに直接コマンドを送信し、SS−BBDのホイールに間接コマンドを送信することができる。本デバイスの動作はまた、障害物検出及び回避機構(経路計画システム)によって影響を受けることができる。
1つの実施形態において、有効な行動を保証するために、ロボットサッカーは、プレイしているフィールド上の物体を識別するために、迅速でロバストな視覚情報処理を必要とすることができる。この節においては、この要件を満足するために適用した方法及びアーキテクチャを説明する。
視覚情報は、毎秒30フレーム及び640x480ピクセルで動作する広角レンズを備えたSony製IEEE1394カメラによって、SS−BBDに提供することができる。未処理の感覚ピクセルデータは、輝度及び色チャネルに分離することができる(YUV色空間)。図3Cは、この視覚情報が、神経シミュレーションによって処理される方法を示すことができる。すなわち、輝度情報は、ニューロン領域を検出するエッジのセットを提供し、色情報は、ゲームに関連する特定の色を検出するのに専用のニューロン領域を動作させることができる。これらの初期視覚領域からの情報は、ゲームに関連する物体を検出するニューロン領域内で組み合わされる。
1つの実施形態において、異なる色又は色の組合せを有するロボットセンサフィールド上の5つの重要な物体、すなわち、自分のゴール、相手のゴール、ボール、チームメート及び対戦相手が存在する。視覚系は、6つのニューロン色群を使用することができ、その各々が好ましい色、すなわち、赤色、緑色、青色、黄色、ピンク色及び紫色を有する(図3Cを参照)。主に色ベースの物体認識をスピードアップするために、ツールは、UV色空間上の各色に関して参照テーブルを生成することによって、これらの好ましい色を認識することができる。色のテーブル内の値は、その固有の色に属する特定のUV座標の確率と見なすことができる。色参照テーブルを生成するための例示的なユーザインターフェースからのスナップショットが図5に示されている。
視覚及び物体認識神経系は、15個のニューロン領域を含むことができる。図3Cは、様々なニューロン領域、フィードフォワード及び再発興奮性配置、及び抑制シナプス結合を含むシステムの高レベル図を示している。このモデルは、霊長類視覚系の最近のモデルに基づいており、ここで、エッジ及び色フィルタ処理ニューロン領域が1次視覚野にほぼ対応し、物体認識ニューロン領域が、下部側頭葉及び頭頂葉皮質に類似した機能を実施する。ニューロン視覚領域の色及びエッジ群は、前処理された視覚感覚入力との直接的で組織分布的な結合で存在することができる(図3C)。
・6つの色ニューロン群の各々は、画像がその色参照テーブルによって決定された好ましい色にどれほど近く一致するかに比例した活性を有することができる。すなわち、色群における各細胞の活性は、画像内のピクセルの好ましい色に対する「接近度」を示す。例えば、緑色のガラス上に赤いボールを有する絵では、赤色群の活性は、ボールが存在する座標上を除いて、殆ど全ての場所でほぼゼロ(休止)とすることができる。
・垂直方向、水平方向、及び2つの対角線上のエッジフィルタ処理されたYチャネルは、対応する4つのエッジ群上に直接マッピングすることができる。SS−BBDの神経モデルにおいては、プレイしているフィールド上でロボットが認識する必要のあった各物体は、自己ニューロン領域、すなわち、ボール、ゴール、チームメート、対戦相手及び相手のゴール領域を有することができる(図3C参照)。これらの物体群は、1つ又はそれ以上の色ニューロン群からの組織分布的入力を受け取ることができる。
物体によっては単一の色を使用して検出することができる。例えば、ボールは赤色、ゴールは紫色、対戦相手のゴールはピンク色とすることができる。しかしながら、チームは、色の組合せによって示すことができ、例えばある場合において、自分のチームは、同じ色標識上で紫色及び黄色である。これらの物体に関して、対応するニューロン領域は、近隣の組織分布的な位置においてこれらの色の併用を認識することができる。ボールニューロン領域はまた、その形状すなわち特定の形状のエッジの併用によってボールを認識することができる。物体領域は、再発自己興奮性結合を有することができ、幾つかの物体領域はまた、他の物体領域に対する抑制結合を有していた。システムにより形成された抑制結合は、よりロバストとすることができる。視界において同じ場所内に存在するはずがない物体群は、互いに抑制結合を有することができる。これらを全てまとめて考えると、視覚物体認識は、色情報、調整された自己興奮性、並びに物体群及び形状情報間の相互抑制に基づくことができる。これら全てを合わせると、神経シミュレーションが効率的に物体を認識することが可能になる。
図3Cは、視覚系及び物体検出のための概略的な神経アーキテクチャを示しており、以下の特徴を有する。すなわち、視覚系及び物体検出のための概略的な神経アーキテクチャは、1)取得画像のRGBからYUVへの変換、2)UV領域におけるY(輝度)チャネルのエッジフィルタ処理及びカラーフィルタ処理、3)エッジ及び色ニューロン領域が物体ニューロン群と結合されること、4)相互/横方向興奮及び再帰的抑制が物体認識の改善の一助となることである。処理の流れにおける全ての結合は組織分布的とすることができる。黒丸を有する線は抑制を意味することができ、矢印は興奮結合を示すことができる。
図5は、UV領域における色固有のガウスエンベロープ参照テーブルの作成を示している。ユーザは、視野の領域を切り取り、切り取った領域は、選択された色(物体)だけからなることができるようにすることができ、上述の実施例においては赤いボールである。次に、統計的アルゴリズムは、切り取られた領域のRGBピクセル値を読み取り、該ピクセル値をYUVに変換し、該UV値だけに基づいて、UV空間上の2次元確率面のようなガウス分布を生成する。この面は、保存されて、その特定色に関する参照テーブルとして使用することができる。
人間が物体を探すときには、頭部及び目の両方が適切な方向に向いているが、目は、より迅速に動くので最初に辿り着く。目が物体に対するサッカードを完了した後、頭部が回転を完了すると、目は円滑追跡相に入って物体を追跡し、次いで、目はもう一度頭部の中心に位置するようになる。又、標的への移動の場合のように胴体もまた視覚探索に関わる場合、目−頭部協働の後に胴体が頭部を再び中心に戻す。
SS−BBDの標的追跡行動は、人間の行動に類似することができ、すなわち、カメラサッカードは標的物体に目を向けることができ、胴体は、追従するように回転するが、カメラは、物体をスムーズに追跡する。次の段落では、このアルゴリズムを実施することができる神経機構を説明する。ニューロン物体領域の活性は、網膜部位に作られ、標的物体であるように選択されたこれらの領域のいずれもが、網膜部位のパン領域及びチルト領域に投射することができる。従って、パン領域の活性は、標的領域における活性の水平分布を反映することができる。パン領域における活性は、トポロジー方法でパンアクチュエータを駆動することができ、領域の右へのより大きい活性は、カメラが右に向くことを意味する。従って、カメラは、右に向き、画像の右半分内にある物体を再び中心にすることができる。チルト領域は、垂直方向で同様に作動することができる。標的物体の速度に関する情報はまた、パン及びチルト領域の活性を変更することができる。これによって、凝視システムは、位置情報のみが使用された場合に可能であるよりも迅速に動いている物体を追跡することができる。標的物体の見かけの速度は、連続的に計算することができる。2つのスリップ領域(垂直位置に1つと水平位置に1つ)は、標的物体が存在することが予測される場所を示す活性を有することができ、現在の位置及び速度が与えられる。水平方向のスリップ領域は、パン領域に投影することができ、垂直方向のスリップ領域は、チルト領域に投影することができる。このアーキテクチャの結果は、動いている物体に遅れるのではなく、その物体をリードする傾向があること、従って、頭部に追従する胴体動作がより滑らかな軌跡を有することとすることができる。
次に、パン領域の活性は、SS−BBDの回転速度を制御する胴体運動領域に組織分布的に投射することができる。胴体領域内の中心から外れた活性は、当該方向での回転を生じることができる。総合システムは、視覚領域から運動領域に至る活性のカスケードをもたらすことができ、これは行動の変化及び視覚入力の変化を生じることになる。頭部−胴体追跡があまり制約されていなければ、追跡行動が以外にも幾分滑らかな動作にすることができる。しかしながら、カメラ及び胴体動作の時間定数が極めて異なることにより、追跡行動がほとんどの環境において減衰不足になるのが防止される。
コントローラの非神経要素は、2つのレベル、すなわち行動とプレイ上に編成することができる。行動は、物体を探索する又はボールをキックするなど、デバイスが行う原子動作とすることができる。各行動は、他の行動から独立して運動ニューロン領域にコマンドを送る別個のコントローラとすることができる。1つの実施形態において、1つの行動のみがどの時点においても活性化であることが可能であり、センサから直接入力を受け取り、又は感覚ニューロン領域から事前処理された入力を受け取ることができる。基本プレイは、一連の行動と、コントローラが各新しい行動への遷移を引き起こすことになる感覚条件とから構成することができる。プレイはまた合成的とすることができ、すなわちより複雑なプレイは、他のプレイ並びに行動から構成することができる。あらゆるプレイは、実施可能な行動の同じセットを利用するが、これらの行動を種々の方法で再結合し異なる結果をもたらすことができる。最後に、人間のプレイヤがSS−BBDによるプレイの通常の自律的実行をオーバライドすることを可能にする機構が存在してもよい。ボイスコマンドシステムは、SS−BBDにコマンドを無線中継する、人間のプレイヤのSegway Scooter上に設置することができ、人間のプレイヤによって要求された新しいプレイをSS−BBDに実行させるようにする。
SS−BBDによって使用される行動は以下のこととすることができる。物体発見、すなわち標的物体が視覚的に認識されるまで所定位置でカメラをパンし、SS−BBDを回転させる。物体追跡、すなわちパン−チルトユニット及びSS−BBDのホイールの両方を使用して標的物体に目を向けたまま標的物体に近づく。ボール捕捉、すなわちボールに近づくために最後の操作を行い、キャッチャを下ろしてボールを捕まえる。キック、すなわちキャッチャをボールから離して持ち上げ、キックソレノイドを作動させる。ボールのキック及び捕捉行動は、簡単で正確に調整されたコントローラとすることができる。ボール捕捉は、ニューロン視覚ボール領域及びIRからの直接の非神経信号の両方からのフィードバックを使用してボールを捕捉する正しい点にSS−BBDを案内する比例コントローラとすることができ、この点でソレノイドを作動させる。キックは、約1.5m/sで進む真っ直ぐで力強いキックをもたらすキャッチャソレノイド、キッカーソレノイド及びホイールに対するオープンループシーケンスのコマンドとすることができる。両行動は、ボールが上手くキック又は捕捉されていない場合に、処理を補正又は再始動することができる幾つかのエラー補正ロジックを有することができる。
物体発見行動及び物体追跡行動は、神経シミュレーションによって検出されるあらゆる物体、すなわちサッカーボール、フィールド上のゴール、チームメート、又は対戦相手のいずれかに対して作動するように設定することができる。物体発見は、その実行の環境に応じて、2つの異なるアルゴリズムすなわち、(1)前に追跡していた物体の一時的な喪失の間に呼び出された場合と、(2)新規の探索のために呼び出された場合とを有することができる。第1のケースは、標的物体に関して何らかの速度情報が存在する場合に起こることができ、物体発見は、この情報を用いて物体の移動が観測された同じ方向で探索を誘導する。この速度信号によって、幾つかの障害物によって一時的に閉ざされた物体の経路を物体発見が追従し続けることが可能になる。或いは、物体発見は、標的物体に関し無作為の方向で探索することができる。パン−チルトユニットは、デバイスの胴体が回転できるよりも高速にカメラを追跡することができるので、該ユニットは、物体に関するパンの制限に対してヘッドチェックを最初に行う。見つからなかった場合、デバイスは、頭部動作から胴体動作に同じ方向で滑らかに遷移することができる。
物体追跡行動は、目/頭部−胴体協働に関する心理物理学的データの基づくことができ、神経機構を使用して実施することができる。SS−BBDが、ボールを持っていないとき(例えば、こぼれ球を追跡している間)には、物体追跡によってSS−BBDは前進し且つ標的の方に向くことができるようにする。SS−BBDがボールを持っているとき(例えば、ゴールへのシュートの位置についているとき)には、所定位置で単に回転することができる。前進時、物体追跡は、標的追跡と障害物回避とのバランスをとる計画された障害物回避アルゴリズムを使用する。人間が道に沿って障害物を回避しながら、所望の位置に到達しようとするタスクに直面すると、人間のナビゲーション行動は、簡易力学モデルによって説明され予測することができる。SS−BBDは、障害物が存在する際の物体追跡行動を実行するときに、この人間心理物理学モデルを使用して経路を計画することができる。
このモデルは、標的と障害物の両方に対する角度進行方向及び距離の関数としてSS−BBDの角速度を制御することができ、この場合、各障害物に関する項を線形結合することによって、複数の障害物の存在を扱うことができる。因子の進行方向(φ)、障害物距離(do)及び進行方向(Ψo)、標的距離(dt)及び進行方向(Ψ+)は、因子の角速度を決定するためのバネ質量型方程式における変数である。
ここで、第1項は、標的物体への引力を抑制するバネ関数であり、第2項は、障害物からの斥力を決定づける関数である。この式において、進行方向は、ラジアン単位であり、距離はメートル単位である。SS−BBDによって使用されるモデルと人間行動を再現するように意図された原型モデルとの間に差異がある。人間モデルは、減衰項(すなわち、φの関数)を有することができるが、この例示的実施形態においては存在しない。標的物体に対する引力は、このモデルにおいては標的への距離に関連する必要がないが、人間モデルは、指数関数的な距離の項とすることができる。このモデルは、ロボット進行方向からはるかに離れている障害物に反応し、同じ方向にあるこうした障害物により強く反応する。SS−BBDは、人とは実質的に異なる動特性を有するので、障害物項に対する変更及び減衰項の除去を利用することができる。標的物体を発見するために視覚情報を使用するので標的物体項において距離依存関係が無いことを利用することができ、該視覚情報は、十分な進行方向情報を容易に提供するが、実質的な画像処理を行うことなく不十分な距離情報を提供する。
これとは対照的に、障害物は、正確な距離及び進行方向情報を提供するレーザ距離計の使用により検出することができる。障害物は、全てが距離計から2メートル未満にある、少なくとも3°の円弧の範囲を定める隣接レーザ測定値のあらゆるセットとして定義することができる。従って、障害物に関する値Ψo及びdoは、これら3つのレーザ測定値の平均値に等しくなることができる。3°要件は、障害物の偽陽性検出に対する耐性の尺度を提供する。このデバイスは、厳しい安全要件を伴う実環境において作動するので、SS−BBDの並進及び回転速度が付加的な制約を受ける。デバイスの通常の最大前進速度は5m/sであるが、この速度は、レーザ距離計によって検出されるあらゆる障害物の平均距離に比例して低くすることができる。このことにより、クラッタ環境において速度を低下することによって安全性を高めることができる。障害物が前方弧において1m未満にあり、後方弧において1m内に障害物がない(後方IRセンサによって決定されるように)限り、追加の安全性を提供することができる。
図7は、3つの基本的なプレイが行動及びこれらの間の条件遷移からどのように構成することができるかを表す有限状態オートマトンを示している。プレイ選択に至ると、別のプレイが選択され実行される。これらのアルゴリズムを使用する典型的な回避経路の実施例は図6で見ることができる。プレイは、行動よりも高レベルの制御とすることができる。プレイは、行動又は他のプレイからも構成することができる。プレイは、状態が特定の行動、動作又は他のプレイである有限状態オートマトンとすることができる。全ての有限状態オートマトンにおいて同様であるが、プレイを定義する制御の流れを決定する状態間の条件遷移のセットが存在する。SS−BBD上で使用されるプレイのほとんどは、「ボールを追いかける」又は「チームメートにパスする」或いは「ダウンフィールドでゴール近くまで走る」といった、フィールド上の極めて単純な動作のレベルにあるものとすることができる。図7は、基本的プレイである、追いかけ、パス、及びダウンフィールド走を表す有限状態オートマトンを示している。1つの実施形態において、レパートリにおける他の基本的プレイは、シュート(標的が相手のゴールであること以外はパスと同じ)、アップフィールド走(標的を除いてはダウンフィールド走と同じ)、チームメートへの追従、対戦相手のマーク、自分のゴールのブロック、及び待機(所定位置に留まり、ボールを追跡しているが、捕捉するためにボールが十分に近づくまで前進しない)とすることができる。SS−BBDはまた、基本的プレイから構成されたより複雑な幾つかのプレイを有することができる。このようなものの1つは、ダウンフィールドでボールを移動させるように設計された単純な攻撃的プレイである。プレイの流れは、追いかけからパス、及びダウンフィールド走に移行する。ダウンフィールド走が完了すると、プレイは、追いかけに戻り、シーケンスを繰り返すことができる。シーケンスにおける各サブプレイは、その正常な実行を終了したときに次のサブプレイに遷移することができる。
どの時点においても、制御の流れは、人間のチームメートからの声のコマンドによって中断することができる。人間が乗るSegway HT スクータは、マイクロフォンに結合された音声認識ボード(例えば、カリフォルニア州Santa Claritaに所在のSensory Inc.のVoice Extreme(商標)Toolkit)を有し、特定の音声に対して訓練した後、約12個の個別の短いフレーズについて認識することができる。これらのフレーズは、SS BBDのレパートリ内の種々のプレイについてのコードネームとすることができ、このような各フレーズについて、対応するコマンドがSS BBDに無線送信され、SSBBDは、該コマンドを受信すると直ちに目的のプレイを実行する。
模倣生物学は、近年ロボットシステム構築において広く認められた手法になったが、発明者らはシステム神経科学レベルでの行動制御に特に関心がある。脊椎動物神経解剖学及び神経生理学の大規模神経シミュレーションを利用して、実際の神経がどのように機能するかの仮説をテストすることができる。このような神経シミュレーションは、抽象的なシミュレーション世界において動作するのではなく、リッチ環境と相互作用する現実世界のデバイスにおいて具現化されることが重要であると考えている。動物行動の複雑性の大半は、神経系、胴体の他の部分及び環境間の相互作用に起因する。脳ベースデバイスの手法は、従来の技術手法及び人工知能手法を用いては得ることが困難なロバスト性と適応性とを備えて、動的環境においてタスクを持続し且つ遂行する必要があるロボット設計に対する知見を提供する。発明者らは、BBD法をこのSegwayサッカーロボットの設計に応用して、人間と協働的及び競合的、並びに最も重要なことには安全に相互作用することが可能なデバイスを提供した。
これらの2つのデバイスにおいて、ニューロン制御要素及び非ニューロン制御要素が互いにどのように相互作用するかを説明する例示的な動作原理がある。
・ニューロン群における活性量は、非ニューロンコントローラに決定を行わせることができる。例えば、ボール領域のニューロンユニットの総活性が閾値を上回る場合、ボールは視界内に存在し、動作選択ユニットは、ボールを追いかけるよう決定することができる。
・組織分布的にマッピングされたニューロン群における活性の位置は、制御信号として非ニューロンコントローラが使用することができる。例えば、ボールを追跡している間に、障害物がSS−BBDの前で発見される。ボール領域内の活性の質量中心は、視界におけるボールの方位角及び進行方向に対応するx、y値を提供することができる。ボールの進行方向は、障害物回避アルゴリズムが障害物進行方向と併用して使用して、SS−BBDがどの方向に駆動すべきかを判断することができる。
・非ニューロンコントローラは、ニューロン群の間に一時的な結合を生成することができる。例えば、動作選択モジュールは、ボールを追いかけるべきであることを決定する。非ニューロンコントローラは、ボール群から頭部運動群への結合を生成し、結果として得られるニューロン活性のカスケードにより、SS−BBDがボールを追いかけるようになる。
・非ニューロンコントローラは、ある特定の状況において、ニューロンコントローラの運動出力をオーバライドすることができる。例えば、障害物回避モジュールは、自己の運動コマンドを優先して障害物を検出したときに、頭部−胴体ニューロンコントローラの出力を抑制することができる。
・ニューロンコントローラ及び非ニューロンコントローラの両方は、同じ入力ストリームを共有することができる。例えば、Darwin++は、感覚の皮質領域に直接進むレーザ距離データを有する。同じデータはまた、位置特定モジュールによって処理され、地図上の位置を決定することができる。
・推定値を改良するニューロンコントローラと非ニューロンコントローラとの間の情報の循環流れを構築することができる。例えば、Darwin++において、位置特定モジュールは、位置の推定値を提供する。すなわち、この推定値は、海馬の複雑モデルに与えられる幾つかの感覚手法の1つである。海馬のCA1領域内のニューロンユニットは、場所に強く関係している活性を有し、従って、これらのユニットの活性を用いて、閉じた円の位置特定モデルに関する位置の新しい仮説を提供することができる。
・非ニューロンコントローラは、神経活性を調節することができる。SS−BBDの1つのバージョンにおいて、ボールを追いかけている間にボール群から頭部群への一時的な結合が行われるのではなく、全ての物体領域から頭部群への結合が生じる場所でモデルが実装された。しかしながら、動作選択モジュールは、関心のある領域の基礎活性を増やし、物体領域間の相互抑制を許容して、頭部運動領域に向かう他の信号を無効にすることになる。
1つの実施形態において、コードは、約20,000回線を有し、以下:メイン:ソフトウェアのインフラストラクチャ;始動、停止、及び他のモジュール間の通信(1k回線)。ディスプレイ:ユーザインターフェース及び神経シミュレーションの現在状態の視覚化(1.5k回線)。視覚:カメラの低レベル操作及び画像前処理(3k回線)。センサ:IRセンサ、コンパス及びレーザ距離計の低レベル操作(2.5k回線)。Segway:Segway Robotic Mobility Platformによる通信(800回線)。アクチュエータ:パン−チルトユニット及びソレノイドの低レベル操作(700回線)。音声:人間のプレイヤの音声声コマンドモジュールによる通信(300回線)。シミュレータ:神経シミュレーション(5k回線)。動作選択:デバイス行動を制御する非神経アルゴリズム(3k回線)。位置特定:確率的アルゴリズムを使用してグローバル座標系におけるデバイスの位置を推定するコード(1k回線、Darwin++においてのみ)の主要なモジュールからなる。すなわち、総コードベースの約1/4がニューロン制御に専用で、1/6が非ニューロン制御専用、1/3が低レベルセンサ及びアクチュエータ操作、残りがインフラストラクチャ、通信、及びユーザインターフェース専用である。

表3は、1つのSegway Soccer BBDにおけるニューロンユニットの特性を定義するパラメータ値を示している。視覚的な予測物体位置及びパン−チルト位置領域は入力領域であり、これらの活性は、ハイブリッドの非神経要素によって(それぞれ、視覚処理アルゴリズム、物体領域活性の数学的変換、及びパン−チルトユニットに送られるコマンドによって)生成される。物体領域は、視界において特定の項目が配置される場所を表している。運動領域における活性は、様々なアクチュエータへのコマンドを生成するのに使用される。この表は、各領域又は各サブ領域におけるニューロンユニットの数(サイズ)を示している。各領域におけるニューロンユニットは、固有の発火閾値(σ−fire)、これを上回ると電圧依存結合が作用することができる閾値(σ−vdep)、持続パラメータ(ω)、及び倍率(g)を有する。
表4は、1つの実施形態のSS−BBDにおける解剖学的投射及び結合タイプの特性の実施例を示している。シナプス前ニューロンユニットは、所与の確率(p)及び所与の投射形状(軸)を有してシナプス後ニューロンユニットに結合する。この樹状形状は、高さ及び幅(h x w)を有する矩形「[]」、内側半径及び外側半径(r1,r2)によって制限されたリングのサイズを有するドーナツ形もしくはリングの側方結合「Θ」、或いはシナプス前又はシナプス後ニューロンユニットの何らかのペアが所与の結合確率を有する非組織分布的な「non−topo」とすることができる。適合する樹状分岐「M」は、あらゆるシナプス前群からシナプス後群への論理AND組織分布的投射を示している。初期結合強度cij(0)は、最小値及び最大値(min,max)によって与えられた範囲内で均一に分布して無作為に設定される。cij(0)の負の値は抑制結合を示す。「intra」でマークされた結合は、視覚的なサブ領域内の結合を示し、「inter」でマークされた結合は、視覚的なサブ領域間の結合を示す。#でマークされた投射は、正の評価依存であり、これら投射は、TD学習にS+領域を使用する。*でマークされた投射は負の評価依存であり、TD学習にS−領域を使用する。結合タイプは、電圧独立(VI)又は電圧依存(VD)とすることができる。φは結合の持続性を示す。η、k1及びk2の非ゼロ値は塑性結合を示す。
上記の各図及び表において示したようなハイブリッド制御デバイスの機能は、各々が1つ又はそれ以上のプロセッサを有するコンピュータにおいて実行されるソフトウェア(制御ロジックとも呼ばれる)を使用して実施することができる。ソフトウェアは、実行時にプロセッサに対して本明細書で説明された機能を実施させる。実施形態において、このようなソフトウェアは、コンピュータプログラム製品(限定ではないが、RAM、ROM、CD、DVD、ハードドライブ、メモリスティック、インターネットによる電気信号、その他など)のコンピュータ使用可能媒体(限定ではないが、磁気記憶媒体、光学式記憶媒体、搬送波、その他など)内に記憶される。
本発明の好ましい実施形態の上記の説明は、例証及び説明の目的で提供された。本説明は、包括的であること又は本発明を開示された厳密な形態に限定することを意図するものではない。当業者であれば多くの修正及び変形形態が明らかであろう。実施形態は、本発明の原理及びその一部の応用を最も良く説明するように選択され説明されたが、これにより当業者であれば、種々の実施形態に関して並びに企図される特定の用途に好適な種々の修正形態と共に本発明を理解することが可能となる。例えば、本明細書で説明した特徴及び機能は、サッカーをプレーすることができるハイブリッドデバイスに加えて他の応用にも適用することができる。本発明の技術的範囲は、請求項及びこれらの均等物によって定義されるものとする。
(付属書)
脳ベースデバイス(BBD)は、BBDが地形のいずれの側面を横断することができるか、及びいずれの側面を回避しなければならないかを学習することによって、変化する地形に適応することができる。BBDは、従来のロボットシステムの地図作成に勝る環境の態様に関して決定することができる。これらの決定は、本発明のBBDが作る局所物体特徴部の知覚カテゴリーを必要とし、従って、BBDは、進路を計画することができるようになる。
本発明のBBDは、神経領域、1つの実施形態においては、海馬、頭頂葉皮質、下部側頭葉、及び視床方向システムを有する擬似神経系を備えたニューロンコントローラ部分を含むことができる。海馬とこれらの領域との間の双方向の結合性(線図1A参照)、並びに海馬内の複雑な結合性(線図1B参照)は、経時的にマルチモーダル情報をループし、且つ時間的文脈を伴う連想記憶の形成を可能にするシステムを備えることができる。BBDはまた、擬似神経系の制御下の現実世界環境において移動することを可能にする可動ベースと、BBDが物体を認識し且つ評価結果を有する動作を選択することができるようにするマルチセンサ入力とを有する。
線図1A及び線図1Bは、非ニューロンコントローラ部分に結合を付加することによって変更することができるニューロン制御部分の実施例を示している。
線図1Aは、海馬及びその周りの領域の複雑な解剖学的構造及び生理機能を含む、1つの実施形態のニューロンコントローラ部分12の領域及び機能上の神経構造の概略図である。このニューロンコントローラ部分12は、多数の物体からの空間信号を時間単位で統合し、環境28のような未知の環境の探索の助けとなる融通性のあるナビゲーション解決策を提供することができる。ナビゲーションタスクの間にその神経領域から同時にサンプリングを行うことによって、以下でより詳細に説明する海馬のアーキテクチャは、空間的且つエピソード記憶の発達に重要である、異なる時間スケール上のマルチモーダル情報を編成する手段を提供する。
線図1Aに示すように、ニューロンコントローラ部分12は、理解できるようにかなり少ないニューロン及びあまり複雑でないアーキテクチャを有する哺乳類の神経系の解剖学的構造及び生理機能に基づいてモデル化されている。ニューロン制御部分12は、人間脳の類似の皮質領域及び皮質下領域に従って標識される幾つかの神経領域を含むことができる。従って、線図1Aは、V1 Color、V2/4Color、IT、V1 Width、V2/4 Width、Pr、HD、ATN、BF、Hippocampus、R+、S、R−及びMHDGで標識されたそれぞれの神経領域を示している。各神経領域V1 Color、V2/4Color、その他は、ニューロンユニットの異なるタイプを含み、この各々は、ニューロンの局所固体群を示すことができる。線図1Aに示す各楕円は異なる神経領域を示しており、その領域の各々が多くのニューロンユニットを有する。モデル化され又は擬似の神経領域を哺乳類の神経系の対応する領域と区別するために、擬似領域は斜体字(例えばIT)で示している。
線図1Aの神経構造はまた、1つの実施形態の様々な投射P(図の矢印を参照)を介してニューロンコントローラ部分12の結合性を概略的に示している。投射Pは、ニューロンユニット間の複数のシナプス結合を含むことができる。シナプス結合は、信号をシナプス前ニューロンユニットからシナプス後ニューロンユニットに送ることを可能にすることができる。投射Pは、神経領域内又は神経領域間のいずれかにあるものとすることができる。更に、投射Pは、線図1A内の説明文によって示される特性を有することができ、すなわち、(1)「電圧独立性」、(2)「電圧依存性」、(3)「可塑性」、(4)「抑制性」、及び(5)「評価依存性」であり、以下で詳細に説明する。
擬似神経系12への入力は、CCDカメラ16、ホイール走行距離計18、壁30検出用のIRセンサ22、24、及び環境28の隠しプラットホーム36から得ることができる。擬似神経系12の神経領域は、視覚野(V1、V2/4)、下部側頭葉(IT)、頭頂葉皮質(Pr)、方向細胞(HD)、視床前核(ATN)、自己本位の進行方向に対する運動領域(MHDG)、評価システム(S)、並びに正及び負の報酬領域(R+、R−)に類似することができる。海馬は、3つの主要なセンサ入力流れ(IT、Pr、ATN)、運動システム(MHDG)及び評価システム(S)と結合することができる。明瞭にするために、神経領域の各々内の内在的結合は線図1Aから割愛した。
線図1Bは、海馬領域内の詳細な結合性を示している。モデル化された海馬は、内嗅皮質(ECIN、ECOUT)、歯状回(DG)、CA3サブフィールド及びCA1サブフィールドに類似する領域を含むことができる。これらの領域は、フィードバック抑制(例えば、CA3−>CA3FB−>CA3)、フィードフォワード抑制(例えば、DG−>CA3FF−>CA3)、及び律動抑制(例えば、BF−>Hippocampus)を引き起こす介在ニューロンを含むことができる。
擬似神経系12の更に詳細な説明が以下に記載する表1及び表2に与えられる。しかしながら全体的に、擬似神経系12の1つのバージョンにおいては合計で50ニューロン領域、50ニューロン領域内に90,000ニューロンユニット、及び約140万のシナプス結合が存在する。
線図1Aに示すニューロンコントローラ部分12は、5つのシステム:すなわち、(1)視覚系38、(2)方向システム40、(3)海馬体42、(4)評価システム44、及び(5)動作選択システム46を含むことができる。
(線図1A.視覚系38)
視覚系38は、霊長類の後頭側頭の又は腹側皮質経路及び背側皮質経路に関してモデル化することができる。視覚系における、線図1Aに示す腹側皮質経路(V1 color−>V2/4 color−>IT)は、下部側頭葉(IT)において受容野が視野全体を覆って地形がなくなるまで漸次的手に大きくなる受容野を有する連続した領域のニューロンユニットを含むことができる。線図1Aに示す背側皮質経路(V1 width−>V2/4 width−>Pr)は、物体のサイズ及び位置に反応するニューロンユニットを含むことができる。
CCDカメラ16からの視覚画像は、色及びエッジに関してフィルタ処理することができ、フィルタ処理された出力は、領域V1−Color及びV1−Widthにおいて神経活性に直接影響を及ぼす。例えば、CCDカメラ16は、NOMAD10上のRF送信機を介して、神経シミュレーションを実行しているコンピュータワークステーション(以下で説明する)の1つに取り付けられたフレームグラバーに320x240ピクセルRGBビデオ画像を送信することができる。この画像は、空間的に平均化されて80x60ピクセル画像を生成することができる。異なるサイズのGaborフィルタ(8x8、16x16、32x32及び64x64)を用いて、変化する幅の垂直エッジを検出することができる。Gabor関数の出力は、対応するV1幅サブ領域(V1−width8、V1−width16、V1−width32及びV1−width64)のニューロンユニット上に直接マッピングすることができる(線図1Aには示していない)。カラーフィルタ(例えば、緑色のネガの周囲を伴う赤いポジの中心、緑色のポジの周囲を伴う赤いネガの中心、赤−緑のネガを伴う青いポジ、及び赤−緑のポジを伴う青いネガ)を画像に適用することができる。カラーフィルタの出力は、V1 Colorのサブ領域であるV1−red、V1−green、V1−blue及びV1−yellowのニューロンユニット上に直接マッピングすることができる(線図1Aには示していない)。V1ニューロンユニットは、V2/V4内のニューロンユニットに網膜部位に投射する。
(線図1Aの方向システム40)
領域HD内のニューロンは、多くの場合、「方向」細胞と呼ばれる。NOMAD10のホイール20から得られた情報を用いて、NOMAD10の現在の現在の進行方向を推定することができる。この情報は、方向神経領域(HD)内に入力される。360HDニューロンユニット(表1参照)の各々は、コサイン同調曲線を有し、πラジアンの同調幅を備えて好ましい進行方向に対して最大限に反応することができる。
ここで、HDiは、
の好ましい方向を有する方向細胞であり、iは0〜359の範囲をとり、curr headingは、走行距離計情報から計算されるNOMADの進行方向である。
方向細胞は、視床前核(表2及び線図1AにおけるHD−>ATN参照)及び進行方向に基づく運動領域(表2及び線図1AにおけるHD−>MHDG参照、この経路は線図1Aにはないことに留意)に類似した領域に組織分布的に投射することができる。NOMAD10への新しい進行方向は、ニューロン領域MHDGにおける活性に基づいて選択することができる(線図1Aを参照、更に詳細には以下の行動選択を参照)。
(海馬体−神経領域海馬42)
擬似海馬体のアーキテクチャは、げっ歯類の神経構造に基づくことができる。海馬への入力の流れは、擬似神経系における連合皮質領域から、内嗅皮質2を介して海馬に到達することができる(表2及び線図1A〜線図1BにおけるATN−>ECIN、IT−>ECIN、Pr−>ECIN参照)。有孔経路は、主に内嗅皮質から歯状回に投射することができるが、CA3及びCA1サブフィールドにも投射する(表2及び線図1BにおけるECIN−>DG、ECIN−>CA3、ECIN−>CA1参照)。苔状繊維(表2及び線図1BにおけるDG−>CA3参照)、Schaffer側枝(表2及び線図1BにおけるCA3−>CA1参照)、及び海馬から皮質に戻る分岐投射(表2及び線図1A〜線図1BにおけるCA1−>ECOUT−>ATN、IT、Pr参照)もまた、擬似神経系12内に存在することができる。海馬体において見られる一般的な再発結合性はまた、擬似神経系12内にも含めることができる(表2及び線図1BにおけるECIN−>ECOUT、DG−>DG及びCA3−>CA3参照)。海馬特性内の結合の全て(すなわち、ECIN、ECOUT、DG、CA3、CA1)は、評価独立及び可塑性とすることができる(以下のシナプス可塑性の節を参照)。
海馬内の内在的及び外在的フィードバック及びフィードフォワード抑制結合の特有のパターンは、海馬処理において重要な役割を果たすことができる。その結果、ニューロンコントローラ部分12は、フィードバック抑制結合(表2及び線図1BにおけるEC−>ECFB−>EC、DG−>DGFB−>DG、CA3−>CA3FB−>CA3、CA1−>CA1FB−>CA1参照)及びフィードフォワード抑制結合(表2及び線図1BにおけるDG−>CA3FF−>CA3、CA3−>CA1FF−>CA1参照)を含むことができる。これらの結合は、入力とネットワーク安定性とを分離するのに有用とすることができる。
(基礎前脳及びシータ律動(表2))
擬似基礎前脳(BF)は、神経シミュレーションのために外因性のシータ律動を提供することができる。擬似基礎前脳領域の機能は、海馬内への入力をゲート制御し、活性レベルを安定に保つこととすることができる。BF領域は、13のシミュレーションサイクルを超える律動的活性を有することができる。
ここで、theta={0.01,0.165,0.33,0.495,0.66,0.825,1.00,0.825,0.66,0.495,0.33,0.165,0.01}。BFは、抑制結合を全ての海馬領域に投射することができる(表2におけるBF−>ECIN、ECOUT、DG、CA3、CA1参照)。適応的な抑制のレベルは、特定の範囲内の海馬領域における活性を保つことができる。
ここで、rは、領域(すなわち、ECIN、ECOUT、DG、CA3、CA1)を意味し、sfr(t)は時間tにおける倍率であり、sr(t)は、時間tにおける領域rの活性ニューロンユニットの百分率であり、tgtrは、領域rの活性ユニットの望ましい百分率(ECIN=10%、ECOUT=10%、DG=20%、CA3=5%、及びCA1=10%)であり、BFr(t)は、海馬領域r結合へのBFのシナプス前ニューロンユニット活性である。
(線図1Aの評価システム及び時間的差異学習44)
擬似評価システム44における活性は、NOMAD10によって経験された顕著な感覚事象の発生を信号伝達し、この活性は、図示の経路における結合強度の調整に寄与することができる。最初に、評価システムSは、隠れたプラットホーム36を検出するIR検出器24により活性化することができ(表2及び線図1AにおけるR+−>S参照)、評価依存結合の増強を引き起こし(CA1−>S及びCA1−>MHDG)、又は障害物回避IRセンサ22によって(表2及び線図1AにおけるR-−>S参照)評価依存結合の減退を引き起こす。学習後、上記及びより詳細に以下で説明する訓練試行に従って、領域CA1は、領域S活性に作用することができる。増強又は減退の大きさは、時間的差異(TD)学習規則の神経実施に基づくことができる。
ここで、
は、時間tにおける評価システムSの平均活性であり、τは、1シータサイクル又は13シミュレーションサイクルであり、R+は正の報酬で下向きのIR検出器24がトリガされた場合は1に等しく、NOMAD10が隠れたプラットホーム36を越えたことを意味し、Rはペナルティあって、NOMADのベース周りの7つのIR検出器22の1つがトリガさられた場合に1に等しく、NOMAD10が壁30に極めて接近したことを意味する。時間的差異TD規則の基本的な発想は、学習が時間的に連続した報酬の予測間の差異に基づいていることとすることができる。言い換えれば、学習の目標は、次の時間区間(τ)における次の予測に現在の入力パターンに対する学習者の現在の予測を密接に一致させることとすることができる。予測値が増加すると、TDは正になり、影響を受けた擬似神経系12のシナプス結合は増強され、予測値が減少すると、TDは負になり、影響を受けたシナプス結合は減退される。幾つかの経験後、NOMAD10がプラットホーム36に進んで評価が増加し、従って、プラットホーム36への運動を増強することができる。或いは、NOMAD10が障害物に近づくと評価は減少し、従って、壁30及び他の障害物から離れる運動を増強することができる。時間的差異が個々のシナプス結合にどのように適用されるかに関する詳細は、以下にシナプス可塑性を説明する差異に提供する。
(線図1Aの動作選択及び探索行動46)
NOMAD10は、3シータサイクル(39シミュレーションサイクル)前進し、次に、以下に説明するように新しい進行方向を選択することができる。NOMAD10が障害物を検出すると、24インチだけその方向を逆に戻り、次いで、障害物を検出したIRセンサ22から向きを変える。NOMAD10が隠れたプラットホーム36を検出すると、全てシステム12制御下で、反時計周りに60度回転して3秒間待機し、次に時計周りに60度回転して3秒間待機し、次いで、時計周りに更に60度回転して3秒間待機し、最後に反時計周りに回転して元の進行方向に戻ることができる。この時点でシミュレーションが終了し、擬似神経系12の現在の状態がハードディスク内に保存される。他の場合では、3シータサイクルの後、NOMAD10は、擬似神経系12の運動領域(MHDG)の活性に基づいて新しい進行方向を選択することができる。NOMAD10は、元の進行方向から、全てシステム12の制御下で、最初に反時計周りに60度回転して3秒間待機し、次に時計周りに60度回転して3秒間待機し、次いで時計周りに更に60度回転して3秒間待機し、最後に反時計周りに回転して元の進行方向に戻ることができる。MHDGの平均活性は、待機時間中に計算される。softmaxアルゴリズムを用いて、次式に基づき新しい進行方向を選択するための確率分布を生成することができる。
ここで、newhdgは、NOMAD10に関す可能性のある新しい進行方向であり、
は、可能性のある新しい進行方向におけるMHDGの平均活性であり、hdgは現在の進行方向であり、hは3つの位置(現在の進行方向、現在の進行方向マイナス60度、現在の進行方向プラス60度)を有する。擬似神経系12が、新しい進行方向を選択することができた後、NOMAD10は、新しい進行方向に向けられ、進行方向選択処理を再び起動する前に、更に3シータサイクル分前進する。
(ニューロンユニット/動特性−一般)
神経領域V1 Color、V1 Width、その他内のニューロンユニットは、平均発火率モデルによってシミュレートすることができる。各ユニットの状態は、平均発火率変数によって決定することができる。各ユニットの平均発火率変数は、約200ミリ秒の時間期間中のほぼ100ニューロンの群の平均活性又は発火率変数に相当する。
V1 Color、V1 Width、その他の神経領域内及び神経領域間の両方の神経ユニット間のシナプス結合は、電圧独立又は電圧依存のいずれか、及び可塑性又は非可塑性のいずれかであるように設定することができる。電圧独立結合は、ニューロンのシナプス後状態に関係なく、シナプス後ニューロンにシナプス入力を提供することができる。電圧依存結合は、活性化されることになるシナプス後脱分極を必要とする受容体タイプ(例えば、NMDA受容体)の寄与を表すことができる。
言い換えれば、シナプス前ニューロンは、軸索に沿ってシナプスを貫通してシナプス後ニューロンに信号を送信することができる。シナプス後ニューロンは、この信号を受け取り、他のシナプス前ニューロンから受け取った他の信号と統合することができる。
電圧独立結合は、シナプス前ニューロンが高い割合で発火している場合に、シナプスを介して結合されているシナプス後ニューロンが高い割合で発火することになる。
電圧依存結合は異なることができる。シナプス後ニューロンが、シナプス前入力信号を受け取ったときに、ある割合で既に発火している場合には、電圧依存結合は、シナプス後ニューロンを更に発火させることができる。シナプス後ニューロンが活性、すなわち既に発火していることができるので、このニューロンは、入力信号を受け取ったときにある閾値レベルにある。従って、このシナプス前結合は、シナプス後ニューロンを調整して更に発火させることができる。電圧依存結合は、シナプス前ニューロンがいかに活性化されていても、シナプス後ニューロンが閾値を上回っていない場合には、該シナプス後ニューロンに影響を及ぼすことはできない。従って、シナプス後ニューロンは、電圧依存シナプス結合によって反応又は調整されることになるある所与の活性閾値を有することができる。
(ニューロンユニット)
各ニューロンユニットの平均発火率は、連続的に0(休止)から1(最大発火)までの範囲をとることができる。ニューロンユニットの状態は、その現在の状態と電圧独立並びに電圧依存入力からの寄与の関数として更新することができる。ユニットjからユニットiへの電圧独立入力は、次式とすることができる。
ここで、sj(t)はユニットjの活性度であり、cijはユニットjからユニットiへの結合強度である。ユニットiにおける電圧独立シナプス後影響POSTi VIは、ユニットi上への全ての入力を合計することによって計算することができる。
ここで、Mは、解剖学的に定義された異なる結合タイプ(表2を参照)の数であり、Nlは、ユニットiに投射するタイプMの結合数であり、φは、シナプス入力の持続性である。
ユニットjからユニットiへの電圧依存入力は、次式とすることができる。
ここで、
σi vdepは、これを下回ると電圧依存結合が作用しない後シナプス活性の閾値である(表1を参照)。
ユニットiにおける電圧依存シナプス後影響POSTi VDは次式によって与えることができる。
新しい活性si(t+1)は、ニューロンユニットiに対するシナプス後影響の合計に基づいて選択することができる。
ニューロンユニットに関する新しい活性は、新しく選択されたフェーズにおける活性レベルであり、以下の活性化関数に従うことができる。
ここで、
ここで、ωは、1つのサイクルから次のサイクルまでのユニット活性の持続性を決定し、giは倍率であり、σi fireはユニット固有の発火閾値である。
ニューロンユニットの固有パラメータ値を表1に与える。
表1に示すように、領域V1、HD、R+、R-及びBFは入力領域であり、それらの活性は、それぞれ、カメラ画像、走行距離計及びIRセンサに基づくことができる。領域V1及びV2/V4は、色に関する4つのサブ領域(赤色、緑色、青色及び黄色)と、NOMAD10がナビゲートする閉鎖環境28の実施例に一致する幅を変更するための4つのサブ領域とを有することができる。表1は、各領域又は各サブ領域(サイズ)におけるニューロンユニットの数を示している。各領域におけるニューロンユニットは、固有の発火閾値(σ−fire)、これを上回ると電圧依存結合が作用することができる閾値(σ−vdep)と、持続パラメータ(ω)と、倍率(g)とを有する。
ニューロンユニットに関するシナプス結合を表2に与えることができる。

表2に示すように、シナプス前ニューロンユニットは、所与の確率(p)及び所与の投射形状(軸)を有して、シナプス後ニューロンユニットに結合することができる。この樹状形状は、高さ及び幅(h x w)を有する矩形「[]」、又は内側半径及び外側半径(r1,r2)によって制限された形状を有するドーナツ形「Θ」であり、或いは、シナプス前及びシナプス後のニューロンユニットの何らかのペアが所与の結合確率を有する非組織分布的な「non−topo」とすることができる。初期結合強度cij(0)は、最小値及び最大値(min,max)によって与えられた範囲内で無作為に設定することができる。cij(0)の負の値は抑制結合を示す。「intra」でマークされた結合は、視覚的なサブ領域内の結合を示し、「inter」でマークされた結合は、視覚的なサブ領域間の結合を示す。#でマークされた投射は、評価依存とすることができる。既に説明したように、結合タイプは、電圧独立(VI)又は電圧依存(VD)とすることができる。φは結合の持続性を示す。η、k1及びk2の非ゼロ値は塑性結合を示す。
(シナプス可塑性−評価独立可塑性)
シナプス強度は、シナプス前及びシナプス後ニューロンユニットのフェーズ及び活性に依存する、シナプス規則に従った調整の影響を受けることができる。可塑的シナプス結合は、評価独立(線図1B及び表2におけるECIN−>DG、CA3、CA1、DG−>CA3、CA3−>CA1、CA1−>ECOUT参照)又は評価依存(CA1−>S、CA1−>MHDG参照)のいずれかとすることができる。これらの両方の規則は、修正されたBCM学習規則に基づいており、ここでは、シナプス変化(Δcij)は、シナプス後及びシナプス前ニューロンユニットの活性と、線図1Bの隣に挿入してグラフで示した可変閾値(θ)との関数である。強い相関性がある発火フェーズを備えたニューロンユニット間のシナプスは増強され、弱い相関性があるフェーズを備えたニューロンユニット間のシナプスは減退される。変化の大きさは、シナプス前及びシナプス後の活性によって同様に決定される。
従って、cijにおける評価独立シナプス変化は次式で与えることができる。
ここで、si(t)及びsj(t)は、それぞれシナプス後ユニット及びシナプス前ユニットの活性度であり、ηは一定の学習率である。関数BCMは、区分線形関数として実施され、入力としての後シナプス活性をとることができ、可変閾値θ、2つの傾き(k1,k2)及び飽和パラメータρ(全範囲を通してρ=6)によって定義される。
閾値は、後シナプス活性に基づいて調整することができる。
評価独立可塑性は、無制限の増強を防ぐために、重み正規化を受けることができる。
ここで、cijは特定の結合であり、Kはニューロンユニットj上の結合の総数である。
(シナプス可塑性−評価依存可塑性)
評価依存可塑性に関する規則は、シナプス変化が、シナプス前活性と、後シナプス活性と、評価システムからの時間的差異TDとによって規定される点で、評価独立規則と異なることができる(上述の評価システム及び時間的差異学習を参照)。評価依存シナプス可塑性に関するシナプス変化は、次式で与えることができる。
ここで、TD(t)は、時間tにおける時間的差異値である。
102 デバイス
104、106、108 センサ
110 コントローラ
112 ニューロンコントローラ部分
114 非ニューロンコントローラ部分
116、118、120 アクチュエータ
ハイブリッド制御デバイスの図である。 ハイブリッド制御デバイスの第1の実施例を示す図である。 ハイブリッド制御デバイスの第1の実施例を示す図である。 ハイブリッド制御デバイスの第2の実施例を示す図である。 ハイブリッド制御デバイスの第2の実施例を示す図である。 ハイブリッド制御デバイスの第2の実施例を示す図である。 個別のロボットプラットホーム上にあるハイブリッド制御デバイスを示す図である。 ハイブリッド制御デバイスに関する画像処理の実施例を示す図である。 ハイブリッド制御デバイスの操作の実施例を示す図である。 ハイブリッドデバイスの1つの実施例に関する高レベルのプレイ行動を示す有限状態オートマトンの図である。 ハイブリッドデバイスの1つの実施例に関する高レベルのプレイ行動を示す有限状態オートマトンの図である。 ハイブリッドデバイスの1つの実施例に関する高レベルのプレイ行動を示す有限状態オートマトンの図である。
図7A−Cは、3つの基本的なプレイが行動及びこれらの間の条件遷移からどのように構成することができるかを表す有限状態オートマトンを示している。プレイ選択に至ると、別のプレイが選択され実行される。これらのアルゴリズムを使用する典型的な回避経路の実施例は図6で見ることができる。プレイは、行動よりも高レベルの制御とすることができる。プレイは、行動又は他のプレイからも構成することができる。プレイは、状態が特定の行動、動作又は他のプレイである有限状態オートマトンとすることができる。全ての有限状態オートマトンにおいて同様であるが、プレイを定義する制御の流れを決定する状態間の条件遷移のセットが存在する。SS−BBD上で使用されるプレイのほとんどは、「ボールを追いかける」又は「チームメートにパスする」或いは「ダウンフィールドでゴール近くまで走る」といった、フィールド上の極めて単純な動作のレベルにあるものとすることができる。図7A−Cは、基本的プレイである、追いかけ、パス、及びダウンフィールド走を表す有限状態オートマトンを示している。1つの実施形態において、レパートリにおける他の基本的プレイは、シュート(標的が相手のゴールであること以外はパスと同じ)、アップフィールド走(標的を除いてはダウンフィールド走と同じ)、チームメートへの追従、対戦相手のマーク、自分のゴールのブロック、及び待機(所定位置に留まり、ボールを追跡しているが、捕捉するためにボールが十分に近づくまで前進しない)とすることができる。SS−BBDはまた、基本的プレイから構成されたより複雑な幾つかのプレイを有することができる。このようなものの1つは、ダウンフィールドでボールを移動させるように設計された単純な攻撃的プレイである。プレイの流れは、追いかけからパス、及びダウンフィールド走に移行する。ダウンフィールド走が完了すると、プレイは、追いかけに戻り、シーケンスを繰り返すことができる。シーケンスにおける各サブプレイは、その正常な実行を終了したときに次のサブプレイに遷移することができる。

Claims (25)

  1. センサと、
    前記センサからの入力を受け取り、ニューロンコントローラ部分及び非ニューロンコントローラ部分を含むコントローラと、
    前記コントローラからコマンドを受け取るアクチュエータと、
    を備えることを特徴とする装置。
  2. 前記アクチュエータの少なくとも1つが前記ニューロンコントローラ部分によって制御され、前記アクチュエータの別の少なくとも1つが、前記非ニューロンコントローラ部分によって制御される、
    ことを特徴とする請求項1に記載の装置。
  3. 前記アクチュエータのうちの1つが前記ニューロンコントローラ部分と非ニューロンコントローラ部分の両方によって制御される、
    ことを特徴とする請求項2に記載の装置。
  4. 前記アクチュエータのうちの1つが前記ニューロンコントローラ部分と前記非ニューロンコントローラ部分の両方によって制御される、
    ことを特徴とする請求項1に記載の装置。
  5. 前記装置がロボットである、
    ことを特徴とする請求項1に記載の装置。
  6. 前記ニューロンコントローラ部分及び前記非ニューロンコントローラ部分の両方が前記ロボット上にある、
    ことを特徴とする請求項5に記載の装置。
  7. 前記アクチュエータの1つがカメラの方位を調整し、前記ニューロン部分が前記カメラの方位を制御する、
    ことを特徴とする請求項5に記載の装置。
  8. 前記アクチュエータの1つが前記ロボットの動きを調整し、前記ニューロンコントローラ部分及び前記非ニューロンコントローラ部分が前記ロボットの動きの制御を分担する、 ことを特徴とする請求項5に記載の装置。
  9. 前記装置が物体を操作するためのアクチュエータを含み、前記物体の操作が前記非ニューロン部分によって制御される、
    ことを特徴とする請求項5に記載の装置。
  10. 前記非ニューロンコントローラ部分が、前記ニューロンコントローラ部分にデータを提供する確率的位置特定モジュールを含む、
    ことを特徴とする請求項1に記載の装置。
  11. 前記ニューロンコントローラ部分がニューロンユニットを含む、
    ことを特徴とする請求項1に記載の装置。
  12. 前記ニューロンユニットがシナプス前処理及びシナプス後処理を行う、ことを特徴とする請求項11に記載の装置。
  13. 前記ニューロンユニットが他のニューロンユニットへのシナプス結合を有し、前記シナプス結合が結合強度と関連している、
    ことを特徴とする請求項11に記載の装置。
  14. 可塑性処理において結合強度が変更される、
    ことを特徴とする請求項13に記載の装置。
  15. センサと、
    前記センサからの入力を受け取り、ニューロンコントローラ部分及び非ニューロンコントローラ部分を含むコントローラと、
    前記コントローラから制御コマンドを受け取るアクチュエータと、
    を備え、
    前記アクチュエータの少なくとも1つが前記ニューロンコントローラ部分によって制御され、前記アクチュエータの別の少なくとも1つが前記非ニューロンコントローラ部分によって制御される、
    ことを特徴とする装置。
  16. 前記アクチュエータのうちの1つが前記ニューロンコントローラ部分と非ニューロンコントローラ部分の両方によって制御される、
    ことを特徴とする請求項15に記載の装置。
  17. 前記装置がロボットである、
    ことを特徴とする請求項16に記載の装置。
  18. 前記ニューロンコントローラ部分と前記非ニューロンコントローラ部分の両方が前記ロボット上にある、
    ことを特徴とする請求項17に記載の装置。
  19. センサと、
    前記センサからの入力を受け取り、ニューロンコントローラ部分と、該ニューロンコントローラ部分にデータを提供する位置特定モジュールを有する非ニューロンコントローラ部分とを含むコントローラと、
    前記コントローラから制御コマンドを受け取るアクチュエータと、
    を備えることを特徴とする装置。
  20. 前記ニューロンコントローラ部分が前記位置特定モジュールにデータを提供する、
    ことを特徴とする請求項19に記載の装置。
  21. 前記アクチュエータの少なくとも1つが前記ニューロンコントローラ部分によって制御される、
    ことを特徴とする請求項19に記載の装置。
  22. 前記装置がロボットである、
    ことを特徴とする請求項19に記載の装置。
  23. 前記位置特定モジュールが確率的位置モジュールである、
    ことを特徴とする請求項19に記載の装置。
  24. 制御ロジックを格納させたコンピュータ使用可能媒体を備えるコンピュータプログラム製品であって、
    前記制御ロジックが実行時に1つ又はそれ以上のプロセッサに脳ベースデバイスのニューロン制御部分の機能を実行させ、前記制御ロジックが、
    前記1つ又はそれ以上のプロセッサに視覚機能を実行させる手段と、
    前記1つ又はそれ以上のプロセッサに方向機能を実行させる手段と、
    前記1つ又はそれ以上のプロセッサに海馬機能を実行させる手段と、
    前記1つ又はそれ以上のプロセッサに評価機能を実行させる手段と、
    前記1つ又はそれ以上のプロセッサに動作選択機能を実行させる手段と、
    を含むことを特徴とするコンピュータプログラム製品。
  25. 制御ロジックを格納させたコンピュータ使用可能媒体を備えるコンピュータプログラム製品であって、
    前記制御ロジックが実行時に1つ又はそれ以上のプロセッサに1つ又はそれ以上のニューロンユニットをシミュレートさせ、前記制御ロジックが、
    前記1つ又はそれ以上のプロセッサに視覚系における1つ又はそれ以上のニューロンユニットの操作をシミュレートさせる手段と、
    前記1つ又はそれ以上のプロセッサに方向システムにおける1つ又はそれ以上のニューロンユニットの操作をシミュレートさせる手段と、
    前記1つ又はそれ以上のプロセッサに海馬体における1つ又はそれ以上のニューロンユニットの操作をシミュレートさせる手段と、
    前記1つ又はそれ以上のプロセッサに評価システムにおける1つ又はそれ以上のニューロンユニットの操作をシミュレートさせる手段と、
    前記1つ又はそれ以上のプロセッサに動作選択システムにおける1つ又はそれ以上のニューロンユニットの操作をシミュレートさせる手段と、
    を含むことを特徴とするコンピュータプログラム製品。
JP2012222508A 2005-09-13 2012-10-04 ハイブリッド制御デバイス Withdrawn JP2013020644A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US71682105P 2005-09-13 2005-09-13
US60/716,821 2005-09-13
US11/530,685 US7765029B2 (en) 2005-09-13 2006-09-11 Hybrid control device
US11/530,685 2006-09-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008531224A Division JP2009508263A (ja) 2005-09-13 2006-09-13 ハイブリッド制御デバイス

Publications (1)

Publication Number Publication Date
JP2013020644A true JP2013020644A (ja) 2013-01-31

Family

ID=37865498

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008531224A Pending JP2009508263A (ja) 2005-09-13 2006-09-13 ハイブリッド制御デバイス
JP2012222508A Withdrawn JP2013020644A (ja) 2005-09-13 2012-10-04 ハイブリッド制御デバイス

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008531224A Pending JP2009508263A (ja) 2005-09-13 2006-09-13 ハイブリッド制御デバイス

Country Status (4)

Country Link
US (3) US7765029B2 (ja)
EP (1) EP1934894A4 (ja)
JP (2) JP2009508263A (ja)
WO (1) WO2007033101A2 (ja)

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7765029B2 (en) * 2005-09-13 2010-07-27 Neurosciences Research Foundation, Inc. Hybrid control device
US8648867B2 (en) 2006-09-25 2014-02-11 Neurala Llc Graphic processor based accelerator system and method
US8346391B1 (en) * 2006-12-28 2013-01-01 Science Applications International Corporation Methods and systems for an autonomous robotic platform
EP2256667B1 (en) * 2009-05-28 2012-06-27 Honda Research Institute Europe GmbH Driver assistance system or robot with dynamic attention module
US8473436B2 (en) * 2009-11-18 2013-06-25 The Intellisis Corporation Neural segmentation of an input signal and applications using simulated neurons, and a phase modulator
US8483816B1 (en) * 2010-02-03 2013-07-09 Hrl Laboratories, Llc Systems, methods, and apparatus for neuro-robotic tracking point selection
US9405975B2 (en) 2010-03-26 2016-08-02 Brain Corporation Apparatus and methods for pulse-code invariant object recognition
US9311593B2 (en) 2010-03-26 2016-04-12 Brain Corporation Apparatus and methods for polychronous encoding and multiplexing in neuronal prosthetic devices
US9122994B2 (en) 2010-03-26 2015-09-01 Brain Corporation Apparatus and methods for temporally proximate object recognition
US8909950B1 (en) 2010-04-18 2014-12-09 Aptima, Inc. Systems and methods of power management
US8521671B2 (en) * 2010-04-30 2013-08-27 The Intellisis Corporation Neural network for clustering input data based on a Gaussian Mixture Model
US9906838B2 (en) 2010-07-12 2018-02-27 Time Warner Cable Enterprises Llc Apparatus and methods for content delivery and message exchange across multiple content delivery networks
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US9177259B1 (en) * 2010-11-29 2015-11-03 Aptima Inc. Systems and methods for recognizing and reacting to spatiotemporal patterns
US8924218B2 (en) * 2010-11-29 2014-12-30 Greg L. Corpier Automated personal assistance system
JP5759164B2 (ja) * 2010-12-20 2015-08-05 株式会社スクウェア・エニックス ゲーム用人工知能
US9566710B2 (en) 2011-06-02 2017-02-14 Brain Corporation Apparatus and methods for operating robotic devices using selective state space training
US9070039B2 (en) 2013-02-01 2015-06-30 Brian Corporation Temporal winner takes all spiking neuron network sensory processing apparatus and methods
US8649884B2 (en) * 2011-07-27 2014-02-11 Honeywell International Inc. Integrated linear/non-linear hybrid process controller
US9098811B2 (en) 2012-06-04 2015-08-04 Brain Corporation Spiking neuron network apparatus and methods
US9224090B2 (en) 2012-05-07 2015-12-29 Brain Corporation Sensory input processing apparatus in a spiking neural network
US9412041B1 (en) 2012-06-29 2016-08-09 Brain Corporation Retinal apparatus and methods
US9186793B1 (en) 2012-08-31 2015-11-17 Brain Corporation Apparatus and methods for controlling attention of a robot
US9367798B2 (en) 2012-09-20 2016-06-14 Brain Corporation Spiking neuron network adaptive control apparatus and methods
US9311594B1 (en) 2012-09-20 2016-04-12 Brain Corporation Spiking neuron network apparatus and methods for encoding of sensory data
US8972315B2 (en) * 2012-10-25 2015-03-03 Brain Corporation Apparatus and methods for activity-based plasticity in a spiking neuron network
US9183493B2 (en) 2012-10-25 2015-11-10 Brain Corporation Adaptive plasticity apparatus and methods for spiking neuron network
US9111226B2 (en) 2012-10-25 2015-08-18 Brain Corporation Modulated plasticity apparatus and methods for spiking neuron network
US9218563B2 (en) 2012-10-25 2015-12-22 Brain Corporation Spiking neuron sensory processing apparatus and methods for saliency detection
US9275326B2 (en) 2012-11-30 2016-03-01 Brain Corporation Rate stabilization through plasticity in spiking neuron network
US9123127B2 (en) 2012-12-10 2015-09-01 Brain Corporation Contrast enhancement spiking neuron network sensory processing apparatus and methods
US9764468B2 (en) 2013-03-15 2017-09-19 Brain Corporation Adaptive predictor apparatus and methods
US8996177B2 (en) 2013-03-15 2015-03-31 Brain Corporation Robotic training apparatus and methods
EP2999940A4 (en) 2013-05-22 2017-11-15 Neurala Inc. Methods and apparatus for early sensory integration and robust acquisition of real world knowledge
EP3000030A4 (en) 2013-05-22 2017-07-05 Neurala Inc. Methods and apparatus for iterative nonspecific distributed runtime architecture and its application to cloud intelligence
US9242372B2 (en) 2013-05-31 2016-01-26 Brain Corporation Adaptive robotic interface apparatus and methods
US9314924B1 (en) 2013-06-14 2016-04-19 Brain Corporation Predictive robotic controller apparatus and methods
US9384443B2 (en) 2013-06-14 2016-07-05 Brain Corporation Robotic training apparatus and methods
US9792546B2 (en) 2013-06-14 2017-10-17 Brain Corporation Hierarchical robotic controller apparatus and methods
US9436909B2 (en) 2013-06-19 2016-09-06 Brain Corporation Increased dynamic range artificial neuron network apparatus and methods
US9239985B2 (en) 2013-06-19 2016-01-19 Brain Corporation Apparatus and methods for processing inputs in an artificial neuron network
US20150005937A1 (en) * 2013-06-27 2015-01-01 Brain Corporation Action selection apparatus and methods
WO2015010103A2 (en) 2013-07-19 2015-01-22 Opx Biotechnologies, Inc. Microorganisms and methods for the production of fatty acids and fatty acid derived products
US9552546B1 (en) 2013-07-30 2017-01-24 Brain Corporation Apparatus and methods for efficacy balancing in a spiking neuron network
JP6464447B2 (ja) * 2013-09-02 2019-02-06 本田技研工業株式会社 観測値の予測装置及び観測値の予測方法
US9296101B2 (en) 2013-09-27 2016-03-29 Brain Corporation Robotic control arbitration apparatus and methods
US9579789B2 (en) * 2013-09-27 2017-02-28 Brain Corporation Apparatus and methods for training of robotic control arbitration
US9489623B1 (en) 2013-10-15 2016-11-08 Brain Corporation Apparatus and methods for backward propagation of errors in a spiking neuron network
US9597797B2 (en) 2013-11-01 2017-03-21 Brain Corporation Apparatus and methods for haptic training of robots
US9463571B2 (en) 2013-11-01 2016-10-11 Brian Corporation Apparatus and methods for online training of robots
US9248569B2 (en) 2013-11-22 2016-02-02 Brain Corporation Discrepancy detection apparatus and methods for machine learning
US9358685B2 (en) 2014-02-03 2016-06-07 Brain Corporation Apparatus and methods for control of robot actions based on corrective user inputs
US10552734B2 (en) 2014-02-21 2020-02-04 Qualcomm Incorporated Dynamic spatial target selection
US9533413B2 (en) 2014-03-13 2017-01-03 Brain Corporation Trainable modular robotic apparatus and methods
US9987743B2 (en) 2014-03-13 2018-06-05 Brain Corporation Trainable modular robotic apparatus and methods
US9364950B2 (en) 2014-03-13 2016-06-14 Brain Corporation Trainable modular robotic methods
US9626566B2 (en) 2014-03-19 2017-04-18 Neurala, Inc. Methods and apparatus for autonomous robotic control
WO2015143173A2 (en) * 2014-03-19 2015-09-24 Neurala, Inc. Methods and apparatus for autonomous robotic control
US9346167B2 (en) 2014-04-29 2016-05-24 Brain Corporation Trainable convolutional network apparatus and methods for operating a robotic vehicle
US20170244937A1 (en) * 2014-06-03 2017-08-24 Gopro, Inc. Apparatus and methods for aerial video acquisition
US9630318B2 (en) 2014-10-02 2017-04-25 Brain Corporation Feature detection apparatus and methods for training of robotic navigation
US9881349B1 (en) 2014-10-24 2018-01-30 Gopro, Inc. Apparatus and methods for computerized object identification
US9426946B2 (en) 2014-12-02 2016-08-30 Brain Corporation Computerized learning landscaping apparatus and methods
CN104617679B (zh) * 2014-12-23 2016-08-31 惠州学院 基于无线供电的机器人智能足球场系统
US9717387B1 (en) 2015-02-26 2017-08-01 Brain Corporation Apparatus and methods for programming and training of robotic household appliances
US9840003B2 (en) 2015-06-24 2017-12-12 Brain Corporation Apparatus and methods for safe navigation of robotic devices
GB201512278D0 (en) 2015-07-14 2015-08-19 Apical Ltd Hybrid neural network
WO2017076928A1 (en) 2015-11-02 2017-05-11 Starship Technologies Oü Method, device and assembly for map generation
US10241514B2 (en) 2016-05-11 2019-03-26 Brain Corporation Systems and methods for initializing a robot to autonomously travel a trained route
US9987752B2 (en) 2016-06-10 2018-06-05 Brain Corporation Systems and methods for automatic detection of spills
US10282849B2 (en) 2016-06-17 2019-05-07 Brain Corporation Systems and methods for predictive/reconstructive visual object tracker
US10016896B2 (en) 2016-06-30 2018-07-10 Brain Corporation Systems and methods for robotic behavior around moving bodies
CN106125730B (zh) * 2016-07-10 2019-04-30 北京工业大学 一种基于鼠脑海马空间细胞的机器人导航地图构建方法
US10274325B2 (en) 2016-11-01 2019-04-30 Brain Corporation Systems and methods for robotic mapping
US10001780B2 (en) 2016-11-02 2018-06-19 Brain Corporation Systems and methods for dynamic route planning in autonomous navigation
US10723018B2 (en) 2016-11-28 2020-07-28 Brain Corporation Systems and methods for remote operating and/or monitoring of a robot
US10377040B2 (en) 2017-02-02 2019-08-13 Brain Corporation Systems and methods for assisting a robotic apparatus
US10852730B2 (en) * 2017-02-08 2020-12-01 Brain Corporation Systems and methods for robotic mobile platforms
US10293485B2 (en) 2017-03-30 2019-05-21 Brain Corporation Systems and methods for robotic path planning
US11551028B2 (en) 2017-04-04 2023-01-10 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network
US11238334B2 (en) 2017-04-04 2022-02-01 Hailo Technologies Ltd. System and method of input alignment for efficient vector operations in an artificial neural network
US10387298B2 (en) 2017-04-04 2019-08-20 Hailo Technologies Ltd Artificial neural network incorporating emphasis and focus techniques
US11615297B2 (en) 2017-04-04 2023-03-28 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network compiler
US11544545B2 (en) 2017-04-04 2023-01-03 Hailo Technologies Ltd. Structured activation based sparsity in an artificial neural network
US10646999B2 (en) * 2017-07-20 2020-05-12 Tata Consultancy Services Limited Systems and methods for detecting grasp poses for handling target objects
US10810427B1 (en) * 2017-12-15 2020-10-20 AI Incorporated Methods for an autonomous robotic device to identify locations captured in an image
SE542950C2 (en) * 2018-02-01 2020-09-22 Leine & Linde Ab Methods, computer programs, devices and encoders for signal error correction
KR102657884B1 (ko) 2018-12-18 2024-04-17 삼성전자주식회사 서비스 로봇의 동작 제어 방법 및 장치
DE102018133058A1 (de) 2018-12-20 2020-06-25 Beckhoff Automation Gmbh Verfahren zum steuern eines automatisierungsprozesses in echtzeit
US11958183B2 (en) 2019-09-19 2024-04-16 The Research Foundation For The State University Of New York Negotiation-based human-robot collaboration via augmented reality
US11221929B1 (en) 2020-09-29 2022-01-11 Hailo Technologies Ltd. Data stream fault detection mechanism in an artificial neural network processor
US11263077B1 (en) 2020-09-29 2022-03-01 Hailo Technologies Ltd. Neural network intermediate results safety mechanism in an artificial neural network processor
US11237894B1 (en) 2020-09-29 2022-02-01 Hailo Technologies Ltd. Layer control unit instruction addressing safety mechanism in an artificial neural network processor
US11811421B2 (en) 2020-09-29 2023-11-07 Hailo Technologies Ltd. Weights safety mechanism in an artificial neural network processor
CN113110492B (zh) * 2021-05-07 2022-06-21 苏州大学 一种路径规划方法
CN114326386B (zh) * 2021-11-30 2024-01-23 卡斯柯信号有限公司 一种列车自动驾驶轨迹规划与跟踪一体化控制方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05297904A (ja) * 1992-04-22 1993-11-12 Hitachi Ltd 最適制御方式選定方法及び装置
JPH1083455A (ja) * 1996-07-08 1998-03-31 Sony Corp 物体認識装置および方法
JPH10254592A (ja) * 1997-03-13 1998-09-25 Nec Corp 感情生成装置およびその方法
JPH11259129A (ja) * 1998-03-09 1999-09-24 Yamaha Motor Co Ltd 自律移動体の制御方法
JP2009508263A (ja) * 2005-09-13 2009-02-26 ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド ハイブリッド制御デバイス

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1089221A (en) * 1911-12-16 1914-03-03 Basf Ag Anthraquinone coloring-matters and process of making them.
US4095367A (en) * 1976-06-09 1978-06-20 Takara Co., Ltd. Articulated robot assembly
US4884216A (en) * 1987-11-09 1989-11-28 Michael Kuperstein Neural network system for adaptive sensory-motor coordination of multijoint robots for single postures
US5048097A (en) * 1990-02-02 1991-09-10 Eastman Kodak Company Optical character recognition neural network system for machine-printed characters
US5920851A (en) * 1991-08-13 1999-07-06 The Research Foundation Of State University Of Ny Method for generating a representation of an environment
US5164826A (en) * 1991-08-19 1992-11-17 Westinghouse Electric Corp. Method and apparatus for visual inspection of the internal structure of apparatus through internal passages
US5491650A (en) * 1993-04-19 1996-02-13 California Institute Of Technology High precision computing with charge domain devices and a pseudo-spectral method therefor
US5991675A (en) * 1993-06-02 1999-11-23 Honda Giken Kogyo Kabushiki Kaisha Vehicle control system based on estimation of the driving skill of a vehicle operator
US6137886A (en) * 1994-07-18 2000-10-24 Cooper Tire & Rubber Company Active vibration control method and apparatus
US5781702A (en) * 1995-06-07 1998-07-14 Univ South Western Hybrid chip-set architecture for artificial neural network system
AU726049B2 (en) * 1995-09-19 2000-10-26 Veracel Inc. A neural network assisted multi-spectral segmentation system
US5748847A (en) * 1995-12-21 1998-05-05 Maryland Technology Corporation Nonadaptively trained adaptive neural systems
US6236908B1 (en) * 1997-05-07 2001-05-22 Ford Global Technologies, Inc. Virtual vehicle sensors based on neural networks trained using data generated by simulation models
US5987444A (en) * 1997-09-23 1999-11-16 Lo; James Ting-Ho Robust neutral systems
US6353814B1 (en) * 1997-10-08 2002-03-05 Michigan State University Developmental learning machine and method
EP1089221A3 (en) 1999-09-29 2007-05-02 Lucent Technologies Inc. Spike-based hybrid computation
WO2002073526A2 (en) * 2001-03-13 2002-09-19 Wide Horizon Holdings Inc. Cerebral programming
NZ530434A (en) * 2001-07-02 2005-01-28 Battelle Memorial Institute Intelligent microsensor module
US6553300B2 (en) * 2001-07-16 2003-04-22 Deere & Company Harvester with intelligent hybrid control system
WO2004018158A2 (en) * 2002-08-21 2004-03-04 Neal Solomon Organizing groups of self-configurable mobile robotic agents
WO2004033159A1 (ja) 2002-10-11 2004-04-22 Fujitsu Limited ロボット制御アルゴリズム構築装置、ロボット制御アルゴリズム構築プログラム、ロボット制御装置、ロボット制御プログラム、およびロボット
JP4587738B2 (ja) * 2003-08-25 2010-11-24 ソニー株式会社 ロボット装置及びロボットの姿勢制御方法
US20060253223A1 (en) * 2003-12-30 2006-11-09 Vanderbilt University Robotic trajectories using behavior superposition
US7519452B2 (en) * 2004-04-15 2009-04-14 Neurosciences Research Foundation, Inc. Mobile brain-based device for use in a real world environment
US7627540B2 (en) * 2005-06-28 2009-12-01 Neurosciences Research Foundation, Inc. Addressing scheme for neural modeling and brain-based devices using special purpose processor
US7533071B2 (en) * 2005-06-28 2009-05-12 Neurosciences Research Foundation, Inc. Neural modeling and brain-based devices using special purpose processor

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05297904A (ja) * 1992-04-22 1993-11-12 Hitachi Ltd 最適制御方式選定方法及び装置
JPH1083455A (ja) * 1996-07-08 1998-03-31 Sony Corp 物体認識装置および方法
JPH10254592A (ja) * 1997-03-13 1998-09-25 Nec Corp 感情生成装置およびその方法
JPH11259129A (ja) * 1998-03-09 1999-09-24 Yamaha Motor Co Ltd 自律移動体の制御方法
JP2009508263A (ja) * 2005-09-13 2009-02-26 ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド ハイブリッド制御デバイス

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7013003610; CHANG-HA1 XU, HUA-MING LI, XIN-HE XU: 'A COMPOSITE CONTROLLER BASED ON FUZZY RULES AND NEURAL NETWORKS FOR SOCCER ROBOT SYSTEM' First International Conference on Machine Learning and Cybernetics , 20021104, p511-p514 *

Also Published As

Publication number Publication date
US20110022230A1 (en) 2011-01-27
WO2007033101A3 (en) 2007-11-29
US8583286B2 (en) 2013-11-12
US7765029B2 (en) 2010-07-27
EP1934894A4 (en) 2010-05-26
EP1934894A2 (en) 2008-06-25
US20070100780A1 (en) 2007-05-03
US20120209432A1 (en) 2012-08-16
WO2007033101A2 (en) 2007-03-22
JP2009508263A (ja) 2009-02-26

Similar Documents

Publication Publication Date Title
JP2013020644A (ja) ハイブリッド制御デバイス
Ruan et al. Mobile robot navigation based on deep reinforcement learning
De Souza et al. Decentralized multi-agent pursuit using deep reinforcement learning
Codevilla et al. End-to-end driving via conditional imitation learning
Chen et al. Stabilization approaches for reinforcement learning-based end-to-end autonomous driving
US20150005937A1 (en) Action selection apparatus and methods
US20150094850A1 (en) Apparatus and methods for training of robotic control arbitration
Xu et al. Monocular vision based autonomous landing of quadrotor through deep reinforcement learning
Haworth et al. Deep integration of physical humanoid control and crowd navigation
Liu et al. Episodic memory-based robotic planning under uncertainty
Rodríguez-Hernandez et al. Flying through gates using a behavioral cloning approach
Mantegazza et al. Vision-based control of a quadrotor in user proximity: Mediated vs end-to-end learning approaches
Hirose et al. ExAug: Robot-conditioned navigation policies via geometric experience augmentation
Xing et al. Neuromodulated patience for robot and self-driving vehicle navigation
Chen et al. Cognitive map-based model: Toward a developmental framework for self-driving cars
Xu et al. Avoidance of manual labeling in robotic autonomous navigation through multi-sensory semi-supervised learning
Fleischer et al. A neurally controlled robot competes and cooperates with humans in Segway soccer
Takehara et al. Autonomous car parking system using deep reinforcement learning
Rojas-Perez et al. A temporal CNN-based approach for autonomous drone racing
CN111975775B (zh) 基于多角度视觉感知的自主机器人导航方法及系统
Fujita et al. Vision, Strategy, and Localization Using the Sony Robots at RoboCup-98
Jaladi et al. End-To-End Training and Testing Gamification Framework to Learn Human Highway Driving
Prakash Behavior-Aware Robot Navigation with Deep Reinforcement Learning
Lőrincz et al. Imitation Learning for Generalizable Self-driving Policy with Sim-to-real Transfer
Lenser On-line robot adaptation to environmental change

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130930

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140108

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20140331