JP5175218B2 - 予測的運動制御のための小脳モデルを有する頭脳ベース・デバイス - Google Patents

予測的運動制御のための小脳モデルを有する頭脳ベース・デバイス Download PDF

Info

Publication number
JP5175218B2
JP5175218B2 JP2008548838A JP2008548838A JP5175218B2 JP 5175218 B2 JP5175218 B2 JP 5175218B2 JP 2008548838 A JP2008548838 A JP 2008548838A JP 2008548838 A JP2008548838 A JP 2008548838A JP 5175218 B2 JP5175218 B2 JP 5175218B2
Authority
JP
Japan
Prior art keywords
brain
based device
synaptic
motor
dcn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008548838A
Other languages
English (en)
Other versions
JP2009523276A (ja
Inventor
ジェフリー エル マキンスキー
ジェラルド エム エデルマン
ジェフリー エル クリッチマー
Original Assignee
ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド filed Critical ニューロサイエンシーズ リサーチ ファンデーション インコーポレイテッド
Publication of JP2009523276A publication Critical patent/JP2009523276A/ja
Application granted granted Critical
Publication of JP5175218B2 publication Critical patent/JP5175218B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/026Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system using a predictor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Robotics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Description

本発明は、実世界環境における予測的運動制御のための擬似神経システムを有する頭脳ベース・デバイスの分野に関する。
(優先権の主張)
本出願は、35U.S.C 119(e)の下で、Jeffrey L.McKinstry他による「A Cerebellar Model for Predictive Motor Control Tested in a Brain−Based Device」と題する、2005年12月28日出願の、米国特許仮出願第60/754,229号(代理人整理番号第NSRF−01009US0号)に基づく優先権を主張するものであり、その出願は引用により本明細書に組み入れられる。
(著作権表示)
本特許書類の開示の一部は、著作権保護の対象となる題材を含んでいる。著作権者は、本特許書類又は本特許開示が米国特許商標庁の特許ファイル又は記録において公開されたときに、本特許書類又は本特許開示の何人による複製に対しても異議を申し立てないが、それ以外はいかなるものであれ一切の著作権を留保する。
頭脳ベース・デバイス(BBD)は、情報を受信するための検知システムと、デバイスが動き回ることを可能にするエフェクタ(effectors)と、検知システムからの入力に応答してエフェクタの動きを制御し、実世界環境における頭脳ベース・デバイスの行動を導く疑似神経システムと、を有するデバイスである。検知システムは、デバイスが動く実世界環境から画像及び他の情報を受信するセンサを含むことができる。擬似神経システムは、頭脳ベース・デバイスへの検知された情報入力を受信及び処理し、そして実世界環境におけるデバイス(BBD)の行動を制御するためにエフェクタに命令を出力する、コンピュータ・ベースのシステムとして実施することができる。
擬似神経システムは、コンピュータ・ベースのシステムにおいて実施されが、典型的には一組の規則通りの実行可能命令に従う又は計算を実行するプログラムされたコンピュータではなく、人間の脳を模倣する。すなわち、脳はコンピュータではなく、その構築物において、計算原理ではなく神経生物学に従う。脳は、特別な特徴又は組織、及び一組の規則通りの命令に従う又はプログラムされたコンピュータのように計算するという観念と整合するとは考えられない機能を有する。脳が受信する信号とコンピュータが受信する信号との比較は、脳に特有の多くの特徴を示す。例えば、実世界は、プログラムされたコンピュータに与えられる明確な一連の信号をストアするデータ記憶媒体と同じようには脳に与えられない。それにもかかわらず、脳は、人間(及び動物)が彼らの環境を検知して実世界環境において動くことを可能にする。
脳の小脳は、正確な適応制御及び運動学習のために不可欠であることが知られている。運動制御に関する神経生理学的、行動的、及び画像形成データの多くと整合する小脳の1つの理論は、小脳が反射神経を予測的コントローラに置き換えるように学習することを提案している。これは、適正な運動制御信号を生成し、適応性の低い反射的応答を回避する。まばたき調整、前庭眼反射、円滑追跡眼球運動、脊髄侵害屈筋反射、握力調節、腕運動、及び衝動性眼球運動を含む多くの適応小脳機能は、この種の運動制御が可能である。現在、この予測機能に関与する機構に関する議論には、遅延線、スペクトル・タイミング、発振器、又は顆粒細胞における動的反復活動についての提案が含まれる。
1つの現在の理論は、基本フィードバック・コントローラ(又は反射)からのフィードバック運動指令が、脳の下オリーブから登上線維を介して小脳に伝えられるエラー信号として用いられることを提案している。さらに、そうした運動学習に関する機構として小脳におけるシナプス適格性追跡もまた提案されている。さらに別の理論は、運動の開始によって引き起こされ、150−200msでピークに達し、1−2秒の持続時間を有する適格性追跡を提案している。
本発明は異なる機構に基づいている。本発明においては、プルキンエ細胞(PC)上又は小脳の深小脳核(DCN)における細胞上へのシナプスが、閾値を超えるシナプス前の活性の開始から一定の遅延後にのみ可塑性に関して適格になる学習ルールが組み入れられる。これらのシナプス強度の変化は、小脳の下オリーブ(IO)からの登上線維が運動エラーの信号を送るときに適格シナプスにおいてのみ起る。この遅延適格性追跡学習ルールは、差し迫った運動エラーを予期して回避するように機能する小脳応答を形成する。
従って、本発明は、小脳の擬似神経システムによって導かれる物理的なモバイル頭脳ベース・デバイス(BBD)であって、BBDの実世界環境との相互作用を測定する脊椎神経解剖学及び神経生理学の特徴を組み入れたデバイスである。
BBDの擬似神経システムは、BBDが実世界環境において動くことを可能にする予測的運動制御を提供する。擬似神経システムは、脳の小脳領域に類似した擬似神経領域を有し、前小脳核(PN)、プルキンエ細胞(PC−Turn及びPC−Velo)、深小脳核(DCN−Turn及びDCN−Velo)、及び下オリーブ(IO−Turn及びIO−Velo)を含み、ここで「Turn」は回転を意味し、「Velo」はBBDの速度を意味する。頭脳ベース・デバイスBBDはまた、脳の擬似皮質領域(MT)上に投射される視覚的入力を供給するカメラと、下オリーブ(IO)内の神経単位を駆動する赤外(IR)近接検出器とを有し、この神経単位が次に回転(モータ−Turn)及びブレーキ(Motor−Velo)のための擬似運動神経を駆動する。
物理的モバイル頭脳ベース・デバイスBBDは、実世界環境において運動し相互作用する際に、トレーニング段階及びテスト段階を経験する。トレーニング又は学習段階の間、BBDは所与の経路又はコースに沿って運動し、BBDがそのコース内の障害物に近づくとき、赤外(IR)近接検出器によって運動エラーの信号が疑似神経システムに送られ、これがBBDを障害物から反射的に方向転換させ障害物の存在下で減速させる。ブレーキ及び障害物から離れる動きを開始する運動エラー信号はまた、擬似皮質領域(MT)と小脳神経単位(PN)(PC)(IO)の間のシナプス効率の変化を引き起こす。学習段階後及びテスト段階中、頭脳ベース・デバイスBBDを所与のコースの中央を滑らかに下るように駆動させるには、視覚運動キューのみで十分である。テスト段階の間、潜在的エラーを予測する皮質領域(MT)の入力は、エラー信号が生成され得るよりも充分前に、頭脳ベース・デバイスBBDが障害物から遠ざかる運動を生じる。
その結果、本発明の遅延適格性追跡ルールは、実世界条件下での運動制御作業における小脳の予測機能を説明する。小脳は、任意の反射神経制御システムを、より適応性の高い予測コントローラ又は「プリフレックス(preflex)」で置き換えるように学習することができる。
図1Aは、その環境を探査してそれを体験しながら適応行動を起すことができる物理的に例示されたモバイル・デバイスを含む、本発明の頭脳ベース・デバイス(BBD)10の絵画図である。頭脳ベース・デバイスBBD10は、その実世界環境においてBBD10を導くための擬似神経システム12(図2参照)を含む。一実施形態において、擬似神経システム12は、以下でより十分に説明される内蔵ベオウルフ・コンピュータのクラスタとして具体化される。
BBD10は、図1Bに示されるように、実世界環境において急湾曲コース、中間湾曲コース、及び緩湾曲コースを含む幾つかのタイプの経路又はコース上を移動できる。これらの3つのコースは、図1Aに示されたオレンジ・コーンを用いて設定される。さらに説明されるように、BBD10は、これらの3つのコース上を、それぞれ、トレーニング段階又は相の間、及びテスト段階又は相の間に移動することになる。
図1Aに示されるように、頭脳ベース・デバイス10は、一実施形態において、ニュー・ハンプシャー州ベッドフォード所在のSegway社によって製造されたSegway Human Transporterの市販のロボット・バージョンである、一般的に14で示されるセグウェイ・ロボット移動プラットフォーム又はRMP上に構築される。BBD10は、一般的に16で示され、BBD10の下位周りに取り付けられた、カラー・カメラ、レーザ距離計、及び短距離IR検出器列から感覚入力を受信して、図1Bのそれぞれのコースを通る際に近くの物体を検出する。BBD10のベース上のアルミニウム・シャーシ18は、カリフォルニア州サンタクララ所在のインテル社によって製造された6つのコンパクトなPentium IV PCのベオウルフ・クラスタと、BBDにおよそ45分間にわたって電力供給するのに十分な容量のバッテリとを含む。
図2は、種々の神経領域とシナプス結合の配列とを含む擬似神経システム12の高レベルの図である。各々の領域及び結合パターンに関する特定のパラメータは、表S1及び表S2に関連して以下で説明される。
擬似神経システム12は、小脳20のものであり、神経経路(MT→PN)で示される視覚皮質領域(MT)24からの入力を受信する前小脳核(PN)22を有する。前小脳核(PN)22は、神経経路(PN→PC、PN→DCN)で示される小脳領域26への出力を生じ、この領域は、深小脳核(DCN)32がBBD10を回転及び速度制御する(PC→DCN)のを妨げるプルキンエ細胞(PC)30及び小脳皮質28と小脳への登上線維入力(IO→PC、IO→DCN)を模倣する下オリーブ(IO)34を含む。
より具体的には、図2は、BBD10の擬似局部的及び機能的神経構造12の概略を示す。図2に示された灰色の楕円は異なる神経領域を示し、黒色の楕円は感覚入力領域を示し、白色の楕円は運動野を示す。図2に示された矢印は、1つの領域から別の領域へのシナプス投射を示す。開放矢じりで終わる黒色矢印は、興奮性結合を示し、円形の終点で終わる黒色矢印は抑制性結合を示し、点線の黒矢じりで終わる灰色矢印は可塑性結合を示す。図1AのBBD10上に一般的に16で示されたカメラからの視覚入力は、皮質領域(MT)24に投射される。システム12は、前小脳核(PN)22、プルキンエ細胞PC30(PC−Turn及びPC−Velo)、深小脳核DCN32(DCN−Turn及びDCN−Velo)、及び下オリーブIO34(IO−Turn及びIO−Velo)からの入力を含み、ここで「Turn」はBBDの回転を表し、「Velo」はBBDの速度を表す。下オリーブIO34内の神経単位は、一般的に16(図1A)で示されるIR近接検出器によって駆動され、それが次に回転36(モータ−Turn)及びブレーキ38(Motor−Velo)に関する運動神経を駆動する。これらの運動神経はまた、さらに後述するように深小脳核32(DCN)によって駆動される。各々の領域は、興奮性又は抑制性のいずれかとすることができる神経単位を含み、その各々は、神経の局所分布を表し[Edelman、G.M.(1987)Neural Darwinism、The Theory of Neuronal Group Selection(Basic Books,Inc.、New York)参照]、各々の単位の平均発火頻度変数は、およそ40ミリ秒の時間の間の約100の現実の神経群の平均活性に対応する。さらなる神経モデルの実施の詳細を以下に説明する。
BBD10は3つの基本的な生得的行動、即ち、前進を続行する、壁又は人のような大きな障害物を回避する、及び図1Aに示されたコーンとの正面衝突を回避する行動を有する。「続行」行動において、BBD10は、「正面」行動、「回避」行動、又は神経疑似活動12がBBD10を減速させ及び/又は回転させない限り、最大で例えば1.25メートル毎秒又は約3マイル毎時で前方に直線的に移動する。疑似神経システム12が介入するとき、運動神経領域は以下でさらに説明されるように車輪コマンドに変換される。運動神経領域は、一般的に16で示されたIR検出器からの入力又は視覚運動経路によって活性化することができる。「続行」はシミュレーションのためのデフォルト行動である。
BBD10に搭載された一般的に16で示されるレーザ距離測定器は、図1A、図1Bに示されたコースを定めるコーンの高さを上回る高さ2.5フィートの180度円弧内における20メートルまでの障害物を検出することができる。例えばBBD10の1メートル以内に物体が検出された場合には、「回避」行動が開始され、レーザ距離測定器16が1メートルよりも近くに障害物を検出しなくなるまで、BBD10がその場で回転する。「回避」行動が完了した後、BBD10は「続行」行動を開始する。一般に、BBD10が図1Aに示されたコーンによって定められた所与のコースの一周を完了したとき、典型的には壁に近づくことになり、「回避」がBBD10をほぼ180度方向転換させ、そこで所与のコースに沿って反対方向に進む。
IR近接検出器16が、BBD10の正面6インチ以内にコーン存在の信号を送った場合、「正面」行動が開始され、BBD10はコーンの妨げがなくなるまで後退する。コーンの妨げがなくなった後で、「続行」行動が開始され、IR検出器16又は視覚運動システム16が典型的に神経運動応答を引き起こして、コーンから遠ざかって図1A及び図1Bに示された所与のコースを進むことになる。
シナプス可塑性及び遅延適格性追跡学習ルール
シナプス強度は、シナプス前、シナプス後、及び下オリーブ(IO)活性に依存するシナプス・ルールによる修正を受ける。神経単位活性の変化の詳細及びパラメータの詳細は後述されるが、次式はこれらの詳細に基づくものである。
シナプス変化は、
Figure 0005175218
によって与えられ、ここでci,jは単位jから単位iまでの結合強度であり、si(t)はシナプス後単位の活性であり、IOi(t)は単位iに対応する下オリーブ単位の活性であり、ηは一定の学習率であり、traceeligibility(t)はシナプスjの適格性追跡である。後述する適格性追跡は、所与の時間にわたる特定のシナプスにおける効力の変化量を決定する。この学習ルールは、PC及びDCNシナプスにおける増強と低下の両方をサポートする。ηが負(例えばPN→PCシナプスにおいて)のとき、学習ルールは、下オリーブ(IO)が基準の発火頻度を上回って活性であるときに低下を誘発し、下オリーブ(IO)が基準を下回るときに増強を誘発する。この学習ルールは、下オリーブ(IO)からのエラーが存在しないときに学習した応答の消去をサポートする。
本発明のモデルにおいて、シナプス効力の変化は、上に示され、より十分に後述される遅延適格性追跡ルールに基づくものであり、そのルールによって、適格性追跡(traceeligibility)はシナプスが適格であるときのシナプスの変化量を決定するものであり、
Figure 0005175218
ここで、s(t)はシナプスへのシナプス前入力であり、σ=0.15であり、Δは前のシミュレーション・サイクルからの時間のずれである。シナプス前入力が閾値を超えたとき、シナプスは設定遅延後に変更に対して適格となり、その時点で、適格性は指数的に低下する。後述するBBD10の学習段階における遅延は、異なる遅延時間の影響を調べるために変化させる。調べた遅延時間は、0、2、4及び8秒である。
視覚及び動作処理
すでに示されたように、視覚情報は、30フレーム毎秒で画像を捉える一般的に16で示すカメラによってBBD10に供給される。視覚前処理の詳細な説明は後述される。本発明のトレーニング/テストの実施例では、赤−オレンジ色の存在に応答する疑似神経システム12の神経単位が、視覚入力をシステム12に供給する(図2の視覚入力)。
視覚ストリーク又はぼかしが動作情報を与える。BBD10内の視覚映像のストリーク及びぼかしは、神経持続性と、視覚神経領域間の相互接続との組合せによって実現される。水平及び垂直方向のエッジ並びに方向選択応答が、ぼかし視覚映像から導出される。
疑似皮質領域MT内の神経単位の活性化は、配向選択性神経単位と方向選択性神経単位の同時活性化の結果である。例えば、所与の受容野における図2に示された神経単位MT−Downは、表S2に関連してより十分に後述されるように、垂直配向神経単位と下方移動選択単位が同じ受容野において共同活性であるときに活性となる。
運動出力
BBD10の動作は、速度(メートル/秒)及び回転速度(度/秒)コマンドによって制御される。所与の回転速度において、回転半径は速度の関数となる、即ち、速度がゼロでの回転速度はその場でのBBD10の回転を生じ、高速度における同じ回転速度は広範囲の回転を生じる。BBD10の回転速度は、Motor−Turn36の活性に基づいて設定することができる(図2参照)(例えばBBD10の左側の活性は右への回転を生じる)。Motor−Turn36の活性は、下オリーブを介する(図2のIO−Turn→Motor−Turn)IR入力(IR−Turn)によって、及び、小脳を介する(図2のDCN−Turn→Motor−Turn)視覚入力(Visual Input)によって影響される。BBD10の速度は、Motor−Velo領域38の活性に基づいて制御される。運動活性がないとき、速度は最大値1.25メートル/秒に設定される。次に、Motor−Velo領域は、障害物の信号を送る一般的に16で示されるIR検出器の数に基づいてBBD10を減速させる、即ち、より多くのIR検出器16が活性化されると、速度はより遅くなる。Motor−Velo38の活性は、下オリーブを介するIR−Velo入力(図2のIO−Velo→Motor−Velo)によって、及び、小脳を介する(図2のDCN−Velo→Motor−Velo)視覚入力(Visual Input)によって影響される。
計算
疑似神経システム12の神経シミュレーションは、ベオウルフ・クラスタ上で実行されるが、これは前述のようにBBD10に搭載され、Linuxオペレーティング・システムを実行する6つの2.4GHz Pentium IVコンピュータを含む。疑似神経システム12の各々のシミュレーションの間、感覚入力が処理され、すべての神経単位の状態が計算され、すべての可塑性結合の結合強度が決定され、運動出力が生成される。各々のシミュレーション・サイクルの実行は、およそ40ミリ秒の実時間を必要とするが、これは、この特定の実施形態のクラスタの計算能力によって制限される。より短いサイクル時間が好ましいが、40ミリ秒のサイクル時間は、一般的に16で示されるカメラの30Hzフレーム速度に十分に近い。各々のシミュレーション・サイクルの間、疑似神経システム12のすべての神経活性とBBDの状態は、BBD10上のディスク・ドライブ(図示せず)のハードディスク上に保存することができる。本発明を実施するのに用いることができるベオウルフ・クラスタのようなマルチプロセッサ・コンピュータ・アーキテクチャを有する頭脳ベース・デバイスに関するさらなる詳細については、本発明の譲受人に譲渡され共通の発明者を含み、引用によりここに組み入れられる、2005年11月24日に公開された、米国特許公開第2005/0261803A1号を参照することができる。
表S1
この表S1は、図2の疑似神経システム12内の神経単位の特性を定義するパラメータの値を示す。領域Red、Ver、Hor、DirUp、DirDown、DirLeft、及びDirRightは入力領域であり、それらの活性は図1Aの一般的に16で示されるカメラからの映像に基づく。IO−Turn及びIO−Veloは入力領域であり、それらの活動は、一般的に16で示されるIR近接検出器に基づく。表S1は、各々の領域又はサブ領域内の神経単位の数(サイズ)を示す。各々の領域内の神経単位は、特定の発火閾値(σ−発火)、それよりも上では電圧依存結合が効果をもち得る閾値(σ−vdep)、及び持続性パラメータ(ω)を有する。
Figure 0005175218
表S2
この表S2は、疑似神経システム12における解剖学的投射及び結合タイプの特性を示す。シナプス前神経単位は、所与の確率(p)及び所与の投射形状(Arbor)でシナプス後神経単位に結合する。この樹枝状分岐形状は、高さと幅をもつ長方形の「ブロック[h,w]」、シナプス前及びシナプス後神経単位の任意の対が結合する所与の確率を有する非局所的「nontopo」、又は、シナプス前受容野からシナプス後受容野への1対1投射が存在する「一致」とすることができ、これらの結合は、すべての結合したシナプス前単位が発火閾値を超えて活性である場合にのみ、シナプス後単位に対する影響をもつ。最初の結合強度cij(0)は、最小値及び最大値[min,max]によって与えられる範囲内で一様な分布でランダムに設定される。cij(0)の負の値は抑制性結合を示す。結合タイプは、電圧非依存(VI)又は電圧依存(VD)とすることができる。学習率ηのゼロでない値は可塑性結合を意味し、ηの正の値はシナプス増強を示し、ηの負の値はシナプス低下を示す。
表S2 疑似神経システムにおける解剖学的投射及び結合タイプの特性
Figure 0005175218
神経動力学及びシナプス可塑性
頭脳ベース・デバイス(BBD)10の疑似神経システム12内の神経単位は、平均発火頻度モデルと、両方ともに神経領域内及び間にあって、電圧非依存性又は電圧依存性のいずれか及び可塑性又は非可塑性のいずれかに設定される神経単位間のシナプス結合とによってシミュレートされる。電圧非依存結合は、シナプス後状態に関係なくシナプス入力を供給する。電圧依存結合は、活性化するのにシナプス後脱分極を必要とし、神経動力学において調節の役割を果たす傾向がある、受容体型(例えばNMDA受容体)の寄与を表す。
各々の神経単位の平均発火頻度は、連続的に0(静止)から1(最大発火)までの範囲にわたる。神経単位の状態は、Krichmar,J.L.及びEdelman,G.M.、(2002)、Cereb Cortex、818−30、並びに、Seth,A.K.、McKinstry,J.L.、Edelman,G.M.及びKrichmar,J.L.、(2004)、Cereb Cortex、1185−99に記載されるように、その現在状態と電圧非依存及び電圧依存入力からの寄与との関数として更新される。
神経単位jから神経単位iへの電圧非依存入力は、
Figure 0005175218
(6)
であり、ここでsj(t)は神経単位jの活性であり、cijは神経単位jから神経単位iへの結合強度である。神経単位iに対する電圧非依存のシナプス後影響、
Figure 0005175218
は、神経単位iへのすべての入力を合計することによって計算され、
Figure 0005175218
(7)
ここでNは、神経単位iに投射する異なる解剖学的に定義された結合タイプ(表S2参照)からとすることができる結合の数である。神経単位jから神経単位iへの電圧依存入力は、
Figure 0005175218
であり、ここで
Figure 0005175218
は、それより下では電圧依存結合の影響がないシナプス後活性の閾値である(表S1参照)。
神経単位iに対する電圧依存シナプス後の影響、
Figure 0005175218
は、
Figure 0005175218
によって与えられる。
神経単位iに対する全てのシナプス後の影響は、
Figure 0005175218
によって与えられる。
新しい活性は、次の活性化関数によって決定され、
Figure 0005175218
ここでωは1つのサイクルから次のサイクルへの神経単位の活性の持続性を決定し、giはスケール因子であり、
Figure 0005175218
は、神経単位の比発火閾値である。神経単位に関する比パラメータ値は表S1に与えられており、シナプス結合は表S2において指定されている。
遅延適格性追跡学習ルール
シナプス強度は、シナプス前、シナプス後、及び下オリーブ(IO)活性に依存するシナプス・ルールによる変更を受ける。微細スケールのシナプス結合に関する比パラメータ設定値は、以下の式及び表S2において与えられる。
ijにおけるシナプス変化は、
Figure 0005175218
によって与えられ、ここでsi(t)はシナプス後単位の活性であり、tracej(t)はシナプスjの適格性追跡であり、IOi(t)は神経単位iに対応する下オリーブIO単位の活性であり、ηは一定の学習率である。学習ルールは、平行線維−プルキンエ細胞(PC)シナプスにおける増強と低下の両方をサポートする。この機構は、下オリーブIOが基準の発火頻度を上回って活性であるときに低下を誘発し、下オリーブIOが基準の発火頻度を下回るときに増強を誘発する。この学習ルールは、下オリーブIOからのエラーが存在しないときに学習した応答の消去をサポートする。
シナプスの可塑性は、前述の本発明の遅延適格性追跡ルールに基づいており、適格性追跡(traceeligibility)はシナプスが適格であるときのシナプスの変化量を決定するものであり、

Figure 0005175218
ここで、s(t)はシナプスへのシナプス前入力であり、σ=0.15であり、Δは前のシミュレーション・サイクルからの時間のずれである。これは、シナプス前入力が閾値を超えたときに、シナプスが設定遅延後の変更に対して適格となり、その時点で、適格性は指数的に低下することを意味する。遅延は、後述するように、異なる遅延時間の影響を調べるために変化させた。調べた遅延時間は、0、2、4及び8秒であった。
遅延適格性追跡学習ルールは、以下のように機能する(4秒の遅延を想定する)。
BBD10の学習段階の前
1.時刻0において、視覚入力(視覚入力及び皮質領域MT)が、PN→DCN及びPN→PCシナプスを閾値を超えて活性化する。
a.これらの閾値を超えたシナプスは、搭載コンピュータ・クラスタの遅延バッファに入れられる。
b.DCN活性は、運動応答を引き起こすのに十分には強くない。
2.BBD10が障害物に当たってから4秒後
a.4秒間又はそれ以上にわたって遅延バッファに入れられたシナプスが、ここでシナプス変化に対して適格となる。
b.下オリーブIOからのエラー信号が発生する。
c.適格PN→DCN及びPN→PCシナプスがIO活性により変化する。
d.IO→DCN結合は、障害物から離れる運動応答を引き起こすのに十分に強い。
学習段階の後及びテスト段階の間
1.時刻0において、視覚入力はPN→DCN及びPN→PCシナプスを閾値を超えて活性化する。
a.これらの閾値を上回るシナプスは、遅延バッファに入れられる。
b.前のシナプス変化のために、DCN活性がここで運動応答を引き起こす。
c.BBD10が、衝突が起こる充分前に障害物から方向転換する。
2.BBD10が何の障害物にも当たらなかった4秒後
a.IOからのエラー信号は発生しない。
b.さらなるシナプス変化は起こらない。
感覚入力
視覚及び動作処理
一実施形態において、一般的に16で示される、30フレーム毎秒で640×480ピクセル画像を捉えるSony IEEE1394CCDカメラによって、視覚情報がBBD10に供給される。未加工の感覚ピクセル・データは、輝度とカラー・チャネル(YUV色空間)に分離される。輝度情報が、赤、緑、青、黄、ピンク及び紫に対する一組のカラー検出器に送られる。色に基づく物体認識を促進するために、UV色空間上の各々の色に関するコンピュータ・クラスタのルックアップ・テーブルを用いることによって色が認識される。カラー・テーブル内の値は、その特定の色に属する特定のUV座標の確率とみなすことができる。本発明のトレーニング及びテスト段階においては、赤色検出器のみが用いられ、これは図1A、図1Bに示された運動作業コースを定めるコーンの色に調整される。赤色検出器は神経シミュレーションに入れられる(表S1及び表S2における赤)。
前述のように、視覚ストリーク又はぼかしは、動作情報を与えることができる。動作ストリークは、神経持続性と、赤及びストリーク神経領域間の相互結合との組合せによって達成される(表S1及び表S2参照)。水平及び垂直方向のエッジは、フィルタ、例えば8×8ガボール・フィルタを有するストリーク神経領域を水平及び垂直配向で回旋させることによって決定される。回旋の結果は、神経群Hor及びVerに直接入力される。上、下、左及び右に対する方向選択応答は、以前及び現在のストリーク神経活性の相互相関によって決定される。相互相関の結果は、図2に示された疑似神経システム12の神経領域DirUP、DirDown、DirLeft及びDirRightに直接入力される。
Figure 0005175218
ここでdij(x,y)は、方向選択神経単位(x,y)の活性であり、iは左に対して−1に設定され、右に対して+1に設定され、jは下に対して−1に設定され、上に対して+1に設定された。Streak(t,x,y)は、時刻tにおけるストリーク神経単位(x,y)であり、sはスピード又はピクセル・オフセットである。
疑似皮質領域MT24内の神経単位の活性は、方向選択神経単位と配向選択神経単位との同時活性化の結果である。例えば、所与の受容野におけるMT−Down神経単位(図2参照)は、垂直配向神経単位(即ちV−V)と下方移動選択単位(即ちDown)が同じ受容野において共活性であるときに活性である(表S2参照)。こうした組合せは、明確に動作をエンコードする。
運動エラー信号
図7A−図7Bは、一般的に16で示されるIR近接検出器から下オリーブIOエラー信号及びBBD10の運動システムへのマッピングを示す。一般的に16で示されるIR近接検出器又はセンサ・アレイは、BBD10の前を横切る11個のセンサの列として配置される。図7Aに示されるように、マッピングはIRセンサから回転コマンドまでである。IR信号は、回転エラー(IO−Turn)に関する下オリーブIO信号に直接マッピングされ、これが回転コマンド(Motor−Turn)に関する運動野上にマッピングされる。BBD10の中央に向かうIR信号は、正面衝突に近いという信号を送って、障害物からの急激な方向転換を生じ、一方、BBD10上の側部に向うIR信号は、障害物からのより緩やかな方向転換を生じる。図7Aに示されていないのは、深小脳核DCNから運動野への投射(DCN→Motor−Turn)である(これらは図2に示されている)。
図7Bにおいて、マッピングは、IR近接検出器又はセンサ16から速度信号までである。BBD10の速度は、閾値を越えたIR検出器16の数及び大きさの関数によって制御される、即ち、BBD10は、より多くのIR検出器16が近くの障害物の信号を送るとき、より遅く動くように命令される。Σは、全てのIR値の和を表す。速度機能は、速度エラー(IO−Velo)に関する下オリーブIOにおける活性の設定を生じ、これが速度制御に関する運動野(Motor−Velo)にマッピングされる。図7Bに示されていないのは、深小脳核DCNから運動野への投射(DCN→Motor−Velo)である(これらは図2に示されている)。
現在の視覚運動トレーニング及びテスト段階においては、運動エラーの信号は、BBD10が障害物の1フィート以内にあるとき、一般的に16で示される赤外(IR)近接検出器によって送られる。IR検出器16は0.0から1.0までの規格化信号を与えるが、ここで0.0はIR範囲内に物体がないことを示し、1.0はIR検出器16の1インチ以内に物体があることを示す。IR検出器の閾値は0.5に設定されるが、これはおよそ12インチに対応する。IR信号は0.5から1.0までほぼ直線的である。
下オリーブIO領域は、運動エラー情報を疑似小脳26に伝送する。一般的に16で示されるIR検出器の値は、回転エラー(図7AのIO−Turn)及び速度エラー(図7BのIO−Velo参照)に関する下オリーブIO活性に変換されて、BBD10に障害物から方向転換させ、障害物の存在下で減速させる。IO−Turn領域は、対応するIR近接検出器16の値に基づいて設定される(図7A参照)。IO−Velo領域は、閾値を超えた活性IR検出器16の数に基づいて設定され(図7B参照)、
Figure 0005175218
ここでIRmaxは、全てのIR検出器16のうちの最大値であり、iは1から11までの範囲の指数であり、IRnumは、閾値を超えたIR検出器の数である(図7参照)。
モータ出力
BBD10の動作は、速度(メートル/秒)及び回転速度(度/秒)コマンドによって制御される。所与の回転速度において、回転半径は速度の関数である、即ち、速度ゼロにおける回転速度はBBD10のその場での回転を生じ、高速度における同じ回転速度は幅広の回転を生じる。
図1Aに示されるBBD10の車輪への運動出力は、神経運動野の活性から導びかれる(表S1及び表S2のMotor−Turn及びMotor−Velo参照)。BBD10の回転速度は、Motor−Turn活性に基づいて設定される(図7A参照)。Motor−Turn活性の中心軌跡が計算され、BBD10の回転を制御するのに用いられる。デバイスの中心のわずかに左に対応する活性(例えば図7AのMott5)は、最高の右方回転速度(1.3度/秒)を生じ、デバイスの横方向左側に対応する活性(例えば図7AのMott1)は、最低の右方回転速度(0.26度/秒)を生じる。左方回転は同じ方法で計算される。Moto−Turn活性は、下オリーブを介するIR入力(表S2のIO−Turn→Motor−Turn参照)によって、及び小脳を介する視覚入力(表S2のDCN−Turn→Motor−Turn参照)によって影響される。
BBD10の速度は、Motor−Velo領域の活性に基づいて制御される(図7B参照)。その領域の活性Motor−Veloは、BBD10の速度の減速を引き起こす。モータ活性がないとき、速度は最大値1.25メートル/秒に設定される。Motor−Velo領域は、障害物の信号を送るIR検出器(一般的に16で示される)の数に基づいてBBD10を減速させる、即ち、活性化されたIR検出器が多いほど、速度は遅くなる。Motor−Velo活性は、下オリーブを介するIR入力(表S2のIO−Velo→Motor−Velo参照)によって、及び小脳を介する視覚入力(表S2のDCN−Velo→Motor−Velo参照)によって影響される。
図8A−図8C及び図8D−図8Fは、BBD10に関する速度及び回転速度の分布を示す。左の列は、図1Bに示された緩、中間及び急回転コースについての速度運動コマンドのヒストグラムを示す。右の列は、図1Bに示された緩、中間及び急回転コースについての回転コマンドのヒストグラムを示す。頻度は、所与の速度(左の列)及び回転速度(右の列)におけるシミュレーション・サイクルの数を表す。
図9A及び図9Bは、図1Bの1つのコースから別のコースへのBBD10による順応を示す。プロットは、各々の条件における5つの被験体に関する平均運動エラーを示し、エラー・バーは標準偏差を示す。図9Aは、緩グループ(gradual)からの被験体を、図1Bの急コース上でトレーニングされて緩コースに順応した被験体(sharp2grad)と比較して示す。sharp2gradグループは、最初の6ラップにおいて緩グループよりも著しく低い運動エラーを有する(p<0.005片側t検定)。図9Bは、急グループ(sharp)からの被験体を、図1Bの緩コース上でトレーニングされて急コースに順応した被験体(grad2sharp)と比較して示す。grad2sharpグループは、最初の6ラップにおいて急グループよりも著しく低い運動エラーを有する(p<0.005片側t検定)。
図10A及び図10Bは、前小脳核(PN)からプルキンエ細胞(PC)及び深小脳核(DCN)への荷重を示す。各々のピクセルは、PNの細胞からPC又はDCNの細胞への荷重の値を示す。この実施形態においては、30×40のPN神経単位(表S1参照)、並びにPC−Turn及びDCN−Turnにおける11の細胞が存在するので、各々の行に11のマトリクス、及び各々のPC又はDCN神経単位に対する1つの30×40マッピングが存在する。グレー・レベルは強度を示し、最大は白であり、最小は黒である。全ての荷重は0.5に初期化される(中間グレー)。従って、より暗いピクセルは低下を受けた荷重を示し、より明るいピクセルは増強を受けた荷重を示す。図10Aにおいては、PNからPC−Turn及びDCN−Turnへの荷重が回転制御に関与する。この荷重は、図1Bの中間コースにおけるトレーニング後の1つのBBD10被験体に関するものである。最小荷重値は0.00であり、最大荷重値は0.78である。図10Bにおいては、PNからPC−Velo及びDCN−Veloへの荷重は、速度制御に関与する。この荷重は、図1Bの中間コースにおけるトレーニング後の1つのBBD10被験体に関するものである。最小荷重値は0.00であり、最大荷重値は0.70である。
図11A及び図11Bは、図1Bに示された緩コース上のトレーニング前及び後の単一の通行の間の、選択された神経領域からの応答を示す。これらの図面は、疑似小脳がどのように機能するか、及び、神経活性の変化が改善された性能とどのように相関するかを示す。図11Aは、代表的な「被験体」についての第1トレーニング通行を示す。活性は、BBD10と図1Aに示されたコーンとの衝突又は異常接近によって活性化される反射動作中の応答を示す。図11A(a)において、オレンジで示された通路境界に対する緑で示されたBBD10の位置が、各々のシミュレーション・サイクルについて示される。図(b)−(i)は、ある時間にわたる種々の神経領域内の各々の神経単位の、グレー・レベルで示された動的活性を示す。白は最大活性を示し、黒は活性がないことを示す。(b)−(e)は、回転を制御する小脳回路の活性を示す。(b)回転に関連する下オリーブ活性は、図1AのBBD10の前部の種々の方向におけるコーンの並びを示す、一般的に16で示されるIR検出器によって駆動される。詳細なマッピングは図7Aに与えられる。(c)回転に関連するプルキンエ細胞(PC−Turn)活性は、DCN−Turnへの局所的抑制性結合により回転に影響を及ぼす。(d)回転に関連する深小脳核(DCN−Turn)活性は、Motor−Turn領域への局所的興奮性投射を介して回転を制御する。(e)回転に関連する運動野活性(Motor−Turn)。神経単位1−5は、BBD10の左車輪速度を増加させて右へ回転させ、一方、神経単位7−11は、右車輪速度を増加させて左へ回転させる。詳細なマッピングは図7Aに与えられる。(f)−(i)は、速度を制御する小脳回路の活性を示す。(f)IR入力からIO−Velo活性化への詳細なマッピングは、図7Bに与えられる。(g)速度に関連するプルキンエ細胞(PC−Turn)活性は、DCN−Veloへの局所抑制性結合により速度に影響を及ぼす。(h)速度に関連する深小脳核(DCN−Velo)活性は、Motor Velo領域への局所刺激性投射を介して速度を制御する。(i)速度コマンド運動野活性(Motor Velo)。ブレーキ信号は、より多くの神経を活性化して強い減速を生じるより強い全IR活性による集団応答である。
図11Bは、図11Aに示された同じコース上でのトレーニングの終了時における、選択された神経領域からの動的神経応答を示す。図11B(a)−(i)は図11Aにおけると同様である。注目すべき幾つかの違いがある。第1に、トレーニング後、BBD10は経路の中央の近くを移動し(図11A(a)と図11B(a)を比較されたい)、下オリーブ内のエラー関連の活性は少なくなる(図11A(b)対図11B(b)及び図11A(f)対図11B(f))。第2に、図11A(d)及び図11A(h)とは異なり、図11B(d)及び図11B(h)は、エラー関連のIO活性が存在しないときに先行して発生するDCN領域からの運動出力を示す。最後に、学習後、特定のPC神経単位は、活性ではなく(図11A(c)対図11B(c)及び図11A(g)対図11B(g))、回転(図11A(d)対図11B(d))及びブレーキ(図11A(h)対図11B(h))に関する対応するDCN神経単位を脱抑制し、結果として経路の中央を進む滑らかな移動を生じる。
結果のまとめ
運動学習は、図1A及び図1Bに示されるように、一組のオレンジの交通コーンによって定められた種々の「S」字湾曲コースに対して評価される。この作業に対するプラットフォームは、入力として、全て一般的に16で示される、カメラ、レーザ距離計、及び赤外近接検出器を有するように変更されたSegway Robotic Mobility Platform(RMP)である。BBD10の疑似神経システム12は、表S1に示されるように、28の神経領域と、27,688の神経単位と、およそ160万のシナプス結合とを含む。内蔵ベオウルフ・コンピュータ・クラスタを用いると、各々のシミュレーション・サイクルにおいてモデル内のすべての神経単位および可塑性結合を更新するのに約40msの実時間がかかる。
BBD10の性能は、急回転セット(「急」)、中間回転セット(「中間」)、及び緩回転セット(「緩」)の3つの異なるコース(図1B)上でテストされる。BBD10は、各々のコースを終点に到達するまで移動し、次に回転してコースを反対方向に移動する。各々の移動を本明細書ではラップと呼ぶ。20ラップを含んだBBD10のトレーニングに続いて4ラップのテストが行われ、テスト中は、IR駆動反射は不活性にされ、視覚キューのみがBBD10に利用可能となる。
下オリーブ(IO)は、小脳に運動エラー情報を伝送すると考えられる。現在の視覚運動作業においては、運動エラーの信号は、BBD10が障害物の1フィート以内にあるときに赤外(IR)近接検出器16によって送られる。IR検出器の応答は、回転エラー(図2のIO−Turn)及び速度エラー(図2のIO−Velo)に関する下オリーブIO活性に変換されて、BBD10を障害物から反射的に方向転換させ、障害物の存在下で減速させる。学習後は、湾曲コースの中央を進むBBD10の滑らかな移動を推進するのに視覚運動キューのみで十分となる(図2のMT→DCN→Motor)。
学習は、障害物に対するラップ当りの平均IR応答を反映する運動エラーの大きさによって計量され、ここでIR値は0(即ちIRの範囲内に物体が存在しない)から1(即ちIR検出器16の1インチ以内に物体が存在する)までの範囲にわたる。トレーニング及びテストは5つの異なる「被験体」を用いて繰り返される。各々の被験体は同じ物理的BBD10であるが、各々は独自の疑似神経システムを有する。この被験体間の変動性は、個々の神経単位間の結合の確率分布とそれらの単位間の初期結合強度とにおけるランダムな初期化の結果である(表S2参照)。しかしながら、異なる被験体の間で、神経領域間の結合性の全体的なパターンは類似したままである。各々のシミュレーション・サイクル、運動エラー、BBD10の回転速度及び速度、並びに、すべての神経単位の状態を分析のために記録することができる。
図1Aに示されたオレンジ・コーンによって指定された経路をナビゲートする機能に対する追跡遅延(前述の)の影響を、遅延間隔を変化させることによってテストすることができる。0、2、4及び8秒の遅延間隔を、一定速度(最高速度の60%又は0.75m/s)で中間コース(図1B)についてテストする。これらのテスト中、速度を制御する神経経路はないものとした。対照として、DCN→Motor結合が損傷され行動がIR反射のみによって駆動される「無学習」グループを用いた。
遅延適格性追跡学習ルールは、この作業においては2及び4秒の遅延で最も効果的となる(図3A)。およそ5ラップ後に、2及び4秒の遅延を有するルールをもったBBD10の被験体は、無様な移動及びコーン衝突から、経路の中央を滑らかに進む移動に移行した。トレーニング後、IOからの結合を損傷させて、疑似神経システムを視覚キューのみによってテストする(図3B)。図3Bに見られるように、運動エラーは、適度な遅延(2又は4秒)により、長い遅延(8秒)、無遅延、又は無学習によるよりも著しく低くなる。
種々の曲がりを有する急、中間及び緩の3つのコースにわたる良好な動作は、適時適切な大きさのブレーキと回転の組合せを必要とする。遅延適格性追跡学習ルールに組み込まれる4秒の遅延は、全ての3つのコース上の良好なナビゲーションのために十分である(図4参照)。被験体は回転の前及び回転中に減速することを学習し、それらは適時に適切な方向に回転することを学習する。ほぼ90度の曲がりを含む急コース上の被験体は、他のコース上よりもわずかに劣る動作を有する。それにもかかわらず、テスト相においては、学習する小脳をもつ被験体は、学習なしの被験体よりも全ての3つのコース上で著しく良好に動作する(図4B−図4D)。
被験体は、それらの行動を各々のコースの細部に順応させる(図8参照)。例えば、被験体は、急コース上よりも緩コース上で速くなる。急コース上の成功は、より低い速度と左又は右へのより頻繁な回転を必要とする。緩コース上の被験体は、典型的には直線路上を最高速度で進み、湾曲路上は減速すると同時にわずかに回転する。1つのコース上の学習は他のコースに一般化される。例えば、急コース上でトレーニングされた被験体は、緩コース上で再トレーニングされ(図9A参照)、緩コース上でトレーニングされた被験体は、急コース上で再トレーニングされた(図9B参照)。両方の場合において、トレーニングされた被験体は、早期のトレーニング・ラップ(例えばラップ1−6)において未経験の被験体よりも著しく良好な動作を示した(p<0.005片側t検定)。しかしながら、緩コースから急コースへの順応は、最高動作に到達するのに付加的なトレーニングを必要とする可能性がある。
BBD10を用いる人工神経モデリング手法は、上で引用した公開特許出願において説明されたのと同様の実世界における行動作業の動作中のすべてのレベルにおいて、疑似神経システム12のすべてのコンポーネントの状態及び相互作用の同時記録を可能にする。キューがBBDの運動コマンドを誘発することを理解するために、BBDのトレーニング中及びテスト中における神経単位からの応答及びシナプス荷重変化を分析することができる。運動出力神経単位から視覚動作に関する疑似皮質領域に戻る活性を追跡することは特に興味深い。
疑似神経システム12は、運動キューに基づいて適切な運動応答を開始する。バックトレース手続きと呼ばれる公知の方法は、特定の時刻における特定の参照神経単位を選択することによって機能経路を特定し、この参照単位において観測された活性を引き起こした全ての神経単位の以前の活性を再帰的に調査する。Krichmar,J.L.、Nitz,D.A.、Gally,J.A.&Edelman、G.M.(2005)、Proc Natl Acad Sci USA 102、2111−6を参照されたい。
例えば、皮質領域MT内の動作選択神経単位によって指定される減速、左回転及び右回転を引き起こす運動野(Motor−Turn及びMotor−Velo)における参照神経単位から始めて、4つの40ms時間ステップをさかのぼる。これらのバックトレースは、学習が行われた後、運動エラーが少なくなるラップであるラップ11−20において実行された。Motor−Turn又はMotor−Veloにおける運動の参照神経単位から始まって、バックトレースは初めに、参照神経単位に物理的に結合し、以前の時間ステップの間アクティブであった他の神経単位のリストを割り出す。次に、この手続きは、この神経単位の新しいリストにより繰り返すことができる。このプロセスは、運動参照事象につながる皮質MT神経単位が識別されるまで繰り返される。この方法を用いて、377の左方回転及び280の右方回転を含むバックトレース・ネットワークが生成される。これらのバックトレースは、知覚から運動動作までのネットワークを通した神経単位の直接因果連鎖を表す(即ち図2のMT→PN→DCN→Motor)。
図5は、トレーニング後に良好な動作を生じたMT神経単位の複合体を示す。運動動作に関して選択されたMT神経単位は、方向調整及び位置の情報の組合せに応答する。例えば、MT−Rightの左上受容野における活性は右への回転を引き起こし、MT−Downの左下受容野もまた右への回転を引き起こす。
経験は神経動力学におけるシフトを生じる。最初に、IR検出器入力が運動神経単位を駆動するIO活性を引き起こす。学習後、視覚入力がDCN活性を引き起こし、これが次にIOからの何らかのエラー信号の前に運動神経単位を駆動する(図11参照)。これらの変化は、PCシナプスにおける低下がDCN神経単位の脱抑制を引き起こして運動活性を駆動するDCN活性を生じる、シナプス効力の変化によってもたらされる。より小さな程度において、DCNシナプスにおける増強はまた、視覚キューに対するDCN応答を増加させる(図10参照)。
本発明の遅延適格性追跡学習ルールに基づく経験依存の可塑性変化によるシナプス荷重の変化もまた調べることができる。PCシナプスにおける低下は、主に速度制御(図10B参照)及び回転(図10A参照)に関与する。図1Aに示されたコーンの近接さを示す運動キューは、視野の一方の側であろうと他方の側であろうと、ブレーキ行動を引き起こす。さらに、異なるコース(急、中間、緩)に応じたシナプス荷重の変化を比較するとき、結合の数及び強度は、急コース(図8参照)上でのBBDの全体的に低い速度に相関して、急コースの場合には、緩コース(図6)と比較してより大きな程度に変化する。回転の制御に関与する荷重変化(図10参照)は、図5に示されたMT応答と調和するパターンを示す。提案されたIOからの反射エラー信号及び遅延適格性追跡学習ルールと連結した小脳の増強及び低下は全体として、小脳における公知のシナプス学習ルールによる荷重を調節するのに十分である。
本発明の好ましい実施形態の上記の説明は、例証及び説明の目的で与えられている。網羅的であること、又は本発明を開示された通りの形態に限定することは意図されていない。当業者には多くの修正及び変化が明らかとなるであろう。実施形態は、本発明の原理及びその実際の用途を最もよく説明し、それにより当業者が本発明、種々の実施形態、及び企図された特定の使用に適した種々の修正を理解することができるように選択され説明された。本発明の範囲は、添付の特許請求の範囲及びそれらの同等物によって規定されることが意図されている。
オレンジ・コーンによって定められる経路又はコース内で移動可能な物理的モバイル頭脳ベース・デバイスの絵画図である。 図1Aの頭脳ベース・デバイスが移動する異なるコースのレイアウトを示す。 図1Aの頭脳ベース・デバイスの擬似神経システムの局部的及び機能的神経構造の概略図である。 図1Bの中間湾曲コース上にあるときの、図1Aの頭脳ベース・デバイスのトレーニング又は学習相のグラフである。 図1Bの中間湾曲コース上にあるときの、頭脳ベース・デバイスのテスト相のグラフである。 図1Bの、それぞれ緩湾曲、中間湾曲及び急湾曲のコース上にあるときの、図1Aの頭脳ベース・デバイスの学習相をグラフで示す。 緩湾曲コース上のテスト相における、学習相を経由した頭脳ベース・デバイスと、学習相を経由していない頭脳ベース・デバイスとの比較をグラフで示す。 中間湾曲コース上のテスト相における、学習相を経由した頭脳ベース・デバイスと、学習相を経由していない頭脳ベース・デバイスとの比較をグラフで示す。 急湾曲コース上のテスト相における、学習相を経由した頭脳ベース・デバイスと、学習相を経由していない頭脳ベース・デバイスとの比較をグラフで示す。 図1Bの急湾曲コース、中間湾曲コース及び緩湾曲コースのそれぞれについて、図1Aの頭脳ベース・デバイスによってなされた左回転に対する、図2の神経構造の領域MTにおける神経単位による異なる応答を示す。 図1Bの急湾曲コース、中間湾曲コース及び緩湾曲コースのそれぞれについて、図1Aの頭脳ベース・デバイスによってなされた右回転に対する、図2の神経構造の領域MTにおける神経単位による異なる応答を示す。 緩やかな湾曲コース上での図1Aの頭脳ベース・デバイスのトレーニング相の後の、図2の神経構造の速度制御(PC−Velo)に関する、前小脳核(PN)からプルキンエ細胞(PC)へのシナプス荷重のマトリクスを示す。 中間湾曲コース上での図1Aの頭脳ベース・デバイスのトレーニング相の後の、図2の神経構造の速度制御(PC−Velo)に関する、前小脳核(PN)からプルキンエ細胞(PC)へのシナプス荷重のマトリクスを示す。 急湾曲コース上での図1Aの頭脳ベース・デバイスのトレーニング相の後の、図2の神経構造の速度制御(PC−Velo)に関する、前小脳核(PN)からプルキンエ細胞(PC)へのシナプス荷重のマトリクスを示す。 図2の神経構造内に示された回転コマンド(モータ−Turn)に関する運動野上にマッピングされる回転エラー(IO−Turn)に関する下オリーブ(IO)への、図1Aの頭脳ベース・デバイスの赤外(IR)近接検出器からの回転マッピング(IP−Turn)を示す。 図2の神経構造内に示された速度コマンド(Motor−Velo)に関する運動野上にマッピングされる速度(IO−Velo)に関する下オリーブ(IO)への、図1Aの頭脳ベース・デバイスの赤外(IR)近接検出器からの和Σを介する速度マッピング(IR−Velo)を示す。 図1Bの緩湾曲コースに対する速度運動コマンドの分布のヒストグラムである。 図1Bの中間湾曲コースに対する速度運動コマンドの分布のヒストグラムである。 図1Bの急湾曲コースに対する速度運動コマンドの分布のヒストグラムである。 図1Bの緩湾曲コースに対する回転コマンドの分布のヒストグラムである。 図1Bの中間湾曲コースに対する回転コマンドの分布のヒストグラムである。 図1Bの急湾曲コースに対する回転コマンドの分布のヒストグラムである。 頭脳ベース・デバイスの急湾曲コースから緩湾曲コースへの順応を示す。 頭脳ベース・デバイスの緩湾曲コースから急湾曲コースへの順応を示す。 図1Aの頭脳ベース・デバイスの回転制御に関与する、前小脳核(PN)からプルキンエ細胞(PC)及び深小脳核(DCN)への荷重を示す。 図1Aの頭脳ベース・デバイスの速度制御に関与する、前小脳核(PN)からプルキンエ細胞(PC)及び深小脳核(DCN)への荷重を示す。 (a)−(i)は、図1Aの頭脳ベース・デバイスが図1Bの緩湾曲コースを初めに通行する際の、図1Aに示されたコーンの衝突又は異常接近によって活性化される、選択された神経領域からの応答を示す。 (a)−(i)は、トレーニングの終了時に図11A(a)に示されたのと同じコース上での選択された神経領域からの応答を示す。

Claims (12)

  1. 頭脳ベース・デバイスであって、
    実世界環境における頭脳ベース・デバイスの移動を可能にする機構と、
    前記機構を制御して前記頭脳ベース・デバイスを前記実世界環境において移動させるため、前記実世界環境と相互作用する疑似神経システムとを備え、
    前記疑似神経システムは、シナプスを有する小脳のモデルを含み、前記シナプスの接続強度は、前記モデルが前記機構の運動制御を予測すること可能となる閾値を超えた特定のシナプスの活性化から所与の時間間隔の後でのみ修正され、さらに、
    実世界学習モードの間、
    a)時刻t 0 において、前記頭脳ベース・デバイスへの視覚入力は、前記小脳モデルの特定のシナプスをある閾値よりも上に活性化させ、前記特定のシナプスは遅延バッファにストアされるが、前記小脳モデルの活性は前記機構を制御する運動応答を引き起こすほどは強くなく、
    b)時刻t 0 の後の時刻t 1 までは、前記バッファにストアされた前記特定のシナプスはシナプス変化がされることが回避され、
    c)時刻t 1 において、前記バッファにストアされた前記特定のシナプスはシナプス変化がされることが許可され、前記頭脳ベース・デバイスの前記移動経路内の障害物に応答してエラー信号が生成されるとき、このエラー信号に応答して前記特定のシナプスのシナプス可塑性変化が起こり、そして、シナプス結合が前記機構の運動制御を引き起こすのに十分に強くなって、前記頭脳ベース・デバイスを前記障害物から離れるように動かすことを生じさせる、ことを特徴とする頭脳ベース・デバイス。
  2. 前記頭脳ベース・デバイスは、該デバイスの移動経路内の障害物を予測するために、実世界学習モード及び実世界学習後モードを有する、請求項1に記載の頭脳ベース・デバイス。
  3. 前記学習後モードの間、
    a)時刻t0において、前記頭脳ベース・デバイスへの視覚入力が特定のシナプスをある閾値よりも上に活性化させ、前記特定のシナプスは遅延バッファにストアされ、前記小脳の活性が運動制御応答を引き起こし、そして、前記実世界学習モード中に起こるシナプス変化に起因して、前記頭脳ベース・デバイスが衝突しないようにその経路内の障害物を避けるようにし、
    b)時刻t0の後の一定時間の間、エラー信号は生成されず、かつ、付加的なシナプス変化は起こらない、請求項1又は2に記載の頭脳ベース・デバイス。
  4. 前記小脳の前記モデルは、前小脳核(PN)と、プルキンエ細胞(PC)を有する小脳皮質と、深小脳核(DCN)と、下オリーブ(IO)とを含み、
    前記前小脳核は前記小脳皮質に出力し、前記プルキンエ細胞(PC)は前記頭脳ベース・デバイスの回転及び速度制御に関する前記深小脳核を抑制し、前記下オリーブ(IO)は前記小脳皮質への登上線維入力を模倣する、請求項3に記載の頭脳ベース・デバイス。
  5. 前記疑似神経システムは、前記プルキンエ細胞(PC)への入力を供給する視覚皮質領域(MT)をさらに含む、請求項に記載の頭脳ベース・デバイス。
  6. 前記機構は、前記視覚皮質領域(MT)への視覚入力を供給するカメラを含む、請求項に記載の頭脳ベース・デバイス。
  7. 前記機構は、前記下オリーブ(IO)への回転及び速度入力を供給する検出器を含む、請求項に記載の頭脳ベース・デバイス。
  8. 前記機構は、モータ及び該モータによって駆動される車輪を含み、
    前記モータは、前記深小脳核(DCN)から及び前記下オリーブ(IO)からの入力を受信して前記頭脳ベース・デバイスの回転及び速度を制御する、請求項に記載の頭脳ベース・デバイス。
  9. 前記所与の時間間隔は2−4秒の範囲内の一定の遅延であることを特徴とする、請求項に記載の頭脳ベース・デバイス。
  10. 実世界環境におけるモバイル頭脳ベース・デバイスの移動を制御する方法であって、
    前記モバイル頭脳ベース・デバイスは小脳をモデル化した疑似神経システムを含み、
    前記モバイル頭脳ベース・デバイスの学習段階の間、
    (i)前小脳核(PN)からプルキンエ細胞(PC)までの、及び前小脳核(PN)から深小脳核(DCN)までのシナプスをある閾値よりも上に活性化させる視覚入力を供給し、
    (ii)前記閾値を超えたそれらのシナプスをストアし、
    (iii)前記閾値を超えるシナプスの存在から所定時間経過後に、前記モバイル頭脳ベース・デバイスが障害物に当たった場合にエラー信号を生成し、
    (iv)下オリーブ(IO)からPN→PC及びPN→DCN経路の前記シナプスにエラー信号を供給するステップを含み、
    少なくとも前記所定の時間にわたってストアされたそれらのシナプスは、前記エラー信号によるシナプス変化を受け、
    前記経路IO→DCN内の前記シナプス結合は、前記モバイル頭脳ベース・デバイスを前記障害物から遠ざかるように動かす応答を引き起こすのに十分に強い、ことを特徴とする方法。
  11. テスト段階の間、
    (i)前記経路PN→PC及びPN→DCN内のシナプスをある閾値よりも上に活性化させる視覚入力を供給し、
    (ii)前記閾値を超えたシナプスをストアするステップをさらに含み、この場合、前記学習段階の間の前記シナプス変化の結果として、深小脳核(DCN)の活性が前記頭脳ベース・デバイスに前記障害物を避けさせる応答を引き起こし、
    (iii)前記閾値を超えるシナプスの存在から所定時間経過後に前記下オリーブ(IO)からのエラー信号は生成されず、さらなるシナプス変化は起こらない、ことを特徴とする請求項10に記載の方法。
  12. 前記所定の時間は予め定められて2−4秒の範囲内にあることを特徴とする、請求項11に記載の方法。
JP2008548838A 2005-12-28 2006-12-27 予測的運動制御のための小脳モデルを有する頭脳ベース・デバイス Expired - Fee Related JP5175218B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US75422905P 2005-12-28 2005-12-28
US60/754,229 2005-12-28
PCT/US2006/062634 WO2007076516A2 (en) 2005-12-28 2006-12-27 Brain-based device having a cerebellar model for predictive motor control

Publications (2)

Publication Number Publication Date
JP2009523276A JP2009523276A (ja) 2009-06-18
JP5175218B2 true JP5175218B2 (ja) 2013-04-03

Family

ID=38218872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008548838A Expired - Fee Related JP5175218B2 (ja) 2005-12-28 2006-12-27 予測的運動制御のための小脳モデルを有する頭脳ベース・デバイス

Country Status (5)

Country Link
US (2) US7827124B2 (ja)
EP (1) EP1969513A4 (ja)
JP (1) JP5175218B2 (ja)
CN (1) CN101390100B (ja)
WO (1) WO2007076516A2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006039797B4 (de) * 2006-08-24 2013-11-07 Qimonda Ag Verfahren zum Trainieren von Verbindungen in einer Speicheranordnung und entsprechend ausgestaltete Speicheranordnungen
EP2263150A2 (en) * 2008-02-27 2010-12-22 Tsvi Achler Feedback systems and methods for recognizing patterns
US8924322B2 (en) 2012-06-15 2014-12-30 International Business Machines Corporation Multi-processor cortical simulations with reciprocal connections with shared weights
US9563740B2 (en) * 2012-10-16 2017-02-07 The Florida International University Board Of Trustees Neural interface activity simulator
CN105917354A (zh) * 2014-10-09 2016-08-31 微软技术许可有限责任公司 用于图像处理的空间金字塔池化网络
CN105388757A (zh) * 2015-10-22 2016-03-09 北京航空航天大学 一种电动加载系统的复合控制方法
US10839302B2 (en) 2015-11-24 2020-11-17 The Research Foundation For The State University Of New York Approximate value iteration with complex returns by bounding
US10599976B2 (en) * 2016-11-07 2020-03-24 International Business Machines Corporation Update of attenuation coefficient for a model corresponding to time-series input data
US10928814B2 (en) 2017-02-24 2021-02-23 General Electric Technology Gmbh Autonomous procedure for monitoring and diagnostics of machine based on electrical signature analysis
US11301750B2 (en) * 2017-03-31 2022-04-12 Ecole Polytechnique Federale De Lausanne (Epfl) Simplification of neural models that include arborized projections
CN107341543B (zh) * 2017-06-18 2020-09-29 大连理工大学 一种基于强化学习的小脑模型建模方法
US10403116B2 (en) 2017-06-20 2019-09-03 General Electric Company Electrical signature analysis of electrical rotating machines
CN108388213B (zh) * 2018-02-05 2019-11-08 浙江天悟智能技术有限公司 基于局部可塑性回声状态网络的聚酯纺丝工艺控制方法
JP7107017B2 (ja) * 2018-06-21 2022-07-27 カシオ計算機株式会社 ロボット、ロボットの制御方法及びプログラム
GB2575505B (en) * 2018-07-13 2022-08-24 Centaur Robotics Ltd Mobility aid device and method of manufacturing
CN112060082B (zh) * 2020-08-19 2021-10-15 大连理工大学 基于仿生强化学习型小脑模型的在线稳定控制仿人机器人
CN112782844B (zh) * 2021-01-12 2023-03-31 中国科学院光电技术研究所 一种自适应光学系统稳定闭环控制方法
CN114872040B (zh) * 2022-04-20 2024-04-16 中国科学院自动化研究所 基于小脑预测与修正的肌肉骨骼机器人控制方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5136687A (en) * 1989-10-10 1992-08-04 Edelman Gerald M Categorization automata employing neuronal group selection with reentry
WO1997046929A2 (en) * 1996-06-04 1997-12-11 Werbos Paul J 3-brain architecture for an intelligent decision and control system
JP3271544B2 (ja) * 1997-03-05 2002-04-02 三菱電機株式会社 学習制御方法
WO2001041867A1 (en) * 1999-12-07 2001-06-14 Krasnow Institute Adaptive electric field modulation of neural systems
US7822694B2 (en) * 2002-08-21 2010-10-26 New York University Neuro-mimetic control systems and methods
US7519452B2 (en) 2004-04-15 2009-04-14 Neurosciences Research Foundation, Inc. Mobile brain-based device for use in a real world environment

Also Published As

Publication number Publication date
WO2007076516A3 (en) 2008-04-10
US20070194727A1 (en) 2007-08-23
JP2009523276A (ja) 2009-06-18
EP1969513A4 (en) 2010-05-05
WO2007076516A9 (en) 2007-08-16
WO2007076516A2 (en) 2007-07-05
CN101390100B (zh) 2012-05-30
US7827124B2 (en) 2010-11-02
US20110047109A1 (en) 2011-02-24
CN101390100A (zh) 2009-03-18
EP1969513A2 (en) 2008-09-17
US8131658B2 (en) 2012-03-06

Similar Documents

Publication Publication Date Title
JP5175218B2 (ja) 予測的運動制御のための小脳モデルを有する頭脳ベース・デバイス
Bing et al. End to end learning of spiking neural network based on r-stdp for a lane keeping vehicle
US9579789B2 (en) Apparatus and methods for training of robotic control arbitration
Nolfi et al. Evolutionary robotics
US8285657B2 (en) Mobile brain-based device having a simulated nervous system based on the hippocampus
US8583286B2 (en) Hybrid control device
Cox et al. Neuromodulation as a robot controller
EP2437205A1 (en) Mobile brain-based device for use in a real world environment
US20150094852A1 (en) Robotic control arbitration apparatus and methods
Yue et al. A collision detection system for a mobile robot inspired by the locust visual system
Sporns What neuro-robotic models can teach us about neural and cognitive development
Chen et al. Versatile networks of simulated spiking neurons displaying winner-take-all behavior
Bonarini The body, the mind or the eye, first?
US20230177283A1 (en) Nervous system emulator engine and methods using same
Degris et al. A spiking neuron model of head-direction cells for robot orientation
Sandamirskaya et al. Dynamic field theory of sequential action: A model and its implementation on an embodied agent
Holland et al. A neuroanatomically grounded optimal control model of the compensatory eye movement system in mice
Hu et al. Slasher: Stadium racer car for event camera end-to-end learning autonomous driving experiments
Wang et al. An adaptive behavior decision model of mobile robot based on the neuromodulation
Barrera Anticipatory mechanisms of human sensorymotor coordination inspire control of adaptive robots: a brief review
CN117195994A (zh) 可变模型的训练方法和芯片产品
Northmore A network of spiking neurons develops sensorimotor mechanisms while guiding behavior
French et al. The hi-noon neural simulator and its applications to animal, animat and humanoid studies
Holland et al. A neuroanatomically grounded optimal control model of the compensatory eye movement system
Brohan et al. Reinforcement learning in a self-organised representation of feature space

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120326

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120626

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120703

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130104

R150 Certificate of patent or registration of utility model

Ref document number: 5175218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees